KR20180081527A - 클로스트리듐 박테리아의 형질전환을 위한 유전자 도구 - Google Patents
클로스트리듐 박테리아의 형질전환을 위한 유전자 도구 Download PDFInfo
- Publication number
- KR20180081527A KR20180081527A KR1020187013946A KR20187013946A KR20180081527A KR 20180081527 A KR20180081527 A KR 20180081527A KR 1020187013946 A KR1020187013946 A KR 1020187013946A KR 20187013946 A KR20187013946 A KR 20187013946A KR 20180081527 A KR20180081527 A KR 20180081527A
- Authority
- KR
- South Korea
- Prior art keywords
- bacteria
- cas9
- lys
- leu
- gene
- Prior art date
Links
- 241000193403 Clostridium Species 0.000 title claims abstract description 68
- 230000002068 genetic effect Effects 0.000 title claims abstract description 50
- 230000009466 transformation Effects 0.000 title claims abstract description 22
- 241000894006 Bacteria Species 0.000 claims abstract description 91
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 57
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 50
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 50
- 230000006801 homologous recombination Effects 0.000 claims abstract description 28
- 238000002744 homologous recombination Methods 0.000 claims abstract description 28
- 108020005004 Guide RNA Proteins 0.000 claims description 86
- 239000013612 plasmid Substances 0.000 claims description 71
- 108090000623 proteins and genes Proteins 0.000 claims description 62
- 108091033409 CRISPR Proteins 0.000 claims description 55
- 230000014509 gene expression Effects 0.000 claims description 50
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 claims description 48
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 45
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 38
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 claims description 34
- 230000001939 inductive effect Effects 0.000 claims description 30
- 230000001580 bacterial effect Effects 0.000 claims description 25
- 239000002904 solvent Substances 0.000 claims description 25
- 230000008685 targeting Effects 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 24
- 230000008439 repair process Effects 0.000 claims description 20
- 108091026890 Coding region Proteins 0.000 claims description 16
- 230000001131 transforming effect Effects 0.000 claims description 16
- 238000004519 manufacturing process Methods 0.000 claims description 15
- 239000000203 mixture Substances 0.000 claims description 15
- 102000004190 Enzymes Human genes 0.000 claims description 13
- 108090000790 Enzymes Proteins 0.000 claims description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 9
- 108020000946 Bacterial DNA Proteins 0.000 claims description 9
- 241000193401 Clostridium acetobutylicum Species 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 7
- 230000004083 survival effect Effects 0.000 claims description 7
- 241000193454 Clostridium beijerinckii Species 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 6
- 239000000411 inducer Substances 0.000 claims description 5
- 238000006467 substitution reaction Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 241000193171 Clostridium butyricum Species 0.000 claims description 3
- 241000193470 Clostridium sporogenes Species 0.000 claims description 3
- 241000186522 Clostridium aurantibutyricum Species 0.000 claims description 2
- 241000429427 Clostridium saccharobutylicum Species 0.000 claims description 2
- 241001508458 Clostridium saccharoperbutylacetonicum Species 0.000 claims description 2
- 241000193452 Clostridium tyrobutyricum Species 0.000 claims description 2
- 241000933069 Lachnoclostridium phytofermentans Species 0.000 claims description 2
- 238000002955 isolation Methods 0.000 claims description 2
- 241000002309 Collariella virescens Species 0.000 claims 1
- 125000002485 formyl group Chemical class [H]C(*)=O 0.000 claims 1
- 101150076274 upp gene Proteins 0.000 description 47
- 101150038500 cas9 gene Proteins 0.000 description 46
- 108020004414 DNA Proteins 0.000 description 45
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 28
- 239000002773 nucleotide Substances 0.000 description 22
- 125000003729 nucleotide group Chemical group 0.000 description 21
- 210000004027 cell Anatomy 0.000 description 18
- 229960003276 erythromycin Drugs 0.000 description 14
- 238000000855 fermentation Methods 0.000 description 14
- 230000004151 fermentation Effects 0.000 description 14
- 101150014383 adhE gene Proteins 0.000 description 13
- 230000000694 effects Effects 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- 235000018102 proteins Nutrition 0.000 description 12
- 102000004169 proteins and genes Human genes 0.000 description 12
- 101710163270 Nuclease Proteins 0.000 description 11
- 229940088598 enzyme Drugs 0.000 description 11
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 10
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 10
- 229960002949 fluorouracil Drugs 0.000 description 10
- 239000002609 medium Substances 0.000 description 10
- 230000010076 replication Effects 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 9
- 230000003321 amplification Effects 0.000 description 9
- 230000006698 induction Effects 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 238000003199 nucleic acid amplification method Methods 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 108091079001 CRISPR RNA Proteins 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 8
- 101150019709 celA gene Proteins 0.000 description 8
- 230000002759 chromosomal effect Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 230000003284 homeostatic effect Effects 0.000 description 8
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 7
- 101150006589 adc gene Proteins 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 229930101283 tetracycline Natural products 0.000 description 7
- 229960003495 thiamine Drugs 0.000 description 7
- 235000019157 thiamine Nutrition 0.000 description 7
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 7
- 239000011721 thiamine Substances 0.000 description 7
- 101150110790 xylB gene Proteins 0.000 description 7
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- 101100157012 Thermoanaerobacterium saccharolyticum (strain DSM 8691 / JW/SL-YS485) xynB gene Proteins 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 6
- 230000005782 double-strand break Effects 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 5
- 101100385573 Clostridium acetobutylicum (strain ATCC 824 / DSM 792 / JCM 1419 / LMG 5710 / VKM B-1787) ctfB gene Proteins 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 241000193996 Streptococcus pyogenes Species 0.000 description 5
- 101150067366 adh gene Proteins 0.000 description 5
- 239000003242 anti bacterial agent Substances 0.000 description 5
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 101150056596 azin2 gene Proteins 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 101150050362 thl gene Proteins 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 230000009261 transgenic effect Effects 0.000 description 5
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Chemical compound CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 4
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 4
- 101100385572 Clostridium acetobutylicum (strain ATCC 824 / DSM 792 / JCM 1419 / LMG 5710 / VKM B-1787) ctfA gene Proteins 0.000 description 4
- 241000193468 Clostridium perfringens Species 0.000 description 4
- 101100119095 Enterococcus faecalis (strain ATCC 700802 / V583) ermB gene Proteins 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 4
- 108091093037 Peptide nucleic acid Proteins 0.000 description 4
- 108091028113 Trans-activating crRNA Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 241000193453 [Clostridium] cellulolyticum Species 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 150000001413 amino acids Chemical group 0.000 description 4
- 229940088710 antibiotic agent Drugs 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 239000002551 biofuel Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000001768 carboxy methyl cellulose Substances 0.000 description 4
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 4
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 229960005091 chloramphenicol Drugs 0.000 description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 238000010362 genome editing Methods 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 125000001475 halogen functional group Chemical group 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 238000009630 liquid culture Methods 0.000 description 4
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- YONPFOKPAKAQLX-UHFFFAOYSA-N 5-fluoro-1h-pyrimidine-2,4-dione;phosphoric acid Chemical compound OP(O)(O)=O.FC1=CNC(=O)NC1=O YONPFOKPAKAQLX-UHFFFAOYSA-N 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 3
- 101100354311 Bacillus subtilis (strain 168) licB gene Proteins 0.000 description 3
- 241001112696 Clostridia Species 0.000 description 3
- 241000423302 Clostridium acetobutylicum ATCC 824 Species 0.000 description 3
- 101100005275 Clostridium perfringens catP gene Proteins 0.000 description 3
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 3
- 101150019065 HBD gene Proteins 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 3
- 239000004098 Tetracycline Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 210000003578 bacterial chromosome Anatomy 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 101150008363 celC gene Proteins 0.000 description 3
- 239000001913 cellulose Substances 0.000 description 3
- 229920002678 cellulose Polymers 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 101150026781 chbB gene Proteins 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 238000012269 metabolic engineering Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 229960002180 tetracycline Drugs 0.000 description 3
- 235000019364 tetracycline Nutrition 0.000 description 3
- 150000003522 tetracyclines Chemical class 0.000 description 3
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- 239000004382 Amylase Substances 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 101100283604 Caenorhabditis elegans pigk-1 gene Proteins 0.000 description 2
- 108010034933 CelA endoglucanase Proteins 0.000 description 2
- 108010059892 Cellulase Proteins 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 241001112695 Clostridiales Species 0.000 description 2
- 241000193163 Clostridioides difficile Species 0.000 description 2
- 241000423301 Clostridioides difficile 630 Species 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 101100125338 Escherichia coli (strain K12) hypF gene Proteins 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- 206010053759 Growth retardation Diseases 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- 241000019008 Hyda Species 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 238000002944 PCR assay Methods 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 150000001299 aldehydes Chemical class 0.000 description 2
- 102000004139 alpha-Amylases Human genes 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- 229940024171 alpha-amylase Drugs 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 230000001461 cytolytic effect Effects 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 231100000001 growth retardation Toxicity 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000013632 homeostatic process Effects 0.000 description 2
- 101150029013 hydA gene Proteins 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- KPYHRMNYOUGKKI-UHFFFAOYSA-N phosphoric acid;1h-pyrimidine-2,4-dione Chemical compound OP(O)(O)=O.O=C1C=CNC(=O)N1 KPYHRMNYOUGKKI-UHFFFAOYSA-N 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 101150048333 ptb gene Proteins 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- SPJMAPNWDLIVRR-UHFFFAOYSA-M sodium;3-chloro-2-phenylphenolate Chemical compound [Na+].[O-]C1=CC=CC(Cl)=C1C1=CC=CC=C1 SPJMAPNWDLIVRR-UHFFFAOYSA-M 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 229960000268 spectinomycin Drugs 0.000 description 2
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 101150107585 tetA gene Proteins 0.000 description 2
- 229960003053 thiamphenicol Drugs 0.000 description 2
- OTVAEFIXJLOWRX-NXEZZACHSA-N thiamphenicol Chemical compound CS(=O)(=O)C1=CC=C([C@@H](O)[C@@H](CO)NC(=O)C(Cl)Cl)C=C1 OTVAEFIXJLOWRX-NXEZZACHSA-N 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- PKAUICCNAWQPAU-UHFFFAOYSA-N 2-(4-chloro-2-methylphenoxy)acetic acid;n-methylmethanamine Chemical compound CNC.CC1=CC(Cl)=CC=C1OCC(O)=O PKAUICCNAWQPAU-UHFFFAOYSA-N 0.000 description 1
- QIGJYVCQYDKYDW-UHFFFAOYSA-N 3-O-alpha-D-mannopyranosyl-D-mannopyranose Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(CO)OC(O)C1O QIGJYVCQYDKYDW-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 101100235000 Acetobacterium woodii (strain ATCC 29683 / DSM 1030 / JCM 2381 / KCTC 1655 / WB1) lctB gene Proteins 0.000 description 1
- 101100235003 Acetobacterium woodii (strain ATCC 29683 / DSM 1030 / JCM 2381 / KCTC 1655 / WB1) lctC gene Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- FTNRWCPWDWRPAV-BZSNNMDCSA-N Asn-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTNRWCPWDWRPAV-BZSNNMDCSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 101100449954 Bacillus subtilis (strain 168) eglS gene Proteins 0.000 description 1
- 208000003508 Botulism Diseases 0.000 description 1
- 241000534630 Brevibacillus choshinensis Species 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 101100476566 Campylobacter jejuni aad9 gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 101100162672 Clostridium acetobutylicum (strain ATCC 824 / DSM 792 / JCM 1419 / LMG 5710 / VKM B-1787) amyA gene Proteins 0.000 description 1
- 101100162137 Clostridium acetobutylicum (strain ATCC 824 / DSM 792 / JCM 1419 / LMG 5710 / VKM B-1787) bdhB gene Proteins 0.000 description 1
- 101100313703 Clostridium acetobutylicum (strain ATCC 824 / DSM 792 / JCM 1419 / LMG 5710 / VKM B-1787) thlA gene Proteins 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 241000186566 Clostridium ljungdahlii Species 0.000 description 1
- 241000186581 Clostridium novyi Species 0.000 description 1
- 101100313720 Clostridium pasteurianum thl gene Proteins 0.000 description 1
- 241000193449 Clostridium tetani Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 101000636215 Crotalus durissus terrificus Crotamine Proteins 0.000 description 1
- 101710095468 Cyclase Proteins 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 101100190555 Dictyostelium discoideum pkgB gene Proteins 0.000 description 1
- 101150110799 ETFA gene Proteins 0.000 description 1
- 101150046595 ETFB gene Proteins 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 101100476567 Enterococcus faecalis spc gene Proteins 0.000 description 1
- 101100031701 Escherichia coli (strain K12) bglF gene Proteins 0.000 description 1
- 101100218687 Escherichia coli (strain K12) bglG gene Proteins 0.000 description 1
- 101100437498 Escherichia coli (strain K12) uidA gene Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 206010018612 Gonorrhoea Diseases 0.000 description 1
- 101100217614 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) atoB gene Proteins 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- DEOQGJUXUQGUJN-KKUMJFAQSA-N His-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DEOQGJUXUQGUJN-KKUMJFAQSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- 108010020056 Hydrogenase Proteins 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 101100001037 Komagataeibacter europaeus adhA gene Proteins 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- 101100162145 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) adhC2 gene Proteins 0.000 description 1
- 101100162144 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) adhc1 gene Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 101100378791 Paenarthrobacter nicotinovorans aldh gene Proteins 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101100162655 Pseudomonas stutzeri amyP gene Proteins 0.000 description 1
- 101100453320 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) pfkC gene Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 101100490556 Schizosaccharomyces pombe (strain 972 / ATCC 24843) adh1 gene Proteins 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000194019 Streptococcus mutans Species 0.000 description 1
- 241000320123 Streptococcus pyogenes M1 GAS Species 0.000 description 1
- 101100166146 Streptococcus pyogenes serotype M1 cas9 gene Proteins 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 101100029403 Synechocystis sp. (strain PCC 6803 / Kazusa) pfkA2 gene Proteins 0.000 description 1
- 206010043376 Tetanus Diseases 0.000 description 1
- 241001137871 Thermoanaerobacterium saccharolyticum Species 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- WDJHALXBUFZDSR-UHFFFAOYSA-M acetoacetate Chemical compound CC(=O)CC([O-])=O WDJHALXBUFZDSR-UHFFFAOYSA-M 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 101150004356 adhC gene Proteins 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 229940024606 amino acid Drugs 0.000 description 1
- 101150088296 amyP gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 150000001510 aspartic acids Chemical class 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 101150063145 atoA gene Proteins 0.000 description 1
- 101150006429 atoB gene Proteins 0.000 description 1
- 230000008970 bacterial immunity Effects 0.000 description 1
- 101150050729 bdhA gene Proteins 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 101150091659 bglC gene Proteins 0.000 description 1
- BSDUHMFABVUZLQ-UHFFFAOYSA-N butan-1-ol;ethanol;propan-2-ol Chemical compound CCO.CC(C)O.CCCCO BSDUHMFABVUZLQ-UHFFFAOYSA-N 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 206010009887 colitis Diseases 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- IQFVPQOLBLOTPF-HKXUKFGYSA-L congo red Chemical compound [Na+].[Na+].C1=CC=CC2=C(N)C(/N=N/C3=CC=C(C=C3)C3=CC=C(C=C3)/N=N/C3=C(C4=CC=CC=C4C(=C3)S([O-])(=O)=O)N)=CC(S([O-])(=O)=O)=C21 IQFVPQOLBLOTPF-HKXUKFGYSA-L 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 101150060293 ctfB gene Proteins 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 101150003727 egl2 gene Proteins 0.000 description 1
- 101150095359 eglA gene Proteins 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 108010045466 endoglucanase CelD Proteins 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 101150086253 ermB gene Proteins 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 101150042018 glcG gene Proteins 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 208000001786 gonorrhea Diseases 0.000 description 1
- 101150070420 gyrA gene Proteins 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000007124 immune defense Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 101150109249 lacI gene Proteins 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- QIGJYVCQYDKYDW-LCOYTZNXSA-N laminarabiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@H]1[C@H](O)[C@@H](CO)OC(O)[C@@H]1O QIGJYVCQYDKYDW-LCOYTZNXSA-N 0.000 description 1
- 231100001231 less toxic Toxicity 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 101150038284 pfkA gene Proteins 0.000 description 1
- 101150004013 pfkA1 gene Proteins 0.000 description 1
- 101150060387 pfp gene Proteins 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- BDERNNFJNOPAEC-UHFFFAOYSA-N propan-1-ol Chemical compound CCCO BDERNNFJNOPAEC-UHFFFAOYSA-N 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 101150020896 ptk gene Proteins 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- -1 sigE Proteins 0.000 description 1
- 101150067544 sigF gene Proteins 0.000 description 1
- 101150015060 sigG gene Proteins 0.000 description 1
- 101150077142 sigH gene Proteins 0.000 description 1
- 101150025376 sigK gene Proteins 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 101150015970 tetM gene Proteins 0.000 description 1
- 101150061166 tetR gene Proteins 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/065—Ethanol, i.e. non-beverage with microorganisms other than yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
- C12P7/26—Ketones
- C12P7/28—Acetone-containing products
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/145—Clostridium
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 클로스트리듐 속의 박테리아, 전형적으로 용매형성성 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는 적어도 2종의 상이한 핵산을 포함하는 유전자 도구에 관한 것이다.
Description
본 발명은 클로스트리듐(Clostridium) 속의 박테리아, 전형적으로 클로스트리듐 속의 용매형성성(solventogenic) 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는 적어도 2종의 상이한 핵산을 포함하는 유전자 도구에 관한 것이다.
퍼미큐테스(Firmicutes) 문, 클로스트리듐 속에 속하는 박테리아는 내생포자를 형성할 수 있는 절대 혐기성 그람 양성 바실러스이다. 이러한 속은 그들의 병원성 성질 또는 그들의 산업적 및 의학적 관심의 해석에 관해 연구되는 많은 종들을 함유한다. 예를 들어, 클로스트리듐 테타니(Clostridium tetani), 클로스트리듐 보툴리늄(Clostridium botulinum), 클로스트리듐 퍼프린젠스(Clostridium perfringens) 및 클로스트리듐 디피실(Clostridium difficile)은 각각이 파상풍, 보툴리누스 중독증, 가스 괴저증 및 가막성 대장염의 원인이 되는 동인이 된다. 동시에, 인간에 비병원성인 다른 종들 예컨대 클로스트리듐 아세토부틸리컴(Clostridium acetobutylicum), 클로스트리듐 부티리컴(Clostridium butyricum) 및 클로스트리듐 베이제린키(Clostridium beijerinckii)는 발효에 사용된다. 마지막으로, 클로스트리듐 노비(Clostridium novyi) 및 클로스트리듐 스포로제네스(Clostridium sporogenes)는 최근에 항암 요법의 개발을 목표로 하는 연구에서 사용되고 있다.
산업적 관심 대상의 클로스트리듐 종은 포도당에서 셀룰로스에 이르는 범위의 광범위한 기질 및 당류로부터 용매를 생성시킬 수 있다. 용매 생성 클로스트리듐 박테리아는 이중영양적 성장을 특징으로 한다. 산(아세트산 및 부티르산)이 대수 성장기 동안 생성된다. 그러고 나서, 세포 성장이 멈추고 박테리아가 정체기에 들어가면, 이들은 용매를 생성한다.
대부분의 용매형성성 클로스트리듐 균주는 최종 생성물로서 아세톤, 부탄올 및 에탄올을 생성한다. 이들 균주는 "ABE 균주"라고 불린다. 이것은 예를 들어 씨. 아세토부틸리컴 ATCC824 및 씨. 베이제린키 NCIMB 8052 균주의 경우이다. 다른 균주들도 또한 아세톤을 이소프로판올로 환원시킬 수 있고 "IBE 균주"라고 불린다. 이것은 예를 들어 아세톤을 이소프로판올로 환원시킬 수 있는 1차/2차 알코올-디히드로게나제를 코딩하는 adh 유전자를 그의 게놈에 갖는 균주 씨. 베이제린키 DSM 6423(NRRL B593)의 경우이다.
씨. 아세토부틸리컴 ATCC824에 의한 이소프로판올 생성은 씨. 베이제린키 DSM 6423 유래의 adh 유전자를 발현시키기 위한 플라스미드의 도입 후에 가능하다. 이러한 유전자 변형된 균주는 DSM 6423 균주와 동일한 방식으로 수행한다. 이러한 수행은 각각 산의 재동화에 관여하는 CoA-트랜스퍼라제, 및 아세토아세테이트 디카복실라제를 코딩하는 ctfA, ctfB 및 adc 유전자의 오페론 구조 내 과발현 후에 개선될 수 있다(Collas et al., 2012). 이들 유전자를 함유하는 플라스미드의 도입은 IBE 혼합물을 생성하도록 ATCC824 균주의 발효 프로파일을 변형시킨다. 그러나, 성장 배지 중 항생제의 존재는 이러한 유전자 구성체를 유지시키는데 필요하여, 이 균주를 산업적 용도로 사용하는 것을 불가능하게 만든다.
클로스트리듐 속의 박테리아에 대한 명백한 관심에도 불구하고, 유전자 변형된 균주 획득의 어려움으로 인해 그들 물질대사를 연구하고/하거나 변형시키는 작업은 거의 수행되지 않았다. 가장 강건한 시스템은 게놈의 정밀하고 안정한 변형을 가능하게 하는 상동성 재조합 사건을 기반으로 한다. 그러나, 클로스트리듐에서 관찰되는 상동성 재조합 빈도는 매우 낮고, 선별 마커(예를 들어, 항생제 내성 유전자) 및 대항-선별 마커(예를 들어, 독소 코딩 유전자)가 필수적인 것으로 입증되었다. 2가지 도구가 최근에 개발되었는데(Al-Hinai et al., 2012; Cartman et al., 2012), 각각은 단일 플라스미드의 사용을 기반으로 한다. 획기적이긴 하지만, 이들 시스템은 단점을 갖는다. 제1 시스템은 많은 수의 변형을 수행하기 위한 도구의 재사용을 방지하고 돌연변이체의 유전자 맥락(genetic context)을 변경시킬 수 있는 FRT 카세트(선별가능한 마커의 절제 동안 사용됨)를 변형 부위에 남겨두는 결점을 갖는다. 이들 결점은 당업자에게 잘 알려져 있다. 두 순차적인 상동성 재조합 사건을 필요로 하는, 제2 시스템은 게놈의 필수 영역을 변형시키는데 사용될 수 없다. 2종의 플라스미드의 순차적 사용을 포함하는 도구가 이후에 개발되었는데, 그들 중 하나는 메가뉴클레아제 I-SceI을 코딩하며, 이것은 특정 표적 부위에서 이중 가닥 DNA에 파괴를 유도할 수 있고 상동성 재조합 사건을 촉진할 수 있다(Zhang et al., 2015). 여기서도 역시, 일부 필수 유전자의 변형이 두 순차적 상동성 재조합 사건을 수행하는 필요성으로 인해 불가능하다. 현재, 개발된 최신 세대의 도구(Wang et al., 2015; Xu et al., 2015)는 진핵생물에서 관찰되는 RNA 간섭과 유사한 방식으로 작동하는, CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats) 기술을 기반으로 한다(Barrangou et al., 2007). 각각 씨. 베이제린키 및 씨. 셀룰롤리티컴에 적합화된 문헌 [Wang et al.] 및 문헌 [Xu et al.]에 기술된 도구는 단일 플라스미드의 사용을 기반으로 한다. 문헌 [Xu et al.]은 이중 가닥 파괴 대신 단일 가닥 파괴를 생성하는 Cas9 효소의 변형된 이형(version)을 사용한다. 이용가능한 CRISPR 기술-기반 도구 둘 모두는 박테리아 게놈에 삽입시킬 수 있는 관심 핵산의 크기(및 따라서 코딩 서열 또는 유전자의 개수)(문헌 [Xu et al.]에 따라 고작 약 1.8 kb)를 상당히 제한한다는 주요한 단점을 갖는다.
발명의 개요
본 발명의 목적은 산업적 규모로 클로스트리듐 속의 박테리아의 사용을 가능하게 하기 위해 최초로 박테리아 게놈을 변형시킬 수 있는, 전체로서 클로스트리듐 속, 구체적으로 클로스트리듐 속의 용매형성성 박테리아에 적합화된 유전자 도구를 제공하는 것이다.
따라서 본 발명은 적어도 2종의 상이한 핵산을 포함하는 것을 특징으로 하는, 클로스트리듐 속의 박테리아, 바람직하게는 클로스트리듐 속의 용매형성성 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는 유전자 도구에 관한 것이다. 이러한 도구는 예를 들어 박테리아 생존에 필수적인 서열을 포함하는 클로스트리듐 속의 박테리아의 게놈의 영역을 변형시킬 수 있거나, 또는 현존하는 도구를 사용해서는 불가능한, 핵산 서열의 거대 단편의 삽입을 가능하게 할 수 있다.
따라서 본 발명의 제1 목적은:
- 적어도 Cas9을 코딩하는 제1 핵산으로서,
여기서 Cas9 코딩 서열은 프로모터의 제어 하에 위치되는 것인 제1 핵산, 및
- 상동성 재조합 기전에 의해, Cas9-표적화 박테리아 DNA의 일부분의 관심 서열로의 치환을 가능하게 하는 복구 주형을 함유하는 적어도 제2 핵산
을 포함하는 것을 특징으로 하고,
i) 상기 핵산 중 적어도 하나는 하나 이상의 가이드 RNA(gRNA)를 더 코딩하거나, 또는 ii) 유전자 도구는 하나 이상의 가이드 RNA를 더 포함하며, 각각의 가이드 RNA는 Cas9-효소-결합 RNA 구조, 및 박테리아 DNA의 표적화 부분에 상보적인 서열을 포함하는 것을 특징으로 하는, 클로스트리듐 속의 용매형성성 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는 유전자 도구에 관한 것이다.
본 발명은 또한 본 발명에 따른 유전자 도구를 박테리아에 도입시키는 단계를 포함하는 것을 특징으로 하는, 클로스트리듐 속의 박테리아, 전형적으로 클로스트리듐 속의 용매형성성 박테리아를 상동성 재조합에 의해 형질전환 및/또는 유전자 변형시키기 위한 방법에 관한 것이다. 본 발명은 또한 그에 따라 형질전환되고/되거나 유전자 변형된 클로스트리듐 속의 박테리아에 관한 것이다.
본 발명자는 또한 본 발명에 따른 유전자 도구의 성분, 및 임의로는 구체적으로 도구 내에서 사용되는 선택된 유도성 프로모터(들)에 적합화된 하나 이상의 유도인자를 포함하는, 클로스트리듐 속의 박테리아를 사용하여, 적어도 하나의 용매, 예를 들어, 용매의 혼합물을 생성시키거나, 또는 클로스트리듐 속의 박테리아를 형질전환 및/또는 유전자 변형시키기 위한 키트를 개시한다.
또한 산업적 규모로 용매 또는 용매의 혼합물, 바람직하게는 아세톤, 부탄올, 에탄올, 이소프로판올 또는 이의 혼합물, 전형적으로 이소프로판올/부탄올 혼합물을 생성하기 위한, 본 발명에 따른 유전자 도구, 상동성 재조합에 의해 클로스트리듐 속의 박테리아를 형질전환 및/또는 유전자 변형시키기 위한 방법, 이에 따라 형질전환 및/또는 유전자 변형된 박테리아의 용도를 개시한다.
발명의 상세한 설명
CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)은 박테리아 및 고세균에서 파지 및 플라스미드에 대항하여 면역 방어 역할을 갖는 유전자의 유전자좌를 의미한다. CRISPR-Cas9 시스템은 본질적으로 표적 게놈에서 이중 가닥 파괴를 유도하는 Cas9 단백질 및 절단 부위에 대한 특이성을 책임지는 가이드 RNA(gRNA)의 조합을 기반으로 한다. DNA에서 표적화 이중 가닥 파괴를 생성시키는 이러한 능력은 관심 균주의 게놈으로 돌연변이를 도입시키는데 필수적인 상동성 재조합 사건을 촉진시킬 수 있다. 세포 생존능은 게놈의 무결성에 의존적이다. 박테리아는 복구 주형을 요구하는 상동성 재조합 기전에 의해서건, 또는 비상동성 말단 연결 기전에 의해서건 간에, 그의 DNA 내 임의 파괴를 복구해야만 한다. 세포에 이러한 주형을 제공함으로서, 파괴 부위에 상응하는 영역을 변형시키는 것이 가능하다(도 2). DNA 분자에 이중 가닥 파괴를 만드는 CRISPR의 능력은 다양한 유기체, 구체적으로 스트렙토코커스 피오제네스(Streptococcus pyogenes)에서 유전자 도구로서의 이의 최근 사용을 가능하게 하였으며, 이는 대장균(E. coli), 및 진핵생물 세포에서 처음 특징규명되었다(Jiang et al., 2013; Cong et al., 2013; Hwang et al., 2013; Hsu et al., 2013). 이는 박테리아 게놈에 대해 제한된 변형만을 가능하게 하는 유전자 도구의 도움으로 클로스트리듐 베이제린키 및 클로스트리듐 셀룰롤리티컴에서 최근에 사용되었는데, 산업적 규모로는 비현실적이다(Wang et al., 2015; Xu et al., 2015).
클로스트리듐 속의 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하고, 적어도 2종의 상이한 핵산을 포함하는 유전자 도구가 본 명세서에서 최초로 개시된다. 본 발명자들은 이 도구를 산업적 관점에서 특히 유용하게 하여, 따라서 오랜 동안 표현된 요구를 충족시키는데 충분히 효과적인 방식으로, 클로스트리듐 속의 용매형성성 박테리아를 형질전환 및/또는 유전자 변형시킬 수 있다는 것을 입증하였다.
클로스트리듐 속의 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는, 본 발명에 따른 구체적인 유전자 도구는:
- 적어도 Cas9를 코딩하는 제1 핵산으로서, 여기서 Cas9 코딩 서열은 프로모터의 제어 하에 위치되는 것인 제1 핵산, 및
- 상동성 재조합 기전에 의해서, Cas9-표적화 박테리아 DNA의 일부분의 관심 서열로의 치환을 가능하게 하는 복구 주형을 함유하는 적어도 제2 핵산
을 포함하고,
여기서 i) 상기 핵산 중 적어도 하나는 하나 이상의 가이드 RNA(gRNA)를 더 코딩하거나 또는 ii) 유전자 도구는 하나 이상의 가이드 RNA를 더 포함한다는 것을 고려한다. 이러한 도구에서 각각의 가이드 RNA는 Cas9-효소-결합 RNA 구조, 및 박테리아 DNA의 표적화 부분에 상보적인 서열을 포함한다.
표현 "클로스트리듐 속의 박테리아"는 구체적으로 산업적 관심의 클로스트리듐 종, 전형적으로 클로스트리듐 속의 용매형성성 박테리아를 의미하려는 의도이다. 표현 "클로스트리듐 속의 박테리아"는 야생형 박테리아 뿐 아니라 CRISPR 시스템에 노출시키지 않고 그들 성능을 개선시키는(예를 들어, ctfA, ctfB 및 adc 유전자의 과발현) 목적으로 유전자 변형시켜 그로부터 유래된 균주를 포함한다.
표현 "산업적 관심의 클로스트리듐 종"은 발효에 의해, 단당류 예컨대 포도당, 자일로스, 프룩토스 또는 만노스, 다당류 예컨대 셀룰로스 또는 헤미셀룰로스, 산 예컨대 부티르산 또는 아세트산, 또는 클로스트리듐 속의 박테리아에 의해 동화될 수 있고 이용될 수 있는 임의의 다른 탄소원(예를 들어, CO, CO2 및 메탄올)으로부터 용매를 생성시킬 수 있는 종을 의미하려는 의도이다. 관심의 용매형성성 박테리아의 예로는 아세톤, 부탄올, 에탄올 및/또는 이소프로판올을 생성하는 클로스트리듐 속의 박테리아, 예컨대 "ABE 균주"[발효 생성물로서 아세톤, 부탄올 및 에탄올을 생성하는 균주] 및 "IBE 균주"[발효 생성물로서 이소프로판올(아세톤의 환원에 의함), 부탄올 및 에탄올을 생성하는 균주]와 같이 문헌에서 확인되는 균주들이 있다. 클로스트리듐 속의 용매형성성 박테리아는 씨. 아세토부틸리컴(C. acetobutylicum), 씨. 셀룰롤리티컴(C. cellulolyticum), 씨. 피토퍼멘탄스(C. phytofermentans), 씨. 베이제린키(C. beijerinckii), 씨. 사카로부틸리컴(C. saccharobutylicum), 씨. 사카로퍼부틸아세토니컴(C. saccharoperbutylacetonicum), 씨. 스포로제네스(C. sporogenes), 씨. 부티리컴(C. butyricum), 씨. 아우란티부티리컴(C. aurantibutyricum) 및 씨. 티로부티리컴(C. tyrobutyricum), 바람직하게는 씨. 아세토부틸리컴, 씨. 베이제린키, 씨. 부티리컴 및 씨. 티로부티리컴 및 씨. 셀룰롤리티컴, 및 보다 바람직하게는 씨. 아세토부틸리컴 및 씨. 베이제린키에서 선택될 수 있다.
구체적인 실시형태에서, 관심있는 클로스트리듐 속의 박테리아는 "ABE 균주", 바람직하게는 씨. 아세토부틸리컴 ATCC824 균주 또는 씨. 베이제린키 NCIMB 8052 균주이다.
다른 구체적인 실시형태에서, 관심있는 클로스트리듐 속의 박테리아는 "IBE 균주", 바람직하게는 씨. 베이제린키 DSM 6423 균주(NRRL B593 균주라고도 식별함)이다.
CRISPR 시스템은 2종의 별개의 성분, 즉 i) 엔도뉴클레아제, 본 경우에서 CRISPR 시스템과 연관된 뉴클레아제(Cas 또는 "CRISPR-연관 단백질"), Cas9, 및 ii) 가이드 RNA를 함유한다. 가이드 RNA는 박테리아 CRISPR RNA(crRNA) 및 tracrRNA(trans-activating CRISPR RNA)의 조합으로 이루어진 키메라 RNA의 형태이다(Jinek et al., Science 2012 - 도 3 참조). gRNA는 Cas 단백질을 위한 가이드로서 제공되는 "스페이서 서열"에 상응하는 crRNA의 표적화 특이성, 및 tracrRNA의 입체형태 특성을 단일 전사물에 조합한다. gRNA 및 Cas9 단백질이 세포에서 동시에 발현되는 경우, 표적 게놈 서열은 영구적으로 변형되거나 또는 차단될 수 있다. 변형은 유리하게는 복구 주형에 의해 가이드된다.
본 발명에 따른 유전자 도구는 적어도 Cas9을 코딩하는 제1 핵산을 포함한다. 용어 "Cas9"은 Cas9 단백질(Csn1 또는 Csx12라고도 함) 또는 이의 기능성 단백질, 펩티드 또는 폴리펩티드 단편을 의미하려는 의도이고, "기능성"은 하나 이상의 가이드 RNA와 상호작용할 수 있고 표적 게놈의 DNA에 이중 가닥 파괴를 생성시킬 수 있는 효소(뉴클레아제) 활성을 수행할 수 있는 것을 의미한다. 따라서, "Cas9"은 예를 들어 단백질의 사전정의된 기능에 필수적이지 않은 단백질 도메인, 구체적으로 하나 이상의 gRNA와 상호작용하는데 필요하지 않은 도메인을 제거하기 위해 절단된, 변형된 단백질을 나타낼 수 있다.
본 발명의 맥락에서 사용시 Cas9(전체 단백질 또는 이의 단편)을 코딩하는 서열은 임의의 공지된 Cas9 단백질로부터 획득될 수 있다(Makarova et al., 2011). 본 발명에서 유용한 Cas9 단백질의 예는 제한없이, 스트렙토코커스 피오제네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 뮤탄스(Streptococcus mutans), 캄필로박터 제주니(Campylobacter jejuni), 프란시셀라 노비시다(Francisella novicida) 및 나이세리아 메닌지티디스(Neisseria meningitidis) 유래의 Cas9 단백질을 포함한다. 본 발명에서 유용한 다른 Cas9 단백질은 또한 [Fonfara et al., 2013]의 논문에 기술되어 있다.
구체적인 실시형태에서, 본 발명에 따른 유전자 도구의 핵산 중 하나에 의해 코딩되는 Cas9 단백질, 또는 이의 기능성 단백질, 펩티드 또는 폴리펩티드 단편은 SEQ ID NO: 1의 아미노산 서열, 또는 SEQ ID NO: 1의 아미노산 서열과 적어도 50%, 바람직하게는 적어도 60% 동일성을 갖고, SEQ ID NO: 1의 아미노산 서열의 위치 10("D10") 및 위치 840("D840")을 차지하는 적어도 2개의 아스파르트산("D")을 함유하는 임의의 다른 아미노산 서열을 포함하거나, 또는 그로 이루어진다.
바람직한 실시형태에서, Cas9는 스트렙토코커스 피오제네스(Streptococcus pyogenes) M1 GAS 균주 유래의 cas9 유전자(NCBI 수탁 번호: NC_002737.2 SPy_1046, SEQ ID NO: 2)에 의해 코딩되는 Cas9 단백질(NCBI 수탁 번호: WP_010922251.1, SEQ ID NO: 1), 또는 클로스트리듐 속의 박테리아가 우선적으로 사용하는 코돈, 전형적으로 이 박테리아 속에서 Cas9 단백질의 촉진된 발현을 가능케 하는, 아데닌("A") 및 티민("T") 염기가 풍부한 코돈을 함유하는 전사물을 생기게 하는 최적화를 겪은 이의 이형("최적화된 이형(optimized version")을 포함하거나, 또는 그로 이루어진다. 이들 최적화된 코돈은 각각의 박테리아 균주에 특이적인, 당업자에게 잘 알려진 코돈 용법 편향성을 준수한다.
이 문헌에 개시된 펩티드 서열에서, 아미노산은 다음의 명명법에 따라 그들의 한 글자 코드로 표시된다: C: 시스테인; D: 아스파르트산; E: 글루탐산; F: 페닐알라닌; G: 글리신; H: 히스티딘; I: 이소류신; K: 리신; L: 류신; M: 메티오닌; N: 아스파라긴; P: 프롤린; Q: 글루타민; R: 아르기닌; S: 세린; T: 트레오닌; V: 발린; W: 트립토판 및 Y: 티로신.
구체적인 실시형태에 따라서, Cas9 도메인은 전체 Cas9 단백질, 바람직하게는 스트렙토코커스 피오제네스 유래의 Cas9 단백질, 또는 이의 최적화된 이형으로 이루어진다.
본 발명에 따른 유전자 도구의 핵산 중 하나에 존재하는 Cas9 코딩 서열은 프로모터의 제어 하에 위치된다. 이 프로모터는 항상성 프로모터이거나 또는 유도성 프로모터일 수 있다. 바람직한 실시형태에서, Cas9 발현을 제어하는 프로모터는 유도성 프로모터이다.
본 발명의 맥락에서 유용한 항상성 프로모터의 예는 thl 유전자의 프로모터, ptb 유전자의 프로모터, adc 유전자의 프로모터, BCS 오페론의 프로모터, 또는 이의 유도체, 바람직하게는 기능성이지만 보다 짧은(절단형) 유도체 예컨대 씨. 아세토부틸리컴 유래의 thl 유전자 프로모터의 "miniPthl" 유도체(Dong et al., 2012), 또는 클로스트리듐에서 단백질의 발현을 가능케하는, 당업자에게 잘 알려진 임의의 다른 프로모터에서 선택될 수 있다.
본 발명의 맥락에서 유용한 유도성 프로모터의 예는 예를 들어 그 발현이 전사 억제인자 TetR에 의해 제어되는 프로모터, 예를 들어, tetA 유전자(본래 대장균 트랜스포존 Tn10에 존재하는 테트라사이클린 내성 유전자)의 프로모터; 그 발현이 L-아라비노스에 의해 제어되는 프로모터, 예를 들어 ptk 유전자의 프로모터(문헌 [Zhang J. et al., 2015] 참조)로서, ARAi 시스템을 구축하기 위해 씨. 아세토부틸리컴 유래의 araR 조절인자 발현 카세트와 조합된 것(문헌 [Zhang J. et al., 2015] 참조); 그 발현이 라미나리비오스(β-1,3 포도당 이량체)에 의해 제어되는 프로모터, 예를 들어 바람직하게는 억제인자 유전자 glyR3 및 관심 유전자가 바로 후속되는, celC 유전자 프로모터(문헌 [Mearls EB et al. (2015)] 참조) 또는 celC 유전자 프로모터(문헌 [Newcomb M. et al., 2011] 참조); 그 발현이 락토스에 의해 제어되는 프로모터, 예를 들어 바람직하게는 AdhE1(알데하이드/알코올 디히드로게나제) 유전자가 바로 후속되는, bgaL 유전자 프로모터(문헌 [Banerjee et al., 2014] 참조); 그 발현이 자일로스에 의해 제어되는 프로모터, 예를 들어 xylB 유전자 프로모터(문헌 [Nariya H et al., 2011] 참조); 및 그 발현이 UV 노출에 의해 제어되는 프로모터, 예를 들어 bcn 프로모터(문헌 [Dupuy et al., 2005] 참조)로부터 선택될 수 있다.
상기 기술된 프로모터 중 하나로부터 유래된 프로모터, 바람직하게는 기능성이지만 짧은(절단형) 유도체가 또한 유리하게 본 발명의 맥락에서 사용될 수 있다.
본 발명에서 유용한 다른 유도성 프로모터가 또한 예를 들어 [Ransom EM et al. (2015)], [Currie DH et al. (2013)], [D'Urzo N et al. (2013)] 및 [Hartman AH et al. (2011)]의 논문에 기술되어 있다.
바람직한 유도성 프로모터는 Pcm-2tetO1 및 Pcm-2tetO2/1로부터 선택된, tetA 로부터 유래된 언히드로테트라사이클린(aTc)-유도성 프로모터(aTc는 테트라사이클린보다 덜 독성이 있고 보다 낮은 농도에서 전사 억제인자 TetR의 억제를 풀어줄 수 있음)이다(Dong et al., 2012).
또 다른 바람직한 유도성 프로모터는 xylB로부터 유래된 자일로스 유도성 프로모터, 예를 들어 클로스트리듐 디피실(Clostridium difficile) 630 유래의 xylB 프로모터이다(Nariya et al., 2011).
본 명세서에 개시된 바와 같은 유도성 프로모터는 유리하게는 효소의 작용을 제어하고 바람직한 유전자 변형을 겪은 형질전환체의 선택을 촉진하는 것을 가능하게 한다.
용어 "가이드 RNA" 또는 "gRNA"는 본 발명의 의미에서 박테리아 염색체의 표적 영역 쪽으로 가이드하기 위해 "Cas9"과 상호작용할 수 있는 RNA 분자를 의미한다. 파괴의 특이성은 gRNA에 의해 결정된다. 상기에 설명한 바와 같이, 각각의 gRNA는 다음의 2개 영역을 포함한다:
- 표적 염색체 영역에 상보적이고 내생성 CRISPR 시스템의 crRNA를 모방하는, gRNA의 5' 말단의 제1 영역(통상적으로 "SDS" 영역이라고 불림), 및
- 내생성 CRISPR 시스템의 crRNA 및 tracrRNA(trans-activating crRNA) 사이의 염기쌍 상호작용을 모방하고 본질적으로 단일 가닥 서열로 3' 방향으로 종결되는 이중 가닥 스템-루프 구조를 갖는, gRNA의 3' 말단의 제2 영역(통상적으로 "핸들" 영역이라고 함). 이 제2 영역은 Cas9에 대한 gRNA의 결합에 필수적이다.
gRNA의 제1 영역(SDS 영역)은 표적화 염색체 서열에 따라 다양하다.
표적 염색체 영역에 상보적인 gRNA의 SDS 영역은 적어도 1개의 뉴클레오티드, 바람직하게는 적어도 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 또는 40개 뉴클레오티드, 전형적으로 1 내지 40개 뉴클레오티드를 포함한다. 바람직하게는, 이 영역은 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개 뉴클레오티드의 길이를 갖는다.
gRNA의 제2 영역(핸들 영역)은 스템-루프(또는 헤어핀) 구조를 갖는다. 상이한 gRNA의 핸들 영역은 선택된 염색체 표적에 의존하지 않는다.
구체적인 실시형태에 따라서, 핸들 영역은 적어도 1개 뉴클레오티드, 바람직하게는 적어도 1, 50, 100, 200, 500 및 1000개 뉴클레오티드, 전형적으로 1 내지 1000개 뉴클레오티드의 서열을 포함하거나, 또는 그로 이루어진다. 바람직하게, 이 영역은 40 내지 120개 뉴클레오티드의 길이를 갖는다.
gRNA의 전체 길이는 일반적으로 50 내지 1000개 뉴클레오티드, 바람직하게는 80 내지 200개 뉴클레오티드, 보다 특히 구체적으로 90 내지 120개 뉴클레오티드이다. 구체적인 실시형태에 따라서, 본 발명에서 사용하는 바와 같은 gRNA는 95 내지 110개 뉴클레오티드 범위의 길이, 예를 들어 약 100개 또는 약 110개 뉴클레오티드의 길이를 갖는다.
당업자는 표적화하려는 염색체 영역에 따라서 gRNA의 서열 및 구조를 잘 알려진 기술을 사용하여 쉽게 정의할 수 있다(예를 들어, [DiCarlo et al., 2013]의 논문을 참조함).
박테리아 염색체 내의 표적화된 DNA 영역/부분/서열은 비코딩 DNA의 일부분 또는 코딩 DNA의 일부분에 상응할 수 있다. 구체적인 실시형태에서, 박테리아 DNA의 표적화된 부분은 박테리아 생존에 필수적인 하나 이상의 유전자 또는 유전자 부분(들) 또는 그 불활성화가 관심 핵산(들)이 통합된 박테리아의 선택을 가능케 하는 하나 이상의 유전자 또는 DNA 서열을 포함한다.
클로스트리듐 속의 박테리아 내의 표적화 DNA 부분의 구체적인 예는 실험 부문에서 사용되는 서열이다. 이들은 예를 들어 upp(SEQ ID NO: 3) 및 adhE1(SEQ ID NO: 4) 유전자를 코딩하는 서열이다.
표적화된 DNA 영역/부분/서열에는 Cas9 결합에서 역할을 하는 PAM(protospacer adjacent motif) 서열이 후속된다.
소정 gRNA의 SDS 영역은 박테리아 염색체 내의 표적화된 DNA 영역/부분/서열과 100% 동일하거나 또는 적어도 80% 동일하거나, 바람직하게는 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하고, 상기 영역/부분/서열의 상보성 서열의 전부 또는 일부분, 전형적으로 적어도 1개 뉴클레오티드, 바람직하게는 적어도 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 또는 40개 뉴클레오티드, 전형적으로 1 내지 40개 뉴클레오티드를 포함하는 서열, 바람직하게는 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개 뉴클레오티드를 포함하는 서열과 혼성화할 수 있다.
본 발명에 따른 방법에서, 하나 이상의 gRNA가 동시에 사용될 수 있다. 이들 상이한 gRNA는 동일하거나 또는 상이한, 바람직하게는 상이한, 염색체 영역을 표적으로 할 수 있다.
gRNA는 gRNA 분자(성숙형 또는 전구체)의 형태로, 전구체의 형태로 또는 상기 gRNA를 코딩하는 하나 이상의 핵산의 형태로 박테리아 세포에 도입될 수 있다. gRNA는 바람직하게는 상기 gRNA를 코딩하는 하나 이상의 핵산의 형태로 박테리아 세포에 도입된다.
하나 이상의 gRNA가 RNA 분자의 형태로 직접적으로 세포에 도입되는 경우, 이들 gRNA(성숙형 또는 전구체)는 예를 들어 뉴클레아제에 대한 그들의 내성을 증가시키고 따라서 세포 내에서 이들의 수명을 증가시킬 수 있게 하는 변형된 뉴클레오티드 또는 화학 변형을 함유할 수 있다. 이들은 특히, 적어도 하나의 변형되거나 또는 비천연인 뉴클레오티드, 예를 들어 변형된 염기, 예컨대 이노신, 메틸-5-데옥시시티딘, 디메틸아미노-5-데옥시우리딘, 데옥시우리딘, 디아미노-2,6-푸린, 브로모-5-데옥시우리딘 또는 혼성화를 가능케하는 임의의 다른 변형된 염기를 포함하는 뉴클레오티드를 포함할 수 있다. 본 발명에 따라 사용되는 gRNA는 뉴클레오티드간 결합 수준, 예를 들어 포스포로티오에이트, H-포스포네이트 또는 알킬-포스포네이트, 또는 골격의 수준, 예를 들어 알파-올리고뉴클레오티드, 2'-O-알킬 리보스 또는 펩티드 핵산(PNA)에 대해 변형될 수도 있다(Egholm et al., 1992).
gRNA는 천연 RNA, 합성 RNA, 또는 재조합 기술로 생성된 RNA일 수 있다. 상기 gRNA는 당업자에게 공지된 임의 방법 예컨대 화학 합성, 생체내 전사 또는 증폭 기술에 의해 제조될 수 있다.
gRNA가 하나 이상의 핵산의 형태로 박테리아 세포에 도입될 때, 하나 이상의 gRNA를 코딩하는 하나 이상의 서열은 발현 프로모터의 제어 하에 위치된다. 상기 프로모터는 항상성일 수 있거나 또는 유도성일 수 있다.
몇몇 gRNA가 사용될 때, 각각의 gRNA의 발현은 상이한 프로모터에 의해 제어될 수 있다. 바람직하게는, 사용되는 프로모터는 모든 gRNA에 대해 동일하다. 구체적인 실시형태에서, 발현시키고자 의도하는 몇몇개, 예를 들어 오직 소수의 gRNA의 발현을 허용하도록 동일한 프로모터가 사용될 수 있다.
바람직한 실시형태에서, 하나 이상의 gRNA의 발현을 제어하는 하나 이상의 프로모터는 항상성 프로모터이다.
본 발명의 맥락에서 유용한 항상성 프로모터의 예는 thl 유전자의 프로모터, ptb 유전자의 프로모터 또는 bcs 오페론의 프로모터, 또는 이의 유도체, 바람직하게는 miniPthl, 또는 클로스트리듐 내에서 RNA(코딩 또는 비코딩)의 합성을 가능하게 하는, 당업자에게 잘 알려진 임의의 다른 프로모터로부터 선택될 수 있다.
본 발명의 맥락에서 유용한 유도성 프로모터의 예는 tetA 유전자의 프로모터, xylA 유전자의 프로모터, lacI 유전자의 프로모터, 또는 bgaL 유전자의 프로모터, 또는 이의 유도체, 바람직하게는 2tetO1 또는 tetO2/1로부터 선택될 수 있다. 바람직한 유도성 프로모터는 tetO2/1이다.
Cas9 및 하나 이상의 gRNA의 발현을 제어하는 프로모터는 동일하거나 또는 상이할 수 있고 항상성이거나 또는 유도성일 수 있다. 본 발명의 구체적이고 바람직한 실시형태에서, 각각, Cas9 또는 하나 이상의 gRNA의 발현을 제어하는 프로모터 중 오직 하나는 유도성 프로모터이다.
본 발명의 의미 내에서, 용어 "핵산"은 코딩 서열로부터 합성된 전사물의 코돈이 클로스트리듐 속의 박테리아에서 사용을 위해 그에서 가장 빈번하게 발견되는 코돈이 되도록 최적화되거나, 또는 임의로는 화학적으로 변형된(즉, 예를 들어 변형된 결합, 변형된 염기 및/또는 변형된 당을 포함하는 변형된 뉴클레오티드, 비천연 염기를 포함), 임의의 천연, 합성, 반합성 또는 재조합 DNA 또는 RNA 분자를 의미하고자 한다. 상기에서 설명한 바와 같이, 클로스트리듐 속의 경우, 최적화된 코돈은 전형적으로 아데닌("A") 및 티민("T") 염기가 풍부한 코돈이다.
본 발명에 따른 유전자 도구 내에 존재하는 각각의 핵산, 전형적으로 "제1" 핵산 및 "제2" 핵산은 별개의 독립체로 이루어지고, 예를 들어 i) 발현 카세트(또는 "구성체") 예컨대 하나 이상의 관심 (코딩) 서열, 전형적으로 그 발현 생성물이 박테리아 내에서 관심 기능의 생성에 기여하는 몇몇 관심 코딩 서열을 포함하는 오페론에 작동적으로 연결된(당업자가 이해하는 의미로) 적어도 하나의 전사 프로모터를 포함하는 핵산, 또는 예컨대 활성화 서열 및/또는 전사 종결인자를 더 포함하는 핵산; 또는 ii) 상기 정의된 바와 같은 하나 이상의 발현 카세트를 포함하는, 원형 또는 선형의, 단일 가닥 또는 이중 가닥 벡터, 예를 들어 플라스미드, 파지, 코스미드, 인공 또는 합성 염색체에 상응한다. 바람직하게, 벡터는 플라스미드이다.
발현 카세트 및 벡터는 당업자에게 잘 알려진 통상의 절차에 의해 구축될 수 있고 하나 이상의 프로모터, 박테리아 복제 기원(ORI 서열), 종결인자 서열, 선택 유전자, 예를 들어 항생제 내성 유전자, 및 카세트 또는 벡터의 표적화 삽입을 허용하는 서열("측접 영역")을 포함할 수 있다. 또한, 상기 발현 카세트 및 벡터는 당업자에게 잘 알려진 기술에 의해 게놈에 통합시킬 수 있다.
관심 ORI 서열은 pIP404, pAMβ1, repH(씨. 아세토부틸리컴의 복제 기원), ColE1 또는 rep(대장균의 복제 기원), 또는 클로스트리듐 세포 내에서 벡터, 전형적으로 플라스미드를 유지시킬 수 있게 하는 임의의 다른 복제 기원으로부터 선택될 수 있다.
관심 종결 서열은 adc 및 thl 유전자의 종결 서열, bcs 오페론의 종결 서열, 또는 클로스트리듐 내에서 전사의 중지를 위한, 당업자에게 잘 알려진 임의의 다른 종결인자로부터 선택될 수 있다.
관심 선택 유전자는 ermB, catP, bla, tetA, tetM, 및 암피실린, 에리쓰로마이신, 클로람페니콜, 티암페니콜, 테트라사이클린 또는 당업자에게 잘 알려진 클로스트리듐 속의 박테리아를 선택하는데 사용될 수 있는 임의의 다른 항생제에 대한 내성을 위한 임의의 다른 유전자로부터 선택될 수 있다.
구체적인 벡터는 하나 이상의 발현 카세트를 포함하고, 각각의 카세트는 gRNA를 코딩한다.
구체적인 실시형태에서, 본 발명은 청구항에서 확인된 바와 같은 "제1" 핵산으로서 그 서열이 SEQ ID NO: 5, SEQ ID NO: 6 및 SEQ ID NO: 7의 서열 중 하나로부터 선택되는 플라스미드 벡터를 포함하는 유전자 도구에 관한 것이다.
구체적인 실시형태에서, 본 발명은 "제2" 또는 "n번째" 핵산으로서, 그 서열이 SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10 및 SEQ ID NO: 11의 서열 중 하나로부터 선택되는 플라스미드 벡터를 포함하는 유전자 도구에 관한 것이다.
관심 서열은 선택된 복구 주형에 의해 가이드되는 상동성 재조합 기전을 통해 박테리아 게놈에 도입된다(CRISPR 기술에 따름). 관심 서열은 박테리아 게놈 내의 표적화된 부분을 치환한다. 따라서 재조합 과정은 박테리아의 게놈 내에서 표적화 부분의 전체 또는 부분 변형 또는 결실을 가능하게 하거나 또는 박테리아의 게놈에 핵산 단편(구체적인 실시형태에서 거대 단편)의 삽입을 가능하게 한다. 선택된 복구 주형은 실제로, 원하는 형질전환의 성질에 따라 박테리아 게놈의 표적화 서열의 전부 또는 일부, 또는 다소간 변형된 이의 이형을 포함할 수 있다. DNA의 표적화된 부분처럼, 따라서 주형은 그 자체가 천연 및/또는 합성, 코딩 및/또는 비코딩 서열에 상응하는 하나 이상의 핵산 서열 또는 핵산 서열 부분을 포함할 수 있다. 주형은 예를 들어 박테리아 생존, 구체적으로 클로스트리듐 속의 박테리아의 생존에 필수적인 유전자, 또는 그의 불활성화가 하나 이상의 관심 핵산이 통합된 클로스트리듐 속의 박테리아의 선택을 가능하게 하는 하나 이상의 유전자 또는 DNA 서열에 상응하는 하나 이상의 서열 또는 서열의 일부분(들)을 포함할 수 있다. 주형은 또한 하나 이상의 "외래" 서열, 즉 클로스트리듐 속에 속하는 박테리아의 게놈 또는 상기 속의 특정 종의 게놈에 자연적으로 부재하는 서열을 포함할 수 있다. 주형은 또한 상기 기술된 바와 같은 서열의 조합을 포함할 수 있다.
관심 서열의 구체적인 예는 실험 부문에서 사용되는 서열들이다. 이들은 예를 들어 서열 upp_del(SEQ ID NO: 12) 및 upp_중지(SEQ ID NO: 13)이다.
본 발명에 따른 유전자 도구는 복구 주형이, 관심 핵산, 전형적으로 적어도 1개 염기쌍(bp), 바람직하게는 적어도 1, 2, 3, 4, 5, 10, 15, 20, 50, 100, 1,000, 10,000, 100,000 또는 1,000,000 bp, 전형적으로 1 bp 내지 20 kb 또는 1 bp 내지 10 kb, 바람직하게는 10 bp 내지 20 kb 또는 10 bp 내지 10 kb, 예를 들어 1 bp 내지 2 kb를 포함하는 DNA 서열 또는 서열 부분의, 클로스트리듐 속의 박테리아의 박테리아 게놈 내로의 도입을 가이드할 수 있게 한다.
구체적인 실시형태에서, 관심 DNA 서열은 적어도 하나의 관심 생성물, 바람직하게는 용매의 생성을 촉진하는 생성물, 전형적으로 적어도 하나의 관심 단백질, 예를 들어 효소; 막 단백질 예컨대 트랜스포터; 전사 인자; 또는 이의 조합을 코딩한다.
바람직한 실시형태에서, 관심 DNA 서열은 용매의 생성을 촉진하고 전형적으로 i) 예를 들어 알코올 디히드로게나제를 코딩하는 서열(예를 들어 adh, adhE, adhE1, adhE2, bdhA, 및 bdhB에서 선택된 서열), 트랜스퍼라제를 코딩하는 서열(예를 들어, ctfA, ctfB, atoA 및 atoB에서 선택된 서열), 디카복실라제를 코딩하는 서열(예를 들어, adc), 히드로게나제를 코딩하는 서열(예를 들어, etfA, etfB 및 hydA에서 선택된 서열), 및 이의 조합에서 선택되는, 효소, 바람직하게는 알데하이드에서 알코올로의 전환에 관여하는 효소를 코딩하는 서열, ii) 막 단백질을 코딩하는 서열, 예를 들어 포스포트랜스퍼라제를 코딩하는 서열(예를 들어, glcG, bglC, cbe4532, cbe4533, cbe4982, cbe4983, cbe0751에서 선택된 서열), 및 iii) 전사 인자를 코딩하는 서열(예를 들어, sigE, sigF, sigG, sigH, sigK에서 선택된 서열)에서 선택된다.
본 발명은 또한 클로스트리듐 속의 박테리아, 바람직하게는 클로스트리듐 속의 용매형성성 박테리아를 상동성 재조합에 의해 형질전환 및/또는 유전자 변형시키는 방법에 관한 것이다. 상기 방법은 본 출원에서 개시된 바와 같은 본 발명에 따른 유전자 도구를 박테리아에 도입시키는 단계를 포함한다. 상기 방법은 형질전환된 박테리아, 즉 하나 이상의 원하는 재조합/최적화를 갖는 박테리아를 획득하는 단계를 더 포함할 수 있다.
클로스트리듐 속의 용매형성성 박테리아를 상동성 재조합에 의해 형질전환 및/또는 유전자 변형시키기 위한 본 발명에 따른 구체적인 방법은 순서대로, 하기 단계를 포함한다:
a) 적어도 하나의 유도성 프로모터를 포함하는 본 출원에 개시된 바와 같은 본 발명에 따른 유전자 도구를 박테리아에 도입시키는 단계, 및
b) 박테리아를 유전자 변형시키기 위해 유도성 프로모터의 발현을 유도시키는 단계.
본 발명에 따른 유전자 도구의 성분(핵산 또는 gRNA)을 박테리아에 도입시키는 것은 당업자에게 공지된 임의의 직접 또는 간접 방법, 예를 들어 형질전환, 접합, 미세주입, 형질감염, 전기천공 등, 바람직하게는 형질전환에 의해 수행된다(Lutke-Eversloh, 2014).
필요한 경우, 유도 단계는 본 발명에 따른 유전자 도구를 표적 박테리아에 도입시킨 후 당업자에게 공지된 임의 방법으로 실행할 수 있다. 이는 예를 들어 충분한 양으로 존재하는 적합한 물질과 박테리아를 접촉시키거나, 또는 UV 광에 노출시켜 수행된다. 상기 물질은 선택된 유도성 프로모터에 연결된 발현의 억제를 풀어준다. 선택된 프로모터가 Pcm-2tetO1 및 Pcm-tetO2/1에서 선택되는, 언히드로테트라사이클린(aTc)-유도성 프로모터인 경우, aTc는 바람직하게는 약 1 ng/mL 내지 약 5000 ng/mL, 바람직하게는 1 mL 당 약 100 ng 내지 약 500 ng/mL 또는 1 mL 당 약 200 ng 내지 약 300 ng/mL, 예를 들어 약 250 ng/mL 범위의 농도로 사용된다.
구체적인 실시형태에서, 방법은 존재하는 경우 단계 b) 이후에, i) 이미 도입된 것 또는 도입된 것들과 상이한 복구 주형 및 ii) 박테리아의 게놈의 표적화 구역으로 그들의 통합을 가능하게 하는 하나 이상의 가이드 RNA를 코딩하는, n번째, 예를 들어 제3, 제4, 제5 등의 핵산을 도입시키는 하나 이상의 추가 단계를 포함하고, 각각의 추가 단계는, 바람직하게는 유리하게 이전에 도입된 복구 주형을 코딩하는 핵산의 제거 단계로서 이후에 박테리아 세포는 상기 핵산이 "소거된" 것으로 간주되는 것인 단계, 및 바람직하게는 이전에 도입된 하나 이상의 가이드 RNA 또는 하나 이상의 가이드 RNA를 코딩하는 서열의 제거 단계가 선행된다.
구체적으로 유리한 방식으로, 그리고 종래 이용가능한 도구와 대조적으로, 본 발명에 따른 유전자 도구는 한 단계로, 즉 단일 핵산(전형적으로 본 명세서에서 개시하는 바와 같은 "제2" 핵산)을 사용하거나, 또는 몇몇 단계로, 즉 몇몇 핵산(전형적으로 본 명세서에서 개시하는 바와 같은 "제2" 및 하나 이상의 "n번째" 핵산)을 사용하여, 바람직하게는 한 단계로, 소형 크기뿐만 아니라 대형 크기의 관심 서열의 도입을 가능하게 한다.
본 발명의 구체적인 실시형태에서, 이러한 "n번째" 핵산은 박테리아 DNA의 표적화 부분을 결실시키거나 또는 보다 짧은 서열(예를 들어, 적어도 하나의 염기쌍이 결실된 서열) 및/또는 비기능성인 서열에 의해 치환된다. 본 발명의 구체적으로 바람직한 실시형태에서, "제2" 또는 "n번째" 핵산은 유리하게는 박테리아 게놈에 적어도 하나의 염기쌍, 및 최대 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13 kb를 포함하는 관심 핵산을 도입시킨다.
관심 핵산은 사용된 gRNA에 따라서 동일하거나 또는 상이한 영역에서 박테리아 염색체, 및 유용한 것으로 입증된다면 박테리아 생존에 필수적인 유전자, 예를 들어 유전자 gyrA, pfkA, hydA, crt, thl, hbd, 또는 클로스트리듐 속의 박테리아의 생존에 필수적인 것으로 당업자에게 알려진 임의의 다른 유전자 중 하나를 포함하는 박테리아 게놈의 일부분, 및/또는 그 불활성화가 하나 이상의 관심 핵산이 통합된 박테리아의 선택을 가능케 하는 유전자 또는 DNA 서열, 예를 들어 upp 유전자에 삽입될 수 있다.
본 발명에 의해서, 전형적으로 본 발명에 따른 유전자 도구 및 방법에 의해서, 형질전환된 관심 박테리아, 예를 들어 그것이 유래된 박테리아와 유전자형 또는 표현형 차이를 갖는 향상된 변이체, 전형적으로 산업적으로 유용한 박테리아, 예를 들어 용매 또는 생물연료의 생산에 유용한 박테리아가 획득되도록 클로스트리듐 속의 박테리아를 효율적으로(고빈도의 상동성 재조합), 실질적으로(대형 크기의 관심 핵산을 박테리아의 게놈 내에 도입시키는 것이 가능), 그리고 안정하게(형질전환된 박테리아를 항생제와 접촉시켜 유지시킬 필요없음) 변형시키는 것이 이제 가능하다.
본 발명의 또 다른 목적은 본 발명에 따른 방법 및/또는 유전자 도구를 사용하여 형질전환된, 클로스트리듐 속의 박테리아, 전형적으로 클로스트리듐 속의 용매형성성 박테리아에 관한 것이다. 이러한 박테리아는 복구 주형을 사용하는 상동성 재조합에 의해 그의 게놈에 도입된 하나 이상의 관심 핵산을 발현한다. 이러한 박테리아는 본 발명에 따른 유전자 도구의 전부 또는 일부, 전형적으로 Cas9 또는 Cas9를 코딩하는 핵산을 포함할 수 있다.
본 발명에 따른 방법 및 유전자 도구를 사용하여 형질전환된, 본 발명에 따른 클로스트리듐 속의 구체적인 박테리아, 예를 들어 박테리아 ATCC824는 더 이상 pSOL 메가플라스미드를 함유하지 않는다.
구체적인 실시형태에서, 본 발명에 따른 방법 및 유전자 도구를 사용하여 형질전환된, 본 발명에 따른 클로스트리듐 속의 박테리아는 그의 게놈에 자발적으로 도입된 하나 이상의 관심 핵산의 발현에 의해서만 하나 이상의 용매를 생성시킬 수 있다.
본 발명은 또한 본 명세서에 개시된 바와 같은 유전자 도구의 성분의 전부 또는 일부, 전형적으로 i) Cas9를 코딩하는 제1 핵산으로서, 여기서 Cas9 코딩 서열은 프로모터의 제어 하에 위치되는 것인 제1 핵산, 및 ii) 상동성 재조합 기전에 의해서, Cas9-표적화 박테리아 DNA의 일부분의 관심 서열로의 치환을 허용하는 복구 주형을 코딩하는 적어도 제2 핵산, 및 임의로는 도구 내에서 임의로 사용되는 선택된 유도성 프로모터(들)에 적합화된 하나 이상의 유도인자를 포함하는, 클로스트리듐 속의 박테리아를 형질전환 및/또는 유전자 변형시키기 위한 키트에 관한 것이다.
본 발명에 따른 구체적인 키트는 태그를 포함하는 Cas9 단백질의 발현을 가능하게 한다.
본 발명에 따른 키트는 하나 이상의 소모품 예컨대 배양 배지, 적어도 하나의 클로스트리듐 속의 컴피턴트 박테리아(즉, 형질전환에 사용하기 위해 패키징됨), 적어도 하나의 gRNA, Cas9 단백질, 하나 이상의 선택 분자, 또는 설명서 세트를 더 포함할 수 있다.
본 발명은 전형적으로 본 명세서에 개시된 형질전환 방법의 실시 또는 클로스트리듐 속의 박테리아를 사용하여 용매(들)(적어도 하나의 용매)의 생성을 위한 키트에 관한 것이다.
본 발명은 마지막으로, 클로스트리듐 속의 박테리아, 전형적으로 클로스트리듐 속의 용매형성성 박테리아를 형질전환 및/또는 유전자 변형시키기 위한, 예를 들어, 클로스트리듐 속의 박테리아의 향상된 변이체를 발생시키기 위한, 본 발명에 따른 유전자 도구, 또는 방법, 또는 키트의 잠재적인 용도에 관한 것이다.
마지막으로, 본 발명은 전형적으로 산업적 규모로, 구체적으로 용매 또는 생물연료, 또는 이의 혼합물의 생성을 위한, 본 발명에 따른 유전자 도구, 방법, 키트 또는 형질전환된 클로스트리듐 속의 박테리아의 잠재적인 용도에 관한 것이다. 생성될 가능성이 있는 용매는 전형적으로 아세톤, 부탄올, 에탄올, 이소프로판올 또는 이의 혼합물, 전형적으로 에탄올/이소프로판올, 부탄올/이소프로판올, 또는 에탄올/부탄올 혼합물, 바람직하게는 이소프로판올/부탄올 혼합물이다.
구체적인 실시형태에서, 에탄올/이소프로판올 혼합물의 비는 적어도 1/4과 같다. 상기 비는 바람직하게는 1/3 내지 1, 보다 바람직하게는 1과 같다.
구체적인 실시형태에서, 에탄올/부탄올 혼합물의 비는 적어도 1/4과 같다. 상기 비는 바람직하게는 1/3 내지 1, 보다 바람직하게는 1과 같다.
구체적인 실시형태에서, 이소프로판올/부탄올 혼합물의 비는 적어도 1/4과 같다. 상기 비는 바람직하게는 1/3 내지 1, 보다 바람직하게는 1과 같다.
본 발명에 따른 형질전환된 박테리아의 용도는 전형적으로 산업적 규모로 적어도 100 톤의 아세톤, 적어도 100 톤의 에탄올, 적어도 1000 톤의 이소프로판올, 적어도 1800 톤의 부탄올, 또는 적어도 40,000 톤의 이의 혼합물의 연간 생산을 가능하게 한다.
이하의 실시예 및 도면의 목적은 이의 범주를 제한하지 않고 본 발명을 보다 완전하게 예시하려는 것이다.
도 1: 클로스트리듐의 용매형성성 균주의 물질대사. ABE 균주는 아세톤, 에탄올 및 부탄올을 생성시키는 한편, IBE 균주는 아세톤을 이소프로판올로 전환시키는 adh 유전자를 보유한다. 문헌 [Lee et al., 2012]을 변형시킴.
도 2: CRISPR의 작용 방식(Mali et al.)
도 3: 게놈 편집을 위한 CRISPR-Cas9의 용도. 이중 가닥 파괴는 gRNA에 의해 지정된, Cas9 뉴클레아제에 의해 생성된다. 상동성 재조합에 의한 이러한 파괴의 복구는 복구 주형에 함유된 변형의 게놈 내로의 도입을 가능하게 한다. 도면은 문헌 [Ann Ran et al., 2013]의 것을 변형시켰다.
도 4: upp 표적화 플라스미드. pIP404, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균(E. coli)의 복제 기원. catP, 클로람페니콜 아세틸트랜스퍼라제 유전자(클로람페니콜/티암페니콜 내성 유전자). CDS, 코딩 서열.
도 5: pSOL 표적화 플라스미드. pIP404, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균 복제 기원. catP, 클로람페니콜 아세틸 트랜스퍼라제 유전자(클로람페니콜/티암페니콜 내성 유전자). CDS, 코딩 서열.
도 6: pEC500E-miniPthl-Cas9 벡터 지도. pAMβ1, 씨. 아세토부틸리컴의 복제 기원. rep, 대장균의 복제 기원. bla, β-락타마제 유전자(암피실린 내성). ermB, 메틸라제(에리쓰로마이신 내성). CDS, 코딩 서열.
도 7: 야생형 균주 및 획득된 형질전환체에서 cas9에 의해 표적화된 구역의 서열분석. NC_003030, 클로스트리듐 아세토부틸리컴 ATCC824의 서열(GenBank); crRNA, gRNA에 의해 인식되는 부위; PAM, protospacer adjacent motif, Cas9 결합에서 역할을 함. CDS, 코딩 서열. SEQ ID NO: 22는 도 7에 표시된 NC_003030 단편에 상응하고 SEQ ID NO: 23은 각각 "upp_중지 복구 주형", "ATCC824" 및 "ATCC824 upp-"로서 식별되는 서열의 도 7에 표시된 단편에 상응한다.
도 8: 증폭 결과.
A: catP_fwd x catP_rev(예상 크기: 709 bp)
B: RH_ctfB_R x V-CTFA-CAC2707_R(예상 크기: 351 bp)
1: 2-로그 마커(NEB). 2: H20, 음성 대조군. 3: 비형질전환 ATCC824. 4: pEC500E-miniPthl-cas9로 형질전환된 ATCC824. 5 & 6: pEC500E-miniPthl-cas9 및 pEC750C로 형질전환된 ATCC824(2종의 독립된 형질전환체). 7 & 8: pEC500E-miniPthl-cas9 및 pEC750C-gRNA_adhE로 형질전환된 ATCC824(2종의 독립된 형질전환체).
도 9: ATCC824로부터 유래된 균주의 α-아밀라제 활성의 검출. 1: ATCC824; 2: pEC500E 및 pEC750C로 형질전환된 ATCC824; 3: pEC500E-miniPthl-cas9 및 pEC750C로 형질전환된 ATCC824; 4: pEC500E 및 pEC750C-gRNA_adhE로 형질전환된 ATCC824; 5: pEC500E-miniPthl-cas9 및 pEC750C-gRNA_adhE로 형질전환된 ATCC824.
도 10: 야생형 균주 및 형질전환체의 발효 결과(2종의 기술적 복제물).
도 11: A/B. cas9을 위한 유도성 발현 플라스미드. repH, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균의 복제 기원. ermB, 메틸라제(에리쓰로마이신 내성). tetR, 전사 억제인자 TetR을 코딩하는 유전자. CDS, 코딩 서열.
도 12: 프로모터 Pcm-2tetO1 및 Pcm-tetO2/1로부터 출발하는 발현에 대한 유도의 효과. 상기 프로모터들은 gusA 유전자의 하류에 위치시켰고, GusA 활성은 100 ng/mL의 aTc의 부재 또는 존재 하에, 씨. 아세토부틸리컴 ATCC824 세포에서 측정하였다. 문헌 [Dong et al., 2012]을 변형시킴.
도 13: pEC750C-gRNA_upp를 함유하는 형질전환체의 생존능에 대한 aTc 농도의 효과.
도 14: 5-FU-낸성 돌연변이체의 생성. 액체 배양액의 연속 희석물을 다양한 배지 상에 침적시켰다. 상동성 재조합 사건이 복구 주형의 삽입을 가능하게 한 형질전환체만이 2YTG + 5-FU 상에서 성장할 수 있었다. 백색 화살표는 후속되는 실험에 선택된 콜로니를 나타낸다. ND, 희석하지 않음.
도 15: upp_del 형질전환체의 PCR 분석.
A. upp 유전자 주변의 유전자 구성. 코딩 서열은 화살표로 나타낸다. 회색 직사각형은 upp_del 주형에서 부재하는 영역을 나타낸다. 사용된 프라이머는 삼각형으로 표시한다. CDS, 코딩 서열. PAM, protospacer adjacent motif, Cas9 결합에서 역할을 함.
B. 증폭 결과. M: 2-로그 마커(NEB). 1: H20, 음성 대조군. 2: 비형질전환된 ATCC824.
3: aTc에 노출 전 pFW0001-Pcm-2tetO1-cas9 및 pEC750CgRNA_upp-upp_del로 형질전환된 ATCC824. 4 & 5: 2YTG+5-FU 상에서 단리된, aTc에 노출 전 pFW0001-Pcm-2tetO1-cas9 및 pEC750CgRNA_upp-upp_del로 형질전환된 ATCC824(2종의 독립된 형질전환체).
도 16: 2YTG+5-FU 상에서 단리된 콜로니에서 cas9-표적화 구역의 서열분석.
NC_003030, 클로스트리듐 아세토부틸리컴 ATCC824의 서열(GenBank); crRNA, gRNA에 의해 인식되는 부위; PAM, protospacer adjacent motif, Cas9 결합에서 역할을 함. CDS, 코딩 서열. SEQ ID NO: 24는 도 16에 표시된 ATCC824 균주의 게놈 서열의 단편에 상응하고 SEQ ID NO: 25는 각각 "upp_중지 주형", "클론 pFW0001-Pcm-2tetO1-cas9 - pEC750C-gRNA_upp-upp_중지1" 및 "클론 pFW0001-Pcm-tetO2/1-cas9 - pEC750C-gRNA_upp-upp_중지1" 및 "클론 pFW0001-Pcm-tetO2/1-cas9 - pEC750C-gRNA_upp-upp_중지2"로서 식별되는 서열의 도 16에 표시된 단편에 상응한다.
도 17: pEC750C-gRNA_upp-Δupp::ipa8 플라스미드. pIP404, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균의 복제 기원. 아세틸트랜스퍼라제(클로람페니콜/티암페니콜 내성 유전자). CDS, 코딩 서열. RHA/LHA: upp 유전자의 측접 서열(ca_c2879).
도 18: 프라이머 CA_C2877 및 CA_C2882를 사용한 증폭 결과. M, 2-로그 크기 마커(NEB). P, pEC750C-gRNA_upp-Δupp::ipa8; WT, ATCC 824.
도 19: ATCC 824 및 돌연변이체 upp_del 및 Δupp::ipa8에 의한 용매의 생성. 오차 막대는 이중으로 수행된 실험의 표준 편차를 나타낸다. upp_del 및 Δupp::ipa8에 대해 획득된 데이터는 각 경우에서 2종의 생물학적으로 독립적인 돌연변이체에 대해 획득된 평균이다.
도 20: 엔도글루카나제 CelA(pWUR3) CelD(pWUR 4)를 발현하는 다양한 균주 및 빈 플라스미드를 발현하는 대조군 균주의 한천 상에서의 엔도글루카나제 활성 측정. 이들 다양한 균주는 0.2% CMC를 함유하는 페트리 디쉬 상에서 48시간 동안 인큐베이션하였다. 콩고 레드 염색으로 가시화시킨 가수분해 후광(halo)은 각 균주의 엔도글루카나제 활성을 특징짓는다. 대조군 균주 상에서는 후광을 검출할 수 없는 한편, 엔도글루카나제 CelA 또는 CelD를 발현하는 균주에서는 분명하게 볼 수 있다.
도 21: pSEC500E_X_Cas9 플라스미드. pAMB1, 씨. 베이제린키의 복제 기원; PxylB, xylB 프로모터; ColE1 기원, 대장균의 복제 기원; AmpR, 암피실린 내성 유전자; PermB, ermB 유전자 프로모터; ermB, 에리쓰로마이신 내성 유전자; 2 마이크론 ori, 효모의 복제 기원; URA3, 영양요구성 마커.
도 22: pS_celAS1 플라스미드. HS1 및 HS2, 상동성 서열; aad9, 스펙티노마이신 내성 유전자; pCB102, 씨. 베이제린키의 복제 기원; ColE1 기원, 대장균에서의 복제 기원. PeglA, eglA 유전자 프로모터.
도 23: 증가되는 농도의 자일로스를 함유하는 CGM 한천 배지 상에서의 씨. 베이제린키 NCIMB8052의 재조합 균주 (pEC500E_Xcas9, pS_celAS1)의 선택.
도 24: celA 유전자가 통합된 NCIMB8052 균주 및 NCIMB8052 균주의 PCR에 의한 확인. M, GeneRuler 1kb DNA 래더(ThermoFisher).
도 2: CRISPR의 작용 방식(Mali et al.)
도 3: 게놈 편집을 위한 CRISPR-Cas9의 용도. 이중 가닥 파괴는 gRNA에 의해 지정된, Cas9 뉴클레아제에 의해 생성된다. 상동성 재조합에 의한 이러한 파괴의 복구는 복구 주형에 함유된 변형의 게놈 내로의 도입을 가능하게 한다. 도면은 문헌 [Ann Ran et al., 2013]의 것을 변형시켰다.
도 4: upp 표적화 플라스미드. pIP404, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균(E. coli)의 복제 기원. catP, 클로람페니콜 아세틸트랜스퍼라제 유전자(클로람페니콜/티암페니콜 내성 유전자). CDS, 코딩 서열.
도 5: pSOL 표적화 플라스미드. pIP404, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균 복제 기원. catP, 클로람페니콜 아세틸 트랜스퍼라제 유전자(클로람페니콜/티암페니콜 내성 유전자). CDS, 코딩 서열.
도 6: pEC500E-miniPthl-Cas9 벡터 지도. pAMβ1, 씨. 아세토부틸리컴의 복제 기원. rep, 대장균의 복제 기원. bla, β-락타마제 유전자(암피실린 내성). ermB, 메틸라제(에리쓰로마이신 내성). CDS, 코딩 서열.
도 7: 야생형 균주 및 획득된 형질전환체에서 cas9에 의해 표적화된 구역의 서열분석. NC_003030, 클로스트리듐 아세토부틸리컴 ATCC824의 서열(GenBank); crRNA, gRNA에 의해 인식되는 부위; PAM, protospacer adjacent motif, Cas9 결합에서 역할을 함. CDS, 코딩 서열. SEQ ID NO: 22는 도 7에 표시된 NC_003030 단편에 상응하고 SEQ ID NO: 23은 각각 "upp_중지 복구 주형", "ATCC824" 및 "ATCC824 upp-"로서 식별되는 서열의 도 7에 표시된 단편에 상응한다.
도 8: 증폭 결과.
A: catP_fwd x catP_rev(예상 크기: 709 bp)
B: RH_ctfB_R x V-CTFA-CAC2707_R(예상 크기: 351 bp)
1: 2-로그 마커(NEB). 2: H20, 음성 대조군. 3: 비형질전환 ATCC824. 4: pEC500E-miniPthl-cas9로 형질전환된 ATCC824. 5 & 6: pEC500E-miniPthl-cas9 및 pEC750C로 형질전환된 ATCC824(2종의 독립된 형질전환체). 7 & 8: pEC500E-miniPthl-cas9 및 pEC750C-gRNA_adhE로 형질전환된 ATCC824(2종의 독립된 형질전환체).
도 9: ATCC824로부터 유래된 균주의 α-아밀라제 활성의 검출. 1: ATCC824; 2: pEC500E 및 pEC750C로 형질전환된 ATCC824; 3: pEC500E-miniPthl-cas9 및 pEC750C로 형질전환된 ATCC824; 4: pEC500E 및 pEC750C-gRNA_adhE로 형질전환된 ATCC824; 5: pEC500E-miniPthl-cas9 및 pEC750C-gRNA_adhE로 형질전환된 ATCC824.
도 10: 야생형 균주 및 형질전환체의 발효 결과(2종의 기술적 복제물).
도 11: A/B. cas9을 위한 유도성 발현 플라스미드. repH, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균의 복제 기원. ermB, 메틸라제(에리쓰로마이신 내성). tetR, 전사 억제인자 TetR을 코딩하는 유전자. CDS, 코딩 서열.
도 12: 프로모터 Pcm-2tetO1 및 Pcm-tetO2/1로부터 출발하는 발현에 대한 유도의 효과. 상기 프로모터들은 gusA 유전자의 하류에 위치시켰고, GusA 활성은 100 ng/mL의 aTc의 부재 또는 존재 하에, 씨. 아세토부틸리컴 ATCC824 세포에서 측정하였다. 문헌 [Dong et al., 2012]을 변형시킴.
도 13: pEC750C-gRNA_upp를 함유하는 형질전환체의 생존능에 대한 aTc 농도의 효과.
도 14: 5-FU-낸성 돌연변이체의 생성. 액체 배양액의 연속 희석물을 다양한 배지 상에 침적시켰다. 상동성 재조합 사건이 복구 주형의 삽입을 가능하게 한 형질전환체만이 2YTG + 5-FU 상에서 성장할 수 있었다. 백색 화살표는 후속되는 실험에 선택된 콜로니를 나타낸다. ND, 희석하지 않음.
도 15: upp_del 형질전환체의 PCR 분석.
A. upp 유전자 주변의 유전자 구성. 코딩 서열은 화살표로 나타낸다. 회색 직사각형은 upp_del 주형에서 부재하는 영역을 나타낸다. 사용된 프라이머는 삼각형으로 표시한다. CDS, 코딩 서열. PAM, protospacer adjacent motif, Cas9 결합에서 역할을 함.
B. 증폭 결과. M: 2-로그 마커(NEB). 1: H20, 음성 대조군. 2: 비형질전환된 ATCC824.
3: aTc에 노출 전 pFW0001-Pcm-2tetO1-cas9 및 pEC750CgRNA_upp-upp_del로 형질전환된 ATCC824. 4 & 5: 2YTG+5-FU 상에서 단리된, aTc에 노출 전 pFW0001-Pcm-2tetO1-cas9 및 pEC750CgRNA_upp-upp_del로 형질전환된 ATCC824(2종의 독립된 형질전환체).
도 16: 2YTG+5-FU 상에서 단리된 콜로니에서 cas9-표적화 구역의 서열분석.
NC_003030, 클로스트리듐 아세토부틸리컴 ATCC824의 서열(GenBank); crRNA, gRNA에 의해 인식되는 부위; PAM, protospacer adjacent motif, Cas9 결합에서 역할을 함. CDS, 코딩 서열. SEQ ID NO: 24는 도 16에 표시된 ATCC824 균주의 게놈 서열의 단편에 상응하고 SEQ ID NO: 25는 각각 "upp_중지 주형", "클론 pFW0001-Pcm-2tetO1-cas9 - pEC750C-gRNA_upp-upp_중지1" 및 "클론 pFW0001-Pcm-tetO2/1-cas9 - pEC750C-gRNA_upp-upp_중지1" 및 "클론 pFW0001-Pcm-tetO2/1-cas9 - pEC750C-gRNA_upp-upp_중지2"로서 식별되는 서열의 도 16에 표시된 단편에 상응한다.
도 17: pEC750C-gRNA_upp-Δupp::ipa8 플라스미드. pIP404, 씨. 아세토부틸리컴의 복제 기원. ColE1, 대장균의 복제 기원. 아세틸트랜스퍼라제(클로람페니콜/티암페니콜 내성 유전자). CDS, 코딩 서열. RHA/LHA: upp 유전자의 측접 서열(ca_c2879).
도 18: 프라이머 CA_C2877 및 CA_C2882를 사용한 증폭 결과. M, 2-로그 크기 마커(NEB). P, pEC750C-gRNA_upp-Δupp::ipa8; WT, ATCC 824.
도 19: ATCC 824 및 돌연변이체 upp_del 및 Δupp::ipa8에 의한 용매의 생성. 오차 막대는 이중으로 수행된 실험의 표준 편차를 나타낸다. upp_del 및 Δupp::ipa8에 대해 획득된 데이터는 각 경우에서 2종의 생물학적으로 독립적인 돌연변이체에 대해 획득된 평균이다.
도 20: 엔도글루카나제 CelA(pWUR3) CelD(pWUR 4)를 발현하는 다양한 균주 및 빈 플라스미드를 발현하는 대조군 균주의 한천 상에서의 엔도글루카나제 활성 측정. 이들 다양한 균주는 0.2% CMC를 함유하는 페트리 디쉬 상에서 48시간 동안 인큐베이션하였다. 콩고 레드 염색으로 가시화시킨 가수분해 후광(halo)은 각 균주의 엔도글루카나제 활성을 특징짓는다. 대조군 균주 상에서는 후광을 검출할 수 없는 한편, 엔도글루카나제 CelA 또는 CelD를 발현하는 균주에서는 분명하게 볼 수 있다.
도 21: pSEC500E_X_Cas9 플라스미드. pAMB1, 씨. 베이제린키의 복제 기원; PxylB, xylB 프로모터; ColE1 기원, 대장균의 복제 기원; AmpR, 암피실린 내성 유전자; PermB, ermB 유전자 프로모터; ermB, 에리쓰로마이신 내성 유전자; 2 마이크론 ori, 효모의 복제 기원; URA3, 영양요구성 마커.
도 22: pS_celAS1 플라스미드. HS1 및 HS2, 상동성 서열; aad9, 스펙티노마이신 내성 유전자; pCB102, 씨. 베이제린키의 복제 기원; ColE1 기원, 대장균에서의 복제 기원. PeglA, eglA 유전자 프로모터.
도 23: 증가되는 농도의 자일로스를 함유하는 CGM 한천 배지 상에서의 씨. 베이제린키 NCIMB8052의 재조합 균주 (pEC500E_Xcas9, pS_celAS1)의 선택.
도 24: celA 유전자가 통합된 NCIMB8052 균주 및 NCIMB8052 균주의 PCR에 의한 확인. M, GeneRuler 1kb DNA 래더(ThermoFisher).
실시예
본 발명자들은 다음의 2종의 표적에 대해서 본 명세서에서 개시하고 청구한 유전자 도구를 시험하였다: upp 및 adhE 유전자.
upp
유전자의 불활성화
선택된 제1 표적은 간단한 스크리닝을 통해서, 디자인된 유전자 변형 기술을 검증할 수 있게 한다. upp 유전자는 우라실 포스포리보실트랜스퍼라제를 코딩한다. 이 효소는 우라실로부터 우라실 모노포스페이트(UMP)를 형성할 뿐만 아니라, 또한 5-플루오로우라실(5-FU)로부터 5-플루오로우라실 모노포스페이트(5-FUMP)를 형성한다. 5-FUMP는 RNA 합성을 차단하는 세포에 유해한 화합물이다. 결과적으로, 이의 게놈에 upp 유전자를 함유하는 박테리아는 이 유전자를 발현하지 않는 균주와 대조적으로, 5-FU를 함유하는 배지 상에서 성장할 수 없을 것이다.
이 유전자의 표적화는 간단한 표현형 관찰에 의해, 변형 전략이 유효한지 여부를 간단하고 신속하게 결정할 수 있게 한다. upp를 표적으로 하는 3종의 플라스미드를 구축하였다(도 4 + SEQ ID NO: 9, 10 및 11 참조). 이들 3종 모두는 유전자를 표적으로 하는 동일한 gRNA를 함유하고, 이들 중 2종은 또한 결실 또는 점 돌연변이를 생성시키는 도구의 능력을 보여주기 위해 상이한 복구 주형을 함유한다:
● upp_del 주형(SEQ ID NO: 12)은 gRNA에 의해 결정되는 파괴 부위의 각 측면으로부터 150-nt에 위치된 2개의 500-뉴클레오티드(nt) 단편을 함유한다. 파괴를 복구하기 위한 이 주형의 사용은 upp 유전자의 코딩 서열 내에서 300-nt 결실을 야기하여, 후자가 이후에 불활성 단백질을 코딩하게 될 것이다.
● upp_중지 주형(SEQ ID NO: 13)은 Cas9이 불완전하고 불활성인 단백질을 코딩할 유전자를 더이상 표적으로 할 수 없는 방식으로 넌센스 돌연변이(중지 코돈으로의 아미노산을 코딩하는 코돈의 치환을 유도)의 존재에 의해 gRNA 인식 부위에서 변형되는, 파괴 부위의 각 측면 상에 위치된 2개의 650-nt 단편을 함유한다.
pSOL 플라스미드의 상실
선택된 제2 표적은 발효 과정에서 관심 대상이다: 용매형성에 관여하는 유전자 세트, 특히 adhE는 pSOL 메가플라스미드 상에 위치하고, 이의 상실이 아세톤 및 부탄올의 생성을 제거하는 것으로 확인되었다. pSOL 표적화 플라스미드를 사용하는 이들 발효 경로의 제거 후(도 5 참조), 게놈에 직접적으로 관심 유전자를 재도입시키는 것이 가능하다. pSOL을 더이상 함유하지 않는 균주를 획득하기 위해서, adhE를 표적화하기 위한 플라스미드를 구축하였다. 발명자들은 pSOL이 세포에 필수적인 기능을 함유하지 않아, 세포가 이의 존재 없이 생존할 수 있게 된다는 것을 보여주었다.
씨. 아세토부틸리컴 ATCC824에서
cas9
의 항상성 발현
선택된 전략은 2종의 플라스미드의 부수적인 사용을 필요로 한다:
- pEC500E 플라스미드로부터 유래된, 뉴클레아제의 항상성 발현을 위한 벡터:
pEC500E-miniPthl-Cas9 (도 6 + SEQ ID NO: 5 참조);
- pEC750C로부터 유래된, 뉴클레아제 파괴 부위를 결정하고 임의로는 파괴의 복구를 가능하게 하는, 표적화 벡터 중 하나:
● pEC750C-gRNA_upp (SEQ ID NO: 9), upp를 표적으로 하는 gRNA 함유;
● pEC750C-gRNA_upp-upp_del (SEQ ID NO: 10), upp를 표적으로 하는 gRNA 및 upp_del 주형 함유;
● pEC750C-gRNA_upp-upp_중지 (SEQ ID NO: 11), upp를 표적으로 하는 gRNA 및 upp_중지 주형 함유;
● pEC750C-gRNA_adhE (SEQ ID NO: 8), adhE를 표적으로 하는 gRNA 함유.
pEC500E-miniPthl-Cas9 발현 벡터 뿐만 아니라, 빈 벡터에 상응하는 대조군 플라스미드(pEC500E)를 ATCC824 균주에 도입시켰다. 그런 다음, 획득된 2종의 균주를 대조군으로 사용한, pEC750C 벡터로부터 유래된, 표적화 벡터로 형질전환시켰다. 이 제2 형질전환 단계의 결과를 하기 표 1에 표시하였다.
표 1: 형질전환 결과. ++, 획득된 수많은 형질전환체(형질전환 당 102 내지 103 콜로니를 획득함); -, 형질전환체 미획득.
획득된 형질전환 결과는 Cas9이 기능성임을 나타내었다. 실제로, 뉴클레아제가 발현되고 upp 유전자가 gRNA에 의해 표적화되는 경우, 게놈 DNA에 야기된 파괴 및 복구 주형의 부재에서 게놈의 복구를 수행하는 박테리아의 불능(pEC500E-miniPthl-cas9 및 pEC750C-gRNA_upp로 형질전환)으로 인해 형질전환체가 획득되지 않았다.
upp
의 표적화
표적화 벡터가 pEC500E를 함유하는 균주에 도입되는 경우 획득된 결과는, 형질전환체가 각각의 표적화 벡터로 획득되었으므로, ATCC824 균주의 게놈이 cas9 상동체를 함유하지 않는다는 것을 보여준다.
pEC500E-miniPthl-cas9 및 pEC750C-gRNA_upp-upp_중지를 함유하는 형질전환체를 이후에 수회 비선택적 배지 상에 재플레이팅하여, 함유하고 있는 플라스미드가 상실되게 하였다. 콜로니가 그들 플라스미드를 소거하여 항생제에 민감해 지면, upp 유전자(SEQ ID NO: 3)를 서열분석하였다(도 7 참조).
원하는 변형이 실제로 존재하였다. 따라서 2종의 플라스미드의 도입 및 강력한 항상성 프로모터에 의한 cas9 유전자의 발현을 포함하는 CRISPR-Cas9 유전자 도구는 실제로 기능성이다.
adhE
의 표적화
pEC500E-miniPthl-cas9 및 pEC750C_gRNA_adhE 플라스미드로의 야생형 균주 형질전환 동안 형질전환체가 획득되었다. cas9가 활성이므로, 이 결과는 pSOL 메가플라스미드의 파괴가 ATCC824의 생존능에 영향을 미치지 않는다는 것을 나타낸다.
pSOL의 가능한 상실을 확증하기 위해, 다양한 시험을 수행하였다:
- pSOL 상에 존재하는 유전자: ctfB 의 PCR 검출
catP_fwd x catP_rev를 사용하는 PCR은 pEC750C 플라스미드 상에 존재하는, 티암페니콜 내성 유전자의 검출을 가능하게 한다. 이의 검출은 표적화 벡터가 존재한다는 것을 확증시켜준다.
RH_ctfB_R x V-CTFA-CAC2707_R을 사용하는 PCR은 pSOL 메가플라스미드 상에 존재하는 ctfB 유전자의 일부분의 검출을 가능하게 하고, 후자가 세포에 존재하는지 여부를 알 수 있게 한다.
증폭은 pSOL 메가플라스미드가 pEC500E-miniPthl-cas9 및 pEC750C-gRNA_adhE 로 형질전환된 클론에 더이상 존재하지 않는다는 것을 나타내는 것으로 보인다(도 8 참조).
- pSOL 상에 존재하는 유전자에 의해 코딩되는 효소 활성의 검출
pSOL 메가플라스미드에 함유된 유전자 중에서, amyP는 α-아밀라제 활성을 갖는 세포외 효소를 코딩한다. 이 활성은 전분 및 포도당을 함유하는 고형 배지 상에서 검출할 수 있다(Sabathe et al., 2002). 액체 배양액의 희석물을 0.2% 포도당 및 2% 전분을 함유하는 한천 플레이트 상에 침적시키고 72시간 동안 37℃에서 인큐베이션하였다. 그런 다음, α-아밀라제 활성을 요오드 염색에 의해 가시화시켰다. 박테리아 콜로니 주변의 투명한 후광은 α-아밀라제 활성의 존재를 나타낸다. pEC500E-miniPthl-cas9 및 pEC750C-gRNA_adhE를 함유하는 ATCC824 주변의 활성 부재는 amyP 유전자가 이 균주에서 발현되지 않는다는 것을 나타내어, 메가플라스미드가 더이상 존재하지 않는다는 것을 확증시켜준다(도 9 참조).
- 발효 결과
2종의 균주의 발효 결과를 확립하기 위해 게이프스(Gapes) 배지에서 24시간 동안 ATCC824 야생형 균주 및 형질전환체를 성장시켰다. 획득된 발효 결과는, 형질전환체에서 adhE, adhE1 및 adc 유전자(pSOL 메가플라스미드 상에 존재)의 부재로 인한 에탄올 생성의 감소 및 부탄올 및 아세테이트 생성의 제거를 보여준다(도 10 참조).
따라서 Cas9는 ATCC824 균주의 천연 플라스미드 또는 염색체 상에서 작용할 수 있어, 균주에 존재하는 염색체 및 임의의 염색체외 유전자 물질(플라스미드, 박테리오파지 등)로 이의 작용을 넓히는 것이 가능하다.
씨. 아세토부틸리컴 ATCC824에서
cas9
의 유도성 발현
게놈과 복구 주형 간의 상동성 재조합 사건을 가능하게 하기 위해, 뉴클레아제가 활성인 세포의 수를 증가시키는 것이 필요하다(pEC500E-miniPthl-cas9을 함유하는 ATCC824 균주를 표적화 벡터로 형질전환시켰을 때 103 까지). 이를 위해서, 뉴클레아제 발현이 제어되는 시스템이 필요하다. pFW0001 벡터로부터 유래된, cas9 유전자가 언히드로테트라사이클린-유도성 프로모터의 제어 하에 위치하는 2개 벡터를 구축하였다:
● pFW0001-Pcm-2tetO1-cas9 (도 11A + SEQ ID NO: 6 참조);
● pFW0001-Pcm-tetO2/1-cas9 (도 11B + SEQ ID NO: 7 참조);
cas9 발현을 제어하는 프로모터는 전사 억제인자 TetR이 결합하는 오퍼레이터 서열, tetO1 및 tetO2를 함유한다. 이 억제는 언히드로테트라사이클린(aTc)의 존재에 의해 풀어진다. 이 시스템은 적은 누수로 제어된 방출을 가능케 한다. aTc의 존재 하에, 합성은 프로모터 Pcm-2tetO1로부터 출발하여 더 높아진다(도 12 참조).
씨. 아세토부틸리컴 ATCC824의 형질전환:
발현 벡터 및 빈 벡터(pFW0001)를 ATCC824에 도입시켰다. 이후에, 하기 플라스미드를 각 유형의 형질전환체에 도입시켰다(표 2 참조):
● pEC750C-gRNA_upp, upp를 표적으로 하는 gRNA 함유;
● pEC750C-gRNA_upp-upp_del, upp를 표적으로 하는 gRNA 및 upp_del 주형 함유;
● pEC750C-gRNA_upp-upp_중지, upp를 표적으로 하는 gRNA 및 upp_중지 주형 함유;
형질전환된 콜로니는 상이하게 희석하여, 다양한 고형 배지 상에 스트리킹하였다:
● 2YTG + 에리쓰로마이신 (세포 생존능 확인을 위함, 106의 희석 배수);
● 2YTG + 에리쓰로마이신 + 티암페니콜 (형질전환체의 선택을 위함);
● 2YTG + 에리쓰로마이신 + 티암페니콜 + aTc(200 ng/mL) (유도인자 존재 하 형질전환체의 선택을 위함).
표 2: 각각의 형질전환을 위한 각 유형의 배지에서 획득한 콜로니 수.
ery, 에리쓰로마이신. thiam, 티암페니콜. aTc, 언히드로테트라사이클린. 괄호 안, 희석 배수. ND, 희석하지 않음. -, 시험하지 않음.
빈 표적화 벡터(pEC750C, 대조군)가 사용된 경우에도, 존재하는 경우에 소수의 형질전환체가 획득되었으므로, aTc의 독성 효과가 관찰되었다. 예상한 바와 같이, gRNA_upp 카세트를 함유하는 pEC750C가 aTc 함유 배지 상에서 cas9을 발현하는 세포에 도입되었을 때 형질전환체가 획득되지 않았다. 다른 한편으로, aTc가 없는 배지 상에서 각 플라스미드 조합에 대해 많은 형질전환체가 획득되었는데, 이는 cas9이 발현되지 않음을 나타낸다.
aTc의 존재 하에서의 Cas9 발현:
에리쓰로마이신 및 티암페니콜을 함유하는 플레이트 상에서 획득된 다양한 변이체를 동일한 유형의 배지 상에 재플레이팅한 후, 항생제 둘 모두를 함유하는 액체 사전배양물을 접종하는데 사용하였다. 그런 다음, 이들 사전배양물을 시스템이 기능성인지 여부를 결정하기 위해 다양한 농도의 aTc를 함유하는 다른 액체 배양물을 접종하는데 사용하였다.
cas9의 유도:
3종의 형질전환체를 aTc의 존재 하에 cas9 발현을 유도하는 능력을 분석하는데 사용하였다:
pFW0001 및 pEC750C-gRNA_upp를 함유하는 ATCC824;
pFW0001-Pcm-2tetO1-cas9 및 pEC750C-gRNA_upp를 함유하는 ATCC824;
pFW0001-Pcm-tetO2/1-cas9 및 pEC750C-gRNA_upp를 함유하는 ATCC824
에리쓰로마이신, 티암페니콜 및 상승 농도의 aTc를 함유하는 액체 배지를 이들 형질전환체의 액체 사전배양물로부터 접종하였다(도 13 참조). 성장하는 세포의 능력은 72시간의 배양 후 광학 밀도의 측정을 통해 평가하였다.
뉴클레아제를 발현하지 않는 형질전환체는 aTc의 존재에 의해 약간의 영향을 받거나 또는 전혀 영향받지 않았다. 한편, 낮은 aTc 농도에서도, 프로모터 Pcm-2tetO1를 통해 cas9를 발현하는 플라스미드(pFW0001-Pcm-2tetO1-cas9) 및 오직 gRNA만을 함유하는 플라스미드(pEC750C-gRNA_upp)를 함유하는 형질전환체는 상당한 성장 지연을 나타냈다. 프로모터 Pcm-tetO2/1를 통해 cas9을 발현하는 플라스미드(pFW0001-Pcm-tetO2/1-cas9) 및 gRNA 만을 함유하는 플라스미드(pEC750C-gRNA_upp)를 함유하는 형질전환체는 낮은 aTc 농도에서 영향받지 않았다.
그러나, 150 ng/mL에서 출발하여, 강력한 성장 지연이 관찰되었고, 300 ng/mL에서 성장이 관찰되지 않았다. 따라서, 프로모터 Pcm-tetO2/1은 유도인자 부재 하에서 Pcm-2tetO1 보다 더 양호한 발현 억제를 가능하게 하는 것으로 보인다.
돌연변이체의 생성
이중 가닥 파괴를 복구하기 위한 표적화 플라스미드를 함유하는 형질전환체의 액체 배양물을 aTC의 부재 또는 존재(100 ng/mL) 하에서 제조하였다. 사용된 형질전환체는 표 3에 표시된 12개 플라스미드 조합 중 하나를 함유하였다.
표 3: 형질전환체에 존재하는 플라스미드 조합.
72시간 배양 후, 분취액을 다양한 배지 상에 침적시켰다:
● 티암페니콜 및 에리쓰로마이신을 함유하는 2YTG;
● 티암페니콜, 에리쓰로마이신, 및 100 ng/mL의 aTc를 함유하는 2YTG;
● 5-플루오로우라실을 함유하는 2YTG.
상동성 재조합 사건이 복구 주형의 삽입을 가능하게 하는 형질전환체만이 2YTG + 5-FU 상에서 성장할 수 있었다(도 14 참조).
upp_del 형질전환체의 분석:
2YTG + 5-FU 상에서 단리된 클론을 PCR에 의해 분석하였다(도 15 참조).
catP_fwd x catP_rev를 사용하는 PCR은 pEC750C 플라스미드 상에 존재하는 티암페니콜 내성 유전자의 검출을 가능하게 한다. 이의 검출은 표적화 벡터가 존재함을 확증시켜준다.
LHA_upp_fwd x RHA_upp_rev를 사용하는 PCR은 upp 유전자 뿐만 아니라 측접 영역의 증폭을 가능하게 한다. 하기에 표시된 프라이머를 upp_del 복구 주형의 구축에 사용하였다(도 15 + SEQ ID NO: 14-21 참조):
표 4:
upp_주형_fwd x upp_주형_rev를 사용하는 PCR은 upp_del 복구 주형이 부재하는, upp 유전자의 내부 단편의 증폭을 가능하게 한다.
획득된 결과는 분석된 형질전환체의 upp 유전자 내 결실을 확증시켜주었다.
upp_중지 돌연변이체의 분석:
upp 유전자를, aTc에 노출 후 2YTG+5-FU 상에서 단리된 3종의 클론에서 서열분석하였다(도 16 참조):
● 프로모터 Pcm-2tetO1를 통해 cas9을 발현하는 플라스미드(pFW0001-Pcm-2tetO1-cas9) 및 gRAN 뿐만 아니라 upp_중지 복구 주형을 함유하는 플라스미드(pEC750CgRNA_upp-upp_중지)를 함유하는 첫번째;
● 프로모터 Pcm-tetO2/1를 통해 cas9을 발현하는 플라스미드(pFW0001-Pcm-tetO2/1-cas9) 및 gRNA 뿐만 아니라 upp_중지 복구 주형을 함유하는 플라스미드(pEC750CgRNA_upp-upp_중지)를 함유하는 두번째.
따라서 제2 플라스미드에 존재하는 gRNA 및 유도성 프로모터의 제어 하의 cas9 유전자의 사용에 의해 유전자 변형 시스템을 개발하고자 하는 전략은 기능적이다. 항상성 프로모터 miniPthl의 사용과 비교하여, cas9 유전자의 유도는 효소의 작용을 제어하고 원하는 변형을 거친 형질전환체의 선택을 촉진시킬 수 있다.
오페론
ipa8로의
upp
유전자의 치환
만들어진 변형은, thl 유전자의 항상성 프로모터의 제어 하에 ATCC 824 균주의 adc, ctfA, ctfB 유전자(생성된 산의 재동화 및 아세톤의 형성을 가능하게 함) 및 씨. 베이제린키 DSM6423 유래의 adh 유전자(이소프로판올로의 아세톤의 전환을 가능하게 함)를 함유하는 오페론 ipa8의 씨. 아세토부틸리컴 ATCC 824 게놈 내로의 삽입으로 이루어진다. 이러한 3614-bp 오페론이 upp 유전자 대신 삽입된다.
upp 유전자의 각 측면 상에 위치된 1-kb 서열이 측접된 오페론으로 구성된 복구 주형을 pEC750-gRNA_upp 플라스미드에 삽입하여, pEC750C-gRNA_upp-Δ upp::ipa8 플라스미드를 획득하였다(도 17 및 SEQ ID NO: 26 참조).
이 플라스미드를 pFW0001-Pcm-tetO2/1-cas9 플라스미드를 함유하는 컴피턴트 ATCC 824 세포에 도입시켰다. cas9 발현의 유도는 티암페니콜, 에리쓰로마이신, 및 유도인자 aTc를 함유하는 2YTG 배지 상에서 수행하였다.
획득된 콜로니는 ATCC824 균주에서 2720-bp 생성물의 증폭을 가능하게 하는 프라이머 쌍 CA_C2877 및 CA_C2882를 사용하여 PCR에 의해 분석하였다:
CA_C2877: 5'-CTTTTTAAAAAAGTTAAATAAGGAAGG-3' (SEQ ID NO: 27);
CA_C2882: 5'-GTTTAACTTAAGTTACAGAAAAGCTAGG-3' (SEQ ID NO: 28)
유도 후 획득된 4종의 독립 콜로니 및 다양한 대조군에 대해 수행된 PCR 검정의 결과는 ipa8 오페론으로의 upp 유전자의 치환을 확증시켜주었다(도 18).
획득된 돌연변이체 뿐만 아니라, WT 균주 및 Δupp 돌연변이체(대조군으로서 사용)에 대해서 72시간 동안 34℃ 및 150 rpm에서 게이프스 배지(Gapes et al., 1996) 중에서 발효를 수행하였다. 발효 상청액은 내부 표준물로서 0.5 g/L 프로판올 용액을 사용하여 HPLC를 통해 분석하였다. 탄수화물 농도는 굴절률 검출기(Varian 350 RI)가 장착된 Aminex®HXP-87P 컬럼(Biorad, 300 mm × 7.8 mm) 상에서 정량하였다. 컬럼 온도는 80℃였고 용리액은 0.4 mL/분의 유속의 황산으로 이루어졌다(Spectra System RI 150).
획득된 결과는 Δupp::ipa8 돌연변이체가 WT 균주 또는 Δupp 돌연변이체와 대조적으로 아세톤을 이소프로판올로 환원시킬 수 있다는 것을 보여주었다(도 19).
클로스트리듐
베이제린키
NCIMB8052의
게놈 내로의
celA
유전자의 삽입
만들어진 변형은, 클로스트리듐 사카로부틸리컴 NCP262 유래의 eglA 프로모터의 제어 하에 네오칼리마스틱스 파트리시아럼(Neocallimastix patriciarum) 유래의 celA 유전자의 씨. 베이제린키 NCIMB8052 게놈 내로의 삽입으로 이루어진다. 이 유전자는 CMC(카복시메틸 셀룰로스)라고 불리는, 셀룰로스 기질을 분해할 수 있는 효소를 코딩한다. 1667 bp 크기의 유전자 및 이의 프로모터를 hbd 유전자 이후에 삽입시켰고, 이 균주가 CMC를 분해할 수 있게 된다(도 20, Lopez-Contreras et al., 2001).
이러한 삽입을 수행하기 위해, 2종의 플라스미드를 사용하였다:
- pEC500E_X_cas9 플라스미드: 클로스트리듐 디피실 630 유래의 xylB 유도성 프로모터의 제어 하에서 cas9 유전자를 발현함(Nariya et al., 2011)(도 21 및 SEQ ID NO: 29 참조).
- xylB 프로모터의 제어 하에서 가이드 RNA를 발현하고 씨. 베이제린키 NCIMB8052 유래의 hbd 유전자를 표적으로 하는 pS_XR_celAS1 플라스미드. 이 플라스미드는 또한 가이드 RNA가 표적으로 하는 영역의 각 측면에 위치하는 1001 및 1017개 염기쌍의 2개 상동성 영역이 측접된, egl2 프로모터의 제어 하의 celA 유전자로 이루어진 복구 주형을 함유한다(도 22 및 SEQ ID NO: 30 참조).
이들 2종의 플라스미드를 순차적으로 NCIMB8052에 도입시켰다. cas9 발현의 유도는 스펙티노마이신 및 에리쓰로마이신 뿐만 아니라 상승 농도의 자일로스 유도인자를 함유하는 CGM(6.25 g/L 효모 추출물; 0.5 g/L MgSO4·7H2O; 0.95 g/L KH2HPO4; 0.95 g/L K2HPO4; 0.013 g/L MnSO4·7H2O; 0.013 g/L FeSO4·7H2O; 1.25 g/L NaCl; 2.5 g/L (NH4)2SO4; 2.5 g/L 아스파라긴) 상에서 수행하였다(도 24).
6% 자일로스를 함유하는 CGM 상에서 유도 후 획득된 콜로니는 NCIMB8052 균주에서 2070-염기쌍 생성물 및 celA 유전자를 통합한 경우 3718-염기쌍 생성물의 증폭을 가능하게 하는 프라이머 쌍 Cbei_325_F 및 Cbei_325_R을 사용하여 PCR에 의해 분석하였다:
Cbei_325_F (celA)
5' - AGATAATTATGAAGTTAATCCTTAG - 3'(SEQ ID NO: 31)
Cbei_326_R (celA)
5' - CATTTGCTTTCAGGTCTTCTTTTGCTG - 3'(SEQ ID NO: 32)
대조군 균주 및 유도 후 획득된 독립 콜로니에 대해 수행된 PCR 검정의 결과는, NCIMB8052 내로의 celA 유전자의 삽입을 확증시켜주었다(도 25).
참조문헌
- Al-Hinai, M. A. et al. Novel system for efficient isolation of Clostridium double-crossover allelic exchange mutants enabling markerless chromosomal gene deletions and DNA integration. Appl . Environ Microbiol . 2012. 78(22): 8112-21.
- Ran, F. A. et al. Genome engineering using the CRISPR-Cas9 system. Nature protocols. 2013. 8(11): 2281-308.
- Barrangou, R. et al. CRISPR provides acquired resistance against viruses in prokaryotes. Science. 2007, 315(5819): 1709-12.
- Banerjee, A. et al. Lactose-inducible system for metabolic engineering of Clostridium ljungdahlii, Appl. Environ. Microbiol. 2014.80(8): 2410-6.
- Cartman, S. T. et al. Precise manipulation of the Clostridium difficile chromosome reveals a lack of association between the tcdC genotype and toxin production. Appl. Environ. Microbiol. 2012. 78(13): 4683-90.
- Currie, D.H. et al. Functional heterologous expression of an engineered full length CipA from Clostridium thermocellum in Thermoanaerobacterium saccharolyticum, Biotechnol. Biofuels. 2013. 6(1): 32.
- DiCarlo, J. E. et al. Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic Acids Res. 2013, 41(7): 4336-43
- Dong, H. et al. Development of an anhydrotetracycline-inducible gene expression system for solvent-producing Clostridium acetobutylicum: A useful tool for strain engineering. Metab. Eng. 2012. 14(1): 59-67.
- D'Urzo, N. et al. High-level intracellular expression of heterologous proteins in Brevibacillus choshinensis SP3 under the control of a xylose inducible promoter. Microb. Cell Fact. 2013. 12: 12
- Egholm, M. et al. Peptide nucleic acids (PNA). Oligonucleotide analogs with an achiral peptide backbone. J. Am. Chem. Soc. 1992. 114(5): 1895-7.
- Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic acids res. 2013, 42(4): 2577-90.
- Gapes, J. R., Nimcevic, D., & Friedl, A. (1996). Long-Term Continuous Cultivation of Clostridium beijerinckii in a Two-Stage Chemostat with On-Line Solvent Removal. Applied and environmental microbiology, 62(9), 3210-3219.
- Hartman, A.H. et al. Construction and characterization of a lactose-inducible promoter system for controlled gene expression in Clostridium perfringens. Appl. Environ. Microbiol. 77(2): 471-8
- Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 2012. 337(6096): 816-21.
- Lee, J. et al. Metabolic engineering of Clostridium acetobutylicum ATCC 824 for isopropanol-butanol-ethanol fermentation. Appl. Environ. Microbiol; 2012. 78(5): 1416-23.
- Lopez-Contreras AM, Smidt H, van der Oost J, Claassen PAM, Mooibroek H, de Vos WM. 2001. Clostridium beijerinckii Cells Expressing Neocallismatix patriciarum Glycoside Hydrolases Show Enhanced Lichenan Utilization and Solvent Production. Appl Environ Microbiol 67:5127-5133.
- Lutke-Eversloh, T. Application of new metabolic engineering tools for Clostridium acetobutylicum. Appl. Microbiol. Biotechnol. 2014. 98(13): 5823-37.
- Mali, P. et al. Cas9 as a versatile tool for engineering biology. Nat. methods. 2013, 10(10): 957-63.
- Makarova, K. S., et al. Evolution and classification of the CRISPR-Cas systems. Nat. Rev. Microbiol. 2011, 9(6): 467-77.
- Mearls, E.B. et al. Development of a regulatable plasmid-based gene expression system for Clostridium thermocellum, Appl. Microbiol. Biotechnol. 2015.99(18): 7589-99.
- Nariya, H. et al., Development and characterization of a xylose-inducible gene expression system for Clostridium perfringens, Appl. Environ. Microbiol. 2011.77(23): 8439-41.
- Nariya H, Miyata S, Kuwahara T, Okabe A. 2011. Development and characterization of a xylose-inducible gene expression system for Clostridium perfringens. Appl Environ Microbiol 77:8439-8441.
- Newcomb, M. et al. Co-transcription of the celC gene cluster in Clostridium thermocellum, Appl. Microbiol. Biotechnol. 2011. 90(2): 625-34.
- Wang, Y. et al. Markerless chromosomal gene deletion in Clostridium beijerinckii using CRISPR/Cas9 system. J. Biotechnol.2015. 200: 1-5.
- Xu, T. et al. Efficient genome editing in Clostridium cellulolyticum via CRISPR-Cas9 nickase. Appl. Environ. Microbiol. 2015 AEM-00873.
- Zhang, N. et al. I-SceI-mediated scarless gene modification via allelic exchange in Clostridium. J. Microbiol. Methods. 2015, 108: 49-60.
- Zhang, J. et al. A novel arabinose-inducible genetic operation system developed for Clostridium cellulolyticum, Biotechnol. Biofuels. 2015.8: 36.
<110> IFP Energies Nouvelles
<120> OUTIL GENETIQUE DE TRANSFORMATION DE BACTERIES CLOSTRIDIUM
<130> B2115PC00
<150> FR 1559846
<151> 2015-10-16
<160> 32
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 2
<211> 4107
<212> DNA
<213> Streptococcus pyogenes
<400> 2
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600
attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720
ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960
atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160
catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220
gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280
attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340
atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400
gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460
gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520
attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580
gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640
aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700
acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760
ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820
actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880
aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940
taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000
tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120
aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180
cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240
gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300
cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360
gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420
tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480
aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540
tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600
tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660
caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720
cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780
cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840
attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900
ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960
cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020
gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080
gatttgagtc agctaggagg tgactga 4107
<210> 3
<211> 630
<212> DNA
<213> clostridium
<400> 3
atgagtaaag ttacacaaat atcacatcca cttatattac acaaattagc atttatgaga 60
gataaaaaaa caggatctaa agattttaga gagatggtag aagaagtagc aatgctaatg 120
gcatatgaag taacaagaga aatgcagctt gaaactgttg aaatagaaac tcctatatgt 180
ataactaaat gtaaaatgtt agcaggaaaa aaggtagcta tagttcctat acttagagca 240
ggacttggaa tggtaaatgg agtattaaaa ttaatacctg ctgctaaggt tggacatata 300
ggattatata gagatgaaaa gacattaaaa cctgtagaat acttctgtaa acttcctcaa 360
gatatagagg aaagagacat aatagtaact gatccaatgc ttgcaactgg tgggtcagca 420
atagatgcaa taacacttct taagaaaaga ggagcaaaat acataagact tatgtgtctt 480
ataggagcac cagaaggtat agcagcagta caagaagcac atccagatgt agatatatac 540
ctcgcatcaa tagatgaaaa gttagatgaa aatggatata tagttcctgg tcttggagat 600
gctggagata gattattcgg tacaaaataa 630
<210> 4
<211> 2589
<212> DNA
<213> clostridium
<400> 4
atgaaagtca caacagtaaa ggaattagat gaaaaactca aggtaattaa agaagctcaa 60
aaaaaattct cttgttactc gcaagaaatg gttgatgaaa tctttagaaa tgcagcaatg 120
gcagcaatcg acgcaaggat agagctagca aaagcagctg ttttggaaac cggtatgggc 180
ttagttgaag acaaggttat aaaaaatcat tttgcaggcg aatacatcta taacaaatat 240
aaggatgaaa aaacctgcgg tataattgaa cgaaatgaac cctacggaat tacaaaaata 300
gcagaaccta taggagttgt agctgctata atccctgtaa caaaccccac atcaacaaca 360
atatttaaat ccttaatatc ccttaaaact agaaatggaa ttttcttttc gcctcaccca 420
agggcaaaaa aatccacaat actagcagct aaaacaatac ttgatgcagc cgttaagagt 480
ggtgccccgg aaaatataat aggttggata gatgaacctt caattgaact aactcaatat 540
ttaatgcaaa aagcagatat aacccttgca actggtggtc cctcactagt taaatctgct 600
tattcttccg gaaaaccagc aataggtgtt ggtccgggta acaccccagt aataattgat 660
gaatctgctc atataaaaat ggcagtaagt tcaattatat tatccaaaac ctatgataat 720
ggtgttatat gtgcttctga acaatctgta atagtcttaa aatccatata taacaaggta 780
aaagatgagt tccaagaaag aggagcttat ataataaaga aaaacgaatt ggataaagtc 840
cgtgaagtga tttttaaaga tggatccgta aaccctaaaa tagtcggaca gtcagcttat 900
actatagcag ctatggctgg cataaaagta cctaaaacca caagaatatt aataggagaa 960
gttacctcct taggtgaaga agaacctttt gcccacgaaa aactatctcc tgttttggct 1020
atgtatgagg ctgacaattt tgatgatgct ttaaaaaaag cagtaactct aataaactta 1080
ggaggcctcg gccatacctc aggaatatat gcagatgaaa taaaagcacg agataaaata 1140
gatagattta gtagtgccat gaaaaccgta agaacctttg taaatatccc aacctcacaa 1200
ggtgcaagtg gagatctata taattttaga ataccacctt ctttcacgct tggctgcgga 1260
ttttggggag gaaattctgt ttccgagaat gttggtccaa aacatctttt gaatattaaa 1320
accgtagctg aaaggagaga aaacatgctt tggtttagag ttccacataa agtatatttt 1380
aagttcggtt gtcttcaatt tgctttaaaa gatttaaaag atctaaagaa aaaaagagcc 1440
tttatagtta ctgatagtga cccctataat ttaaactatg ttgattcaat aataaaaata 1500
cttgagcacc tagatattga ttttaaagta tttaataagg ttggaagaga agctgatctt 1560
aaaaccataa aaaaagcaac tgaagaaatg tcctccttta tgccagacac tataatagct 1620
ttaggtggta cccctgaaat gagctctgca aagctaatgt gggtactata tgaacatcca 1680
gaagtaaaat ttgaagatct tgcaataaaa tttatggaca taagaaagag aatatatact 1740
ttcccaaaac tcggtaaaaa ggctatgtta gttgcaatta caacttctgc tggttccggt 1800
tctgaggtta ctccttttgc tttagtaact gacaataaca ctggaaataa gtacatgtta 1860
gcagattatg aaatgacacc aaatatggca attgtagatg cagaacttat gatgaaaatg 1920
ccaaagggat taaccgctta ttcaggtata gatgcactag taaatagtat agaagcatac 1980
acatccgtat atgcttcaga atacacaaac ggactagcac tagaggcaat acgattaata 2040
tttaaatatt tgcctgaggc ttacaaaaac ggaagaacca atgaaaaagc aagagagaaa 2100
atggctcacg cttcaactat ggcaggtatg gcatccgcta atgcatttct aggtctatgt 2160
cattccatgg caataaaatt aagttcagaa cacaatattc ctagtggcat tgccaatgca 2220
ttactaatag aagaagtaat aaaatttaac gcagttgata atcctgtaaa acaagcccct 2280
tgcccacaat ataagtatcc aaacaccata tttagatatg ctcgaattgc agattatata 2340
aagcttggag gaaatactga tgaggaaaag gtagatctct taattaacaa aatacatgaa 2400
ctaaaaaaag ctttaaatat accaacttca ataaaggatg caggtgtttt ggaggaaaac 2460
ttctattcct cccttgatag aatatctgaa cttgcactag atgatcaatg cacaggcgct 2520
aatcctagat ttcctcttac aagtgagata aaagaaatgt atataaattg ttttaaaaaa 2580
caaccttaa 2589
<210> 5
<211> 10469
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 5
catggataaa aagtacagta ttggtctaga cataggaact aactctgttg ggtgggctgt 60
tataacagat gaatataaag ttccatcaaa aaaatttaaa gtattaggaa acactgatag 120
acattcaata aaaaaaaact tgataggtgc tttattattc gattcaggag agactgctga 180
agctacacgt ttaaaaagaa cagctagacg tagatataca agaagaaaaa ataggatatg 240
ttatcttcaa gaaattttta gtaatgaaat ggcaaaagtt gatgattcat tctttcacag 300
actagaagaa agtttcttag ttgaagaaga taagaagcat gaaagacacc ctatttttgg 360
taatatcgta gatgaagtag catatcatga gaagtatcca actatctatc atttaagaaa 420
gaaattagtt gattctacag ataaagctga tctgagatta atatatttag ctttagctca 480
tatgattaaa tttagaggac attttttaat agaaggtgat ttaaacccag acaacagcga 540
tgtagataaa ttatttatcc aattagttca aacttataat caattattcg aagagaatcc 600
aattaatgca agtggtgtag acgctaaggc tatattatca gctagattat caaaatctag 660
aagattagaa aatctaatag ctcaacttcc tggagaaaag aaaaatggac tttttgggaa 720
cctaatagct ctctcactcg gactaacacc aaattttaaa agcaattttg atcttgctga 780
agacgcaaag ttacaactat caaaggatac atacgatgat gatttagata atttgttagc 840
tcaaataggt gatcaatatg ctgatttgtt tcttgcagca aaaaacttaa gtgatgcaat 900
tttactatca gatatactta gagtaaatac agaaataaca aaggctcctt tatcagcaag 960
tatgattaaa cgatatgatg agcatcatca agatttaaca ttattaaagg cacttgtaag 1020
acaacaatta ccagaaaaat ataaagaaat tttctttgat caatctaaaa atggatatgc 1080
tggatatata gacggtggag caagtcaaga agagttttat aaatttataa agcctatttt 1140
agaaaaaatg gatggaactg aagaattact tgttaaactt aacagagaag atttacttag 1200
aaaacaaaga acttttgata atggttcaat tcctcaccaa attcatttag gagaattaca 1260
tgctatacta agaagacaag aagattttta tccatttctt aaagataata gagaaaaaat 1320
tgaaaaaatt ttaactttta gaataccata ttatgtagga ccacttgcaa ggggaaattc 1380
aagatttgca tggatgacta gaaaatcaga agaaactata accccgtgga attttgaaga 1440
agtagtagat aaaggagcta gtgctcaatc atttatagaa agaatgacaa attttgataa 1500
gaatcttcct aacgaaaagg ttttgccaaa gcatagcctt ctttatgagt attttacagt 1560
ttataatgag cttactaaag taaaatacgt tacagaagga atgagaaaac cagcattttt 1620
gtctggtgaa caaaagaaag caatagtaga cctattattt aaaacaaata ggaaggttac 1680
cgtaaagcaa cttaaagaag attacttcaa aaaaattgaa tgctttgata gtgttgaaat 1740
atcaggagtt gaagatagat ttaatgcttc acttggtaca tatcacgatc tcttaaaaat 1800
tataaaagat aaggattttt tagataatga agaaaatgaa gatattcttg aagatatagt 1860
attaacattg acactttttg aagatagaga aatgatagaa gaaagattaa aaacatatgc 1920
acatcttttt gatgataagg ttatgaagca acttaaaaga agaagatata caggttgggg 1980
acgtttgtca agaaagctaa ttaatggtat tagagataaa caatcaggaa agactattct 2040
cgattttctt aaatcagatg gatttgctaa tagaaacttt atgcaattaa ttcatgatga 2100
ttctcttact ttcaaagagg atattcaaaa ggctcaagtt tctggacaag gcgatagctt 2160
acacgaacac attgctaacc ttgcagggag ccccgctatc aaaaaaggaa ttttacaaac 2220
agttaaagtt gtagatgaac ttgttaaagt tatgggaaga cacaaacctg agaatatagt 2280
tatagaaatg gccagagaaa atcaaacaac acaaaaagga caaaaaaatt ctagagagag 2340
aatgaagaga attgaagaag gaataaaaga gctaggatca caaatattaa aagaacatcc 2400
agttgaaaat actcaattgc aaaatgaaaa gttatatttg tattacttac aaaatggaag 2460
agatatgtat gttgatcaag aactcgatat taatagatta agtgactatg atgttgatca 2520
tattgttcct caatcatttt taaaagatga ttcaatcgat aacaaagtat taactagatc 2580
agataaaaat agaggaaagt cagataatgt accatctgaa gaagttgtta aaaaaatgaa 2640
gaactattgg agacaacttt taaatgcaaa gctaattaca caaagaaaat ttgacaattt 2700
aacaaaagca gaaagaggag gattaagcga attagacaaa gctggattta taaaaagaca 2760
acttgttgag acaagacaaa taactaagca tgttgctcaa atacttgatt caagaatgaa 2820
tacaaaatat gatgaaaatg ataaattaat cagagaagta aaagtaataa cattaaagtc 2880
aaaattagta tcagatttca gaaaggattt tcaattttac aaagttcgtg aaataaataa 2940
ctatcatcat gctcatgatg catacttaaa tgctgttgta ggaactgctc ttattaagaa 3000
atatcctaaa ctagaaagcg aatttgttta tggagattat aaagtttatg atgtgcgcaa 3060
aatgatcgcg aaatccgaac aagaaatcgg taaggctaca gcaaaatatt tcttttatag 3120
taatataatg aattttttta agacagaaat aactttggct aatggtgaaa tcagaaaaag 3180
accacttatc gaaacaaatg gagagacagg agaaatagta tgggataaag gaagagattt 3240
tgctactgtt agaaaagtac taagtatgcc acaagtaaat atcgtaaaga aaactgaagt 3300
tcaaactgga ggtttctcta aggaatcaat tttacctaag agaaattcag ataagttaat 3360
tgcaaggaaa aaagattggg acccaaaaaa atacggtggt tttgatagtc caacagttgc 3420
ctatagtgtt cttgtagtag cgaaagttga gaaaggtaag tcaaaaaagt tgaaaagcgt 3480
aaaagaactt cttggtatca caattatgga aagatcttca tttgaaaaaa atccaattga 3540
ctttttagaa gctaagggtt ataaagaagt taaaaaggat ttaatcataa aactaccaaa 3600
gtatagtcta tttgaactcg aaaacggaag aaaacgaatg ctcgctagcg caggagaact 3660
tcaaaaagga aatgaacttg cgctgccatc aaagtatgta aatttcttat atttagcttc 3720
tcattatgag aaattaaaag gatcaccaga ggataatgaa caaaagcaac tatttgtaga 3780
acaacacaaa cattatttag atgaaataat agaacaaata tctgaatttt ctaaaagagt 3840
tatacttgcc gacgcaaatc tagataaggt gctttcagcg tataataaac acagagataa 3900
accaataaga gaacaagcag aaaacattat ccatcttttt acattaacta atcttggtgc 3960
accagctgca tttaagtact ttgatacaac aatagataga aaaagataca catctactaa 4020
agaagtatta gacgcaactt taatacatca atctattaca gggctttatg aaacaagaat 4080
tgatttaagt caactaggcg gagattaagt cgacaaagta ttgttaaaaa taactctgta 4140
gaattataaa ttagttctac agagttattt tttgacccgg gtaccgagct cgaattcgta 4200
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 4260
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 4320
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 4380
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 4440
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 4500
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 4560
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 4620
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 4680
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 4740
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 4800
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 4860
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 4920
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 4980
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 5040
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 5100
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 5160
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 5220
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 5280
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 5340
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 5400
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 5460
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 5520
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 5580
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 5640
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 5700
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 5760
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 5820
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 5880
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 5940
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 6000
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 6060
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 6120
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 6180
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 6240
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 6300
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 6360
ctgccgggcc tcttgcggga tcaaaagaaa aacgaaatga tacaccaatc agtgcaaaaa 6420
aagatataat gggagataag acggttcgtg ttcgtgctga cttgcaccat atcataaaaa 6480
tcgaaacagc aaagaatggc ggaaacgtaa aagaagttat ggaaataaga cttagaagca 6540
aacttaagag tgtgttgata gtgcagtatc ttaaaatttt gtataatagg aattgaagtt 6600
aaattagatg ctaaaaattt gtaattaaga aggagtgatt acatgaacaa aaatataaaa 6660
tattctcaaa actttttaac gagtgaaaaa gtactcaacc aaataataaa acaattgaat 6720
ttaaaagaaa ccgataccgt ttacgaaatt ggaacaggta aagggcattt aacgacgaaa 6780
ctggctaaaa taagtaaaca ggtaacgtct attgaattag acagtcatct attcaactta 6840
tcgtcagaaa aattaaaact gaatactcgt gtcactttaa ttcaccaaga tattctacag 6900
tttcaattcc ctaacaaaca gaggtataaa attgttggga gtattcctta ccatttaagc 6960
acacaaatta ttaaaaaagt ggtttttgaa agccatgcgt ctgacatcta tctgattgtt 7020
gaagaaggat tctacaagcg taccttggat attcaccgaa cactagggtt gctcttgcac 7080
actcaagtct cgattcagca attgcttaag ctgccagcgg aatgctttca tcctaaacca 7140
aaagtaaaca gtgtcttaat aaaacttacc cgccatacca cagatgttcc agataaatat 7200
tggaagctat atacgtactt tgtttcaaaa tgggtcaatc gagaatatcg tcaactgttt 7260
actaaaaatc agtttcatca agcaatgaaa cacgccaaag taaacaattt aagtaccgtt 7320
acttatgagc aagtattgtc tatttttaat agttatctat tatttaacgg gaggaaataa 7380
ttctatgagt ccctaggccc aactaactca acgctagtag tggatttaat cccaaatgag 7440
ccaacagaac cagaaccaga aacagaatca gaacaagtaa cattggattt agaaatggaa 7500
gaagaaaaaa gcaatgactt cgtgtgaata atgcacgaaa tcgttgctta ttttttttta 7560
aaagcggtat actagatata acgaaacaac gaactgaata gaaacgaaaa aagagccatg 7620
acacatttat aaaatgtttg acgacatttt ataaatgcat agcccgataa gattgccaaa 7680
ccaacgctta tcagttagtc agatgaactc ttccctcgta agaagttatt taattaactt 7740
tgtttgaaga cggtatataa ccgtactatc attatatagg gaaatcagag agttttcaag 7800
tatctaagct actgaattta agaattgtta agcaatcaat cggaaatcgt ttgattgctt 7860
tttttgtatt catttataga aggtggagtt tgtatgaatc atgatgaatg taaaacttat 7920
ataaaaaata gtttattgga gataagaaaa ttagcaaata tctatacact agaaacgttt 7980
aagaaagagt tagaaaagag aaatatctac ttagaaacaa aatcagataa gtatttttct 8040
tcggaggggg aagattatat atataagtta atagaaaata acaaaataat ttattcgatt 8100
agtggaaaaa aattgactta taaaggaaaa aaatcttttt caaaacatgc aatattgaaa 8160
cagttgaatg aaaaagcaaa ccaagttaat taaacaacct attttatagg atttatagga 8220
aaggagaaca gctgaatgaa tatccctttt gttgtagaaa ctgtgcttca tgacggcttg 8280
ttaaagtaca aatttaaaaa tagtaaaatt cgctcaatca ctaccaagcc aggtaaaagc 8340
aaaggggcta tttttgcgta tcgctcaaaa tcaagcatga ttggcggtcg tggtgttgtt 8400
ctgacttccg aggaagcgat tcaagaaaat caagatacat ttacacattg gacacccaac 8460
gtttatcgtt atggaacgta tgcagacgaa aaccgttcat acacgaaagg acattctgaa 8520
aacaatttaa gacaaatcaa taccttcttt attgattttg atattcacac ggcaaaagaa 8580
actatttcag caagcgatat tttaacaacc gctattgatt taggttttat gcctactatg 8640
attatcaaat ctgataaagg ttatcaagca tattttgttt tagaaacgcc agtctatgtg 8700
acttcaaaat cagaatttaa atctgtcaaa gcagccaaaa taatttcgca aaatatccga 8760
gaatattttg gaaagtcttt gccagttgat ctaacgtgta atcattttgg tattgctcgc 8820
ataccaagaa cggacaatgt agaatttttt gatcctaatt accgttattc tttcaaagaa 8880
tggcaagatt ggtctttcaa acaaacagat aataagggct ttactcgttc aagtctaacg 8940
gttttaagcg gtacagaagg caaaaaacaa gtagatgaac cctggtttaa tctcttattg 9000
cacgaaacga aattttcagg agaaaagggt ttaatagggc gtaataacgt catgtttacc 9060
ctctctttag cctactttag ttcaggctat tcaatcgaaa cgtgcgaata taatatgttt 9120
gagtttaata atcgattaga tcaaccctta gaagaaaaag aagtaatcaa aattgttaga 9180
agtgcctatt cagaaaacta tcaaggggct aatagggaat acattaccat tctttgcaaa 9240
gcttgggtat caagtgattt aaccagtaaa gatttatttg tccgtcaagg gtggtttaaa 9300
ttcaagaaaa aaagaagcga acgtcaacgt gttcatttgt cagaatggaa agaagattta 9360
atggcttata ttagcgaaaa aagcgatgta tacaagcctt atttagtgac gaccaaaaaa 9420
gagattagag aagtgctagg cattcctgaa cggacattag ataaattgct gaaggtactg 9480
aaggcgaatc aggaaatttt ctttaagatt aaaccaggaa gaaatggtgg cattcaactt 9540
gctagtgtta aatcattgtt gctatcgatc attaaagtaa aaaaagaaga aaaagaaagc 9600
tatataaagg cgctgacaaa ttcttttgac ttagagcata cattcattca agagacttta 9660
aacaagctag cagaacgccc taaaacggac acacaactcg atttgtttag ctatgataca 9720
ggctgaaaat aaaacccgca ctatgccatt acatttatat ctatgatacg tgtttgtttt 9780
ttctttgctg tttagcgaat gattagcaga aatatacaga gtaagatttt aattaattat 9840
tagggggaga aggagagagt agcccgaaaa cttttagttg gcttggactg aacgaagtga 9900
gggaaaggct actaaaacgt cgaggggcag tgagagcgaa gcgaacactt gattttttaa 9960
ttttctatct tttataggtc attagagtat acttatttgt cctataaact atttagcagc 10020
ataatagatt tattgaatag gtcatttaag ttgagcatat tagaggagga aaatcttgga 10080
gaaatatttg aagaacccga ttacatggat tggattagtt cttgtggtta cgtggttttt 10140
aactaaaagt agtgaatttt tgatttttgg tgtgtgtgtc ttgttgttag tatttgctag 10200
tcaaagtgat taaatagaat tctagcgcca ttcgccattc aggctgcgca actgttggga 10260
agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 10320
aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 10380
cagtgccaag cttgcatgcc tgcaggcctc gagtatattg ataaaaataa taatagtggg 10440
tataattaag ttgttaggag gttagttac 10469
<210> 6
<211> 8876
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 6
tcgagactct atcattgata gagtttgaaa ctctatcatt gatagagtat aatatctttg 60
ttcattagag cgataaactt gaatttgaga gggaacttcc atggataaaa agtacagtat 120
tggtctagac ataggaacta actctgttgg gtgggctgtt ataacagatg aatataaagt 180
tccatcaaaa aaatttaaag tattaggaaa cactgataga cattcaataa aaaaaaactt 240
gataggtgct ttattattcg attcaggaga gactgctgaa gctacacgtt taaaaagaac 300
agctagacgt agatatacaa gaagaaaaaa taggatatgt tatcttcaag aaatttttag 360
taatgaaatg gcaaaagttg atgattcatt ctttcacaga ctagaagaaa gtttcttagt 420
tgaagaagat aagaagcatg aaagacaccc tatttttggt aatatcgtag atgaagtagc 480
atatcatgag aagtatccaa ctatctatca tttaagaaag aaattagttg attctacaga 540
taaagctgat ctgagattaa tatatttagc tttagctcat atgattaaat ttagaggaca 600
ttttttaata gaaggtgatt taaacccaga caacagcgat gtagataaat tatttatcca 660
attagttcaa acttataatc aattattcga agagaatcca attaatgcaa gtggtgtaga 720
cgctaaggct atattatcag ctagattatc aaaatctaga agattagaaa atctaatagc 780
tcaacttcct ggagaaaaga aaaatggact ttttgggaac ctaatagctc tctcactcgg 840
actaacacca aattttaaaa gcaattttga tcttgctgaa gacgcaaagt tacaactatc 900
aaaggataca tacgatgatg atttagataa tttgttagct caaataggtg atcaatatgc 960
tgatttgttt cttgcagcaa aaaacttaag tgatgcaatt ttactatcag atatacttag 1020
agtaaataca gaaataacaa aggctccttt atcagcaagt atgattaaac gatatgatga 1080
gcatcatcaa gatttaacat tattaaaggc acttgtaaga caacaattac cagaaaaata 1140
taaagaaatt ttctttgatc aatctaaaaa tggatatgct ggatatatag acggtggagc 1200
aagtcaagaa gagttttata aatttataaa gcctatttta gaaaaaatgg atggaactga 1260
agaattactt gttaaactta acagagaaga tttacttaga aaacaaagaa cttttgataa 1320
tggttcaatt cctcaccaaa ttcatttagg agaattacat gctatactaa gaagacaaga 1380
agatttttat ccatttctta aagataatag agaaaaaatt gaaaaaattt taacttttag 1440
aataccatat tatgtaggac cacttgcaag gggaaattca agatttgcat ggatgactag 1500
aaaatcagaa gaaactataa ccccgtggaa ttttgaagaa gtagtagata aaggagctag 1560
tgctcaatca tttatagaaa gaatgacaaa ttttgataag aatcttccta acgaaaaggt 1620
tttgccaaag catagccttc tttatgagta ttttacagtt tataatgagc ttactaaagt 1680
aaaatacgtt acagaaggaa tgagaaaacc agcatttttg tctggtgaac aaaagaaagc 1740
aatagtagac ctattattta aaacaaatag gaaggttacc gtaaagcaac ttaaagaaga 1800
ttacttcaaa aaaattgaat gctttgatag tgttgaaata tcaggagttg aagatagatt 1860
taatgcttca cttggtacat atcacgatct cttaaaaatt ataaaagata aggatttttt 1920
agataatgaa gaaaatgaag atattcttga agatatagta ttaacattga cactttttga 1980
agatagagaa atgatagaag aaagattaaa aacatatgca catctttttg atgataaggt 2040
tatgaagcaa cttaaaagaa gaagatatac aggttgggga cgtttgtcaa gaaagctaat 2100
taatggtatt agagataaac aatcaggaaa gactattctc gattttctta aatcagatgg 2160
atttgctaat agaaacttta tgcaattaat tcatgatgat tctcttactt tcaaagagga 2220
tattcaaaag gctcaagttt ctggacaagg cgatagctta cacgaacaca ttgctaacct 2280
tgcagggagc cccgctatca aaaaaggaat tttacaaaca gttaaagttg tagatgaact 2340
tgttaaagtt atgggaagac acaaacctga gaatatagtt atagaaatgg ccagagaaaa 2400
tcaaacaaca caaaaaggac aaaaaaattc tagagagaga atgaagagaa ttgaagaagg 2460
aataaaagag ctaggatcac aaatattaaa agaacatcca gttgaaaata ctcaattgca 2520
aaatgaaaag ttatatttgt attacttaca aaatggaaga gatatgtatg ttgatcaaga 2580
actcgatatt aatagattaa gtgactatga tgttgatcat attgttcctc aatcattttt 2640
aaaagatgat tcaatcgata acaaagtatt aactagatca gataaaaata gaggaaagtc 2700
agataatgta ccatctgaag aagttgttaa aaaaatgaag aactattgga gacaactttt 2760
aaatgcaaag ctaattacac aaagaaaatt tgacaattta acaaaagcag aaagaggagg 2820
attaagcgaa ttagacaaag ctggatttat aaaaagacaa cttgttgaga caagacaaat 2880
aactaagcat gttgctcaaa tacttgattc aagaatgaat acaaaatatg atgaaaatga 2940
taaattaatc agagaagtaa aagtaataac attaaagtca aaattagtat cagatttcag 3000
aaaggatttt caattttaca aagttcgtga aataaataac tatcatcatg ctcatgatgc 3060
atacttaaat gctgttgtag gaactgctct tattaagaaa tatcctaaac tagaaagcga 3120
atttgtttat ggagattata aagtttatga tgtgcgcaaa atgatcgcga aatccgaaca 3180
agaaatcggt aaggctacag caaaatattt cttttatagt aatataatga atttttttaa 3240
gacagaaata actttggcta atggtgaaat cagaaaaaga ccacttatcg aaacaaatgg 3300
agagacagga gaaatagtat gggataaagg aagagatttt gctactgtta gaaaagtact 3360
aagtatgcca caagtaaata tcgtaaagaa aactgaagtt caaactggag gtttctctaa 3420
ggaatcaatt ttacctaaga gaaattcaga taagttaatt gcaaggaaaa aagattggga 3480
cccaaaaaaa tacggtggtt ttgatagtcc aacagttgcc tatagtgttc ttgtagtagc 3540
gaaagttgag aaaggtaagt caaaaaagtt gaaaagcgta aaagaacttc ttggtatcac 3600
aattatggaa agatcttcat ttgaaaaaaa tccaattgac tttttagaag ctaagggtta 3660
taaagaagtt aaaaaggatt taatcataaa actaccaaag tatagtctat ttgaactcga 3720
aaacggaaga aaacgaatgc tcgctagcgc aggagaactt caaaaaggaa atgaacttgc 3780
gctgccatca aagtatgtaa atttcttata tttagcttct cattatgaga aattaaaagg 3840
atcaccagag gataatgaac aaaagcaact atttgtagaa caacacaaac attatttaga 3900
tgaaataata gaacaaatat ctgaattttc taaaagagtt atacttgccg acgcaaatct 3960
agataaggtg ctttcagcgt ataataaaca cagagataaa ccaataagag aacaagcaga 4020
aaacattatc catcttttta cattaactaa tcttggtgca ccagctgcat ttaagtactt 4080
tgatacaaca atagatagaa aaagatacac atctactaaa gaagtattag acgcaacttt 4140
aatacatcaa tctattacag ggctttatga aacaagaatt gatttaagtc aactaggcgg 4200
agattaagtc gacaaagtat tgttaaaaat aactctgtag aattataaat tagttctaca 4260
gagttatttt ttgacccggg tatattgata aaaataataa tagtgggtat aattaagttg 4320
ttaggaggtt agttagaatg atgtcaagat tagataaaag taaagtgatt aacagcgcat 4380
tagagctgct taatgaggtc ggaatcgaag gtttaacaac ccgtaaactc gcccagaagc 4440
taggtgtaga gcagcctaca ttgtattggc atgtaaaaaa taagcgggct ttgctcgacg 4500
ccttagccat tgagatgtta gataggcacc atactcactt ttgcccttta gaaggggaaa 4560
gctggcaaga ttttttacgt aataacgcta aaagttttag atgtgcttta ctaagtcatc 4620
gcgatggagc aaaagtacat ttaggtacac ggcctacaga aaaacagtat gaaactctcg 4680
aaaatcaatt agccttttta tgccaacaag gtttttcact agagaatgca ttatatgcac 4740
tcagcgctgt ggggcatttt actttaggtt gcgtattgga agatcaagag catcaagtcg 4800
ctaaagaaga aagggaaaca cctactactg atagtatgcc gccattatta cgacaagcta 4860
tcgaattatt tgatcaccaa ggtgcagagc cagccttctt attcggcctt gaattgatca 4920
tatgcggatt agaaaaacaa cttaaatgtg aaagtgggtc ttaaaagcag cataaccttt 4980
ttccgtgatg gtaacttcac ggtaaccaag atgtcgagtt gagctcgaat tcgtaatcat 5040
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 5100
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 5160
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 5220
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 5280
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 5340
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 5400
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5460
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5520
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5580
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5640
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5700
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5760
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5820
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 5880
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 5940
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 6000
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 6060
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 6120
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 6180
atgagtaaac ttggtctgac agttaccagg tccactgccg ggcctcttgc gggatcaaaa 6240
gaaaaacgaa atgatacacc aatcagtgca aaaaaagata taatgggaga taagacggtt 6300
cgtgttcgtg ctgacttgca ccatatcata aaaatcgaaa cagcaaagaa tggcggaaac 6360
gtaaaagaag ttatggaaat aagacttaga agcaaactta agagtgtgtt gatagtgcag 6420
tatcttaaaa ttttgtataa taggaattga agttaaatta gatgctaaaa atttgtaatt 6480
aagaaggagt gattacatga acaaaaatat aaaatattct caaaactttt taacgagtga 6540
aaaagtactc aaccaaataa taaaacaatt gaatttaaaa gaaaccgata ccgtttacga 6600
aattggaaca ggtaaagggc atttaacgac gaaactggct aaaataagta aacaggtaac 6660
gtctattgaa ttagacagtc atctattcaa cttatcgtca gaaaaattaa aactgaatac 6720
tcgtgtcact ttaattcacc aagatattct acagtttcaa ttccctaaca aacagaggta 6780
taaaattgtt gggagtattc cttaccattt aagcacacaa attattaaaa aagtggtttt 6840
tgaaagccat gcgtctgaca tctatctgat tgttgaagaa ggattctaca agcgtacctt 6900
ggatattcac cgaacactag ggttgctctt gcacactcaa gtctcgattc agcaattgct 6960
taagctgcca gcggaatgct ttcatcctaa accaaaagta aacagtgtct taataaaact 7020
tacccgccat accacagatg ttccagataa atattggaag ctatatacgt actttgtttc 7080
aaaatgggtc aatcgagaat atcgtcaact gtttactaaa aatcagtttc atcaagcaat 7140
gaaacacgcc aaagtaaaca atttaagtac cgttacttat gagcaagtat tgtctatttt 7200
taatagttat ctattattta acgggaggaa ataattctat gagtccctag gcaggcctcc 7260
gccattattt ttttgaacaa ttgacaattc atttcttatt ttttattaag tgatagtcaa 7320
aaggcataac agtgctgaat agaaagaaat ttacagaaaa gaaaattata gaatttagta 7380
tgattaatta tactcattta tgaatgttta attgaataca aaaaaaaata cttgttatgt 7440
attcaattac gggttaaaat atagacaagt tgaaaaattt aataaaaaaa taagtcctca 7500
gctcttatat attaagctac caacttagta tataagccaa aacttaaatg tgctaccaac 7560
acatcaagcc gttagagaac tctatctata gcaatatttc aaatgtaccg acatacaaga 7620
gaaacattaa ctatatatat tcaatttatg agattatctt aacagatata aatgtaaatt 7680
gcaataagta agatttagaa gtttatagcc tttgtgtatt ggaagcagta cgcaaaggct 7740
tttttatttg ataaaaatta gaagtatatt tattttttca taattaattt atgaaaatga 7800
aagggggtga gcaaagtgac agaggaaagc agtatcttat caaataacaa ggtattagca 7860
atatcattat tgactttagc agtaaacatt atgactttta tagtgcttgt agctaagtag 7920
tacgaaaggg ggagctttaa aaagctcctt ggaatacata gaattcataa attaatttat 7980
gaaaagaagg gcgtatatga aaacttgtaa aaattgcaaa gagtttatta aagatactga 8040
aatatgcaaa atacattcgt tgatgattca tgataaaaca gtagcaacct attgcagtaa 8100
atacaatgag tcaagatgtt tacataaagg gaaagtccaa tgtattaatt gttcaaagat 8160
gaaccgatat ggatggtgtg ccataaaaat gagatgtttt acagaggaag aacagaaaaa 8220
agaacgtaca tgcattaaat attatgcaag gagctttaaa aaagctcatg taaagaagag 8280
taaaaagaaa aaataattta tttattaatt taatattgag agtgccgaca cagtatgcac 8340
taaaaaatat atctgtggtg tagtgagccg atacaaaagg atagtcactc gcattttcat 8400
aatacatctt atgttatgat tatgtgtcgg tgggacttca cgacgaaaac ccacaataaa 8460
aaaagagttc ggggtagggt taagcatagt tgaggcaact aaacaatcaa gctaggatat 8520
gcagtagcag accgtaaggt cgttgtttag gtgtgttgta atacatacgc tattaagatg 8580
taaaaatacg gataccaatg aagggaaaag tataattttt ggatgtagtt tgtttgttca 8640
tctatgggca aactacgtcc aaagccgttt ccaaatctgc taaaaagtat atcctttcta 8700
aaatcaaagt caagtatgaa atcataaata aagtttaatt ttgaagttat tatgatatta 8760
tgtttttcta ttaaaataaa ttaagtatat agaatagttt aataatagta tatacttaat 8820
gtgataagtg tctgacagtg tcacagaaag gatgattgtt atggattata agcggc 8876
<210> 7
<211> 8874
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 7
catggataaa aagtacagta ttggtctaga cataggaact aactctgttg ggtgggctgt 60
tataacagat gaatataaag ttccatcaaa aaaatttaaa gtattaggaa acactgatag 120
acattcaata aaaaaaaact tgataggtgc tttattattc gattcaggag agactgctga 180
agctacacgt ttaaaaagaa cagctagacg tagatataca agaagaaaaa ataggatatg 240
ttatcttcaa gaaattttta gtaatgaaat ggcaaaagtt gatgattcat tctttcacag 300
actagaagaa agtttcttag ttgaagaaga taagaagcat gaaagacacc ctatttttgg 360
taatatcgta gatgaagtag catatcatga gaagtatcca actatctatc atttaagaaa 420
gaaattagtt gattctacag ataaagctga tctgagatta atatatttag ctttagctca 480
tatgattaaa tttagaggac attttttaat agaaggtgat ttaaacccag acaacagcga 540
tgtagataaa ttatttatcc aattagttca aacttataat caattattcg aagagaatcc 600
aattaatgca agtggtgtag acgctaaggc tatattatca gctagattat caaaatctag 660
aagattagaa aatctaatag ctcaacttcc tggagaaaag aaaaatggac tttttgggaa 720
cctaatagct ctctcactcg gactaacacc aaattttaaa agcaattttg atcttgctga 780
agacgcaaag ttacaactat caaaggatac atacgatgat gatttagata atttgttagc 840
tcaaataggt gatcaatatg ctgatttgtt tcttgcagca aaaaacttaa gtgatgcaat 900
tttactatca gatatactta gagtaaatac agaaataaca aaggctcctt tatcagcaag 960
tatgattaaa cgatatgatg agcatcatca agatttaaca ttattaaagg cacttgtaag 1020
acaacaatta ccagaaaaat ataaagaaat tttctttgat caatctaaaa atggatatgc 1080
tggatatata gacggtggag caagtcaaga agagttttat aaatttataa agcctatttt 1140
agaaaaaatg gatggaactg aagaattact tgttaaactt aacagagaag atttacttag 1200
aaaacaaaga acttttgata atggttcaat tcctcaccaa attcatttag gagaattaca 1260
tgctatacta agaagacaag aagattttta tccatttctt aaagataata gagaaaaaat 1320
tgaaaaaatt ttaactttta gaataccata ttatgtagga ccacttgcaa ggggaaattc 1380
aagatttgca tggatgacta gaaaatcaga agaaactata accccgtgga attttgaaga 1440
agtagtagat aaaggagcta gtgctcaatc atttatagaa agaatgacaa attttgataa 1500
gaatcttcct aacgaaaagg ttttgccaaa gcatagcctt ctttatgagt attttacagt 1560
ttataatgag cttactaaag taaaatacgt tacagaagga atgagaaaac cagcattttt 1620
gtctggtgaa caaaagaaag caatagtaga cctattattt aaaacaaata ggaaggttac 1680
cgtaaagcaa cttaaagaag attacttcaa aaaaattgaa tgctttgata gtgttgaaat 1740
atcaggagtt gaagatagat ttaatgcttc acttggtaca tatcacgatc tcttaaaaat 1800
tataaaagat aaggattttt tagataatga agaaaatgaa gatattcttg aagatatagt 1860
attaacattg acactttttg aagatagaga aatgatagaa gaaagattaa aaacatatgc 1920
acatcttttt gatgataagg ttatgaagca acttaaaaga agaagatata caggttgggg 1980
acgtttgtca agaaagctaa ttaatggtat tagagataaa caatcaggaa agactattct 2040
cgattttctt aaatcagatg gatttgctaa tagaaacttt atgcaattaa ttcatgatga 2100
ttctcttact ttcaaagagg atattcaaaa ggctcaagtt tctggacaag gcgatagctt 2160
acacgaacac attgctaacc ttgcagggag ccccgctatc aaaaaaggaa ttttacaaac 2220
agttaaagtt gtagatgaac ttgttaaagt tatgggaaga cacaaacctg agaatatagt 2280
tatagaaatg gccagagaaa atcaaacaac acaaaaagga caaaaaaatt ctagagagag 2340
aatgaagaga attgaagaag gaataaaaga gctaggatca caaatattaa aagaacatcc 2400
agttgaaaat actcaattgc aaaatgaaaa gttatatttg tattacttac aaaatggaag 2460
agatatgtat gttgatcaag aactcgatat taatagatta agtgactatg atgttgatca 2520
tattgttcct caatcatttt taaaagatga ttcaatcgat aacaaagtat taactagatc 2580
agataaaaat agaggaaagt cagataatgt accatctgaa gaagttgtta aaaaaatgaa 2640
gaactattgg agacaacttt taaatgcaaa gctaattaca caaagaaaat ttgacaattt 2700
aacaaaagca gaaagaggag gattaagcga attagacaaa gctggattta taaaaagaca 2760
acttgttgag acaagacaaa taactaagca tgttgctcaa atacttgatt caagaatgaa 2820
tacaaaatat gatgaaaatg ataaattaat cagagaagta aaagtaataa cattaaagtc 2880
aaaattagta tcagatttca gaaaggattt tcaattttac aaagttcgtg aaataaataa 2940
ctatcatcat gctcatgatg catacttaaa tgctgttgta ggaactgctc ttattaagaa 3000
atatcctaaa ctagaaagcg aatttgttta tggagattat aaagtttatg atgtgcgcaa 3060
aatgatcgcg aaatccgaac aagaaatcgg taaggctaca gcaaaatatt tcttttatag 3120
taatataatg aattttttta agacagaaat aactttggct aatggtgaaa tcagaaaaag 3180
accacttatc gaaacaaatg gagagacagg agaaatagta tgggataaag gaagagattt 3240
tgctactgtt agaaaagtac taagtatgcc acaagtaaat atcgtaaaga aaactgaagt 3300
tcaaactgga ggtttctcta aggaatcaat tttacctaag agaaattcag ataagttaat 3360
tgcaaggaaa aaagattggg acccaaaaaa atacggtggt tttgatagtc caacagttgc 3420
ctatagtgtt cttgtagtag cgaaagttga gaaaggtaag tcaaaaaagt tgaaaagcgt 3480
aaaagaactt cttggtatca caattatgga aagatcttca tttgaaaaaa atccaattga 3540
ctttttagaa gctaagggtt ataaagaagt taaaaaggat ttaatcataa aactaccaaa 3600
gtatagtcta tttgaactcg aaaacggaag aaaacgaatg ctcgctagcg caggagaact 3660
tcaaaaagga aatgaacttg cgctgccatc aaagtatgta aatttcttat atttagcttc 3720
tcattatgag aaattaaaag gatcaccaga ggataatgaa caaaagcaac tatttgtaga 3780
acaacacaaa cattatttag atgaaataat agaacaaata tctgaatttt ctaaaagagt 3840
tatacttgcc gacgcaaatc tagataaggt gctttcagcg tataataaac acagagataa 3900
accaataaga gaacaagcag aaaacattat ccatcttttt acattaacta atcttggtgc 3960
accagctgca tttaagtact ttgatacaac aatagataga aaaagataca catctactaa 4020
agaagtatta gacgcaactt taatacatca atctattaca gggctttatg aaacaagaat 4080
tgatttaagt caactaggcg gagattaagt cgacaaagta ttgttaaaaa taactctgta 4140
gaattataaa ttagttctac agagttattt tttgacccgg gtatattgat aaaaataata 4200
atagtgggta taattaagtt gttaggaggt tagttagaat gatgtcaaga ttagataaaa 4260
gtaaagtgat taacagcgca ttagagctgc ttaatgaggt cggaatcgaa ggtttaacaa 4320
cccgtaaact cgcccagaag ctaggtgtag agcagcctac attgtattgg catgtaaaaa 4380
ataagcgggc tttgctcgac gccttagcca ttgagatgtt agataggcac catactcact 4440
tttgcccttt agaaggggaa agctggcaag attttttacg taataacgct aaaagtttta 4500
gatgtgcttt actaagtcat cgcgatggag caaaagtaca tttaggtaca cggcctacag 4560
aaaaacagta tgaaactctc gaaaatcaat tagccttttt atgccaacaa ggtttttcac 4620
tagagaatgc attatatgca ctcagcgctg tggggcattt tactttaggt tgcgtattgg 4680
aagatcaaga gcatcaagtc gctaaagaag aaagggaaac acctactact gatagtatgc 4740
cgccattatt acgacaagct atcgaattat ttgatcacca aggtgcagag ccagccttct 4800
tattcggcct tgaattgatc atatgcggat tagaaaaaca acttaaatgt gaaagtgggt 4860
cttaaaagca gcataacctt tttccgtgat ggtaacttca cggtaaccaa gatgtcgagt 4920
tgagctcgaa ttcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca 4980
caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag 5040
tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 5100
cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 5160
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 5220
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 5280
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 5340
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 5400
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 5460
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 5520
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 5580
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 5640
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 5700
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 5760
ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag 5820
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 5880
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 5940
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 6000
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 6060
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccag gtccactgcc 6120
gggcctcttg cgggatcaaa agaaaaacga aatgatacac caatcagtgc aaaaaaagat 6180
ataatgggag ataagacggt tcgtgttcgt gctgacttgc accatatcat aaaaatcgaa 6240
acagcaaaga atggcggaaa cgtaaaagaa gttatggaaa taagacttag aagcaaactt 6300
aagagtgtgt tgatagtgca gtatcttaaa attttgtata ataggaattg aagttaaatt 6360
agatgctaaa aatttgtaat taagaaggag tgattacatg aacaaaaata taaaatattc 6420
tcaaaacttt ttaacgagtg aaaaagtact caaccaaata ataaaacaat tgaatttaaa 6480
agaaaccgat accgtttacg aaattggaac aggtaaaggg catttaacga cgaaactggc 6540
taaaataagt aaacaggtaa cgtctattga attagacagt catctattca acttatcgtc 6600
agaaaaatta aaactgaata ctcgtgtcac tttaattcac caagatattc tacagtttca 6660
attccctaac aaacagaggt ataaaattgt tgggagtatt ccttaccatt taagcacaca 6720
aattattaaa aaagtggttt ttgaaagcca tgcgtctgac atctatctga ttgttgaaga 6780
aggattctac aagcgtacct tggatattca ccgaacacta gggttgctct tgcacactca 6840
agtctcgatt cagcaattgc ttaagctgcc agcggaatgc tttcatccta aaccaaaagt 6900
aaacagtgtc ttaataaaac ttacccgcca taccacagat gttccagata aatattggaa 6960
gctatatacg tactttgttt caaaatgggt caatcgagaa tatcgtcaac tgtttactaa 7020
aaatcagttt catcaagcaa tgaaacacgc caaagtaaac aatttaagta ccgttactta 7080
tgagcaagta ttgtctattt ttaatagtta tctattattt aacgggagga aataattcta 7140
tgagtcccta ggcaggcctc cgccattatt tttttgaaca attgacaatt catttcttat 7200
tttttattaa gtgatagtca aaaggcataa cagtgctgaa tagaaagaaa tttacagaaa 7260
agaaaattat agaatttagt atgattaatt atactcattt atgaatgttt aattgaatac 7320
aaaaaaaaat acttgttatg tattcaatta cgggttaaaa tatagacaag ttgaaaaatt 7380
taataaaaaa ataagtcctc agctcttata tattaagcta ccaacttagt atataagcca 7440
aaacttaaat gtgctaccaa cacatcaagc cgttagagaa ctctatctat agcaatattt 7500
caaatgtacc gacatacaag agaaacatta actatatata ttcaatttat gagattatct 7560
taacagatat aaatgtaaat tgcaataagt aagatttaga agtttatagc ctttgtgtat 7620
tggaagcagt acgcaaaggc ttttttattt gataaaaatt agaagtatat ttattttttc 7680
ataattaatt tatgaaaatg aaagggggtg agcaaagtga cagaggaaag cagtatctta 7740
tcaaataaca aggtattagc aatatcatta ttgactttag cagtaaacat tatgactttt 7800
atagtgcttg tagctaagta gtacgaaagg gggagcttta aaaagctcct tggaatacat 7860
agaattcata aattaattta tgaaaagaag ggcgtatatg aaaacttgta aaaattgcaa 7920
agagtttatt aaagatactg aaatatgcaa aatacattcg ttgatgattc atgataaaac 7980
agtagcaacc tattgcagta aatacaatga gtcaagatgt ttacataaag ggaaagtcca 8040
atgtattaat tgttcaaaga tgaaccgata tggatggtgt gccataaaaa tgagatgttt 8100
tacagaggaa gaacagaaaa aagaacgtac atgcattaaa tattatgcaa ggagctttaa 8160
aaaagctcat gtaaagaaga gtaaaaagaa aaaataattt atttattaat ttaatattga 8220
gagtgccgac acagtatgca ctaaaaaata tatctgtggt gtagtgagcc gatacaaaag 8280
gatagtcact cgcattttca taatacatct tatgttatga ttatgtgtcg gtgggacttc 8340
acgacgaaaa cccacaataa aaaaagagtt cggggtaggg ttaagcatag ttgaggcaac 8400
taaacaatca agctaggata tgcagtagca gaccgtaagg tcgttgttta ggtgtgttgt 8460
aatacatacg ctattaagat gtaaaaatac ggataccaat gaagggaaaa gtataatttt 8520
tggatgtagt ttgtttgttc atctatgggc aaactacgtc caaagccgtt tccaaatctg 8580
ctaaaaagta tatcctttct aaaatcaaag tcaagtatga aatcataaat aaagtttaat 8640
tttgaagtta ttatgatatt atgtttttct attaaaataa attaagtata tagaatagtt 8700
taataatagt atatacttaa tgtgataagt gtctgacagt gtcacagaaa ggatgattgt 8760
tatggattat aagcggctcg agtccctatc agtgatagat tgaaactcta tcattgatag 8820
agtataatat ctttgttcat tagagcgata aacttgaatt tgagagggaa cttc 8874
<210> 8
<211> 4938
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 8
tcgactctag aggatccccg ggtaccgagc tcgaattcgt aatcatggtc atagctgttt 60
cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 120
tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 180
cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg 240
gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 300
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 360
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 420
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 480
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 540
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 600
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 660
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 720
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 780
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 840
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 900
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 960
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 1020
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 1080
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 1140
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 1200
tctgacagtt accaaagcta gcttaatact agtatatact taatgtgata agtgtctgac 1260
agctgaccgg tctaaagagg tccctagcgc ctacggggaa tttgtatcga taaggggtac 1320
aaattcccac taagcgctcg gccggggatc gatccccggg tacgtacccg gcagtttttc 1380
tttttcggca agtgttcaag aagttattaa gtcgggagtg cagtcgaagt gggcaagttg 1440
aaaaattcac aaaaatgtgg tataatatct ttgttcatta gagcgataaa cttgaatttg 1500
agagggaact tagatggtat ttgaaaaaat tgataaaaat agttggaaca gaaaagagta 1560
ttttgaccac tactttgcaa gtgtaccttg tacctacagc atgaccgtta aagtggatat 1620
cacacaaata aaggaaaagg gaatgaaact atatcctgca atgctttatt atattgcaat 1680
gattgtaaac cgccattcag agtttaggac ggcaatcaat caagatggtg aattggggat 1740
atatgatgag atgataccaa gctatacaat atttcacaat gatactgaaa cattttccag 1800
cctttggact gagtgtaagt ctgactttaa atcattttta gcagattatg aaagtgatac 1860
gcaacggtat ggaaacaatc atagaatgga aggaaagcca aatgctccgg aaaacatttt 1920
taatgtatct atgataccgt ggtcaacctt cgatggcttt aatctgaatt tgcagaaagg 1980
atatgattat ttgattccta tttttactat ggggaaatat tataaagaag ataacaaaat 2040
tatacttcct ttggcaattc aagttcatca cgcagtatgt gacggatttc acatttgccg 2100
ttttgtaaac gaattgcagg aattgataaa tagttaactt caggtttgtc tgtaactaaa 2160
aactagtatt taacctagga tcaaaaaaat ttccaataat cccactctaa gccacaaaca 2220
cgccctataa aatcccgctt taatcccact ttgagacaca tgtaatatta ctttacgccc 2280
tagtatagtg ataatttttt acattcaatg ccacgcaaaa aaataaaggg gcactataat 2340
aaaagttcct tcggaactaa ctaaagtaaa aaattatctt tacaacctcc ccaaaaaaaa 2400
gaacaggtac aaagtaccct ataatacaag cgtaaaaaaa atgagggtaa aaataaaaaa 2460
ataaaaaaat aaaaaaataa aaaaataaaa aaataaaaaa ataaaaaaat ataaaaataa 2520
aaaaatataa aaataaaaaa atataaaaat aaaaaaataa aaaaatataa aaataaaaaa 2580
ataaaaaaat ataaaaatat tttttattta aagtttgaaa aaaatttttt tatattatat 2640
aatctttgaa gaaaagaata taaaaaatga gcctttataa aagcccattt tttttcatat 2700
acgtaatatg acgttctaat gtttttattg gtacttctaa cattagagta atttctttat 2760
ttttaaagcc tttttcttta agggctttta ttttttttct taatacattt aattcctctt 2820
tttttgttgc ttttccttta gcttttaatt gctcttgata atttttttta cctctaatat 2880
tttctcttct cttatattcc tttttagaaa ttattattgt catatatttt tgttcttctt 2940
ctgtaatttc taataactct ataagagttt cattcttata cttatattgc ttatttttat 3000
ctaaataaca tctttcagca cttctagttg ctcttataac ttctctttca cttaaatgtt 3060
gtctaaacat actattaagt tctaaaacat catttaatgc cttctcaatg tcttctgtaa 3120
agctacaaag ataatatcta tataaaaata atataagctc tctgtgtcct tttaaatcat 3180
attctcttag ttcacaaagt tttattatgt cttgtattct tccataatat aaacttcttt 3240
ctctataaat ataatttatt ttgcttggtc tacccttttt cctttcatat ggttttaatt 3300
caggtaaaaa tccattttgt atttctctta agtcataaat atattcgtac tcatctaata 3360
tattgactac tgtttttgat ttagagttta tacttcctgg aactcttaat attctcgttg 3420
catctaaggc ttgtctatct gctccaaagt attttaattg attatataaa tattcttgaa 3480
ccgctttcca taatggtaat gctttactag gtactgcatt tattatccat attaaataca 3540
ttcctcttcc actatctatt acatagtttg gtataggaat actttgatta aaataattct 3600
tttctaagtc cattaatacc tggtctttag ttttgccagt tttataataa tccaagtcta 3660
taaacagtgt atttaactct tttatatttt ctaatcgcct acacggctta taaaaggtat 3720
ttagagttat atagatattt tcatcactca tatctaaatc ttttaattca gcgtatttat 3780
agtgccattg gctatatcct tttttatcta taacgctcct ggttatccac cctttacttc 3840
tactatgaat attatctata tagttctttt tattcagctt taatgcgttt ctcacttatt 3900
cacctcccct tctgtaaaac taagaaaatt atatcatatt ttcaataatt attaactatt 3960
cttaaactct taataaaaaa tagagtaagt ccccaattga aacttaatct attttttatg 4020
ttttaattta ttatttttat taaaatattt taaactaaat taaatgattc tttttaattt 4080
tttactattt cattccataa tatattacta taattattta caaataatat ttcttcattt 4140
gtaatattta gatgatttac taattttagt ttttatatat taaataatta atgtataatt 4200
tatataaaaa atcaaaggag cttataaatt atgattattt ccaaagatac taaagattta 4260
atttttttca attttaacaa tactttttgt aatattatgt ttaaatttaa ttgtattttt 4320
ttcatataat aaagccgttg aagtaaacca atccattttc cttatgatgt tattattaaa 4380
tttaagtttt ataataatat ctttattata tttattgttt ttaaaaaaac tagtgaaatt 4440
tctagtgaaa tttccggctt tattaaactt atttttagga attttatttt cattttcatc 4500
tttacaggat ttgattatat ctttaaatat gttttatcaa atattatctt tttctaaatt 4560
tatatatatt tttattatat ttattattat atatatttta tttttaagtt tctttctaac 4620
agctattaaa aagaaactta aaaataaaaa cacgtactct aaaccaataa ataaaactat 4680
ttttattatt gctgccttga ttggaatagt ttttagtaaa attaatttca atattccaca 4740
atattatatt ataagctagc acgcctcgag tatattgata aaaataataa tagtgggtat 4800
aattaagttg ttaggaggtt agttagactt aaaatccata tataacagtt ttagagctag 4860
aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 4920
tgcttttttt gaagcttg 4938
<210> 9
<211> 4938
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 9
tcgactctag aggatccccg ggtaccgagc tcgaattcgt aatcatggtc atagctgttt 60
cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 120
tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 180
cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg 240
gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 300
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 360
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 420
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 480
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 540
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 600
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 660
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 720
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 780
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 840
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 900
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 960
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 1020
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 1080
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 1140
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 1200
tctgacagtt accaaagcta gcttaatact agtatatact taatgtgata agtgtctgac 1260
agctgaccgg tctaaagagg tccctagcgc ctacggggaa tttgtatcga taaggggtac 1320
aaattcccac taagcgctcg gccggggatc gatccccggg tacgtacccg gcagtttttc 1380
tttttcggca agtgttcaag aagttattaa gtcgggagtg cagtcgaagt gggcaagttg 1440
aaaaattcac aaaaatgtgg tataatatct ttgttcatta gagcgataaa cttgaatttg 1500
agagggaact tagatggtat ttgaaaaaat tgataaaaat agttggaaca gaaaagagta 1560
ttttgaccac tactttgcaa gtgtaccttg tacctacagc atgaccgtta aagtggatat 1620
cacacaaata aaggaaaagg gaatgaaact atatcctgca atgctttatt atattgcaat 1680
gattgtaaac cgccattcag agtttaggac ggcaatcaat caagatggtg aattggggat 1740
atatgatgag atgataccaa gctatacaat atttcacaat gatactgaaa cattttccag 1800
cctttggact gagtgtaagt ctgactttaa atcattttta gcagattatg aaagtgatac 1860
gcaacggtat ggaaacaatc atagaatgga aggaaagcca aatgctccgg aaaacatttt 1920
taatgtatct atgataccgt ggtcaacctt cgatggcttt aatctgaatt tgcagaaagg 1980
atatgattat ttgattccta tttttactat ggggaaatat tataaagaag ataacaaaat 2040
tatacttcct ttggcaattc aagttcatca cgcagtatgt gacggatttc acatttgccg 2100
ttttgtaaac gaattgcagg aattgataaa tagttaactt caggtttgtc tgtaactaaa 2160
aactagtatt taacctagga tcaaaaaaat ttccaataat cccactctaa gccacaaaca 2220
cgccctataa aatcccgctt taatcccact ttgagacaca tgtaatatta ctttacgccc 2280
tagtatagtg ataatttttt acattcaatg ccacgcaaaa aaataaaggg gcactataat 2340
aaaagttcct tcggaactaa ctaaagtaaa aaattatctt tacaacctcc ccaaaaaaaa 2400
gaacaggtac aaagtaccct ataatacaag cgtaaaaaaa atgagggtaa aaataaaaaa 2460
ataaaaaaat aaaaaaataa aaaaataaaa aaataaaaaa ataaaaaaat ataaaaataa 2520
aaaaatataa aaataaaaaa atataaaaat aaaaaaataa aaaaatataa aaataaaaaa 2580
ataaaaaaat ataaaaatat tttttattta aagtttgaaa aaaatttttt tatattatat 2640
aatctttgaa gaaaagaata taaaaaatga gcctttataa aagcccattt tttttcatat 2700
acgtaatatg acgttctaat gtttttattg gtacttctaa cattagagta atttctttat 2760
ttttaaagcc tttttcttta agggctttta ttttttttct taatacattt aattcctctt 2820
tttttgttgc ttttccttta gcttttaatt gctcttgata atttttttta cctctaatat 2880
tttctcttct cttatattcc tttttagaaa ttattattgt catatatttt tgttcttctt 2940
ctgtaatttc taataactct ataagagttt cattcttata cttatattgc ttatttttat 3000
ctaaataaca tctttcagca cttctagttg ctcttataac ttctctttca cttaaatgtt 3060
gtctaaacat actattaagt tctaaaacat catttaatgc cttctcaatg tcttctgtaa 3120
agctacaaag ataatatcta tataaaaata atataagctc tctgtgtcct tttaaatcat 3180
attctcttag ttcacaaagt tttattatgt cttgtattct tccataatat aaacttcttt 3240
ctctataaat ataatttatt ttgcttggtc tacccttttt cctttcatat ggttttaatt 3300
caggtaaaaa tccattttgt atttctctta agtcataaat atattcgtac tcatctaata 3360
tattgactac tgtttttgat ttagagttta tacttcctgg aactcttaat attctcgttg 3420
catctaaggc ttgtctatct gctccaaagt attttaattg attatataaa tattcttgaa 3480
ccgctttcca taatggtaat gctttactag gtactgcatt tattatccat attaaataca 3540
ttcctcttcc actatctatt acatagtttg gtataggaat actttgatta aaataattct 3600
tttctaagtc cattaatacc tggtctttag ttttgccagt tttataataa tccaagtcta 3660
taaacagtgt atttaactct tttatatttt ctaatcgcct acacggctta taaaaggtat 3720
ttagagttat atagatattt tcatcactca tatctaaatc ttttaattca gcgtatttat 3780
agtgccattg gctatatcct tttttatcta taacgctcct ggttatccac cctttacttc 3840
tactatgaat attatctata tagttctttt tattcagctt taatgcgttt ctcacttatt 3900
cacctcccct tctgtaaaac taagaaaatt atatcatatt ttcaataatt attaactatt 3960
cttaaactct taataaaaaa tagagtaagt ccccaattga aacttaatct attttttatg 4020
ttttaattta ttatttttat taaaatattt taaactaaat taaatgattc tttttaattt 4080
tttactattt cattccataa tatattacta taattattta caaataatat ttcttcattt 4140
gtaatattta gatgatttac taattttagt ttttatatat taaataatta atgtataatt 4200
tatataaaaa atcaaaggag cttataaatt atgattattt ccaaagatac taaagattta 4260
atttttttca attttaacaa tactttttgt aatattatgt ttaaatttaa ttgtattttt 4320
ttcatataat aaagccgttg aagtaaacca atccattttc cttatgatgt tattattaaa 4380
tttaagtttt ataataatat ctttattata tttattgttt ttaaaaaaac tagtgaaatt 4440
tctagtgaaa tttccggctt tattaaactt atttttagga attttatttt cattttcatc 4500
tttacaggat ttgattatat ctttaaatat gttttatcaa atattatctt tttctaaatt 4560
tatatatatt tttattatat ttattattat atatatttta tttttaagtt tctttctaac 4620
agctattaaa aagaaactta aaaataaaaa cacgtactct aaaccaataa ataaaactat 4680
ttttattatt gctgccttga ttggaatagt ttttagtaaa attaatttca atattccaca 4740
atattatatt ataagctagc acgcctcgag tatattgata aaaataataa tagtgggtat 4800
aattaagttg ttaggaggtt agttagaact aaatgtaaaa tgttagcgtt ttagagctag 4860
aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg 4920
tgcttttttt gaagcttg 4938
<210> 10
<211> 5911
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 10
aattcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 60
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 120
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 180
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 240
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 300
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 360
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 420
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 480
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 540
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 600
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 660
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 720
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 780
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 840
tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 900
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 960
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 1020
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 1080
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 1140
atctaaagta tatatgagta aacttggtct gacagttacc aaagctagct taatactagt 1200
atatacttaa tgtgataagt gtctgacagc tgaccggtct aaagaggtcc ctagcgccta 1260
cggggaattt gtatcgataa ggggtacaaa ttcccactaa gcgctcggcc ggggatcgat 1320
ccccgggtac gtacccggca gtttttcttt ttcggcaagt gttcaagaag ttattaagtc 1380
gggagtgcag tcgaagtggg caagttgaaa aattcacaaa aatgtggtat aatatctttg 1440
ttcattagag cgataaactt gaatttgaga gggaacttag atggtatttg aaaaaattga 1500
taaaaatagt tggaacagaa aagagtattt tgaccactac tttgcaagtg taccttgtac 1560
ctacagcatg accgttaaag tggatatcac acaaataaag gaaaagggaa tgaaactata 1620
tcctgcaatg ctttattata ttgcaatgat tgtaaaccgc cattcagagt ttaggacggc 1680
aatcaatcaa gatggtgaat tggggatata tgatgagatg ataccaagct atacaatatt 1740
tcacaatgat actgaaacat tttccagcct ttggactgag tgtaagtctg actttaaatc 1800
atttttagca gattatgaaa gtgatacgca acggtatgga aacaatcata gaatggaagg 1860
aaagccaaat gctccggaaa acatttttaa tgtatctatg ataccgtggt caaccttcga 1920
tggctttaat ctgaatttgc agaaaggata tgattatttg attcctattt ttactatggg 1980
gaaatattat aaagaagata acaaaattat acttcctttg gcaattcaag ttcatcacgc 2040
agtatgtgac ggatttcaca tttgccgttt tgtaaacgaa ttgcaggaat tgataaatag 2100
ttaacttcag gtttgtctgt aactaaaaac tagtatttaa cctaggatca aaaaaatttc 2160
caataatccc actctaagcc acaaacacgc cctataaaat cccgctttaa tcccactttg 2220
agacacatgt aatattactt tacgccctag tatagtgata attttttaca ttcaatgcca 2280
cgcaaaaaaa taaaggggca ctataataaa agttccttcg gaactaacta aagtaaaaaa 2340
ttatctttac aacctcccca aaaaaaagaa caggtacaaa gtaccctata atacaagcgt 2400
aaaaaaaatg agggtaaaaa taaaaaaata aaaaaataaa aaaataaaaa aataaaaaaa 2460
taaaaaaata aaaaaatata aaaataaaaa aatataaaaa taaaaaaata taaaaataaa 2520
aaaataaaaa aatataaaaa taaaaaaata aaaaaatata aaaatatttt ttatttaaag 2580
tttgaaaaaa atttttttat attatataat ctttgaagaa aagaatataa aaaatgagcc 2640
tttataaaag cccatttttt ttcatatacg taatatgacg ttctaatgtt tttattggta 2700
cttctaacat tagagtaatt tctttatttt taaagccttt ttctttaagg gcttttattt 2760
tttttcttaa tacatttaat tcctcttttt ttgttgcttt tcctttagct tttaattgct 2820
cttgataatt ttttttacct ctaatatttt ctcttctctt atattccttt ttagaaatta 2880
ttattgtcat atatttttgt tcttcttctg taatttctaa taactctata agagtttcat 2940
tcttatactt atattgctta tttttatcta aataacatct ttcagcactt ctagttgctc 3000
ttataacttc tctttcactt aaatgttgtc taaacatact attaagttct aaaacatcat 3060
ttaatgcctt ctcaatgtct tctgtaaagc tacaaagata atatctatat aaaaataata 3120
taagctctct gtgtcctttt aaatcatatt ctcttagttc acaaagtttt attatgtctt 3180
gtattcttcc ataatataaa cttctttctc tataaatata atttattttg cttggtctac 3240
cctttttcct ttcatatggt tttaattcag gtaaaaatcc attttgtatt tctcttaagt 3300
cataaatata ttcgtactca tctaatatat tgactactgt ttttgattta gagtttatac 3360
ttcctggaac tcttaatatt ctcgttgcat ctaaggcttg tctatctgct ccaaagtatt 3420
ttaattgatt atataaatat tcttgaaccg ctttccataa tggtaatgct ttactaggta 3480
ctgcatttat tatccatatt aaatacattc ctcttccact atctattaca tagtttggta 3540
taggaatact ttgattaaaa taattctttt ctaagtccat taatacctgg tctttagttt 3600
tgccagtttt ataataatcc aagtctataa acagtgtatt taactctttt atattttcta 3660
atcgcctaca cggcttataa aaggtattta gagttatata gatattttca tcactcatat 3720
ctaaatcttt taattcagcg tatttatagt gccattggct atatcctttt ttatctataa 3780
cgctcctggt tatccaccct ttacttctac tatgaatatt atctatatag ttctttttat 3840
tcagctttaa tgcgtttctc acttattcac ctccccttct gtaaaactaa gaaaattata 3900
tcatattttc aataattatt aactattctt aaactcttaa taaaaaatag agtaagtccc 3960
caattgaaac ttaatctatt ttttatgttt taatttatta tttttattaa aatattttaa 4020
actaaattaa atgattcttt ttaatttttt actatttcat tccataatat attactataa 4080
ttatttacaa ataatatttc ttcatttgta atatttagat gatttactaa ttttagtttt 4140
tatatattaa ataattaatg tataatttat ataaaaaatc aaaggagctt ataaattatg 4200
attatttcca aagatactaa agatttaatt tttttcaatt ttaacaatac tttttgtaat 4260
attatgttta aatttaattg tatttttttc atataataaa gccgttgaag taaaccaatc 4320
cattttcctt atgatgttat tattaaattt aagttttata ataatatctt tattatattt 4380
attgttttta aaaaaactag tgaaatttct agtgaaattt ccggctttat taaacttatt 4440
tttaggaatt ttattttcat tttcatcttt acaggatttg attatatctt taaatatgtt 4500
ttatcaaata ttatcttttt ctaaatttat atatattttt attatattta ttattatata 4560
tattttattt ttaagtttct ttctaacagc tattaaaaag aaacttaaaa ataaaaacac 4620
gtactctaaa ccaataaata aaactatttt tattattgct gccttgattg gaatagtttt 4680
tagtaaaatt aatttcaata ttccacaata ttatattata agctagcacg cctcgagtat 4740
attgataaaa ataataatag tgggtataat taagttgtta ggaggttagt tagaactaaa 4800
tgtaaaatgt tagcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 4860
caacttgaaa aagtggcacc gagtcggtgc tttttttgaa gcttgtcgac atgaagatag 4920
caataggtag tgatcatgca ggattttcat tgaaaaagga agttataaaa catttagaga 4980
gtaaaaatat tgaggttaaa gattttggca ctctaactga tgaatcatgt gattatccag 5040
attatgcatt aaaagtagca gaggaagttg ctcaaaaaaa ctttgagttt ggaatactca 5100
tttgtggaac aggtatagga ataagcatat cagcaaataa ggtgccagga ataagagcag 5160
ctgtatgtac agatacattc tgtgctcatg catcaagaga acataacaat gcaaatatac 5220
ttgcaatggg agaaagagtt gtaggacctg gattagcaat tgatatagta gatacatttt 5280
taaattcaaa atttcaggga gataggcatc aaagaagaat agacaagatt acacaaatag 5340
aaaaaaaata caatggagga atgaaataat gagtaaagtt acacaaatat cacatccact 5400
tatattacac aaacttcctc aagatataga ggaaagagac ataatagtaa ctgatccaat 5460
gcttgcaact ggtgggtcag caatagatgc aataacactt cttaagaaaa gaggagcaaa 5520
atacataaga cttatgtgtc ttataggagc accagaaggt atagcagcag tacaagaagc 5580
acatccagat gtagatatat acctcgcatc aatagatgaa aagttagatg aaaatggata 5640
tatagttcct ggtcttggag atgctggaga tagattattc ggtacaaaat aaattgcata 5700
aataaaaagg gctgaaaaat aaatttcagt ccttttattt atattttaac tttattccat 5760
gccactgcct cttctgataa taatagaaat tattaaagtt aatacagatg taagggcaac 5820
tgttccacct ggagcacaat ttaagtaata agagctaaat aatccaacga gtacatctat 5880
aaagctaaat aatattgata atataagcgt g 5911
<210> 11
<211> 6217
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 11
aattcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 60
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 120
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 180
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 240
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 300
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 360
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 420
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 480
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 540
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 600
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 660
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 720
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 780
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 840
tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 900
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 960
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 1020
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 1080
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 1140
atctaaagta tatatgagta aacttggtct gacagttacc aaagctagct taatactagt 1200
atatacttaa tgtgataagt gtctgacagc tgaccggtct aaagaggtcc ctagcgccta 1260
cggggaattt gtatcgataa ggggtacaaa ttcccactaa gcgctcggcc ggggatcgat 1320
ccccgggtac gtacccggca gtttttcttt ttcggcaagt gttcaagaag ttattaagtc 1380
gggagtgcag tcgaagtggg caagttgaaa aattcacaaa aatgtggtat aatatctttg 1440
ttcattagag cgataaactt gaatttgaga gggaacttag atggtatttg aaaaaattga 1500
taaaaatagt tggaacagaa aagagtattt tgaccactac tttgcaagtg taccttgtac 1560
ctacagcatg accgttaaag tggatatcac acaaataaag gaaaagggaa tgaaactata 1620
tcctgcaatg ctttattata ttgcaatgat tgtaaaccgc cattcagagt ttaggacggc 1680
aatcaatcaa gatggtgaat tggggatata tgatgagatg ataccaagct atacaatatt 1740
tcacaatgat actgaaacat tttccagcct ttggactgag tgtaagtctg actttaaatc 1800
atttttagca gattatgaaa gtgatacgca acggtatgga aacaatcata gaatggaagg 1860
aaagccaaat gctccggaaa acatttttaa tgtatctatg ataccgtggt caaccttcga 1920
tggctttaat ctgaatttgc agaaaggata tgattatttg attcctattt ttactatggg 1980
gaaatattat aaagaagata acaaaattat acttcctttg gcaattcaag ttcatcacgc 2040
agtatgtgac ggatttcaca tttgccgttt tgtaaacgaa ttgcaggaat tgataaatag 2100
ttaacttcag gtttgtctgt aactaaaaac tagtatttaa cctaggatca aaaaaatttc 2160
caataatccc actctaagcc acaaacacgc cctataaaat cccgctttaa tcccactttg 2220
agacacatgt aatattactt tacgccctag tatagtgata attttttaca ttcaatgcca 2280
cgcaaaaaaa taaaggggca ctataataaa agttccttcg gaactaacta aagtaaaaaa 2340
ttatctttac aacctcccca aaaaaaagaa caggtacaaa gtaccctata atacaagcgt 2400
aaaaaaaatg agggtaaaaa taaaaaaata aaaaaataaa aaaataaaaa aataaaaaaa 2460
taaaaaaata aaaaaatata aaaataaaaa aatataaaaa taaaaaaata taaaaataaa 2520
aaaataaaaa aatataaaaa taaaaaaata aaaaaatata aaaatatttt ttatttaaag 2580
tttgaaaaaa atttttttat attatataat ctttgaagaa aagaatataa aaaatgagcc 2640
tttataaaag cccatttttt ttcatatacg taatatgacg ttctaatgtt tttattggta 2700
cttctaacat tagagtaatt tctttatttt taaagccttt ttctttaagg gcttttattt 2760
tttttcttaa tacatttaat tcctcttttt ttgttgcttt tcctttagct tttaattgct 2820
cttgataatt ttttttacct ctaatatttt ctcttctctt atattccttt ttagaaatta 2880
ttattgtcat atatttttgt tcttcttctg taatttctaa taactctata agagtttcat 2940
tcttatactt atattgctta tttttatcta aataacatct ttcagcactt ctagttgctc 3000
ttataacttc tctttcactt aaatgttgtc taaacatact attaagttct aaaacatcat 3060
ttaatgcctt ctcaatgtct tctgtaaagc tacaaagata atatctatat aaaaataata 3120
taagctctct gtgtcctttt aaatcatatt ctcttagttc acaaagtttt attatgtctt 3180
gtattcttcc ataatataaa cttctttctc tataaatata atttattttg cttggtctac 3240
cctttttcct ttcatatggt tttaattcag gtaaaaatcc attttgtatt tctcttaagt 3300
cataaatata ttcgtactca tctaatatat tgactactgt ttttgattta gagtttatac 3360
ttcctggaac tcttaatatt ctcgttgcat ctaaggcttg tctatctgct ccaaagtatt 3420
ttaattgatt atataaatat tcttgaaccg ctttccataa tggtaatgct ttactaggta 3480
ctgcatttat tatccatatt aaatacattc ctcttccact atctattaca tagtttggta 3540
taggaatact ttgattaaaa taattctttt ctaagtccat taatacctgg tctttagttt 3600
tgccagtttt ataataatcc aagtctataa acagtgtatt taactctttt atattttcta 3660
atcgcctaca cggcttataa aaggtattta gagttatata gatattttca tcactcatat 3720
ctaaatcttt taattcagcg tatttatagt gccattggct atatcctttt ttatctataa 3780
cgctcctggt tatccaccct ttacttctac tatgaatatt atctatatag ttctttttat 3840
tcagctttaa tgcgtttctc acttattcac ctccccttct gtaaaactaa gaaaattata 3900
tcatattttc aataattatt aactattctt aaactcttaa taaaaaatag agtaagtccc 3960
caattgaaac ttaatctatt ttttatgttt taatttatta tttttattaa aatattttaa 4020
actaaattaa atgattcttt ttaatttttt actatttcat tccataatat attactataa 4080
ttatttacaa ataatatttc ttcatttgta atatttagat gatttactaa ttttagtttt 4140
tatatattaa ataattaatg tataatttat ataaaaaatc aaaggagctt ataaattatg 4200
attatttcca aagatactaa agatttaatt tttttcaatt ttaacaatac tttttgtaat 4260
attatgttta aatttaattg tatttttttc atataataaa gccgttgaag taaaccaatc 4320
cattttcctt atgatgttat tattaaattt aagttttata ataatatctt tattatattt 4380
attgttttta aaaaaactag tgaaatttct agtgaaattt ccggctttat taaacttatt 4440
tttaggaatt ttattttcat tttcatcttt acaggatttg attatatctt taaatatgtt 4500
ttatcaaata ttatcttttt ctaaatttat atatattttt attatattta ttattatata 4560
tattttattt ttaagtttct ttctaacagc tattaaaaag aaacttaaaa ataaaaacac 4620
gtactctaaa ccaataaata aaactatttt tattattgct gccttgattg gaatagtttt 4680
tagtaaaatt aatttcaata ttccacaata ttatattata agctagcacg cctcgagtat 4740
attgataaaa ataataatag tgggtataat taagttgtta ggaggttagt tagaactaaa 4800
tgtaaaatgt tagcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 4860
caacttgaaa aagtggcacc gagtcggtgc tttttttgaa gcttgtcgac atgaagatag 4920
caataggtag tgatcatgca ggattttcat tgaaaaagga agttataaaa catttagaga 4980
gtaaaaatat tgaggttaaa gattttggca ctctaactga tgaatcatgt gattatccag 5040
attatgcatt aaaagtagca gaggaagttg ctcaaaaaaa ctttgagttt ggaatactca 5100
tttgtggaac aggtatagga ataagcatat cagcaaataa ggtgccagga ataagagcag 5160
ctgtatgtac agatacattc tgtgctcatg catcaagaga acataacaat gcaaatatac 5220
ttgcaatggg agaaagagtt gtaggacctg gattagcaat tgatatagta gatacatttt 5280
taaattcaaa atttcaggga gataggcatc aaagaagaat agacaagatt acacaaatag 5340
aaaaaaaata caatggagga atgaaataat gagtaaagtt acacaaatat cacatccact 5400
tatattacac aaattagcat ttatgagaga taaaaaaaca ggatctaaag attttagaga 5460
gatggtagaa gaagtagcaa tgctaatggc atatgaagta acaagagaaa tgcagcttga 5520
aactgttgaa atagaaactc ctatatgtat aactaaatgt aagatgtaag caggaaaaaa 5580
ggtagctata gttcctatac ttagagcagg acttggaatg gtaaatggag tattaaaatt 5640
aatacctgct gctaaggttg gacatatagg attatataga gatgaaaaga cattaaaacc 5700
tgtagaatac ttctgtaaac ttcctcaaga tatagaggaa agagacataa tagtaactga 5760
tccaatgctt gcaactggtg ggtcagcaat agatgcaata acacttctta agaaaagagg 5820
agcaaaatac ataagactta tgtgtcttat aggagcacca gaaggtatag cagcagtaca 5880
agaagcacat ccagatgtag atatatacct cgcatcaata gatgaaaagt tagatgaaaa 5940
tggatatata gttcctggtc ttggagatgc tggagataga ttattcggta caaaataaat 6000
tgcataaata aaaagggctg aaaaataaat ttcagtcctt ttatttatat tttaacttta 6060
ttccatgcca ctgcctcttc tgataataat agaaattatt aaagttaata cagatgtaag 6120
ggcaactgtt ccacctggag cacaatttaa gtaataagag ctaaataatc caacgagtac 6180
atctataaag ctaaataata ttgataatat aagcgtg 6217
<210> 12
<211> 1002
<212> DNA
<213> Artificial Sequence
<220>
<223> upp_del
<400> 12
catgaagata gcaataggta gtgatcatgc aggattttca ttgaaaaagg aagttataaa 60
acatttagag agtaaaaata ttgaggttaa agattttggc actctaactg atgaatcatg 120
tgattatcca gattatgcat taaaagtagc agaggaagtt gctcaaaaaa actttgagtt 180
tggaatactc atttgtggaa caggtatagg aataagcata tcagcaaata aggtgccagg 240
aataagagca gctgtatgta cagatacatt ctgtgctcat gcatcaagag aacataacaa 300
tgcaaatata cttgcaatgg gagaaagagt tgtaggacct ggattagcaa ttgatatagt 360
agatacattt ttaaattcaa aatttcaggg agataggcat caaagaagaa tagacaagat 420
tacacaaata gaaaaaaaat acaatggagg aatgaaataa tgagtaaagt tacacaaata 480
tcacatccac ttatattaca caaacttcct caagatatag aggaaagaga cataatagta 540
actgatccaa tgcttgcaac tggtgggtca gcaatagatg caataacact tcttaagaaa 600
agaggagcaa aatacataag acttatgtgt cttataggag caccagaagg tatagcagca 660
gtacaagaag cacatccaga tgtagatata tacctcgcat caatagatga aaagttagat 720
gaaaatggat atatagttcc tggtcttgga gatgctggag atagattatt cggtacaaaa 780
taaattgcat aaataaaaag ggctgaaaaa taaatttcag tccttttatt tatattttaa 840
ctttattcca tgccactgcc tcttctgata ataatagaaa ttattaaagt taatacagat 900
gtaagggcaa ctgttccacc tggagcacaa tttaagtaat aagagctaaa taatccaacg 960
agtacatcta taaagctaaa taatattgat aatataagcg tg 1002
<210> 13
<211> 1306
<212> DNA
<213> Artificial Sequence
<220>
<223> upp_stop
<400> 13
atgaagatag caataggtag tgatcatgca ggattttcat tgaaaaagga agttataaaa 60
catttagaga gtaaaaatat tgaggttaaa gattttggca ctctaactga tgaatcatgt 120
gattatccag attatgcatt aaaagtagca gaggaagttg ctcaaaaaaa ctttgagttt 180
ggaatactca tttgtggaac aggtatagga ataagcatat cagcaaataa ggtgccagga 240
ataagagcag ctgtatgtac agatacattc tgtgctcatg catcaagaga acataacaat 300
gcaaatatac ttgcaatggg agaaagagtt gtaggacctg gattagcaat tgatatagta 360
gatacatttt taaattcaaa atttcaggga gataggcatc aaagaagaat agacaagatt 420
acacaaatag aaaaaaaata caatggagga atgaaataat gagtaaagtt acacaaatat 480
cacatccact tatattacac aaattagcat ttatgagaga taaaaaaaca ggatctaaag 540
attttagaga gatggtagaa gaagtagcaa tgctaatggc atatgaagta acaagagaaa 600
tgcagcttga aactgttgaa atagaaactc ctatatgtat aactaaatgt aagatgtaag 660
caggaaaaaa ggtagctata gttcctatac ttagagcagg acttggaatg gtaaatggag 720
tattaaaatt aatacctgct gctaaggttg gacatatagg attatataga gatgaaaaga 780
cattaaaacc tgtagaatac ttctgtaaac ttcctcaaga tatagaggaa agagacataa 840
tagtaactga tccaatgctt gcaactggtg ggtcagcaat agatgcaata acacttctta 900
agaaaagagg agcaaaatac ataagactta tgtgtcttat aggagcacca gaaggtatag 960
cagcagtaca agaagcacat ccagatgtag atatatacct cgcatcaata gatgaaaagt 1020
tagatgaaaa tggatatata gttcctggtc ttggagatgc tggagataga ttattcggta 1080
caaaataaat tgcataaata aaaagggctg aaaaataaat ttcagtcctt ttatttatat 1140
tttaacttta ttccatgcca ctgcctcttc tgataataat agaaattatt aaagttaata 1200
cagatgtaag ggcaactgtt ccacctggag cacaatttaa gtaataagag ctaaataatc 1260
caacgagtac atctataaag ctaaataata ttgataatat aagcgt 1306
<210> 14
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 14
gtgggcaagt tgaaaaattc ac 22
<210> 15
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 15
ttaactattt atcaattcct gcaattcg 28
<210> 16
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 16
cttgagactt tgccgtgagg g 21
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 17
tagttggaat gggcgctagt 20
<210> 18
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 18
atgaagatag caataggtag tgatcatgc 29
<210> 19
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 19
acgcttatat tatcaatatt atttagcttt atag 34
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 20
tgtccaacct tagcagcagg 20
<210> 21
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 21
gtagaagaag tagcaatgct aatggc 26
<210> 22
<211> 62
<212> DNA
<213> Clostridium acetobutylicum
<400> 22
aaactcctat atgtataact aaatgtaaaa tgttagcagg aaaaaaggta gctatagttc 60
ct 62
<210> 23
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> fragment upp_stop fig7
<400> 23
aaactcctat atgtataact aaatgtaaga tgtaagcagg aaaaaaggta gctatagttc 60
ct 62
<210> 24
<211> 86
<212> DNA
<213> Clostridium acetobutylicum
<400> 24
aaactgttga aatagaaact cctatatgta taactaaatg taaaatgtta gcaggaaaaa 60
aggtagctat agttcctata cttaga 86
<210> 25
<211> 86
<212> DNA
<213> Artificial Sequence
<220>
<223> fragment upp_stop fig16
<400> 25
aaactgttga aatagaaact cctatatgta taactaaatg taagatgtaa gcaggaaaaa 60
aggtagctat agttcctata cttaga 86
<210> 26
<211> 10537
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 26
tcgactctag aggatcctac ttggttttat agagatttta aggaggaagc tatgaagata 60
ctttttgttt gtactggtaa tacatgtaga agctgtatgg cagaagctat gtttaatagt 120
atgtgtaata tagatggtat agaagctttt tcagcaggtg catctgctat tcatggaagc 180
aaaacttcct taaattcggc tgtggtagtt agggagaact taggcaaaga tatatcaaat 240
agaaaggcta tacagttgac tactttttta gttgatgaat gtgatttagt tttaacaatg 300
acatctttat taagtgacgt gcttagaagt caaatggaga agaactctaa taagatatat 360
tcattaagtg aatatacagg tgtagagggt gacattactg acccatatgg tagaagtgta 420
gagatctaca gacaaactta taaagacatt gaaaagaggc taaaaatact tattaaaaaa 480
ctaaatgaag atagaagtat ttaatcatat actcttatct tctttttttg cgattatgta 540
ttaagtggag gtgtttttat gaagatagca ataggtagtg atcatgcagg attttcattg 600
aaaaaggaag ttataaaaca tttagagagt aaaaatattg aggttaaaga ttttggcact 660
ctaactgatg aatcatgtga ttatccagat tatgcattaa aagtagcaga ggaagttgct 720
caaaaaaact ttgagtttgg aatactcatt tgtggaacag gtataggaat aagcatatca 780
gcaaataagg tgccaggaat aagagcagct gtatgtacag atacattctg tgctcatgca 840
tcaagagaac ataacaatgc aaatatactt gcaatgggag aaagagttgt aggacctgga 900
ttagcaattg atatagtaga tacattttta aattcaaaat ttcagggaga taggcatcaa 960
agaagaatag acaagattac acaaatagaa aaaaaataca atggaggaat gaaataaaaa 1020
aataagagtt accatttaag gtaactctta tttttattac ttaagataat catatataac 1080
ttcagctcta ggcaatatta tatctgcaag aatgtgagag ctagaaacaa tctcttttac 1140
tggcaaatca ttaagtggcg ccatagcgtg atcaaataac tgcagtcgag ttggtcctgt 1200
ccaagcttca tgtacggtaa catctgtgat tttcgcattt ataagctcac atattctagg 1260
gcttccatca taattgggta ttattttcaa catataatta gggcgacaaa tttgatcctt 1320
tgcttcatta gcatctaagg ctttatgttt gtaccccatt gtagctgtcg caactctaag 1380
ttttccatag tctaaagttc ctactaaagt atctgaatcc acaaaaagct ttggataccc 1440
gagcttttta ggatatgcac ttaattccct tcctactgca attgcaggct cattatctaa 1500
atacatcata tgaagataat ctcccttaac tccattaaag cttacgggaa tagcctgtcc 1560
gctttctgta taacaaccaa gtccactcgt atcatgcatt gccataattt caaacctgac 1620
taagggctca tcaatttcta aaggctctgg cacaacttta cgaagtgcat ccatatctgt 1680
acgatataca atgttaaaat actcacgatt atgaaattta tagggtcctc taggaaatgc 1740
aggcgaagtt aatggcgtgc taatttgttt aattacttca tcctttaaca taaaagtcac 1800
cttcctaaat ttaataatgt ttagcttttc taacatactt tatcttcaca ttataaatcg 1860
cctctagtcc tatttattta tatctagtta ttttttgtcg actgtttcat agtatttctt 1920
tctaaacagc catgggtcta agttcattgg atatgagtaa atctgcagca gttaaagacc 1980
ttatttcatc aatggttgtg tttttattaa tttcagtgag aagtaaacca tcattaataa 2040
cctcaattac tccaagttct gttacaatta gatttgcttg agactttgcc gtgaggggaa 2100
gtgtacattt ttttaaaatt ttaggttgac ctttatttgt atgtctcatt gcaattatta 2160
ctttcttagc tccatttact aaatccatag ctccacccat accagagagc atttttccag 2220
gaacaatcca attggctata ttaccctttt catctacctg gagagcccct aaaacagtaa 2280
catctacgtg accaccacgg attagtgaaa acgaaactga gctatcgaaa aatgtgccgt 2340
caggaagtac tgttgtatag tctcctcctg catttactac atctttatct gcctcattta 2400
ttttaggact agcgcccatt ccaactattc cgttttctga ttggaaagta attttgaaat 2460
tttttggtat ataatctgca accatggtag gaagacctac acctaagttt acaagttgac 2520
cattttttaa ttctcttgca actcttttgg ctattatttc tttcgctagg tttttatcat 2580
taatcatttt atgcaggctc ctttactata taatttataa gaactccggg ggtcattgct 2640
ttttcctttt ctagtttttc acagctaact aaattttcag cttcaactat tacggtttta 2700
gctgccattg ccatataggg attaaagttt ttagtagtac ctttatagaa ggtgtttccg 2760
gcctcatcta caatactacc tttaattaat gctacatcgg ctgtaagagg tagctctaac 2820
aaatattccg ttccatttat agatattttt ttctttcctt tttcaatcaa agttcctaaa 2880
cctgttttag ttagtacacc acctaagcca gatccgcctg cacgtattct ttccactaga 2940
gttccttggg gagagagctc tacttcaagt tcattattaa aaagtttttt gccagtatct 3000
gggttgctgc ctatatatga agcaataagc ttttttactt gattatttga tattaactta 3060
ccaatacctg tattaggata acatgtatca ttacttataa tcgttaaatt ctttatattt 3120
aaattaacta aaaaatcaat taatttggtt ggagtgccac agtttaaaaa acctccaatc 3180
ataattgtca tcccatcttt aaagaatgac cttaaatttt caaatctaat tattttagag 3240
ttcattttaa tccctccttt taaattctct agaaaaatta tctcgaggta taatcctcca 3300
tgatctatta tgttataata taactactgc tttaattaag tcttttggct tgtctttcat 3360
taataacagt gcttcttcta tgtgatcaaa tccatgatat acatgtgtaa ctaatttact 3420
tagatcaaca cgattatata ctaccatatc tcttaacatt tctgctctca aacgtccccc 3480
aggacaaaga cctcctttta tagtcttgtg agccattcca catccccatt ctacacgtgg 3540
tattagtaaa gcatctccac ttccatgata atttatatta gaaattattc ctcctggttt 3600
aaccatagat actgcttggg ataatgtttc agaaccaccg cctgccataa ttacgcggtc 3660
aacgcctttt ccattcgtta atttcataac ttgatcaact atatgaccat ttttataatt 3720
tagaatatct gttgctccat aaaattttgc agcctcaaca caaatcggcc tgctccccac 3780
tccaattatt ctacctgctc cacgtaattt agcacctgct attcccatta agccaacagc 3840
tccaatgcca attaccacaa cacttgaacc catttgaata tctgcaagtt ctgctccatg 3900
aaatccagta gtcatcatat ctgttatcat aacagcattt tctaatggca tgtctttagg 3960
tagaatcgca agattcatat ccgcatcatt tacatgaaaa tattcaccaa aaactccatc 4020
cttgaaattt gaaaatttcc atcctgcgag cataccgttt gagtgctgtt gaaaaccagc 4080
ttgaacttcc aaagatctcc aatctggagt tgtacaagga actataactc tgtcaccagg 4140
tttaaaatcc ttcacttcac ttcctacttc aacaacttca cctacagctt catgccctaa 4200
aatcatattc ttcctatctc caagagctcc ctcaaaaaca gtatgtatat ctgatgtaca 4260
cggagatact gctaatgggc gtacaatagc atcatatgaa cccgcaactg gcctttcttt 4320
ttcgatccat cctaacttat taatacctag cattgcaaaa cctttcataa aatatgttcc 4380
tccttaaaaa tattccttta atagtctaag ggcccccata gtttatccct aatttatacg 4440
ttttctctaa caacttaatt atacccacta ttattatttt tatcaatata ttttgttaaa 4500
aaaaacacaa agtttaatat tttttaacaa aaaaattaaa cttatgcata tgctaacccc 4560
cttaaaatca tgttttagca taaatacata agtttatatt ttaactatat taatgtaata 4620
aaaaatactt gattgcataa ataaaaaggg ctgaaaaata aatttcagtc cttttattta 4680
tattttaact ttattccatg ccactgcctc ttctgataat aatagaaatt attaaagtta 4740
atacagatgt aagggcaact gttccacctg gagcacaatt taagtaataa gagctaaata 4800
atccaacgag tacatctata aagctaaata atattgataa tataagcgtt gacttaaatc 4860
cctttttaaa ctgcatagca gcagctacag gtacagctaa tagtgaagag acaactaata 4920
tccctgttat acgtattgaa acggatataa cgaaaccgac aacgatagaa aatatgtaat 4980
ttaaaaattt tgtgtttatg ccagataccc ttgcaccttg ctcatcaaat gttgtatata 5040
aaaagttgtt ataaaatata gctataagaa atatagatac tacacttatt attagtataa 5100
gtacgagatc acttttacca acagttaaaa tacttccaaa aagaaaagat tcaatgtttc 5160
cgcttgcacg tccacttgtt gttaaggtta tagctattcc aacagataga gttaatataa 5220
ttggaagtat taagtccgaa tactgcttaa aggagtttct aagtaattct attaagacag 5280
cacaaatagt tacaaaaata aaggttgtta tcataggatt tacgccaata aagataccta 5340
tagctacacc ggcaaaagaa gcatgtgata atgcatcacc taccattgag tgtcttttta 5400
aaactaagaa aatacctata agtggacaca aaattgcaat cattaccgag gcaagtaaag 5460
cgttttgcat aaaacttaga cgaaatagtt caatcattat ttaacaacct ccatattgct 5520
ttttaaaaaa tcgttaatgt taagcaaaga gccactttct ccatggaaat tgaaaatatg 5580
agttgaatta gaataagcag cctttaaatt atgttctaca catattattg tgaattcgta 5640
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 5700
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 5760
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 5820
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 5880
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 5940
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 6000
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 6060
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 6120
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 6180
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 6240
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 6300
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 6360
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 6420
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 6480
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 6540
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 6600
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 6660
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 6720
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 6780
tatatatgag taaacttggt ctgacagtta ccaaagctag cttaatacta gtatatactt 6840
aatgtgataa gtgtctgaca gctgaccggt ctaaagaggt ccctagcgcc tacggggaat 6900
ttgtatcgat aaggggtaca aattcccact aagcgctcgg ccggggatcg atccccgggt 6960
acgtacccgg cagtttttct ttttcggcaa gtgttcaaga agttattaag tcgggagtgc 7020
agtcgaagtg ggcaagttga aaaattcaca aaaatgtggt ataatatctt tgttcattag 7080
agcgataaac ttgaatttga gagggaactt agatggtatt tgaaaaaatt gataaaaata 7140
gttggaacag aaaagagtat tttgaccact actttgcaag tgtaccttgt acctacagca 7200
tgaccgttaa agtggatatc acacaaataa aggaaaaggg aatgaaacta tatcctgcaa 7260
tgctttatta tattgcaatg attgtaaacc gccattcaga gtttaggacg gcaatcaatc 7320
aagatggtga attggggata tatgatgaga tgataccaag ctatacaata tttcacaatg 7380
atactgaaac attttccagc ctttggactg agtgtaagtc tgactttaaa tcatttttag 7440
cagattatga aagtgatacg caacggtatg gaaacaatca tagaatggaa ggaaagccaa 7500
atgctccgga aaacattttt aatgtatcta tgataccgtg gtcaaccttc gatggcttta 7560
atctgaattt gcagaaagga tatgattatt tgattcctat ttttactatg gggaaatatt 7620
ataaagaaga taacaaaatt atacttcctt tggcaattca agttcatcac gcagtatgtg 7680
acggatttca catttgccgt tttgtaaacg aattgcagga attgataaat agttaacttc 7740
aggtttgtct gtaactaaaa actagtattt aacctaggat caaaaaaatt tccaataatc 7800
ccactctaag ccacaaacac gccctataaa atcccgcttt aatcccactt tgagacacat 7860
gtaatattac tttacgccct agtatagtga taatttttta cattcaatgc cacgcaaaaa 7920
aataaagggg cactataata aaagttcctt cggaactaac taaagtaaaa aattatcttt 7980
acaacctccc caaaaaaaag aacaggtaca aagtacccta taatacaagc gtaaaaaaaa 8040
tgagggtaaa aataaaaaaa taaaaaaata aaaaaataaa aaaataaaaa aataaaaaaa 8100
taaaaaaata taaaaataaa aaaatataaa aataaaaaaa tataaaaata aaaaaataaa 8160
aaaatataaa aataaaaaaa taaaaaaata taaaaatatt ttttatttaa agtttgaaaa 8220
aaattttttt atattatata atctttgaag aaaagaatat aaaaaatgag cctttataaa 8280
agcccatttt ttttcatata cgtaatatga cgttctaatg tttttattgg tacttctaac 8340
attagagtaa tttctttatt tttaaagcct ttttctttaa gggcttttat tttttttctt 8400
aatacattta attcctcttt ttttgttgct tttcctttag cttttaattg ctcttgataa 8460
ttttttttac ctctaatatt ttctcttctc ttatattcct ttttagaaat tattattgtc 8520
atatattttt gttcttcttc tgtaatttct aataactcta taagagtttc attcttatac 8580
ttatattgct tatttttatc taaataacat ctttcagcac ttctagttgc tcttataact 8640
tctctttcac ttaaatgttg tctaaacata ctattaagtt ctaaaacatc atttaatgcc 8700
ttctcaatgt cttctgtaaa gctacaaaga taatatctat ataaaaataa tataagctct 8760
ctgtgtcctt ttaaatcata ttctcttagt tcacaaagtt ttattatgtc ttgtattctt 8820
ccataatata aacttctttc tctataaata taatttattt tgcttggtct accctttttc 8880
ctttcatatg gttttaattc aggtaaaaat ccattttgta tttctcttaa gtcataaata 8940
tattcgtact catctaatat attgactact gtttttgatt tagagtttat acttcctgga 9000
actcttaata ttctcgttgc atctaaggct tgtctatctg ctccaaagta ttttaattga 9060
ttatataaat attcttgaac cgctttccat aatggtaatg ctttactagg tactgcattt 9120
attatccata ttaaatacat tcctcttcca ctatctatta catagtttgg tataggaata 9180
ctttgattaa aataattctt ttctaagtcc attaatacct ggtctttagt tttgccagtt 9240
ttataataat ccaagtctat aaacagtgta tttaactctt ttatattttc taatcgccta 9300
cacggcttat aaaaggtatt tagagttata tagatatttt catcactcat atctaaatct 9360
tttaattcag cgtatttata gtgccattgg ctatatcctt ttttatctat aacgctcctg 9420
gttatccacc ctttacttct actatgaata ttatctatat agttcttttt attcagcttt 9480
aatgcgtttc tcacttattc acctcccctt ctgtaaaact aagaaaatta tatcatattt 9540
tcaataatta ttaactattc ttaaactctt aataaaaaat agagtaagtc cccaattgaa 9600
acttaatcta ttttttatgt tttaatttat tatttttatt aaaatatttt aaactaaatt 9660
aaatgattct ttttaatttt ttactatttc attccataat atattactat aattatttac 9720
aaataatatt tcttcatttg taatatttag atgatttact aattttagtt tttatatatt 9780
aaataattaa tgtataattt atataaaaaa tcaaaggagc ttataaatta tgattatttc 9840
caaagatact aaagatttaa tttttttcaa ttttaacaat actttttgta atattatgtt 9900
taaatttaat tgtatttttt tcatataata aagccgttga agtaaaccaa tccattttcc 9960
ttatgatgtt attattaaat ttaagtttta taataatatc tttattatat ttattgtttt 10020
taaaaaaact agtgaaattt ctagtgaaat ttccggcttt attaaactta tttttaggaa 10080
ttttattttc attttcatct ttacaggatt tgattatatc tttaaatatg ttttatcaaa 10140
tattatcttt ttctaaattt atatatattt ttattatatt tattattata tatattttat 10200
ttttaagttt ctttctaaca gctattaaaa agaaacttaa aaataaaaac acgtactcta 10260
aaccaataaa taaaactatt tttattattg ctgccttgat tggaatagtt tttagtaaaa 10320
ttaatttcaa tattccacaa tattatatta taagctagca cgcctcgagt atattgataa 10380
aaataataat agtgggtata attaagttgt taggaggtta gttagaacta aatgtaaaat 10440
gttagcgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt atcaacttga 10500
aaaagtggca ccgagtcggt gctttttttg aagcttg 10537
<210> 27
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 27
ctttttaaaa aagttaaata aggaagg 27
<210> 28
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 28
gtttaactta agttacagaa aagctagg 28
<210> 29
<211> 12849
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 29
ctagtagtgg atttaatccc aaatgagcca acagaaccag aaccagaaac agaatcagaa 60
caagtaacat tggatttaga aatggaagaa gaaaaaagca atgacttcgt gtgaataatg 120
cacgaaatcg ttgcttattt ttttttaaaa gcggtatact agatataacg aaacaacgaa 180
ctgaatagaa acgaaaaaag agccatgaca catttataaa atgtttgacg acattttata 240
aatgcatagc ccgataagat tgccaaacca acgcttatca gttagtcaga tgaactcttc 300
cctcgtaaga agttatttaa ttaactttgt ttgaagacgg tatataaccg tactatcatt 360
atatagggaa atcagagagt tttcaagtat ctaagctact gaatttaaga attgttaagc 420
aatcaatcgg aaatcgtttg attgcttttt ttgtattcat ttatagaagg tggagtttgt 480
atgaatcatg atgaatgtaa aacttatata aaaaatagtt tattggagat aagaaaatta 540
gcaaatatct atacactaga aacgtttaag aaagagttag aaaagagaaa tatctactta 600
gaaacaaaat cagataagta tttttcttcg gagggggaag attatatata taagttaata 660
gaaaataaca aaataattta ttcgattagt ggaaaaaaat tgacttataa aggaaaaaaa 720
tctttttcaa aacatgcaat attgaaacag ttgaatgaaa aagcaaacca agttaattaa 780
acaacctatt ttataggatt tataggaaag gagaacagct gaatgaatat cccttttgtt 840
gtagaaactg tgcttcatga cggcttgtta aagtacaaat ttaaaaatag taaaattcgc 900
tcaatcacta ccaagccagg taaaagcaaa ggggctattt ttgcgtatcg ctcaaaatca 960
agcatgattg gcggtcgtgg tgttgttctg acttccgagg aagcgattca agaaaatcaa 1020
gatacattta cacattggac acccaacgtt tatcgttatg gaacgtatgc agacgaaaac 1080
cgttcataca cgaaaggaca ttctgaaaac aatttaagac aaatcaatac cttctttatt 1140
gattttgata ttcacacggc aaaagaaact atttcagcaa gcgatatttt aacaaccgct 1200
attgatttag gttttatgcc tactatgatt atcaaatctg ataaaggtta tcaagcatat 1260
tttgttttag aaacgccagt ctatgtgact tcaaaatcag aatttaaatc tgtcaaagca 1320
gccaaaataa tttcgcaaaa tatccgagaa tattttggaa agtctttgcc agttgatcta 1380
acgtgtaatc attttggtat tgctcgcata ccaagaacgg acaatgtaga attttttgat 1440
cctaattacc gttattcttt caaagaatgg caagattggt ctttcaaaca aacagataat 1500
aagggcttta ctcgttcaag tctaacggtt ttaagcggta cagaaggcaa aaaacaagta 1560
gatgaaccct ggtttaatct cttattgcac gaaacgaaat tttcaggaga aaagggttta 1620
atagggcgta ataacgtcat gtttaccctc tctttagcct actttagttc aggctattca 1680
atcgaaacgt gcgaatataa tatgtttgag tttaataatc gattagatca acccttagaa 1740
gaaaaagaag taatcaaaat tgttagaagt gcctattcag aaaactatca aggggctaat 1800
agggaataca ttaccattct ttgcaaagct tgggtatcaa gtgatttaac cagtaaagat 1860
ttatttgtcc gtcaagggtg gtttaaattc aagaaaaaaa gaagcgaacg tcaacgtgtt 1920
catttgtcag aatggaaaga agatttaatg gcttatatta gcgaaaaaag cgatgtatac 1980
aagccttatt tagtgacgac caaaaaagag attagagaag tgctaggcat tcctgaacgg 2040
acattagata aattgctgaa ggtactgaag gcgaatcagg aaattttctt taagattaaa 2100
ccaggaagaa atggtggcat tcaacttgct agtgttaaat cattgttgct atcgatcatt 2160
aaagtaaaaa aagaagaaaa agaaagctat ataaaggcgc tgacaaattc ttttgactta 2220
gagcatacat tcattcaaga gactttaaac aagctagcag aacgccctaa aacggacaca 2280
caactcgatt tgtttagcta tgatacaggc tgaaaataaa acccgcacta tgccattaca 2340
tttatatcta tgatacgtgt ttgttttttc tttgctgttt agcgaatgat tagcagaaat 2400
atacagagta agattttaat taattattag ggggagaagg agagagtagc ccgaaaactt 2460
ttagttggct tggactgaac gaagtgaggg aaaggctact aaaacgtcga ggggcagtga 2520
gagcgaagcg aacacttgat tttttaattt tctatctttt ataggtcatt agagtatact 2580
tatttgtcct ataaactatt tagcagcata atagatttat tgaataggtc atttaagttg 2640
agcatattag aggaggaaaa tcttggagaa atatttgaag aacccgatta catggattgg 2700
attagttctt gtggttacgt ggtttttaac taaaagtagt gaatttttga tttttggtgt 2760
gtgtgtcttg ttgttagtat ttgctagtca aagtgattaa atagaattct agcgccattc 2820
gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2880
ccagctggcg aaagggggat gaaataaaag gttattttgc attgacaaag ataattaaat 2940
attttattat tagttcataa gttagtttaa tatactaaca aaaataaagc aagtaaaata 3000
tacctaaaat ataaaaaaat taggatagga aaacgatagt tatgaagtgg cattcaagga 3060
gggatggata aaaagtacag tattggtcta gacataggaa ctaactctgt tgggtgggct 3120
gttataacag atgaatataa agttccatca aaaaaattta aagtattagg aaacactgat 3180
agacattcaa taaaaaaaaa cttgataggt gctttattat tcgattcagg agagactgct 3240
gaagctacac gtttaaaaag aacagctaga cgtagatata caagaagaaa aaataggata 3300
tgttatcttc aagaaatttt tagtaatgaa atggcaaaag ttgatgattc attctttcac 3360
agactagaag aaagtttctt agttgaagaa gataagaagc atgaaagaca ccctattttt 3420
ggtaatatcg tagatgaagt agcatatcat gagaagtatc caactatcta tcatttaaga 3480
aagaaattag ttgattctac agataaagct gatctgagat taatatattt agctttagct 3540
catatgatta aatttagagg acatttttta atagaaggtg atttaaaccc agacaacagc 3600
gatgtagata aattatttat ccaattagtt caaacttata atcaattatt cgaagagaat 3660
ccaattaatg caagtggtgt agacgctaag gctatattat cagctagatt atcaaaatct 3720
agaagattag aaaatctaat agctcaactt cctggagaaa agaaaaatgg actttttggg 3780
aacctaatag ctctctcact cggactaaca ccaaatttta aaagcaattt tgatcttgct 3840
gaagacgcaa agttacaact atcaaaggat acatacgatg atgatttaga taatttgtta 3900
gctcaaatag gtgatcaata tgctgatttg tttcttgcag caaaaaactt aagtgatgca 3960
attttactat cagatatact tagagtaaat acagaaataa caaaggctcc tttatcagca 4020
agtatgatta aacgatatga tgagcatcat caagatttaa cattattaaa ggcacttgta 4080
agacaacaat taccagaaaa atataaagaa attttctttg atcaatctaa aaatggatat 4140
gctggatata tagacggtgg agcaagtcaa gaagagtttt ataaatttat aaagcctatt 4200
ttagaaaaaa tggatggaac tgaagaatta cttgttaaac ttaacagaga agatttactt 4260
agaaaacaaa gaacttttga taatggttca attcctcacc aaattcattt aggagaatta 4320
catgctatac taagaagaca agaagatttt tatccatttc ttaaagataa tagagaaaaa 4380
attgaaaaaa ttttaacttt tagaatacca tattatgtag gaccacttgc aaggggaaat 4440
tcaagatttg catggatgac tagaaaatca gaagaaacta taaccccgtg gaattttgaa 4500
gaagtagtag ataaaggagc tagtgctcaa tcatttatag aaagaatgac aaattttgat 4560
aagaatcttc ctaacgaaaa ggttttgcca aagcatagcc ttctttatga gtattttaca 4620
gtttataatg agcttactaa agtaaaatac gttacagaag gaatgagaaa accagcattt 4680
ttgtctggtg aacaaaagaa agcaatagta gacctattat ttaaaacaaa taggaaggtt 4740
accgtaaagc aacttaaaga agattacttc aaaaaaattg aatgctttga tagtgttgaa 4800
atatcaggag ttgaagatag atttaatgct tcacttggta catatcacga tctcttaaaa 4860
attataaaag ataaggattt tttagataat gaagaaaatg aagatattct tgaagatata 4920
gtattaacat tgacactttt tgaagataga gaaatgatag aagaaagatt aaaaacatat 4980
gcacatcttt ttgatgataa ggttatgaag caacttaaaa gaagaagata tacaggttgg 5040
ggacgtttgt caagaaagct aattaatggt attagagata aacaatcagg aaagactatt 5100
ctcgattttc ttaaatcaga tggatttgct aatagaaact ttatgcaatt aattcatgat 5160
gattctctta ctttcaaaga ggatattcaa aaggctcaag tttctggaca aggcgatagc 5220
ttacacgaac acattgctaa ccttgcaggg agccccgcta tcaaaaaagg aattttacaa 5280
acagttaaag ttgtagatga acttgttaaa gttatgggaa gacacaaacc tgagaatata 5340
gttatagaaa tggccagaga aaatcaaaca acacaaaaag gacaaaaaaa ttctagagag 5400
agaatgaaga gaattgaaga aggaataaaa gagctaggat cacaaatatt aaaagaacat 5460
ccagttgaaa atactcaatt gcaaaatgaa aagttatatt tgtattactt acaaaatgga 5520
agagatatgt atgttgatca agaactcgat attaatagat taagtgacta tgatgttgat 5580
catattgttc ctcaatcatt tttaaaagat gattcaatcg ataacaaagt attaactaga 5640
tcagataaaa atagaggaaa gtcagataat gtaccatctg aagaagttgt taaaaaaatg 5700
aagaactatt ggagacaact tttaaatgca aagctaatta cacaaagaaa atttgacaat 5760
ttaacaaaag cagaaagagg aggattaagc gaattagaca aagctggatt tataaaaaga 5820
caacttgttg agacaagaca aataactaag catgttgctc aaatacttga ttcaagaatg 5880
aatacaaaat atgatgaaaa tgataaatta atcagagaag taaaagtaat aacattaaag 5940
tcaaaattag tatcagattt cagaaaggat tttcaatttt acaaagttcg tgaaataaat 6000
aactatcatc atgctcatga tgcatactta aatgctgttg taggaactgc tcttattaag 6060
aaatatccta aactagaaag cgaatttgtt tatggagatt ataaagttta tgatgtgcgc 6120
aaaatgatcg cgaaatccga acaagaaatc ggtaaggcta cagcaaaata tttcttttat 6180
agtaatataa tgaatttttt taagacagaa ataactttgg ctaatggtga aatcagaaaa 6240
agaccactta tcgaaacaaa tggagagaca ggagaaatag tatgggataa aggaagagat 6300
tttgctactg ttagaaaagt actaagtatg ccacaagtaa atatcgtaaa gaaaactgaa 6360
gttcaaactg gaggtttctc taaggaatca attttaccta agagaaattc agataagtta 6420
attgcaagga aaaaagattg ggacccaaaa aaatacggtg gttttgatag tccaacagtt 6480
gcctatagtg ttcttgtagt agcgaaagtt gagaaaggta agtcaaaaaa gttgaaaagc 6540
gtaaaagaac ttcttggtat cacaattatg gaaagatctt catttgaaaa aaatccaatt 6600
gactttttag aagctaaggg ttataaagaa gttaaaaagg atttaatcat aaaactacca 6660
aagtatagtc tatttgaact cgaaaacgga agaaaacgaa tgctcgctag cgcaggagaa 6720
cttcaaaaag gaaatgaact tgcgctgcca tcaaagtatg taaatttctt atatttagct 6780
tctcattatg agaaattaaa aggatcacca gaggataatg aacaaaagca actatttgta 6840
gaacaacaca aacattattt agatgaaata atagaacaaa tatctgaatt ttctaaaaga 6900
gttatacttg ccgacgcaaa tctagataag gtgctttcag cgtataataa acacagagat 6960
aaaccaataa gagaacaagc agaaaacatt atccatcttt ttacattaac taatcttggt 7020
gcaccagctg catttaagta ctttgataca acaatagata gaaaaagata cacatctact 7080
aaagaagtat tagacgcaac tttaatacat caatctatta cagggcttta tgaaacaaga 7140
attgatttaa gtcaactagg cggagattaa gaattttttt agaaagaaca tgtgagcaaa 7200
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 7260
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 7320
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 7380
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 7440
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 7500
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 7560
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 7620
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 7680
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 7740
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 7800
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 7860
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 7920
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 7980
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 8040
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 8100
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 8160
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 8220
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 8280
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 8340
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 8400
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 8460
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 8520
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 8580
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 8640
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 8700
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 8760
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 8820
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 8880
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 8940
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 9000
ctgccgggcc tcttgcggga tcaaaagaaa aacgaaatga tacaccaatc agtgcaaaaa 9060
aagatataat gggagataag acggttcgtg ttcgtgctga cttgcaccat atcataaaaa 9120
tcgaaacagc aaagaatggc ggaaacgtaa aagaagttat ggaaataaga cttagaagca 9180
aacttaagag tgtgttgata gtgcagtatc ttaaaatttt gtataatagg aattgaagtt 9240
aaattagatg ctaaaaattt gtaattaaga aggagtgatt acatgaacaa aaatataaaa 9300
tattctcaaa actttttaac gagtgaaaaa gtactcaacc aaataataaa acaattgaat 9360
ttaaaagaaa ccgataccgt ttacgaaatt ggaacaggta aagggcattt aacgacgaaa 9420
ctggctaaaa taagtaaaca ggtaacgtct attgaattag acagtcatct attcaactta 9480
tcgtcagaaa aattaaaact gaatactcgt gtcactttaa ttcaccaaga tattctacag 9540
tttcaattcc ctaacaaaca gaggtataaa attgttggga gtattcctta ccatttaagc 9600
acacaaatta ttaaaaaagt ggtttttgaa agccatgcgt ctgacatcta tctgattgtt 9660
gaagaaggat tctacaagcg taccttggat attcaccgaa cactagggtt gctcttgcac 9720
actcaagtct cgattcagca attgcttaag ctgccagcgg aatgctttca tcctaaacca 9780
aaagtaaaca gtgtcttaat aaaacttacc cgccatacca cagatgttcc agataaatat 9840
tggaagctat atacgtactt tgtttcaaaa tgggtcaatc gagaatatcg tcaactgttt 9900
actaaaaatc agtttcatca agcaatgaaa cacgccaaag taaacaattt aagtaccgtt 9960
acttatgagc aagtattgtc tatttttaat agttatctat tatttaacgg gaggaaataa 10020
ttctatgagt ccctaggggt tccgcgcaca tttccccgaa aagtgccacc tgaacgaagc 10080
atctgtgctt cattttgtag aacaaaaatg caacgcgaga gcgctaattt ttcaaacaaa 10140
gaatctgagc tgcattttta cagaacagaa atgcaacgcg aaagcgctat tttaccaacg 10200
aagaatctgt gcttcatttt tgtaaaacaa aaatgcaacg cgagagcgct aatttttcaa 10260
acaaagaatc tgagctgcat ttttacagaa cagaaatgca acgcgagagc gctattttac 10320
caacaaagaa tctatacttc ttttttgttc tacaaaaatg catcccgaga gcgctatttt 10380
tctaacaaag catcttagat tacttttttt ctcctttgtg cgctctataa tgcagtctct 10440
tgataacttt ttgcactgta ggtccgttaa ggttagaaga aggctacttt ggtgtctatt 10500
ttctcttcca taaaaaaagc ctgactccac ttcccgcgtt tactgattac tagcgaagct 10560
gcgggtgcat tttttcaaga taaaggcatc cccgattata ttctataccg atgtggattg 10620
cgcatacttt gtgaacagaa agtgatagcg ttgatgattc ttcattggtc agaaaattat 10680
gaacggtttc ttctattttg tctctatata ctacgtatag gaaatgttta cattttcgta 10740
ttgttttcga ttcactctat gaatagttct tactacaatt tttttgtcta aagagtaata 10800
ctagagataa acataaaaaa tgtagaggtc gagtttagat gcaagttcaa ggagcgaaag 10860
gtggatgggt aggttatata gggatatagc acagagatat atagcaaaga gatacttttg 10920
agcaatgttt gtggaagcgg tattcgcaat attttagtag ctcgttacag tccggtgcgt 10980
ttttggtttt ttgaaagtgc gtcttcagag cgcttttggt tttcaaaagc gctctgaagt 11040
tcctatactt tctagagaat aggaacttcg gaataggaac ttcaaagcgt ttccgaaaac 11100
gagcgcttcc gaaaatgcaa cgcgagctgc gcacatacag ctcactgttc acgtcgcacc 11160
tatatctgcg tgttgcctgt atatatatat acatgagaag aacggcatag tgcgtgttta 11220
tgcttaaatg cgtacttata tgcgtctatt tatgtaggat gaaaggtagt ctagtacctc 11280
ctgtgatatt atcccattcc atgcggggta tcgtatgctt ccttcagcac taccctttag 11340
ctgttctata tgctgccact cctcaattgg attagtctca tccttcaatg ctatcatttc 11400
ctttgatatt ggatcatact aagaaaccat tattatcatg acattaacct ataaaaatag 11460
gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca 11520
catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 11580
ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc tggcttaact atgcggcatc 11640
agagcagatt gtactgagag tgcaccatac cacagctttt caattcaatt catcattttt 11700
tttttattct tttttttgat ttcggtttct ttgaaatttt tttgattcgg taatctccga 11760
acagaaggaa gaacgaagga aggagcacag acttagattg gtatatatac gcatatgtag 11820
tgttgaagaa acatgaaatt gcccagtatt cttaacccaa ctgcacagaa caaaaacctg 11880
caggaaacga agataaatca tgtcgaaagc tacatataag gaacgtgctg ctactcatcc 11940
tagtcctgtt gctgccaagc tatttaatat catgcacgaa aagcaaacaa acttgtgtgc 12000
ttcattggat gttcgtacca ccaaggaatt actggagtta gttgaagcat taggtcccaa 12060
aatttgttta ctaaaaacac atgtggatat cttgactgat ttttccatgg agggcacagt 12120
taagccgcta aaggcattat ccgccaagta caatttttta ctcttcgaag acagaaaatt 12180
tgctgacatt ggtaatacag tcaaattgca gtactctgcg ggtgtataca gaatagcaga 12240
atgggcagac attacgaatg cacacggtgt ggtgggccca ggtattgtta gcggtttgaa 12300
gcaggcggca gaagaagtaa caaaggaacc tagaggcctt ttgatgttag cagaattgtc 12360
atgcaagggc tccctatcta ctggagaata tactaagggt actgttgaca ttgcgaagag 12420
cgacaaagat tttgttatcg gctttattgc tcaaagagac atgggtggaa gagatgaagg 12480
ttacgattgg ttgattatga cacccggtgt gggtttagat gacaagggag acgcattggg 12540
tcaacagtat agaaccgtgg atgatgtggt ctctacagga tctgacatta ttattgttgg 12600
aagaggacta tttgcaaagg gaagggatgc taaggtagag ggtgaacgtt acagaaaagc 12660
aggctgggaa gcatatttga gaagatgcgg ccagcaaaac taaaaaactg tattataagt 12720
aaatgcatgt atactaaact cacaaattag agcttcaatt taattatatc agttattacc 12780
ctatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgccct aggcccaact 12840
aactcaacg 12849
<210> 30
<211> 9367
<212> DNA
<213> Artificial Sequence
<220>
<223> plasmid
<400> 30
aaaaataatg gccctaggga tatacaattt ttaaaaaata tagctaatct tgcataaact 60
atataataaa tctaatttta gaatgtataa tttaaagggt tatggctgta tatagtcata 120
acccttatat ttcattaatt aaagttaaat tttgtatatt caaaaagctc ttgatattta 180
cggcagagcc accatataga gatgcctcag accctaatga tgaaatttct atatttattc 240
ctttgttaaa agagctaact aacatatctt ttgtaatctg taatatctca gggatatcac 300
taattatttg gctatttaaa tatattattt caggagcata agttgtaata gcattattta 360
tagctattgt taagtaacta caaaactcat gaataacttt tttggcattc tggttatctt 420
cataatatag ttgctttact atatcagaat ctattttagg aatattttct aaagaagaaa 480
gctgttcaaa tacctttttt tctgaacaat actgttctaa acagccacga tttccacaag 540
gacatagttt accattaggc atgatgatag tgtgaccaat ttctccactc ataccatttc 600
tgccactata taatttatta tttattataa tgcctgaacc aaatccactg tgaatactga 660
gactaagtag tgagttatgt acagttgaaa aagtattctc agctaaagct gttaagtttg 720
cttcattttc tatgtgaata ggaaagtcat actttttgct aaggatgcta tataagtcaa 780
tctcattaag attgtaatat ggagtaaaca atactttatt ttcacaagta atcccatgta 840
tagccaaagt aagaccaatt accttataag gagtgtctat tttggatatg ttataactat 900
ttataatttc atctatcaat tgtataacat tgtctttact tacttgtata tctgttaatt 960
tcttagaatt tataatagtt ccatctaagt aagatagaga agaaaatata tagtcgtatc 1020
caatgtccat acttaaagaa atccctgcac atttattaaa tactaataat atgggttttc 1080
ttccgccact atgagtacta tttccaattc ctatttcatg aactagagat tcatcaataa 1140
gttttttggt aatagcggat atagttgctt tattcaatcc tatagtagaa gctatacttg 1200
ccctagaaat aggaccattt tttataattt gttcaagtac caatctttca ttcatttctc 1260
gaatagtgta tttatcagta accaatttga tattcctcct taaaataata ttgtaatact 1320
ttttacacaa aaataaaagg ttattttgca ttgacaaaga taattaaata ttttattatt 1380
agttcataag ttagtttaat atactaacaa aaataaagca agtaaaatat acctaaaata 1440
taaaaaaatt aggataggaa aacgatagtt atgaagtggc attcaaggag tatggaaaaa 1500
ctcaagttta tgcttgtttt agagctagaa atagcaagtt aaaataaggc tagtccgtta 1560
tcaacttgaa aaagtggcac cgagtcggtg cttttaaagt attgttaaaa ataactctgt 1620
agaattataa attagttcta cagagttatt ttttaaaaaa attcaagctt gcatgcctgc 1680
aggccatttt agctaaggat atctataatg aaaagattta gaggaggaat aatttatgaa 1740
aaagattttt gtacttggag caggaacaat gggtgctggt atcgttcaag cattcgctca 1800
aaaaggttgt gaagtaattg taagagacat aaaggaagaa tttgttgaca gaggaatagc 1860
tggaatcact aaaggattag aaaagcaagt tgctaaagga aaaatgtctg aagaagataa 1920
agaagctata ctttcaagaa tttcaggaac aactgatatg aaattagctg ctgactgtga 1980
tttagtagtt gaagctgcaa tcgaaaacat gaaaattaag aaggaaatct tcgctgaatt 2040
agatggaatt tgtaagccag aagcgatttt agcttcaaac acttcatctt tatcaattac 2100
tgaagttgct tcagctacaa agagacctga taaagttatc ggaatgcatt tctttaatcc 2160
agctccagta atgaagcttg ttgaaattat taaaggaata gctacttctc aagaaacttt 2220
tgatgctgtt aaggaattat cagttgctat tggaaaagaa ccagtagaag ttgcagaagc 2280
tccaggattc gttgtaaaca gaatattaat cccaatgatt aacgaagctt catttatcct 2340
acaagaagga atagcttcag ttgaagatat tgatacagct atgaaatatg gtgctaacca 2400
tccaatggga cctttagctt taggagatct tattggatta gacgtttgct tagctatcat 2460
ggatgtttta ttcactgaaa caggtgataa caagtacaga gctagcagca tattaagaaa 2520
atatgttaga gctggatggc ttggaagaaa atcaggaaaa ggattctatg attactctaa 2580
ataatatcat gaatatatgg aaaaactcaa gtttatgctt caaactgctt cccctaattc 2640
cccattttta tatatatttg tattaaatta actttaatgt tacaatgttc ttagtatatt 2700
ttccttaata ttacattagt tctataaact ttattgttct taatatttaa ataaaatcca 2760
tgaagggagg aaaaaactat cttttaaaag tttatagtaa ataaaaaaaa attattaatg 2820
taaaaatata ctaagtatag aatatttata atagggggta ttaacttgtt ttcaaaaatc 2880
aaaaaaatta atttttttaa aaaaacattt tcttttttaa ttgctgttgt aatgatgttg 2940
tttacagtat taggaacaaa tacttataaa gctgaagctg caagtggtgg tgcctgggct 3000
caatgtggag gtgaaaactt ccatggtgat aaatgttgtg tttccggtca cacttgtgtt 3060
agtattaacc aatggtattc acaatgtcaa ccaggaggtg ctccaagcaa taatgcttca 3120
aacaataata ataacaataa caataataac aacaacaata ataacaacaa caataatcac 3180
aacaacaaca acaataacaa caataacaat aacaatggtg gtagtggtag tactaaaaac 3240
ttcttcgata accaaattta tgctaaccca aagtttattg aagaagtcaa ttcttctatt 3300
ccaagattaa gttatgattt acaacaaaag gctcaaaagg ttaagaatgt tccaactgcc 3360
gtttggttag cttgggatgg agccactgga gaagttgctc aacatcttaa agctgctggt 3420
tctaaaactg ttgtcttcat catgtacatg attccaactc gtgattgtaa cgctaatgcc 3480
tctgctggtg gtgctggtaa cctcaacact tacaagggat acgttgataa tattgctaga 3540
actattcgta gttatccaaa ttcaaaggtt gttatgattc ttgaaccaga tactcttggt 3600
aaccttgtta ctgctaatag tgctaactgt caaaacgttc gtaacttaca taagaatgct 3660
ttatcttatg gtgttaatgt tttcggtagc atgagtaatg ttagtgttta ccttgatgct 3720
gctcatggtg cttggttagg tagctctact gataaggttg cttctgttgt taaggaaatc 3780
ttaaataatg ctccaaatgg aaagattcgt ggtttaagta ctaacatttc taactaccaa 3840
tcaatttctt ctgaatacca ataccaccaa aaacttgcct ctgctcttgc tgctgtcggt 3900
gttccaaaca tgcacttcat tgttgatact ggtcgtaatg gtgttactat taattctgga 3960
acatggtgta acttagtcgg tactggtctt ggtgaacgtc caagaggtaa tccaaatgct 4020
ggtatgccat tattagatgc ttacatgtgg cttaagactc caggagaatc tgacggttca 4080
tcctctggtt ctagagctga tccaaattgt tctagtaatg attctcttag aggtgctcca 4140
gatgctggtc aatggttcca tgattacttc gctcaattag taagaaatgc tagaccatca 4200
ttttaagcaa atttctaaat gattgaattt aacaaaaatt actaatctag aggatccccg 4260
ggtaccgagc tcgaattcgt aatcatggaa atatataaat aactactaga ttacataaat 4320
aagtttaaat taaagaatat tgtaaaattc aacaaaacat tttattactg ttaagtaagt 4380
gatataatat attaaataat aactattttc ttaagattaa ttgtataatt taattgaata 4440
ttggatatta aaaaaataaa tagttaaaaa atatgatata ggtggtacac atcagaaaat 4500
gggcaatata aactgtgaca taatctttag aaaaaaactt tagtgtagaa tatattattt 4560
aaagaagaat atatgaatga aataagttaa aactaaggtt gatatgatat tatgtttatc 4620
aatgatttta ctaaaaagat aaaaatatat tttgaatatt cataatcaaa gggtagggtt 4680
catcaatatg catattagat tatgagatga tgcaaactaa ataattttat actgtaaggg 4740
agacggataa taaaatggat tataaatctg tagaatttta tgataattat ttaataataa 4800
aagaattaag aaattttaaa ttaaaacata tatttgagtg cggacagatt tttaggtttg 4860
aagaggtagc agaaaatgat tttattgtaa ttgcgtttgg aagattaatt gaagttaaag 4920
aagatggaaa tgacgtaata atttataatt ctacaaagga agattttaaa aatatttggc 4980
ttaagtattt tgatttagat agagattact cagttataaa agatgaactt tcaaaagatg 5040
ttttacttaa acaaagtatt gaatttggat atggtgttag agtcttgaat caagatccat 5100
ttgaaatgtt gcttagcttt attatttcag cgcgaaataa tataccatca ataaagaaga 5160
ctgtaaataa aatatctaat aaatggggaa aagaaattat ttataaggat aaaacctact 5220
atgcgtttcc taatataggt gaaataaaag atgctacact agaagaaata caggagacag 5280
gagcatcttc catggacgcg tgacgtcgac tctagaaatt cttctaaata taagaatatt 5340
ttaaagaaat atctttatat attagttatt aaaatttata agattataag aaacattata 5400
acatatttta gaacttttta actattctaa aagattaatt tacatattaa catttaatta 5460
tgggtaaaaa ctattttgaa aaatgattta tatggaatta tgtttcttaa atatacaatc 5520
atgtttcatg aatacataat tattttaaat gtattgggag ggtaaattga ttgtgaaacg 5580
cggcgatgtt tattttgctg atttatctcc tgttgttggc tcagagcaag gcggggtgcg 5640
cccggtttta gtgatccaaa atgacatcgg aaatcgcttc agcccaactg ctattgttgc 5700
agccataaca gcacaaatac agaaagcgaa attaccaacc cacgtcgaaa tcgatgcaaa 5760
acgctacggt tttgaaagag attccgttat tttgctggag caaattcgga cgattgacaa 5820
gcaaaggtta acggataaga ttactcatct ggatgatgaa atgatggata aggttgatga 5880
agccttacaa atcagtttgg cactcattga tttttagaca tatttgcagg ttgctcaaat 5940
agagcgaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 6000
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 6060
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 6120
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 6180
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 6240
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 6300
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 6360
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 6420
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 6480
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 6540
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 6600
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 6660
agggattttg gtcatgagat tatcaaaaag gagtttaaac ttctaaaatc tgattaccaa 6720
ttagaatgaa tatttcccaa atattaaata ataaaacaaa aaaattgaaa aaagtgtttc 6780
caccattttt tcaatttttt tataattttt ttaatctgtt atttaaatag tttatagtta 6840
aatttacatt ttcattagtc cattcaatat tctctccaag ataactacga actgctaaca 6900
aaattctctc cctatgttct aatggagaag attcagccac tgcatttccc gcaatatctt 6960
ttggtatgat tttacccgtg tccatagtta aaatcatacg gcataaagtt aatatagagt 7020
tggtttcatc atcctgataa ttatctatta attcctctga cgaatccata atggctcttc 7080
tcacatcaga aaatggaata tcaggtagta attcctctaa gtcataattt ccgtatattc 7140
ttttattttt tcgttttgct tggtaaagca ttatggttaa atctgaattt aattccttct 7200
gaggaatgta tccttgttca taaagctctt gtaaccattc tccataaata aattcttgtt 7260
tgggaggatg attccacggt accatttctt gctgaataat aattgttaat tcaatatatc 7320
gtaagttgct tttatctcct attttctttg aaataggtct aattttttgt ataagtattt 7380
ctttactttg atctgtcaat ggttcagata cgacgactaa aaagtcaaga tcactatttg 7440
gttttagtcc actctcaact cctgatccaa acatgtaagt accaataagg ttatttttta 7500
aatgtttccg aagtattttt ttcactttat taatttgttc gtatgtattc aaatatatcc 7560
tcctcactat tttgattagt acctatttta tatccatagt tgttaattaa ataaacttaa 7620
tttagtttat ttatagattt cattggcttc taaatttttt atctagataa taattatttt 7680
agttaatttt attctagatt atatatgata tgatctttca tttccataaa actaaagtaa 7740
gtgtaaacct attcattggg ccggccgctt ataatccata acaatcatcc tttctgtgac 7800
actgtcagac acttatcaca ttaagtatat actattatta aactattcta tatacttaat 7860
ttattttaat agaaaaacat aatatcataa taacttcaaa attaaacttt atttatgatt 7920
tcatacttga ctttgatttt agaaaggata tactttttag cagatttgga aacggctttg 7980
gacgtagttt gcccatagat gaacaaacaa actacatcca aaaattatac ttttcccttc 8040
attggtatcc gtatttttac atcttaatag cgtatgtatt acaacacacc taaacaacga 8100
ccttacggtc tgctactgca tatcctagct tgattgttta gttgcctcaa ctatgcttaa 8160
ccctaccccg aactcttttt ttattgtggg ttttcgtcgt gaagtcccac cgacacataa 8220
tcataacata agatgtatta tgaaaatgcg agtgactatc cttttgtatc ggctcactac 8280
accacagata tattttttag tgcatactgt gtcggcactc tcaatattaa attaataaat 8340
aaattatttt ttctttttac tcttctttac atgagctttt ttaaagctcc ttgcataata 8400
tttaatgcat gtacgttctt ttttctgttc ttcctctgta aaacatctca tttttatggc 8460
acaccatcca tatcggttca tctttgaaca attaatacat tggactttcc ctttatgtaa 8520
acatcttgac tcattgtatt tactgcaata ggttgctact gttttatcat gaatcatcaa 8580
cgaatgtatt ttgcatattt cagtatcttt aataaactct ttgcaatttt tacaagtttt 8640
catatacgcc cttcttttca taaattaatt tatgaattct atgtattcca aggagctttt 8700
taaagctccc cctttcgtac tacttagcta caagcactat aaaagtcata atgtttactg 8760
ctaaagtcaa taatgatatt gctaatacct tgttatttga taagatactg ctttcctctg 8820
tcactttgct cacccccttt cattttcata aattaattat gaaaaaataa atatacttct 8880
aatttttatc aaataaaaaa gcctttgcgt actgcttcca atacacaaag gctataaact 8940
tctaaatctt acttattgca atttacattt atatctgtta agataatctc ataaattgaa 9000
tatatatagt taatgtttct cttgtatgtc ggtacatttg aaatattgct atagatagag 9060
ttctctaacg gcttgatgtg ttggtagcac atttaagttt tggcttatat actaagttgg 9120
tagcttaata tataagagct gaggacttat ttttttatta aatttttcaa cttgtctata 9180
ttttaacccg taattgaata cataacaagt attttttttt gtattcaatt aaacattcat 9240
aaatgagtat aattaatcat actaaattct ataattttct tttctgtaaa tttctttcta 9300
ttcagcactg ttatgccttt tgactatcac ttaataaaaa ataagaaatg aattgtcaat 9360
tgttcaa 9367
<210> 31
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 31
agataattat gaagttaatc cttag 25
<210> 32
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 32
catttgcttt caggtcttct tttgctg 27
Claims (15)
- 클로스트리듐(Clostridium) 속의 용매형성성(solventogenic) 박테리아의 상동성 재조합에 의한 형질전환을 가능하게 하는 유전자 도구로서,
- 적어도 Cas9을 코딩하는 제1 핵산으로서, 여기서 Cas9 코딩 서열은 프로모터의 제어 하에 위치되는 것인 제1 핵산, 및
- 상동성 재조합 기전에 의해, Cas9-표적화 박테리아 DNA의 일부분의 관심 서열로의 치환을 가능하게 하는 복구 주형을 함유하는 적어도 제2 핵산
을 포함하는 것을 특징으로 하고, i) 상기 핵산 중 적어도 하나는 하나 이상의 가이드 RNA(gRNA)를 더 코딩하거나, 또는 ii) 유전자 도구는 하나 이상의 가이드 RNA를 더 포함하며, 각각의 가이드 RNA는 Cas9-효소-결합 RNA 구조, 및 박테리아 DNA의 표적화 부분에 상보적인 서열을 포함하는 것을 특징으로 하는 유전자 도구. - 제1항에 있어서, 상기 하나 이상의 가이드 RNA를 코딩하는 서열은 프로모터가 선행되고 상기 프로모터 또는 Cas9 제어 프로모터는 유도성 프로모터인 것을 특징으로 하는 유전자 도구.
- 제1항 또는 제2항에 있어서, 박테리아 DNA의 표적화 부분은 박테리아 생존에 필수적인 유전자 또는 유전자 부분을 포함하는 것을 특징으로 하는 유전자 도구.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 클로스트리듐 속의 용매형성성 박테리아는 씨. 아세토부틸리컴(C. acetobutylicum), 씨. 셀룰롤리티컴(C. cellulolyticum), 씨. 피토퍼멘탄스(C. phytofermentans), 씨. 베이제린키(C. beijerinckii), 씨. 사카로부틸리컴(C. saccharobutylicum), 씨. 사카로퍼부틸아세토니컴(C. saccharoperbutylacetonicum), 씨. 스포로제네스(C. sporogenes), 씨. 부티리컴(C. butyricum), 씨, 아우란티부티리컴(C. aurantibutyricum) 및 씨. 티로부티리컴(C. tyrobutyricum)으로부터 선택되는 것을 특징으로 하는 유전자 도구.
- 제4항에 있어서, 용매형성성 박테리아가 씨. 아세토부틸리컴일 때, 상기 씨. 아세토부틸리컴 박테리아는 ATCC824 균주이고, 용매형성성 박테리아가 씨. 베이제린키일 때, 상기 씨. 베이제린키 박테리아는 DSM 6423 균주인 것을 특징으로 하는 유전자 도구.
- 제1항 내지 제5항 중 어느 한 항에 있어서, Cas9 단백질은 SEQ ID NO: 1의 서열을 포함하는 것을 특징으로 하는 유전자 도구.
- 제1항 내지 제6항 중 어느 한 항에 있어서, Cas9 프로모터는 유도성 프로모터인 것을 특징으로 하는 유전자 도구.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 관심 DNA 서열은 용매의 생성을 촉진하는 적어도 하나의 생성물, 전형적으로 알데하이드에서 알코올로의 전환에 관여하는 적어도 하나의 효소, 막 단백질, 전사 인자, 또는 이의 조합을 코딩하는 것을 특징으로 하는 유전자 도구.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 도구 내에 존재하는 각각의 핵산은 별개의 발현 카세트 또는 별개의 벡터, 예를 들어 플라스미드에 속하는 것을 특징으로 하는 유전자 도구.
- 클로스트리듐 속의 용매형성성 박테리아를 상동성 재조합에 의해 형질전환시키기 위한 방법으로서, 제1항 내지 제9항 중 어느 한 항에 따른 유전자 도구를 박테리아에 도입시키는 단계를 포함하는 것을 특징으로 하는 방법.
- 제10항에 있어서, 하기 단계를 포함하는 것을 특징으로 하는 방법:
a) 적어도 하나의 유도성 프로모터를 포함하는 제1항 내지 제9항 중 어느 한 항에 따른 유전자 도구를 박테리아에 도입시키는 단계, 및
b) 박테리아를 유전자 변형시키기 위해 유도성 프로모터의 발현을 유도시키는 단계. - 제10항 또는 제11항에 있어서, 존재하는 경우 단계 b) 이후에, i) 이미 도입된 것 또는 이미 도입된 것들과 상이한 복구 주형, 및 ii) 박테리아의 게놈의 표적화 구역으로 그들의 통합을 가능하게 하는 하나 이상의 가이드 RNA를 코딩하는 n번째 핵산을 도입시키는 하나 이상의 추가 단계를 포함하는 것을 특징으로 하고, 각각의 추가 단계는 이전에 도입시킨 복구 주형을 코딩하는 핵산을 제거하는 단계, 바람직하게는 이전에 도입시킨 하나 이상의 가이드 RNA 또는 하나 이상의 가이드 RNA를 코딩하는 서열을 제거하는 단계가 선행되는 것인 방법.
- 제10항 내지 제12항 중 어느 한 항에 따른 방법을 사용하여 형질전환된 클로스트리듐 속의 용매형성성 박테리아.
- 제1항 내지 제9항 중 어느 한 항에 따른 유전자 도구의 성분 및 임의로는 도구 내에서 사용되는 선택된 유도성 프로모터(들)에 적합화된 하나 이상의 유도인자를 포함하는, 클로스트리듐 속의 박테리아를 형질전환시키거나 또는 클로스트리듐 속의 박테리아를 사용하여 적어도 하나의 용매를 생성시키기 위한 키트.
- 산업적 규모로 용매 또는 용매의 혼합물, 바람직하게는 아세톤, 부탄올, 에탄올, 이소프로판올 또는 이의 혼합물, 전형적으로 이소프로판올/부탄올 혼합물의 생성을 위한, 제1항 내지 제9항 중 어느 한 항에 따른 유전자 도구, 제10항 또는 제11항에 따른 방법, 또는 제12항의 방법에 따라 형질전환된 박테리아의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1559846A FR3042506B1 (fr) | 2015-10-16 | 2015-10-16 | Outil genetique de transformation de bacteries clostridium |
FR1559846 | 2015-10-16 | ||
PCT/FR2016/052663 WO2017064439A1 (fr) | 2015-10-16 | 2016-10-14 | Outil genetique de transformation de bacteries clostridium |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180081527A true KR20180081527A (ko) | 2018-07-16 |
Family
ID=55072908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187013946A KR20180081527A (ko) | 2015-10-16 | 2016-10-14 | 클로스트리듐 박테리아의 형질전환을 위한 유전자 도구 |
Country Status (9)
Country | Link |
---|---|
US (2) | US11746346B2 (ko) |
EP (1) | EP3362559B1 (ko) |
KR (1) | KR20180081527A (ko) |
CN (1) | CN108431221A (ko) |
BR (1) | BR112018007622A2 (ko) |
CA (1) | CA3001815A1 (ko) |
DK (1) | DK3362559T3 (ko) |
FR (1) | FR3042506B1 (ko) |
WO (1) | WO2017064439A1 (ko) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2012333134B2 (en) | 2011-07-22 | 2017-05-25 | John Paul Guilinger | Evaluation and improvement of nuclease cleavage specificity |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9340800B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | Extended DNA-sensing GRNAS |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
US20150166984A1 (en) | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting alpha-antitrypsin point mutations |
AU2015298571B2 (en) | 2014-07-30 | 2020-09-03 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
FR3042506B1 (fr) | 2015-10-16 | 2018-11-30 | IFP Energies Nouvelles | Outil genetique de transformation de bacteries clostridium |
SG10202104041PA (en) | 2015-10-23 | 2021-06-29 | Harvard College | Nucleobase editors and uses thereof |
SG11201900907YA (en) | 2016-08-03 | 2019-02-27 | Harvard College | Adenosine nucleobase editors and uses thereof |
WO2018031683A1 (en) | 2016-08-09 | 2018-02-15 | President And Fellows Of Harvard College | Programmable cas9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
EP3526320A1 (en) | 2016-10-14 | 2019-08-21 | President and Fellows of Harvard College | Aav delivery of nucleobase editors |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
WO2018165629A1 (en) | 2017-03-10 | 2018-09-13 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
KR20190130613A (ko) | 2017-03-23 | 2019-11-22 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제 |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
JP2020534795A (ja) | 2017-07-28 | 2020-12-03 | プレジデント アンド フェローズ オブ ハーバード カレッジ | ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物 |
WO2019139645A2 (en) | 2017-08-30 | 2019-07-18 | President And Fellows Of Harvard College | High efficiency base editors comprising gam |
EP3697906A1 (en) | 2017-10-16 | 2020-08-26 | The Broad Institute, Inc. | Uses of adenosine base editors |
US20210047653A1 (en) * | 2018-01-30 | 2021-02-18 | The University Of Memphis Research Foundation | Compositions and methods for regulating a biological process |
FR3081881B1 (fr) * | 2018-06-04 | 2024-05-24 | Ifp Energies Now | Outil genetique optimise pour modifier les bacteries du genre clostridium |
FR3090691B1 (fr) | 2018-12-20 | 2023-06-09 | Ifp Energies Now | Bacteries clostridium genetiquement modifiees, preparation et utilisations de celles-ci |
EP3942042A1 (en) | 2019-03-19 | 2022-01-26 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
FR3096373A1 (fr) * | 2019-05-24 | 2020-11-27 | IFP Energies Nouvelles | Outil genetique optimisé pour modifier les bacteries |
CN115244069A (zh) | 2019-12-18 | 2022-10-25 | 埃克斯欧姆尼斯生物技术有限公司 | 遗传修饰的梭状杆菌菌株及其用途 |
KR20230019843A (ko) | 2020-05-08 | 2023-02-09 | 더 브로드 인스티튜트, 인코퍼레이티드 | 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물 |
FR3111642A1 (fr) * | 2020-06-23 | 2021-12-24 | IFP Energies Nouvelles | Souches de bacteriesclostridiumresistantes au 5-fluorouracile, outils genetiques et utilisations de ceux-ci |
FR3137108A1 (fr) | 2022-06-27 | 2023-12-29 | IFP Energies Nouvelles | Bacteries clostridium modifiees pour assimiler plusieurs sucres simultanement, preparation et utilisations de celles-ci |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NZ728024A (en) * | 2012-05-25 | 2019-05-31 | Univ California | Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription |
EP3079725B1 (en) * | 2013-12-12 | 2019-10-16 | The Broad Institute, Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for genome editing |
FR3042506B1 (fr) | 2015-10-16 | 2018-11-30 | IFP Energies Nouvelles | Outil genetique de transformation de bacteries clostridium |
FR3081881B1 (fr) | 2018-06-04 | 2024-05-24 | Ifp Energies Now | Outil genetique optimise pour modifier les bacteries du genre clostridium |
-
2015
- 2015-10-16 FR FR1559846A patent/FR3042506B1/fr active Active
-
2016
- 2016-10-14 EP EP16795118.5A patent/EP3362559B1/fr active Active
- 2016-10-14 WO PCT/FR2016/052663 patent/WO2017064439A1/fr active Application Filing
- 2016-10-14 US US15/768,018 patent/US11746346B2/en active Active
- 2016-10-14 CA CA3001815A patent/CA3001815A1/fr active Pending
- 2016-10-14 BR BR112018007622-8A patent/BR112018007622A2/pt unknown
- 2016-10-14 KR KR1020187013946A patent/KR20180081527A/ko not_active Application Discontinuation
- 2016-10-14 CN CN201680068812.7A patent/CN108431221A/zh active Pending
- 2016-10-14 DK DK16795118.5T patent/DK3362559T3/da active
-
2023
- 2023-08-29 US US18/457,402 patent/US20240002835A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
FR3042506B1 (fr) | 2018-11-30 |
US11746346B2 (en) | 2023-09-05 |
CA3001815A1 (fr) | 2017-04-20 |
FR3042506A1 (fr) | 2017-04-21 |
US20240002835A1 (en) | 2024-01-04 |
CN108431221A (zh) | 2018-08-21 |
BR112018007622A2 (pt) | 2018-10-30 |
EP3362559B1 (fr) | 2020-05-06 |
DK3362559T3 (da) | 2020-06-22 |
EP3362559A1 (fr) | 2018-08-22 |
WO2017064439A1 (fr) | 2017-04-20 |
US20180305680A1 (en) | 2018-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20180081527A (ko) | 클로스트리듐 박테리아의 형질전환을 위한 유전자 도구 | |
RU2763170C2 (ru) | Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом | |
AU2021203937B2 (en) | Compositions and methods for rapid and dynamic flux control using synthetic metabolic valves | |
AU2013344512B2 (en) | Recombinant adenoviruses and use thereof | |
CN110551713A (zh) | 用于修饰梭状芽孢杆菌属细菌的优化的遗传工具 | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
US20030119104A1 (en) | Chromosome-based platforms | |
IL236992A (en) | Genetically modified cyanobacteria that produce ethanol | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
KR20160068974A (ko) | 전립선-연관 항원의 발현을 위한 벡터 | |
BRPI0719748A2 (pt) | Microrganismo modificados por engenharia para produzir n-butanol e métodos relacionados | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
CN101617040A (zh) | △17去饱和酶及其在制备多不饱和脂肪酸中的用途 | |
CN101815432A (zh) | 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法 | |
CN101827938A (zh) | 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物 | |
KR20220012327A (ko) | 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포 | |
CN114729387A (zh) | 遗传修饰真菌和与其相关方法和用途 | |
CN114026242A (zh) | 具有髓鞘蛋白零启动子的aav载体及其用于治疗雪旺细胞相关疾病如charcot-marie-tooth疾病的用途 | |
CN101868545B (zh) | 具有改变的根构造的植物、涉及编码富含亮氨酸重复序列激酶(llrk)多肽及其同源物的基因的相关构建体和方法 | |
BRPI0616533A2 (pt) | polinucleotìdeo isolado, fragmento de ácido nucléico isolado, construções de dna recombinante, plantas, sementes, células vegetais, tecidos vegetais, método de isolamento de fragmentos de ácidos nucléico, método de mapeamento de variações genéticas, método de cultivo molecular, plantas de milho, métodos de alteração do transporte de nitrogênio das plantas e variantes de hat de plantas alteradas | |
AU2017252409A1 (en) | Compositions and methods for nucleic acid expression and protein secretion in bacteroides | |
CN101848931B (zh) | 具有改变的根构造的植物、涉及编码exostosin家族多肽及其同源物的基因的相关的构建体和方法 | |
CN113186140B (zh) | 用于预防和/或治疗宿醉和肝病的基因工程细菌 | |
RU2731513C2 (ru) | Генотерапевтический ДНК-вектор на основе генотерапевтического ДНК-вектора VTvaf17, несущий целевой ген, выбранный из группы генов NOS2, NOS3, VIP, KCNMA1, CGRP, для повышения уровня экспрессии этих целевых генов, способ его получения и применения, штамм Escherichia coli SCS110-AF/VTvaf17-NOS2, или Escherichia coli SCS110-AF/VTvaf17-NOS3, или Escherichia coli SCS110-AF/VTvaf17-VIP, или Escherichia coli SCS110-AF/VTvaf17-KCNMA1, или Escherichia coli SCS110-AF/VTvaf17-CGRP, несущий генотерапевтический ДНК-вектор, способ его получения, способ производства в промышленных масштабах генотерапевтического ДНК-вектора | |
CN113614229A (zh) | 遗传修饰的梭菌属细菌、其制备和用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal |