CN1646680A - 用于遗传工程的启动子的质粒系统 - Google Patents
用于遗传工程的启动子的质粒系统 Download PDFInfo
- Publication number
- CN1646680A CN1646680A CNA038091224A CN03809122A CN1646680A CN 1646680 A CN1646680 A CN 1646680A CN A038091224 A CNA038091224 A CN A038091224A CN 03809122 A CN03809122 A CN 03809122A CN 1646680 A CN1646680 A CN 1646680A
- Authority
- CN
- China
- Prior art keywords
- seq
- plasmid
- dna
- gene
- site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013612 plasmid Substances 0.000 title claims abstract description 104
- 238000010353 genetic engineering Methods 0.000 title abstract description 7
- 108700040099 Xylose isomerases Proteins 0.000 claims abstract description 72
- 230000014509 gene expression Effects 0.000 claims abstract description 52
- 238000010367 cloning Methods 0.000 claims abstract description 22
- 108091008146 restriction endonucleases Proteins 0.000 claims abstract description 18
- 239000002773 nucleotide Substances 0.000 claims description 44
- 125000003729 nucleotide group Chemical group 0.000 claims description 44
- 230000035897 transcription Effects 0.000 claims description 23
- 238000013518 transcription Methods 0.000 claims description 23
- 241000187747 Streptomyces Species 0.000 claims description 16
- 108091033319 polynucleotide Proteins 0.000 claims description 7
- 102000040430 polynucleotide Human genes 0.000 claims description 7
- 239000002157 polynucleotide Substances 0.000 claims description 7
- 230000008521 reorganization Effects 0.000 claims description 7
- 101150007902 ASPA gene Proteins 0.000 claims description 6
- 238000000926 separation method Methods 0.000 claims description 6
- 101150080758 tonB gene Proteins 0.000 claims description 6
- 101100378784 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aldA gene Proteins 0.000 claims description 5
- 101100057016 Talaromyces wortmannii astA gene Proteins 0.000 claims description 5
- 108010030074 endodeoxyribonuclease MluI Proteins 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 4
- 101150063051 hom gene Proteins 0.000 claims description 2
- 101150014006 thrA gene Proteins 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 abstract description 159
- 238000000034 method Methods 0.000 abstract description 25
- 102000004169 proteins and genes Human genes 0.000 abstract description 22
- 230000002068 genetic effect Effects 0.000 abstract description 12
- 244000005700 microbiome Species 0.000 abstract description 11
- 108700007698 Genetic Terminator Regions Proteins 0.000 abstract description 7
- 238000003780 insertion Methods 0.000 abstract description 6
- 230000037431 insertion Effects 0.000 abstract description 5
- 239000000463 material Substances 0.000 abstract description 5
- 108020004414 DNA Proteins 0.000 description 127
- 239000012634 fragment Substances 0.000 description 49
- 239000000047 product Substances 0.000 description 41
- 238000003752 polymerase chain reaction Methods 0.000 description 34
- 210000004027 cell Anatomy 0.000 description 32
- 241000894006 Bacteria Species 0.000 description 31
- UXFQFBNBSPQBJW-UHFFFAOYSA-N 2-amino-2-methylpropane-1,3-diol Chemical compound OCC(N)(C)CO UXFQFBNBSPQBJW-UHFFFAOYSA-N 0.000 description 30
- 230000000968 intestinal effect Effects 0.000 description 28
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 27
- 230000000694 effects Effects 0.000 description 27
- 230000008859 change Effects 0.000 description 26
- 101150061843 dhaT gene Proteins 0.000 description 23
- 108090001042 Hydro-Lyases Proteins 0.000 description 21
- 102000004867 Hydro-Lyases Human genes 0.000 description 21
- 150000007523 nucleic acids Chemical class 0.000 description 21
- 108020004707 nucleic acids Proteins 0.000 description 19
- 102000039446 nucleic acids Human genes 0.000 description 19
- 230000001580 bacterial effect Effects 0.000 description 18
- 235000018102 proteins Nutrition 0.000 description 18
- 108010025885 Glycerol dehydratase Proteins 0.000 description 17
- 101100277683 Citrobacter freundii dhaB gene Proteins 0.000 description 16
- 101100098786 Bacillus subtilis (strain 168) tapA gene Proteins 0.000 description 15
- 102000004190 Enzymes Human genes 0.000 description 15
- 108090000790 Enzymes Proteins 0.000 description 15
- 101100321116 Escherichia coli (strain K12) yqhD gene Proteins 0.000 description 15
- 238000011144 upstream manufacturing Methods 0.000 description 13
- 101150034590 DAR1 gene Proteins 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 12
- 235000011187 glycerol Nutrition 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 101150059691 GPP2 gene Proteins 0.000 description 11
- 101100393304 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GPD1 gene Proteins 0.000 description 11
- 238000004321 preservation Methods 0.000 description 11
- 230000003321 amplification Effects 0.000 description 10
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 10
- 238000003199 nucleic acid amplification method Methods 0.000 description 10
- 239000000758 substrate Substances 0.000 description 10
- ZTQSAGDEMFDKMZ-UHFFFAOYSA-N Butyraldehyde Chemical compound CCCC=O ZTQSAGDEMFDKMZ-UHFFFAOYSA-N 0.000 description 8
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 8
- 241000588747 Klebsiella pneumoniae Species 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 101710157860 Oxydoreductase Proteins 0.000 description 8
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 8
- 150000001413 amino acids Chemical group 0.000 description 8
- 230000029087 digestion Effects 0.000 description 8
- 230000008034 disappearance Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 239000008103 glucose Substances 0.000 description 8
- AKXKFZDCRYJKTF-UHFFFAOYSA-N 3-Hydroxypropionaldehyde Chemical compound OCCC=O AKXKFZDCRYJKTF-UHFFFAOYSA-N 0.000 description 7
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 7
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 7
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 7
- 229940024606 amino acid Drugs 0.000 description 7
- 235000001014 amino acid Nutrition 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 230000005030 transcription termination Effects 0.000 description 7
- 108020004705 Codon Proteins 0.000 description 6
- 108010041921 Glycerolphosphate Dehydrogenase Proteins 0.000 description 6
- 102000000587 Glycerolphosphate Dehydrogenase Human genes 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 238000012408 PCR amplification Methods 0.000 description 6
- 239000002253 acid Substances 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 230000004060 metabolic process Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 101000743006 Lactococcus lactis subsp. cremoris UPF0177 protein in abiGi 5'region Proteins 0.000 description 5
- ACFIXJIJDZMPPO-NNYOXOHSSA-N NADPH Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](OP(O)(O)=O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 ACFIXJIJDZMPPO-NNYOXOHSSA-N 0.000 description 5
- 108010065027 Propanediol Dehydratase Proteins 0.000 description 5
- 125000002252 acyl group Chemical group 0.000 description 5
- 150000001299 aldehydes Chemical class 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 101150113187 yqhD gene Proteins 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 4
- 108010000445 Glycerate dehydrogenase Proteins 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- DTBNBXWJWCWCIK-UHFFFAOYSA-N Phosphoenolpyruvic acid Natural products OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 4
- 108020004511 Recombinant DNA Proteins 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 4
- 239000004473 Threonine Substances 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 239000006052 feed supplement Substances 0.000 description 4
- 238000000855 fermentation Methods 0.000 description 4
- 230000004151 fermentation Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000011081 inoculation Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- HGBOYTHUEUWSSQ-UHFFFAOYSA-N valeric aldehyde Natural products CCCCC=O HGBOYTHUEUWSSQ-UHFFFAOYSA-N 0.000 description 4
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 3
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 3
- 101100224392 Bacillus subtilis (strain 168) dpaA gene Proteins 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 241001655322 Streptomycetales Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 239000013599 cloning vector Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 101150000296 luxA gene Proteins 0.000 description 3
- 230000003647 oxidation Effects 0.000 description 3
- 238000007254 oxidation reaction Methods 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N propylene glycol Substances CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- IKHGUXGNUITLKF-UHFFFAOYSA-N Acetaldehyde Chemical compound CC=O IKHGUXGNUITLKF-UHFFFAOYSA-N 0.000 description 2
- 108010013043 Acetylesterase Proteins 0.000 description 2
- 101100204564 Arabidopsis thaliana SYCO gene Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108700025164 Bacteria tonB Proteins 0.000 description 2
- 101100190268 Caenorhabditis elegans pah-1 gene Proteins 0.000 description 2
- 241000193403 Clostridium Species 0.000 description 2
- 101710088194 Dehydrogenase Proteins 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 108010046276 FLP recombinase Proteins 0.000 description 2
- 101150112014 Gapdh gene Proteins 0.000 description 2
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 description 2
- 102000005731 Glucose-6-phosphate isomerase Human genes 0.000 description 2
- 102100036669 Glycerol-3-phosphate dehydrogenase [NAD(+)], cytoplasmic Human genes 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 101001072574 Homo sapiens Glycerol-3-phosphate dehydrogenase [NAD(+)], cytoplasmic Proteins 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- 101000746457 Neisseria gonorrhoeae UPF0213 protein in glnA 3'region Proteins 0.000 description 2
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000029918 bioluminescence Effects 0.000 description 2
- 238000005415 bioluminescence Methods 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 101150055766 cat gene Proteins 0.000 description 2
- 239000003054 catalyst Substances 0.000 description 2
- 230000003915 cell function Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 230000014107 chromosome localization Effects 0.000 description 2
- JBJSVEVEEGOEBZ-SCZZXKLOSA-K coenzyme B(3-) Chemical compound [O-]P(=O)([O-])O[C@H](C)[C@@H](C([O-])=O)NC(=O)CCCCCCS JBJSVEVEEGOEBZ-SCZZXKLOSA-K 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- XUWPJKDMEZSVTP-LTYMHZPRSA-N kalafungina Chemical compound O=C1C2=C(O)C=CC=C2C(=O)C2=C1[C@@H](C)O[C@H]1[C@@H]2OC(=O)C1 XUWPJKDMEZSVTP-LTYMHZPRSA-N 0.000 description 2
- 101150065800 luxB gene Proteins 0.000 description 2
- 101150005370 luxC gene Proteins 0.000 description 2
- 101150112190 luxD gene Proteins 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 230000037452 priming Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000006722 reduction reaction Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000011573 trace mineral Substances 0.000 description 2
- 235000013619 trace mineral Nutrition 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- QBDLSGCHMSRFFL-UHFFFAOYSA-N 2,3-dihydroxypropyl dihydrogen phosphate;phosphoric acid Chemical compound OP(O)(O)=O.OCC(O)COP(O)(O)=O QBDLSGCHMSRFFL-UHFFFAOYSA-N 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 101100330721 Arabidopsis thaliana DAR1 gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 101100398597 Botryotinia fuckeliana lcc1 gene Proteins 0.000 description 1
- 238000009631 Broth culture Methods 0.000 description 1
- YASYEJJMZJALEJ-UHFFFAOYSA-N Citric acid monohydrate Chemical compound O.OC(=O)CC(O)(C(O)=O)CC(O)=O YASYEJJMZJALEJ-UHFFFAOYSA-N 0.000 description 1
- 241000588919 Citrobacter freundii Species 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- GSXOAOHZAIYLCY-UHFFFAOYSA-N D-F6P Natural products OCC(=O)C(O)C(O)C(O)COP(O)(O)=O GSXOAOHZAIYLCY-UHFFFAOYSA-N 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 101100364969 Dictyostelium discoideum scai gene Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- YTNIXZGTHTVJBW-SCRDCRAPSA-L FMNH2(2-) Chemical compound [O-]P(=O)([O-])OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2NC2=C1NC(=O)NC2=O YTNIXZGTHTVJBW-SCRDCRAPSA-L 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 101150004714 GPP1 gene Proteins 0.000 description 1
- 101100068374 Gibberella zeae (strain ATCC MYA-4620 / CBS 123657 / FGSC 9075 / NRRL 31084 / PH-1) GIP1 gene Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101000655188 Homo sapiens Tachykinin-3 Proteins 0.000 description 1
- 102000008133 Iron-Binding Proteins Human genes 0.000 description 1
- 108010035210 Iron-Binding Proteins Proteins 0.000 description 1
- 241001055489 Klebsiella pneumoniae ATCC 25955 Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 101100387236 Lactococcus lactis subsp. lactis (strain IL1403) dhaS gene Proteins 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 101100364971 Mus musculus Scai gene Proteins 0.000 description 1
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical class CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 1
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 238000012181 QIAquick gel extraction kit Methods 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 108010046685 Rho Factor Proteins 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 102100033009 Tachykinin-3 Human genes 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- LPQOADBMXVRBNX-UHFFFAOYSA-N ac1ldcw0 Chemical compound Cl.C1CN(C)CCN1C1=C(F)C=C2C(=O)C(C(O)=O)=CN3CCSC1=C32 LPQOADBMXVRBNX-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 101150066782 adhB gene Proteins 0.000 description 1
- 230000009603 aerobic growth Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- SRBFZHDQGSBBOR-QMKXCQHVSA-N alpha-L-arabinopyranose Chemical compound O[C@H]1CO[C@@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-QMKXCQHVSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- FRHBOQMZUOWXQL-UHFFFAOYSA-L ammonium ferric citrate Chemical compound [NH4+].[Fe+3].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O FRHBOQMZUOWXQL-UHFFFAOYSA-L 0.000 description 1
- 235000011114 ammonium hydroxide Nutrition 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- BGWGXPAPYGQALX-ARQDHWQXSA-N beta-D-fructofuranose 6-phosphate Chemical compound OC[C@@]1(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BGWGXPAPYGQALX-ARQDHWQXSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000003570 biosynthesizing effect Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000010531 catalytic reduction reaction Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 229960004106 citric acid Drugs 0.000 description 1
- 229960002303 citric acid monohydrate Drugs 0.000 description 1
- 230000009514 concussion Effects 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229940125368 controlled substance Drugs 0.000 description 1
- 239000000599 controlled substance Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000002577 cryoprotective agent Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 239000013530 defoamer Substances 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 101150066721 dhaR gene Proteins 0.000 description 1
- GUJOJGAPFQRJSV-UHFFFAOYSA-N dialuminum;dioxosilane;oxygen(2-);hydrate Chemical compound O.[O-2].[O-2].[O-2].[Al+3].[Al+3].O=[Si]=O.O=[Si]=O.O=[Si]=O.O=[Si]=O GUJOJGAPFQRJSV-UHFFFAOYSA-N 0.000 description 1
- RXKJFZQQPQGTFL-UHFFFAOYSA-N dihydroxyacetone Chemical compound OCC(=O)CO RXKJFZQQPQGTFL-UHFFFAOYSA-N 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 229960004642 ferric ammonium citrate Drugs 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 238000007852 inverse PCR Methods 0.000 description 1
- 239000004313 iron ammonium citrate Substances 0.000 description 1
- 235000000011 iron ammonium citrate Nutrition 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 101150059295 luxE gene Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- -1 methylbenzene-2-thiazolone hydrazone Chemical compound 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 210000004332 phalangeal cell Anatomy 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-N phosphoric acid Substances OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 229940011671 vitamin b6 Drugs 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/36—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/76—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明提供了一系列低拷贝数质粒,该质粒包含用于克隆至少3种不同基因或操纵子的限制性内切酶识别位点,且每一位点均侧翼于一个终止子序列,该质粒还含有可改变蛋白质表达水平的葡萄糖异构酶启动子变体。本发明的物质和方法适用于微生物遗传工程,尤其是在探寻多重遗传插入方面。
Description
本申请要求2002年4月22日所提交的美国临时申请No.60/374931的权益。
发明领域
本发明属于分子生物学领域。更具体而言,本发明涉及一系列低拷贝数质粒,该质粒包含用于克隆至少3种不同基因或操纵子的限制性内切酶识别位点,且每一位点均侧翼于一个终止子序列,本发明还涉及一组可改变蛋白质表达水平的启动子。本发明适用于微生物遗传工程,尤其是在探寻多重遗传插入方面。
发明背景
分子生物技术是一门以研究者将特定单位的遗传信息从某一生物体转移至另一生物体的能力为基础的学科。该过程被称为克隆,依赖于重组DNA技术以获得有用的产物或商业化生产方法(Glick,B.R.;Pasternak,J.J.,
Molecular Biotechnology Principles and Applications of Recombinant DNA,2nd ed.American Society forMicrobiology,Washington,DC.(1998))。
商业化生产方法通常要求高表达率地生产由克隆基因编码的蛋白质。实现每一克隆基因的最大表达所适用的单一方案是不存在的。大部分克隆基因具有独特的分子特性,在找到实现可接受表达水平的一组特定条件之前,需要相当长时间的投资和努力。
仅仅将基因插入克隆载体并不能确保所要求水平的成功表达。为满足高表达率的需要,通过操纵若干不同遗传元件构建出许多专用表达载体,这些遗传元件控制着转录、翻译、蛋白质稳定性、氧限制以及宿主细胞的分泌等方面。更具体而言,受到操纵从而可以控制基因表达的分子特征包括:(1)相关转录启动子和终止子序列的特性,(2)核糖体结合位点的强度,(3)克隆基因的拷贝数以及该基因是否质粒本身所携带或被整合进入宿主细胞基因组的,(4)合成的外源蛋白质的最终细胞定位,(5)宿主生物体内的翻译效率,和(6)宿主细胞内克隆基因蛋白质的固有稳定性。
另外,宿主生物体内外源DNA的导入与表达可能削弱正常细胞机能,因此往往改变该生物体的代谢。该现象是外源DNA强加于宿主的代谢负荷或负担造成的。代谢负荷可能是多种情况产生的,包括1)质粒拷贝数的增加,2)蛋白质的过量产生,3)输出位点的饱和,和/或4)外源蛋白质本身对细胞功能的干扰。
解决上述若干障碍的技术是已知的。某些研究小组将不同DNA聚合酶来源或不同噬菌体物种中出现的多个启动子串联,用于在细胞生长的不同时期表达基因(CN 1186856)(US 5547862;J.Biotechnol.2(5):303-316(1985);Biotechniques,18(1):152-154,156-157(1995))。另一个研究小组采用串联重复的多克隆位点(MCS)(Gene,139(1):83-86(1994))以便于将DNA移进和移出质粒载体。一个研究小组报道采用了具有三个多克隆位点的高拷贝数载体,用于在哺乳动物细胞中表达不同基因,其中每一位点均位于不同启动子之后(Biotech.Bioeng.,57(1):1-10(1998))。
除上述技术外,待解决的难题还有如何在使代谢负荷的影响最小、控制重组蛋白质的产率以符合生产需要和增强所转化宿主细胞稳定性的同时,方便且迅速地克隆多个基因或操纵子。
发明概述
申请人构建了可改变生产性生物体中基因表达水平的新型葡萄糖异构酶启动子序列。申请人将含有该变异GI启动子的表达盒整合进pCL 1920来源的低拷贝数质粒中,从而构建出一系列用于遗传工程的质粒。转录终止子通过转录将相关启动子与位于构建体外部的其它启动子分离。
申请人也构建了含有多个稀有限制酶的克隆位点的独特核苷酸序列,进一步有利于构建体内的克隆,或者用于将构建体转移至其它质粒或载体的主链。该独特克隆位点可导入特定基因或操纵子,并可使其在不同强度的合适启动子控制下实现表达。
本发明包括:
1.编码浅青紫链霉菌葡萄糖异构酶变体的分离或重组核酸分子,该核酸分子选自SEQ ID NOs:9-28;
2.编码浅青紫链霉菌葡萄糖异构酶变体的分离或重组核酸分子,该核酸分子包含SEQ ID NOs:9-28中的任一核苷酸序列;
3.编码浅青紫链霉菌葡萄糖异构酶变体的分离或重组核酸分子文库,该文库包含SEQ ID NOs:9-28的核苷酸序列;
4.包含上述多种GI变体的核酸分子的表达盒;以及,
5.包含上述编码多种浅青紫链霉菌葡萄糖异构酶变体的核酸分子的试剂盒。
本发明的一个进一步实施方案是包含至少三个转录终止子和至少一个位于任意两个转录终止子之间的克隆位点的DNA构建体。该DNA构建体的一个优选实施方案包含转录终止子tonB、thrA或aspA,且克隆位点选自AvrII、NheI、BfaI、Cac8I、BsaJI和StyI。优选克隆位点为NheI或AvrII。本发明也包括上述构建体的文库。
本发明包括下列DNA构建体:
由SEQ ID NO:30组成的pSYCO109mcs质粒,
由SEQ ID NO:31组成的短1.5GI启动子,
由SEQ ID NO:32组成的短1.20GI启动子,
由SEQ ID NO:70组成的pAH105质粒,
由SEQ ID NO:71组成的pSYCO101质粒,
由SEQ ID NO:72组成的pSYCO103质粒,
由SEQ ID NO:73组成的pSYCO106质粒,
由SEQ ID NO:74组成的pSYCO109质粒,
由SEQ ID NO:78组成的pSYCO106mcs质粒,和
由SEQ ID NO:79组成的pRJ50质粒。
本发明的一个进一步实施方案是具有多克隆位点的载体,该多克隆位点包含特异于限制性内切酶AscI、NheI、PacI、RsrII、NsiI、SacII、MluI、AgeI、SapI和SnaBI的限制性识别位点序列。该载体的特定实施方案是SEQ ID NO:77的核苷酸序列。
本发明的遗传物质包括含有上述核酸分子和特定多核苷酸所编码特定多肽的转化宿主细胞。
序列表和生物保藏物简述
申请人提供了83个序列,符合专利申请中核苷酸和氨基酸序列的标准表示规则(Decision of the President of the EPO的附录I和II,公开于OJEPO的附近2)、37C.F.R.1.821-1.825和附录A和B(Requirements for Application Disclosures ContainingNucleotides and/or Amino Acid Sequences)、世界知识产权组织(WIPO)标准ST.25(1998)以及EPO和PCT的序列表要求(Rules 5.2和49.5(a-bis),和Administrative Instructions的208节和附录C)。如根据此处引用作为参考的Nucleic Acids Research13:3021-3030(1985)和Biochemical Journal 219(No.2):345-373(1984)中描述的IUPAC-IYUB标准所定义的,在对序列的描述中,一个字母码表示核苷酸序列符号,三个字母码则表示氨基酸。
SEQ ID NO:1为野生型浅青紫链霉菌葡萄糖异构酶(GI)启动子的核苷酸序列。
SEQ ID NOs:2-8为饱和诱变GI启动子所用的寡核苷酸引物。在SEQ ID NOs:3-8中,“N”表示A、T、C或G。
SEQ ID NOs:9-28为GI启动子变体的核苷酸序列。
SEQ ID NO:29为大肠杆菌来源yqhD基因的核苷酸序列。
SEQ ID NO:30为pSYCO109mcs质粒的核苷酸序列。
SEQ ID NO:31为短1.5GI启动子的核苷酸序列。
SEQ ID NO:32为短1.20GI启动子的核苷酸序列。
SEQ ID NO:33为短野生型GI启动子的核苷酸序列。
SEQ ID NOs:34-37为扩增整合有短GI启动子的yqhD所用的寡核苷酸引物。
SEQ ID NOs:38-39为构建yqhD破坏所用的寡核苷酸引物。
SEQ ID NOs:40-43为证实yqhD破坏所用的寡核苷酸引物。
SEQ ID NOs:44-46为以短野生型GI启动子取代染色体ppc启动子所用的寡核苷酸引物。
SEQ ID NO:47为多克隆位点和终止子的核苷酸序列。
SEQ ID NO:48为pHK28-26质粒的核苷酸序列。
SEQ ID NOs:49-50为扩增dhaB3所用的寡核苷酸引物。
SEQ ID NOs:51-52为扩增dhaB1所用的寡核苷酸引物。
SEQ ID NOs:53-54为构建dhaT缺失所用的寡核苷酸引物。
SEQ ID NOs:55-56为构建接头所用的寡核苷酸。
SEQ ID NO:57为编码由限制位点分隔开的三个转录终止子的核苷酸序列。
SEQ ID NOs:58-59为构建SEQ ID NO:60所用的寡核苷酸。
SEQ ID NO:60为编码两侧存在EcoRI和KpnI位点的三个转录终止子的核苷酸序列。
SEQ ID NOs:61-62为扩增SEQ ID NO:60所用的寡核苷酸引物。
SEQ ID NOs:63-66为扩增表达盒所用的寡核苷酸引物。
SEQ ID NO:67为生成pCR-pCL1920所用的双链接头的核苷酸序列。
SEQ ID NOs:68-69为扩增pTrc99A来源的rrnBT1T2终止子所用的寡核苷酸引物。
SEQ ID NO:70为pAH105质粒的核苷酸序列。
SEQ ID NO:71为pSYCO101质粒的核苷酸序列。
SEQ ID NO:72为pSYCO103质粒的核苷酸序列。
SEQ ID NO:73为pSYCO106质粒的核苷酸序列。
SEQ ID NO:74为pSYCO109质粒的核苷酸序列。
SEQ ID NOs:75-76为形成SEQ ID NO:77所用的寡核苷酸引物。
SEQ ID NO:77为含有下列酶的限制性识别位点的多克隆片段的核苷酸序列:NheI、RsrII、SacI、AgeI、SnaBI、AscI、PacI、NsiI、MluI和SapI。
SEQ ID NO:78为pSCYO106mcs质粒的核苷酸序列。
SEQ ID NO:79为pRJ50质粒的核苷酸序列。
SEQ ID NOs:80-81为扩增orf操纵子所用的寡核苷酸引物。
SEQ ID NOs:82-83为检验实施例4中转化体所用的寡核苷酸引物。
申请人在布达佩斯条约有关微生物保藏的国际认可方面的框架下确定了下列生物保藏物,用于专利程序用途:
保藏者鉴定 国际保藏
名称 命名 保藏日
大肠杆菌RJ8n ATCC PTA-4216 2002年4月9日
此处所用“ATCC”指位于10801 University Blvd.,Manassas,VA20110-1109,U.S.A的美国典型培养物保藏中心。“ATCC No.”为ATCC所保藏的培养物的编号。
上述保藏物将保存于指定国际保藏机构至少30年,并可在公开其的专利授权后提供给公众。可以获得保藏物,并不是许可在破坏政府行为授予的专利权的条件下实施本发明。
发明详述
申请人通过构建一系列含有至少三个独特克隆位点的构建体解决了上述难题,其中转录终止子和不同强度的启动子可操作性地将各克隆位点彼此分隔。不同强度的启动子均为浅青紫链霉菌葡萄糖异构酶(GI)启动子(SEQ ID NO:1)的变体。将变异GI启动子与SYCO质粒整合进表达盒中作为生产平台,可提供一个对广泛多种生物加工项目中生物催化剂的发展有用的系统。
本发明可方便并稳定地将内源或外源的基因或操纵子整合进可控制基因表达水平的载体中。利用表达多个基因或操纵子的单个质粒可减少以前用于生成基因产物的方法中维持大肠杆菌宿主中多个质粒所需的抗生素标记数量。利用本发明可最小化代谢负荷的影响、最优化重组蛋白质的产率,并提高转化的宿主细胞的稳定性。本发明尤其适用的是下述生物过程中的遗传工程,即形成产物可能必须表达两个或以上基因或操纵子的生物过程。
申请人构建了可改变基因表达水平的新型GI启动子序列。申请人将含有变异GI启动子的表达盒整合进pCL1920来源的低拷贝数质粒中,从而构建了一系列用于遗传工程的质粒。转录终止子通过转录将相关启动子与位于构建体外部的其它启动子分隔开。
申请人也构建了含至少10个稀有限制酶的克隆位点的独特核苷酸序列,进一步有利于构建体内的克隆,或者用于将构建体转移至其它质粒或载体的主链。独特克隆位点可导入特定基因或操纵子,并可使其在不同强度的合适启动子控制下实现表达。此外,特定构建体的可以侧翼于独特克隆位点,用于实现整合进入任意数量的质粒主链中,包括pUC、pBR322、pACYC、pSC101,或本领域技术人员已知和设想的其它质粒。
申请人证明了本发明在大肠杆菌内从葡萄糖生物合成1,3-丙二醇(3G)方面的特定效用,其中该大肠杆菌经由被要求保护的物质转化过。将表达盒构建到上述低拷贝数质粒中,生成1,3-丙二醇所用的基因便被克隆进载体中。本发明可用于改变其它表达系统中的基因表达。
定义
下述定义和缩写被用于阐释权利要求和说明书。
“开放读码框架”缩写为ORF。
“聚合酶链反应”缩写为PCR。
术语“宿主细胞”或“宿主生物体”指可接受外源或异源基因或多重拷贝的内源基因,并可表达这些基因,生成活性基因产物的微生物。术语“DNA构建体”或“构建体”指DNA的人工构建片段。
“基因”指表达特定蛋白质的核酸片段,包括在前的调节序列(5’非编码序列)和在后的编码序列(3’非编码序列)。“天然基因”指发现于自然中,具有其自身调节序列的基因。“嵌合基因”指非天然基因,且包含未同时发现于自然中的调节和编码序列的任何基因。相应的,嵌合基因可能包含不同来源的调节序列和编码序列,或者相同来源,但以不同于自然中所存在方式排列的调节序列和编码序列。“内源基因”指位于生物体基因组中其固有位置上的天然基因。“外来”、“外源”或“异源”基因指通常未发现于宿主生物体内,但可通过基因转移被导入宿主生物体的基因。外源基因可包含被插入非天然生物体内的天然基因,或嵌合基因。“转基因”指通过转化操作被导入基因组的基因。“基因构建体”指编码用于表达一种或多种特定蛋白质的核酸片段。基因构建体中的基因在性质上可能是天然、嵌合或外源的。
术语“分离的核酸”指基本上与自然伴随天然序列的其它组分(如原始种来源的核糖体、聚合酶和/或侧翼基因组序列)分离开的核酸(如RNA、DNA或混合的聚合物)。该术语包括重组或克隆的DNA分离物,化学合成的类似物或由异源系统生物合成的类似物。
术语“编码(encoding)”和“编码(coding)”指基因通过转录和翻译机制生成氨基酸序列的过程。编码特定氨基酸序列的过程包括可能涉及不引起所编码氨基酸发生改变的碱基改变,或者涉及可能改变一个或多个氨基酸,但不影响该DNA序列所编码蛋白质功能特性的碱基改变。因此,应当理解本发明包括比特定实施例序列更多的序列。可产生沉默改变,即基本上不影响所生成蛋白质分子的功能特性的序列修饰,如序列的缺失、插入或取代也是被预想到的。例如,预想到了反映遗传密码兼并,或导致在特定位点生成化学等价氨基酸的基因序列改变。因此,疏水氨基酸丙氨酸的密码子可能被编码另一种疏水性较差的残基(如甘氨酸),或疏水性较强的残基(如缬氨酸、亮氨酸或异亮氨酸)的密码子取代。类似的导致一种阴性电荷残基取代另一种阴性电荷残基(如天冬氨酸取代谷氨酸),或一种阳性电荷残基取代另一种阳性电荷残基(如赖氨酸取代精氨酸)的改变也被预期可以生成生物学等价产物。导致蛋白质分子的N末端和C末端部分改变的核苷酸改变也被预期不会改变该蛋白质的活性。某些情况中,为研究改变对蛋白质生物学活性的影响,实际可能需要获得序列的突变体。与确定编码产物生物学活性保留的方法一样,上述每种被提到的修饰均属于本领域的常规技术。此外,熟练的技术人员应认同的是本发明所包括的序列也受限于其在严格条件(0.1×SSC、0.1%SDS、65℃)下与此处例证的序列杂交的能力。
术语“表达”指从编码基因产物序列的基因转录和翻译为基因产物。
术语“启动子”指可与RNA聚合酶结合并启动基因转录的DNA区域。
术语“转录终止子”或“终止子”指终止蛋白质合成的遗传元件。
术语“操纵子”指一簇相互配合进行调节的基因。
术语“多肽”和“蛋白质”可互换使用,指基因产物。
术语“质粒”、“载体”和“盒”指常常携带并非细胞中枢代谢一部分的基因,通常为环状双链DNA分子形式的其它染色体元件。该元件可能是任意来源的单或双链DNA或RNA的自主复制序列、基因组整合序列、噬菌体或核苷酸序列(线性或环状)。该元件含有若干已被连接或重组进入某种独特结构的核苷酸序列,该独特结构能够将选定基因产物的启动子片段和DNA序列连同合适的3’未翻译序列一起导入细胞。“转化盒”指含有外源基因,且除该外源基因外还含有促进特定宿主细胞转化的元件的特定载体。“表达盒”指含有外源基因,且除该外源基因外还含有可增强该基因在其宿主内表达的元件的特定载体。
术语“限制性内切酶”指一类于特定且独特的内部位点切下指定长度DNA的酶。通过在DNA中制造出切口,限制性内切酶可使随后的剪接,或者将DNA片段插入内部位点得以实现。术语“限制位点”或“限制性识别位点”指由特定限制酶“识别”并切断的DNA分子中(碱基对的)核苷酸序列。
用于形容限制酶位点的术语“稀有”指基因中特定序列出现的频率低。本说明书所应用优选的稀有限制酶位点是AscI、NheI、PacI、RsrII、NsiI、SacII、MluI、AgeI、SapI和SnaBI。
术语“克隆位点”指载体中可插入DNA的位点。术语“多克隆位点”或“mcs”指含有任意一个或多个不同限制酶位点,并可在载体上的指定位点(限制位点)实现插入的合成DNA序列。术语“独特克隆位点”指在特定DNA序列情况下仅出现一次的克隆位点。
在对载体元件相对位置的描述中,我们感兴趣的特定位点或基因座如果位于将另两个位点分隔开的DNA长度中间,则将其描述为在另外两个位点“之间”。在环状载体的情况中,我们感兴趣的特定位点或基因座如果位于将该载体上另外两个位点分隔开的DNA最短长度内,则将其描述为在另外两个位点“之间”。该特定位点或基因座被描述为“侧翼于”另一个位于我们感兴趣的位点或基因座之前或之后的位点。
术语“遗传改变的”指通过转化或突变从而改变遗传物质的过程。术语“转化”和“转染”指细胞整合核酸后新基因的获得。该获得基因可能被整合进入染色体DNA或作为染色体外复制序列导入。术语“转化体”指转化产物。
术语“甘油脱水酶”或“脱水酶”指负责辅酶B12-依赖性酶活性,即可使甘油分子异构或转化生成产物3-羟基丙醛的多肽。对本发明的应用而言,脱水酶包括优选底物分别为甘油和1,2-丙二醇的甘油脱水酶(GenBank U09771,U30903)和二醇脱水酶(GenBank D45071)。肺炎克氏杆菌ATCC 25955的甘油脱水酶是由基因dhaB1、dhaB2和dhaB3(GenBank U30903)编码的。dhaB1、dhaB2和dhaB3基因分别编码甘油脱水酶的α、β和γ亚基。甘油脱水酶和二醇脱水酶均为利用辅酶B12的复合体(具有α2β2γ2亚基组成)。
甘油和二醇脱水酶容易因甘油和某些其它底物出现机制基础的自杀灭活(Daneil et al.,FEMS Microbiol.Rev.22:553(1999))。术语“脱水酶再活化因子”指负责再活化脱水酶活性的蛋白质。术语“脱水酶再活化活性”、“使脱水酶活性再活化”或“使脱水酶活性再生”指将不具有催化底物能力的脱水酶转化为具有催化底物能力的脱水酶的现象、抑制脱水酶灭活的现象或延长体内脱水酶的有用半衰期的现象。有两种蛋白质已被认定属于脱水酶再活化因子(见WO9821341(US 6013494在此引入作为参考)及其所引参考文献;Danielet al.,同上;Toraya和Mori,J.Biol.Chem.274:3372(1999);和Tobimatsu et al.,J.Bacteriol.181:4110(1999))。
术语“氧化还原酶”或“1,3-丙二醇氧化还原酶”指负责将3-羟基丙醛催化还原为1,3-丙二醇的酶活性的多肽。1,3-丙二醇氧化还原酶包括,例如,由dhaT基因(GeneBank U09771,U30903)编码的多肽。可选的,与梭状芽孢杆菌中的adhB基因(一种可能的NADH依赖型丁醇脱水酶2)存在40%一致性的大肠杆菌开放读码框架,yqhD则编码了可发挥1,3-丙二醇氧化还原酶功能的多肽(WO 0112833)。
由pSYCO质粒(pSYCO101、pSYCO103、pSYCO106、pSYCO109、pSYCO106mcs和pSYCO109mcs)表达的酶均可被描述为包含了表达甘油脱水酶、脱水酶再活化因子、甘油-3-磷酸脱氢酶和甘油-3-磷酸酶所必需的基因。
术语“可发酵碳底物”和“可发酵碳源”指可被本发明的宿主生物体代谢的碳源,尤其是选自下组的碳源,即单糖、寡糖、多糖、甘油、二羟基丙酮和一碳底物或上述物质的混合物。
具有不同强度GI启动子变体的基因表达系统
一种有效的基因表达系统的最低要求是存在位于克隆基因上游的启动子(在DNA上,可结合RNA聚合酶和开始转录的位点)。通常,采用一个对RNA聚合酶具有高亲和性的强启动子的结果是相邻下游区域被高度或频繁转录。
在启动子中,启动子强度(下游基因的转录水平)的主要序列决定子是最保守的碱基对。与该保守序列存在偏差的启动子则减少了转录起始频率(Hawley,D.K.;McClure,W.R.,Nucleic Acids Res.,11:2237-2255(1983))。
已证实大肠杆菌RNA聚合酶的启动子含有保守DNA序列的两个区域,位于转录起始位点上游的大约10和35个碱基对。已确定12个碱基对是启动子当中最保守的。这些碱基是通常所说的-35区,即上游35个碱基对附近的TTGACA,和通常所说的-10区,即上游10个碱基对附近的TATAAT。-10和-35区之间的最佳间距为17个碱基对。如该间距接近17个碱基对,则该启动子较强,而间距为15和20个碱基对的启动子则只保留了部分功能。
申请人构建了一系列整合有浅青紫链霉菌葡萄糖异构酶(GI)启动子变体的构建体。这些构建体构成了具有一系列不同强度启动子变体的文库或试剂盒,从而具有了根据需要调整改变基因表达水平的能力。链霉菌葡萄糖异构酶(EC 5.3.1.9)可将葡萄糖-6-磷酸催化转化为果糖-6-磷酸。编码磷酸葡糖异构酶(pgi)的基因的转录受控于含有一个特征性的-10标记序列(AATAAT)和一个特征性的-35标记序列(TTGACA)的启动子。尽管饱和诱变是在启动子的-35区内进行,-35区上游大约122bp长的SpeI限制位点的改变仍将影响所表达基因的活性。此外,在-10区与该启动子末端之间存在25bp长的缺失,即使SpeI限制位点发生改变,仍可保留86%的酶活性。这些具体结果以前均无报导。
RNA合成的转录终止发生在DNA的特定碱基序列上,调节着转录的终止。DNA上的通用终止序列是一个含有反向重复和一个中央非重复片段的序列。该DNA序列被转录时,RNA可通过链内碱基配对形成茎-环结构。RNA中的该茎-环结构后连接尿苷时,便形成了有效的转录终止子。其它终止位点是富GC序列后连接富AT序列的区域。这种结构无需添加任何其它因子便可终止转录,在某些时候被称为内在终止子或不依赖rho的终止子。
除需要RNA聚合酶的功能之外,还需要类似大肠杆菌来源Rho的蛋白质因子发挥作用的其它类型终止子序列已被发现。Rho不与RNA聚合酶或DNA结合,但可与RNA紧密结合并可沿着链从上游移向RNA聚合酶-DNA复合体。一旦RNA聚合酶暂停于Rho依赖性终止位点,Rho可接着使RNA和聚合酶离开DNA,从而终止转录。转录终止涉及的其它蛋白质是类似Rho的RNA结合蛋白质。在所有情况中,终止涉及的序列均于RNA水平发挥作用。不过,RNA是由DNA转录而来,因此,转录终止最终由DNA上的特定核苷酸序列决定。(Madigan,M.T.;Martinko,J.M.;Parker,J.;Brock Biology of Microorganisms,8th ed.,Prentice Hall;Upper Saddle River,NJ(1997))。
申请人构建了内含三个串联排列的不同终止子序列的终止区域。这三个终止子均侧翼于用于克隆基因或操纵子的独特限制酶位点。tonB终止子是在大肠杆菌tonB基因与相对基因之间被发现的不依赖rho的双向转录终止子(Postle,K.;Good,R.F.,Cell,41,577-585(1985))。结构上与其它不依赖rho的终止子相似的thr弱化子用于大肠杆菌苏氨酸操纵子的转录终止(Yanget et al.,J.Biol.Chem.,270:23330-23336(1995))。具有不依赖rho的终止子的结构特征的aspA终止子则用于大肠杆菌天冬氨酸酶操纵子的转录终止(Takagi etal.,Nucleic Acid Res.,13:2063-2074(1985))。
质粒作为自主、自复制遗传元件,具有可使其本身成为携带克隆DNA的潜在载体的基本特质。天然存在的质粒通常缺乏高质量克隆载体所必需的若干重要特征。这些特征包括(1)小尺寸(将外源DNA有效地转移进入宿主所必需的),(2)可克隆插入DNA的独特限制性内切酶识别位点,和(3)识别携带有克隆载体-插入DNA构建体的受体细胞所用的一种或多种选择性遗传标记。因此,质粒克隆载体必须是经基因工程设计的(Glick,B.R.,Pasternak,J.J.,
Molecular Biotechnology Principles and Applications of Recombinant DNA,2nd ed.,American Society for Microbiology,Washington,DC(1998))。
pCL 1920/21载体是一对低拷贝数质粒,含有一个携带了lac启动子/操纵子的580bp长的BstUI片段、一个多克隆位点、被克隆进入pGB2中代替多接头区域的pUC19的lacZ片段,以及可赋予大肠杆菌以奇霉素和链霉素抗性的pSC101衍生质粒。pCL1920/21载体(每个细胞5个拷贝)与pUC载体(每个细胞200个拷贝)在质粒拷贝数上存在40倍的差异。这样,pCL1920/21载体被转化进菌株时,可调节被插入启动子-操纵子下游的基因的低水平表达。因此它对高拷贝数时可能有害的克隆基因而言是有用的。由于pCL1920/21载体可与ColEl衍生质粒相容,因而可利用二者与pBR 322或pUC衍生质粒一起形成稳定的共转化体(Lerner et al.,Nucleic Acids Res.,18:4631(1990))。
本发明的质粒可应用在多种宿主内以控制物质的生物产量。取代任意内源基因或操纵子的染色体定位天然启动子以改变转录水平
要求保护的启动子变体(包含SEQ ID NOs:31和32的构建体)可应用特定方法中,即取代任意内源基因或操纵子相关的染色体定位天然启动子以改变该基因或操纵子转录水平的方法。结果改变了蛋白质的生产水平。待取代的启动子可以是特定任意微生物中的任何基因,即对该微生物可操作Datsenko和Wanner[(2000)PNAS 97:6640-6645]的Liambda red方法或等效方法。
该方法中,包含一个选择标记的嵌合DNA分子是通过聚合酶链反应(PCR)合成的,该选择标记被可操作地连接在分散排列的非天然启动子上,而非天然启动子则被可操作地连接在靶基因的5’编码区中。该合成是采用下列物质实现的:(1)一对化学合成的引物,(a)第一个引物包含:(i)远离待取代的目标天然启动子的DNA区,(ii)一个非天然启动子,和(iii)来自选择标记的3’或5’末端的DNA区;以及(b)第二个引物包含:(i)最接近目标插入位点的DNA区,和(ii)与第一个引物所用选择标记的末端相对的末端来源的DNA区;和(2)编码选择标记的DNA模板。采用Datsenko和Wanner(同上)的方法将上述合成的DNA产物整合进任意宿主细胞的染色体目标位点。该操作的结果是目标天然启动子被PCR合成的携带了非天然启动子的嵌合分子所取代。
该方法的延伸可用于评估基因表达水平的改变对生物催化剂性能的影响。
大肠杆菌中从葡萄糖到1,3-丙二醇(3G)的生物合成
本发明的质粒可应用在大肠杆菌中,用于从葡萄糖生物合成1,3-丙二醇(3G)。此处的实例包括生产用生物体的构建,即整合了本发明和将可发酵碳底物转化为1,3-丙二醇所必需的遗传机制。
1,3-丙二醇的生成所涉及的基因包括脱水酶基因(典型的是甘油或二醇脱水酶)和氧化还原酶,以及其它被预期将用于脱水酶的装配或维持其稳定性的蛋白质。这些基因可能是被导入宿主细胞内的转基因,或者可能是内源基因。这些基因中的至少一种应为转基因并被导入生产用细胞中。利用本领域所熟知的技术可构建出含有编码了特定酶促途径的必需基因的重组生物体,该酶促途径可将碳底物转化为1,3-丙二醇。然后,转化的生产用细胞在合适条件下生长,从而生成1,3-丙二醇。
大肠杆菌中1,3-丙二醇的生成在以前的报导中已有描述(US5,633,362;US5,821,092;US5,686,276;US6,025,184;US6,013,494;US5,599,689;US6,136,576)。许多不同基因的表达均参与了重组大肠杆菌内从葡萄糖到1,3-丙二醇的生成。编码了甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaT)的基因从诸如克雷伯氏杆菌的天然宿主中被分离出来,被用于转化诸如大肠杆菌菌株DH5α或FM5、肺炎克氏杆菌菌株ATCC25955、产酸克氏杆菌菌株ATCC8724或M5al、酿酒酵母菌株YPH499、巴斯德毕赤酵母菌株GTS115和黑曲霉菌菌株FSl的宿主菌株。
在肺炎克氏杆菌、弗氏柠檬酸杆菌和巴氏固氮梭状芽孢杆菌中,编码了甘油脱水酶的三个结构亚基的基因(dhaB1-3或dhaB、C和E)被定位邻接于编码了特定1,3-丙二醇氧化还原酶的基因(dhaT)。尽管这些微生物在某些遗传组成上存在某些差异,但这些基因是成簇集中在一个还包括orfX和orfZ(编码了甘油脱水酶的脱水酶再活化因子的基因)以及orfY和orfW(未知功能的基因)的群体中。已知上述微生物均含有的特定1,3-丙二醇氧化还原酶(dhaT)属于III型醇脱氢酶家族;均表现为具有一个保守的铁结合基序,并倾向于1,3-丙二醇与3-HPA之间的NAD+/NADH连接的互变。不过,1,3-丙二醇与3-HPA之间的NAD+/NADH连接的互变也是由醇脱氢酶催化的,虽然该酶的动力学参数效力较低,其仍未特异地连接脱水酶上(例如,马肝脏和面包酵母醇脱氢酶(E.C.1.1.1.1))。甘油脱水酶(E.C.4.2.1.30)和二醇[1,2-丙二醇]脱水酶(E.C.4.2.1.28)是相关的,但不同酶由不同基因所编码。来源自产酸克氏杆菌和鼠伤寒沙门氏杆菌的二醇脱水酶基因与甘油脱水酶基因相似,均成簇集中在一个包含类似orfX和orfZ的基因的群体中(Daniel et al.,FEMS Microbiol.Rev.22:553(1999);Toraya和Mori,J.Biol.Chem.274:3372(1999);GenBank AF026270)。
从淀粉美链霉菌中克隆获得编码甘油-3-磷酸脱氢酶的基因(DAR1、GPD1),并对其进行测序(Wang et al.,J.Bact.176:7091-7095(1994))。将DAR1基因克隆进穿梭载体,用于转化表达可生成活性酶的大肠杆菌。Wang等人(同上)认为DAR1受细胞渗透性环境的调节,但未说明该基因有多大可能性被用于提高重组微生物内1,3-丙二醇的产量。
其它甘油-3-磷酸脱氢酶也已被分离获得。例如,从酿酒酵母中克隆获得sn-甘油-3-磷酸脱氢酶,并对其进行测序(Larason et al.,Mol.Microbiol.10:1101(1993))。Albertyn等人(Mol.Cell.Biol.14:4135(1994))描述了从酿酒酵母中克隆获得编码甘油-3-磷酸脱氢酶的GPD1的过程。与Wang等人(同上)一样,Albertyn等人和Larason等人均认同该基因的调节具有渗透敏感性,但未说明该基因有多大可能性被应用在重组微生物内1,3-丙二醇的生成中。
与G3PDH一样,甘油-3-磷酸酶也可从酿酒酵母被分离出来,且该蛋白质被确定是由GPP1和GPP2基因编码的(Norbeck et al.,J.Biol.Chem.271:13875(1996))。与编码G3PDH的基因相似,GPP2似乎也具有渗透敏感性。
实施例
在下述说明本发明优选实施方案的实施例中进一步具体描述了本说明。根据上述讨论和下述实施例,本领域的技术人员均可在不偏离本发明的精神和范畴的同时确定本发明的基本特征,并且可对其进行多种改动和改进以适应不同的应用和条件。
通用方法
实施例中所采用的标准重组DNA和分子克隆技术是本领域所熟知的,Sambrook,J.,Fritsch,E.F.和Maniatis,T.的MolecularCloning:A Laboratory Manual;Cold Spring Harbor LaboratoryPress:Cold Spring Harbor,(1989)(Maniatis)及T.J.Silhavy,M.L.Bennan,和L.W.Enquist,的Experiments with GeneFusions,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1984),以及Ausubel,F.M.et al.由Greene Publishing Assoc.and Wiley-Interscience出版的Current Protocols in MolecularBiology(187)中均对该技术有所描述。
细菌培养物的维持和生长所适用的材料和方法是本领域所熟知的。对适用于下述实施例的技术的阐述可见于
Manual of Methods for Genral Bacteriology(Phillipp Gerhardt,R.G.E.Murray,RalphN.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg和G.Briggs Phillips,eds),American Society for Microbiology,Washington,DC(1994))或
Biotechnology:A Textbook of Industrial Microbiology,第2版,Sinauer Associates,Inc.,Sunderland,MA(1989)中Thomas D.Brock的文章中。如无另外指出,细菌细胞的生长和维持所适用的所有试剂、限制酶和材料均获得自Aldrich Chemicals(Milwaukee,WI)、DIFCO Laboratories(Detroit,MI),GIBCO/BRL(Gaithersburg,MD),New EnglandBiolabs(Beverly,MA)或Sigma Chemical Company(St.Louis,MO)。
缩写含义如下:“h”指小时,“min”指分钟,“sec”指秒,“d”指天,“mL”指毫升,“L”指升,“mm”指毫米,“nm”指纳米,“mM”指毫摩尔,“M”指摩尔,“mmol”指毫摩尔,“μmole”指微摩尔,“g”指克,“μg”指微克。
实施例1
葡萄糖异构酶启动子变体的构建
浅青紫链霉菌葡萄糖异构酶(GI)启动子(SEQ ID NO:1)含有一个特征性的-10标记序列(AATAAT)和一个特征性的-35标记序列(-35T、-34T、-33G、-32A、-31C、-30A)。采用混合的碱基寡核苷酸,通过标准PCR饱和诱变pMP38中GI启动子的-35区(如下述实施例6所描述)。在6个独立的PCR反应中,一个上游引物(SEQ ID NO:2)与6个下游引物(SEQ ID NOs:3-8)中的任意一个配对,这6个下游引物均在-35区中的单一位置上含有了等量混合的全部四种可能碱基,被指定为N。上游引物也整合了两个单一的碱基对改变,即紧随EcoRI位点之后的SpeI限制位点(ACTAGT)改变为AvrII限制位点(CCTAGG)。采用EcoRI和HindIII消化6个PCR产物,并将其分别连接在EcoRI/HindIII消化的pMP38上。将连接产物转化进大肠杆菌,并通过从SpeI到AvrII的转化进行限制性分析,从而识别出重组体质粒,并对其核苷酸测序。预期是只有重组体质粒存在可能的-35区改变。在24种可能的重组体结果(4个碱基在6个位置中)中获得了18个重组体,其中13个在-35区中存在代表性改变(表1)。
表1.通过饱和诱变PCR获得的GI启动子变体
位置 | 碱基 | 名称 | 备注 | SEQ IDNO. |
-30A | A | P1.6 | -35区无变化 | 9 |
T | P1.5 | 10 | ||
G | P1.20 | 11 | ||
C | P1.10 | 12 | ||
-31C | C | P2.8 | -35区无变化 | 9 |
A | P2.39 | 13 | ||
-32A | A | P3.4 | -35区无变化-10与-HindIII位点之间存在25bp长的缺失 | 14 |
C | P3.5 | 15 | ||
-33G | G | P4.49 | -35区无变化 | 9 |
A | P4.15 | 16 | ||
C | P4.1 | 17 | ||
-34T | T | P5.10 | -35区无变化 | 9 |
C | P5.12 | 18 | ||
A | P5.17 | 19 | ||
G | P5.19 | 20 | ||
-35T | T | NA | -35区无变化 | 9 |
G | P6.5 | 21 | ||
A | P6.14 | 22 | ||
C | P6.20 | 23 |
*NA=不可应用
尽管在-35区中可能的18种改变中有5种改变未被分离,仍然可将其用于改变克隆或染色体上所编码的天然和非天然基因或操纵子的表达水平。这5种补充GI启动子变体的描述见表2。
表2.其它潜在GI启动子变体
位置 | 碱基 | SEQ ID NO. |
-31C | G | 24 |
T | 25 | |
-32A | G | 26 |
T | 27 | |
-33G | T | 28 |
实施例2
通过测定甘油脱水酶活性对葡萄糖异构酶启动子变体的分析
以甘油脱水酶(GDH;由dhaB1-3编码)活性被用作确定GI启动子突变的效果的报道分子(表3)。观察结果为,即使-35区中无改变,GDH活性仍然因两个碱基对的改变,即SpeI转化为AvrII而显著减弱(例如P1.6)。也确定了P3.4不具有-35突变,但在紧随-10区存在25个碱基对的缺失,并具有与野生型(86%)相差不大的启动子强度。
在无细胞提取物中,脱水酶活性是以甘油或1,2-丙二醇为底物确定的。无细胞提取物是通过下述步骤制备的,即采用弗氏压碎器破坏细胞,继而离心分离出细胞碎片。Forage和Foster描述了基于乙醛与甲基苯-2-噻唑酮腙反应的实验(Biochim.Biophys.Acta569:249(1979))。
表3.GI启动子变体中相对GDH活性的测定
质粒 | 相对GDH活性 |
pMP38 | 100 |
pMP38/1.6 | 13 |
pMP38/1.5 | 3 |
pMP38/1.20 | 1 |
pMP38/1.10 | 1 |
pMP38/2.39 | 0 |
pMP38/3.4 | 86 |
pMP38/3.5 | 1 |
pMP38/4.1 | 0 |
pMP38/4.15 | 0 |
pMP38/5.12 | 0 |
pMP38/5.17 | 0 |
pMP38/5.19 | 0 |
pMP38/6.5 | 0 |
pMP38/6.14 | 1 |
pMP38/6.20 | 2 |
实施例3
采用LUX实验对GI启动子变体的分析
两类报道分子被用于测定GI启动子变体带来的表达水平。细菌的生物发光是5种结构基因(luxA、luxB、luxC、luxD和luxE)的产物协同作用产生光的现象。luxD产物从前体生成C14脂肪酸。该C14脂肪酸在luxE产物的作用下,在ATP依赖反应中被活化到酰基酶偶联物,将细菌的生物发光结合到细胞的能量状态。酰基酶(luxE产物)充当了转移介质,将酰基基团转移给luxC产物。酰基-LuxC二元复合体继而在特定反应中被还原,该反应中的NADPH充当了电子对,质子供体则将酰基偶联物还原为C14醛。该反应将细胞的还原能力与细菌的光发射联系起来。该光生成反应经荧光素酶(luxA和luxB的产物)催化后产生了光。光发射所需的能量由从醛到脂肪酸的转化和FMNH2的氧化提供,从而使光的生成与细胞能量状态产生了另一种关联。
发光光杆状菌luxAB基因被用作GI启动子变体强度的报道分子(Van Dyk et al.,Appl. Environ. Microbiol.,180:785-792(1995))。将携带发光光杆状菌luxAB基因、3’和5’末端含有SpeI位点,且NcoI位点被工程设计在luxA的起始密码子上的PCR片段亚克隆进pMCS5(MobiTec,Gttingen,Germany)的SpeI位点,从而获得pJT13。接着,将具有SwaI/NcoI末端的、以基因SOEing PCR为基础的卡那霉素盒克隆进SwaI/NcoI消化的pJT13中,从而获得高拷贝luxAB启动子探针pJT14.HIGHCOPY。继而采用SpeI消化pJT14.HIGHCOPY,获得luxAB::卡那霉素盒,将其亚克隆进pRJ50(SEQID NO:79)中的独特NheI位点(与SpeI相容),从而获得低拷贝luxAB启动子探针pJT14.LOWCOPY.1。将GI启动子1.6、1.5、1.20和天然GI启动子作为NotI/NcoI片段克隆进pJT14.HIGHCOPY和pJT14.LOWCOPY中,分别获得高拷贝构建体pJT18、pJT19、pJT20和pJT25,以及低拷贝构建体pJT21.1、pJT22.1、pJT23.1和pJT26.1。继而将这些质粒转化进选择的大肠杆菌菌株中,测定体内生物发光。
如Van Dyk和Rosson所描述的,启动子强度是通过采用大肠杆菌报道菌株的肉汤培养物,以n-癸醛为醛底物,并利用发光计检测发光度而得以确定(Methods in Molecular Biology,Vol.102:Bioluminescence Methods and Protocols,85(1998))。将新鲜琼脂培养皿中的大肠杆菌菌落接种进含有标准Luria-Bertani液体生长培养基,并添加了适当抗菌素的试管中,于37℃需氧生长(震荡)大约16小时。继而将细胞传代培养进含有25毫升新鲜培养基的100毫升摇瓶中,于相同条件下生长大约8-10小时。接着从每一瓶培养物中取出等量培养物(200μL),置入96孔透明白色培养板中,分别测定600nm处的光学密度(SpectraMax 190PlaterReader,MolecularDevices Corporation,Sunnyvale,CA)并利用发光计测定发光度(Luminoscan Ascent TAype 392,LabSystems,Helsinki,Finland)。为获得发光计读数,将2μL外源醛(n-癸醛)添加进各孔内,再进行测定。测定结果如表4所列。这些发光度数值显示的启动子强度水平近似于甘油脱水酶实验所显示的启动子强度水平。
表4:生物发光测定
GI启动子 | 质粒构建体 | 相对生物发光 |
GI野生型 | pJT26.1 | 100% |
GI 1.6 | pJT21.1 | 12.9% |
GI 1.5 | pJT22.1 | 3.0% |
GI 1.20 | pJT23.1 | 1.3% |
实施例4
缩短的GI启动子序列在实现不同水平基因表达方面的应用
将实施例1-3中描述和应用的一个亚型的GI启动子序列用于改变RJ8n菌株中pSYCO109mcs质粒(如实施例8所描述,SEQ ID NO:30)来源的大肠杆菌yqhD(SEQ ID NO:29)的表达水平,其中RJ8n菌株中,染色体上的yqhD基因被破坏,从而获得菌株RJ8n(yqhD-)。
构建三种用于表达yqhD的表达盒。这些盒含有(i)一种缩短的GI启动子,即短1.5GI(SEQ ID NO:31)、短1.20GI(SEQ ID NO:32)或短野生型GI(SEQ ID NO:33);(ii)大肠杆菌KLP23(WO9928480)来源的yqhD;和(iii)苏氨酸终止子(Lynn et al.,J.Mol.Biol.,183:529-541(1985))。yqhD基因是通过PCR扩增从基因组KLP23 DNA分离获得的,该PCR扩增采用了含有一种缩短的GI启动子,也整合有RsrII限制位点,且短1.5GI(SEQ ID NO:34)、短1.20GI(SEQ IDNO:35)或短野生型GI(SEQ ID NO:36)的正向合成引物,和含有苏氨酸终止子,并包括SacI位点,且对应于yqhD(SEQ ID NO:37)的反向引物。采用RsrII/SacI消化质粒pSYCO109mcs,并将RsrII/SacI消化的PCR产物连接进该质粒中。通过电穿孔将连接混合物转化进RJ8n(yqhD-)菌株内,并比较各菌株中的酶活性水平(表5)。
yqhD表达的酶活性将还原醛3-羟基丙醛(3-HPA)和丁醛,还原速率近似于以NADPH为还原等价物源时的还原速率。由于3-HPA是非商业可提供的,通常采用的是丁醛。总体积为1毫升的实验混合物含有:200mM磷酸钾缓冲液(pH7.5)、10mM丁醛、0.2mM NADPH和大约0.01mg来自待检验无细胞提取物的蛋白质。添加蛋白质样品后,测定NADPH的最初氧化速率,继而测定340nm处吸光度的改变(Δε=6.22mM-1)。一个活性单位的定义是在35℃,存在10mM丁醛的条件下,一分钟内氧化1亳摩尔NADPH所需的酶量。下表5列出了多种菌株的活性,均与较长GI启动子变体可实现的表达水平一致。
表5.YqhD活性
菌株和构建体 | 活性(U/mg) | %活性 |
RJ8n(yqhD-) | 0.015 | 0.8 |
RJ8n(yqhD-)/pSYCO109mcs | 0.010 | 0.5 |
RJ8n(yqhD-)/pSYCO10gmcs-短1.20 GI yqhD | 0.14 | 7.3 |
RJ8n(yqhD-)/pSYCO109mcs-短1.5GI yqhD | 0.2g | 15 |
RJ8n(yqhD-)/pSYCO109mcs-短野生型GI yqhD | 1.92 | 100 |
为获得RJ8n(yqhD-),采用Wanner和Datsenko所描述的操作方法破坏大肠杆菌MG1655中的yqhD基因(PNAS,97(12):6640-6645(2000)),以进行Red介导的同源重组。制备正向PCR引物H1∷6574(SEQ ID NO:38)(含有与yqhD同源的42bp长的序列,和将P1结合到pKD13的引物结合位点),和反向PCR引物H2∷6706(SEQ ID NO:39)(含有47bp长的同源yqhD序列,和将P4结合到pKD13的引物结合位点)。以pKD13为模板进行PCR扩增,获得的PCR产物在每一末端均具有yqhD序列,其后接有FRT(FLP识别目标),其中FRT位点位于卡那霉素抗性(kanR)标记的侧翼。将PCR产物电转化进大肠杆菌MG1655细胞中,筛选出具有卡那霉素抗性的转化体。转化体中的正确插入是通过采用位于yqhD基因侧翼的引物yqhDUP(SEQ ID NO:82)和yqhDDN(SEQ ID NO:83)进行PCR证实的。含有Lambda Red系统的温度敏感的质粒是通过菌株于42℃的生长得以清除。
通过P1转导将yqhD∷kan破坏转移进RJ8n中,并采用与kanR基因内的引物配对的yqhDUP2(SEQ ID NO:40)和yqhDDN2(SEQ ID NO:41)引物(Vec 61;SEQ ID NO:42和Vec 60;SEQ ID NO:43)进行PCR验证。为移除卡那霉素标记,整合体是由温度敏感的复制子,pCP20转化的,该复制子含有对应于FLP重组酶的基因。FLP重组酶切除了位于FRT(FLP识别目标)位点侧翼的卡那霉素标记。继而使卡那霉素敏感细胞于42℃生长,以清除pCP20。获得的菌株为RJ8n(yqhD-)。
实施例5
GI启动子对大肠杆菌磷酸烯醇丙酮酸羧化酶染色体启动子的取代
实施例5描述了短野生型GI启动子(SEQ ID NO:33)对大肠杆菌基因组中天然ppc(编码磷酸烯醇丙酮酸羧化酶或PEP羧化酶)启动子的取代。
取代ppc启动子适用的寡核苷酸设计
设计两种寡核苷酸(ppcF,SEQ ID NO:44和ppcR,SEQ ID NO;45),使其可通过PCR扩增特定盒,该盒含有一个同源于天然ppc启动子上游区域的80bp长的序列、一个侧翼于面包酵母FRT位点的氯霉素抗性编码基因(cat)、短野生型GI启动子序列(SEQ ID NO:33)和一个同源于天然ppc启动子的+1转录起始位点下游区域的40bp长的序列。
ppcR引物(SEQ ID NO:45)有100个核苷酸长,包括:从P1(天然ppc启动子)转录起点的+1到ppc的ATG上游41bp的完整序列,从-35上游4bp到-10下游9bp的短野生型GI启动子序列(SEQ ID NO:33),和用于pKD3的引发位点(Wanner和Datsenko,同上),以及含有cat基因的R6K质粒,其中该cat基因侧翼于两个FRT位点。ppcF引物(SEQ ID NO:44)有100个核苷酸长,包括天然ppc启动子上游80bp长的序列和对应于pKD3的引发位点。
采用引物ppcF和ppcR(SEQ ID NOs:44和45),并以质粒pKD3为模板,扩增启动子取代盒。1.15-kb长的PCR产物是通过琼脂糖凝胶电泳,继而利用QIAquick凝胶提取试剂盒(Qiagen,Inc.,Valencia,CA)得以纯化。
采用线性DNA进行同源重组将天然ppc启动子取代进入大肠杆菌基因
组
采用0.5μg上述的1.15-kb线性DNA电转化感受态大肠杆菌MG1655细胞,该细胞含有pKD46(Datsenko和Wanner,同上),该质粒是在阿拉伯糖启动子控制下表达γ、β和exo的Red-重组酶质粒,接着对获得的转化体进行筛选,获得具有氯霉素抗性的转化体(15μg/mL)。采用引物ppcF和seqppcR(SEQ ID NO:46)进行PCR,检验重组体菌株。非特异性整合的盒未生成PCR产物,正确的重组体则生成了1.25-kb长的PCR产物。短野生型GI启动子的序列是通过采用seqppcR引物(SEQ ID NO:46)对1.25-kb长的PCR产物进行测序而得以证实的。
酶活性的测定
采用下述实验方法,以超离心获得的无细胞提取物为对象,测定MG1655和MG1655(短野生型GI-ppc)中的PEP羧化酶活性,结果如表6所示。PPC在短野生型GI启动子的控制下表现的活性是在天然启动子控制下所表现活性的3倍多。
在含有:0.11M Tris缓冲液(pH8.5)、NADH(0.22mM)、硫酸镁(11.1mM)、碳酸氢钠(11.1mM)、酰基-CoA(0.25mM)、MalateDH(Sigma)、50μL的6U细胞提取物和0.03磷酸烯醇丙酮酸(1.11mM)的混合物中测定340nm处的减量(由于NADH的消耗)。采用下列公式确定活性:
表6.
天然和GI1.6启动子来源的PPC活性
菌株 | 活性(U/mg) |
MG1655 | 0.05 |
MG1655(1.6GI ppc) | 0.164 |
实施例6
采用肺炎克氏杆菌dha调节子来源的基因转化大肠杆菌所用表达质粒
的构建
表达载体pTac1Q的构建:
通过将lac1Q基因(Farabaugh,Nature,274(5673):765-769(1978))和tac启动子(Amann et al.,Gene 25:167-178(1983))插入pBR322的EcoRI位点,制备出大肠杆菌表达载体pTac1Q(Sutcliffe,Cold Spring Harb.Symp.Quant.Biol.43:77-90(1979))。多克隆位点和终止子序列(SEQ ID NO:47)取代了从EcoRI到SphI的pBR322序列。
甘油脱水酶基因(dhaB1,2,3,X)的亚克隆:
通过采用5’末端整合有EcoRI位点,3’末端整合有XbaI位点的引物(SEQ ID NOs:49-50)进行PCR,从pHK28-26(SEQ ID NO:48)扩增了dhaB3基因的开放读码框架。将产物亚克隆进pLitmus29(NewEngland Biolabs),获得含有dhaB3的质粒pDHAB3。
采用限制酶KpnI和EcoRI,将特定区域(含有pHK28-26来源dhaB操纵子的dhaB1、dhaB2、dhaB3和dhaBX的完整编码区域)克隆进pBluescriptIIKS+(Stratagene,La Jolla,CA),获得质粒pM7。
通过采用ApaI和XbaI消化质粒pM7,以移除dhaBX基因,纯化5.9-kb长的片段,并将其与质粒pDHAB3来源325-bp长的ApaI-XbaI片段连接,获得pM11(含有dhaB1、dhaB2和dhaB3)。
通过采用5’末端整合有HindIII位点和一个共有核糖体结合位点(RBS),3’末端整合有XbaI位点的引物(SEQ ID NOs:51-52)进行PCR,从pHK28-26扩增dhaB1基因的开放读码框架。将产物亚克隆进pLitmus28(New England Biolabs),获得含有dhaB1的质粒pDT1。
将pM11来源的NotI-XbaI片段(含部分dhaB1基因、dhaB2基因和dhaB 3基因)插入pDT1,获得dhaB表达质粒,pDT2。将HindIII-XbaI片段(含pDT2来源的dhaB(1,2,3)基因)插入pTaclQ,获得pDT3。
1,3-丙二醇脱氢酶基因(dhaT)的亚克隆:
将pHK28-26的KpnI-SacI片段(含1,3-丙二醇脱氢酶(dhaT)基因)亚克隆进pBluescriptII KS+中,获得质粒pAH1。通过以pAH1为模板DNA,并采用5’末端整合有XbaI位点,3’末端整合有BamHI位点的合成引物(SEQ ID NOs:53-54)进行PCR,扩增dhaT基因。将产物亚克隆进pCR-Script(Stratagene)的SrfI位点,获得含有dhaT的质粒pAH4和pAH5。质粒pAH4所含的dhaT基因的表达方向是从pCR-Script中的lac启动子开始的正确表达方向,而质粒pAH5所含的dhaT基因的表达方向则与pAH4所含dhaT基因的表达方向相反。将pAH4来源的XbaI-BamHI片段(含dhaT基因)插入pTac1Q,获得质粒pAH8。将pAH8来源的HindII-BamHI片段(含有RBS和dhaT基因)插入pBluescriptIIKS+,获得pAH11。
用于表达dhaT和dhaB(1,2,3)的表达盒的构建:
利用标准分子生物学方法从上述单个dhaB(1,2,3)和dhaT亚克隆组装用于表达dhaT和dhaB(1,2,3)的表达盒。将SpeI-SacI片段(含pDT3来源的dhaB(1,2,3)基因)插入pAH11的SpeI-SacI位点,获得pAH24。将构建自SEQ ID NOs:55-56的SalI-XbaI接头插入经由限制酶SalI-XbaI消化的pAH5中,获得pDT16。该接头破坏了XbaI位点。继而将pDT16来源1-kb长的SalI-MluI片段插入pAH24中,取代其已存在的SalI-MluI片段,获得pDT18。pDT21是通过将pDT18来源的SalI-NotI片段和pM7来源的NotI-XbaI片段插入pCL1920(GenBank AX085428)中而构建的。通过PCR克隆浅青紫链霉菌来源的葡萄糖异构酶启动子序列(SEQ ID NO:1),将其插入pLitmus28的EcoRI-HindIII位点,获得pDT5。PCL1925是通过将pDT5的EcoRI-PvuII片段(含GI启动子)插入pCL1920(GenBank AX085428)的EcoRI-PvuII位点而获得的。
在链霉菌葡萄糖异构酶启动子控制下表达甘油脱水酶所用的表达载体
的构建:
从pDT24中缺失掉HindIII限制片段(含dhaT),获得pRN105。pDT24质粒是通过将pDT21的HindIII-MluI片段和pDT21的MluI-XbaI片段克隆进pCL1925的HindIII-XbaI位点而构建的。由pRN105模板获得PCR产物(包含dhaX的3’区,即从独特HpaI限制位点到dhaX末端,且5’末端整合有HpaI限制位点,3’末端整合有XbaI限制位点),将其用于取代pRN105中已存在的HpaI/XbaI限制片段,获得pMP37。由pDT29模板获得PCR产物(包含dhaB1的5’区,即从恰好位于起始密码子上游的独特HindIII限制位点到dhaB1内的独特NotI限制位点,且5’末端整合有HindIII限制位点,3’末端整合有NotI限制位点),将其用于取代pRN105中的小HindIII/NotI限制片段,获得pRJ25。PDT29是通过将pHK28-26的SacI-EcoRI片段插入pCL1925的SacI-EcoRI位点而构建的。将小HpaI/XbaI限制片段(含pMP37来源dhaX的5’区)连接至pRJ25来源的大XbaI/HpaI限制片段,获得pMP38,其中浅青紫链霉菌葡萄糖异构酶启动子(SEQ ID NO:1)利用天然核糖体结合位点驱动了肺炎克氏杆菌dhaB1-3,X操纵子的表达。
实施例7
生成1,3-丙二醇所用SYCO质粒的构建
为了在大肠杆菌宿主内从葡萄糖生成1,3-丙二醇,可表达不同来源的若干操纵子。这些操纵子包括负责甘油-3-磷酸脱氢酶、甘油-3-磷酸磷酸酶和甘油脱水酶活性的基因编码。这些基因可能来自诸如肺炎克氏杆菌来源的dha操纵子(含dhaR、dhaT、dhaX和dhaB1-3)和也来自肺炎克氏杆菌的orf操纵子(含orfYXW),以及含酵母菌来源DAR1和GPP2的操纵子。为了在发酵过程中保持菌株稳定性,优选地是在大肠杆菌宿主内保留尽可能少的质粒。为达到该目的,构建了一系列质粒,使其能够在单个质粒上克隆至少三个不同操纵子。为防止RNA聚合酶的连读,采用三种转录终止子位于独特克隆位点侧翼。这些转录终止子包括tonB终止子、thr弱化子和aspA终止子。tonB终止于是位于大肠杆菌tonB基因和相对基因之间的不依赖rho的双向终止子(Postle,K.和Good,R.F.,Cell,41:577-585(1985))。thr弱化子用于大肠杆菌苏氨酸操纵子的转录终止(Lynn et al.,J.Mol.Biol.,183:529-541(1985))。aspA终止子则用于大肠杆菌天冬氨酸酶操纵子的转录终止(Takagi et al.,Nucleic Acid Research.13(6):2063-2072(1985))。
包含三个两侧具有独特克隆位点的转录终止子的pRJ50的构建:
采用PCR介导的重叠延伸组装合成DNA片段(包含tonB、thr和aspA转录终止子(SEQ ID NO:57)和若干限制位点)(Horton et al.,Bio Techniques,8:528-535,(1990))。将两个有100个碱基的寡核苷酸(SEQ ID NOs:58-59)退火,生成一个有175个碱基的DNA片段(SEQ ID NO:60),其中上述两个寡核苷酸在3’末端25个碱基对长的跨距上彼此互补。采用两个另外的寡核苷酸引物(SEQ ID NOs:61-62)进一步扩增上述175-碱基片段,其两侧为EcoRI和KpnI限制位点。采用EcoRI和KpnI消化该175-碱基对的PCR产物,将其亚克隆进EcoRI/KpnI消化的质粒pCL1925中,获得pRJ50(SEQ ID NO:79)。
表达dhaR、orfY、orfX、orfW和dhaB(1,2,3,X)所用表达盒的构建:
构建质粒pDT29的衍生物,其中利用了被称为PCR介导的重叠延伸的技术,将基因dhaT中除了最初5个和最后5个密码子(外加终止密码子)外的全部密码子缺失。以pDT29为模板,采用下列引物生成两个初级PCR产物:
SEQ ID NO:63=5′GAC GCA ACA GTA TTC CGT CGC3′;
SEQ ID NO:64=5′ATG AGC TAT CGT ATG TTC CGC CAG GCA TTC
TGA GTG TTA ACG3′;
SEQ ID NO:65=5′GCC TGG CGG AAC ATA CGA TAG CTC ATA ATA
TAC3′;
SEQ ID NO:66=5′CGG GGC GCT GGG CCA GTA CTG3′.
SEQ ID NO:65与SEQ ID NO:66配对生成一个931bp长的产物,其包含的核酸包括5’dhaB1(到独特ScaI位点)、所有的orfY,和dhaT的最初5个密码子。SEQ ID NO:63与SEQ ID NO:64配对生成一个1348bp长的产物,其包含的核酸包括dhaT的最后5个密码子(外加终止密码子)、所有orfX、所有orfW和5’dhaR(到独特SapI位点)。SEQ ID NO:64的5’末端上的15个碱基构成一个尾部,即SEQ ID NO:65的15-碱基部分的反向互补体。类似的,SEQ ID NO:65的5’末端上的11个碱基构成一个尾部,即SEQ ID NO:64的11-碱基部分的反向互补体。因此,通过PCR退火(经过26-bp长的尾部重叠)和延伸后,将两个初级PCR产物连接在一起,生成了2253bp长的第三个核酸产物。采用SapI和SacI消化该第三个PCR产物,将其连接进也由SapI和SacI消化过的pDT29中,获得质粒pKP32,该质粒除了dhaT内有大的符合读框的缺失以外,其它均与pDT29一致。
表达orfWXY和dhaB1-3并含有不同GI启动子变体的质粒的构建:
PCR扩增pKP 32来源的orf操纵子(SEQ ID NOs:80-81),其5’末端含HindIII,3’末端含AvrII,并将其亚克隆进pLitmus28(NewEngland Biolabs)中的HindIII和AvrII之间,获得pKP 38。将EcoRI/HindIII限制片段(含pMP38/1.6来源的GI突变启动子P1.6(SEQ ID NO:9))亚克隆进pKP 38中的EcoRI和HindIII之间,获得pKP39。将AyrII/XbaI限制片段(含pMP38/1.6来源的dhaB表达盒)亚克隆进pLitmus28(New England Biolabs)中的AvrII和XbaI之间,获得pMP39。将AvrII/XbaI限制片段(含pMP39来源的dhaB表达盒)亚克隆进pRJ50的AvrII位点,获得pSYCO11。将AvrII限制片段(含pKP39来源的orf表达盒)亚克隆进pSYCO11的NheI位点,获得pSYCO12。质粒pSYCO11和pSYCO12相比,除了pSYCO11不含orf操纵子以外,其它均一致。
将EcoRI/HindIII限制片段(含pMP38/1.5来源的GI突变启动子P1.5(SEQ ID NO:10))亚克隆进pKP38中的EcoRI和HindIII之间,获得pKP40。将AvrII限制片段(含pKP40来源,由P1.5驱动的orf操纵子)亚克隆进pSYCO11的NheI位点,获得pSYCO13。将pMP38/1.5来源相应的AvrII/NotI限制片段取代AvrII/NotI限制片段(含P1.6和pSYCO13中dhaB1的5’末端),获得pSYCO19。
具有三个由转录终止子分隔开的操纵子的pSYCO101、pSYCO103、
pSYCO106和pSYCO109载体的构建
将双链核酸接头(SEQ ID NO:67)亚克隆进pCL1920(GenBankAX085428)中的XbaI和SmlI限制位点之间,获得pCR-pCL1920。PCR扩增pAH48中的甘油途径表达盒(SEQ ID NO:68-69),该盒包含pTrc99A(Amersham Pharmacia Biotech,Piscataway,NJ)来源的trc启动子、酿酒酵母的DAR1和GPP2的编码序列,和终止子rrnBT1T2(来源自pTrc99A),并将其亚克隆进pCR-pCL1920的SrfI限制位点,获得pAH105(SEQ ID NO:70)。
将PvuII(2)/PvuII(4)限制片段(含pAH105来源的DAR1/GPP2表达盒)亚克隆进pSYCO12的Bst11071位点,获得pSYCO101(SEQ ID NO:71)。DAR1/GPP2操纵子的方向与orf操纵子和dhaB操纵子的方向相反。将NheI限制片段(含pAH105来源的DAR1/GPP2表达盒)亚克隆进pSYCO19的XbaI位点,获得pSYCO103(SEQ ID NO:72)。
质粒pSYCO103包含(a)一组两个获得自酿酒酵母的外源基因(DAR1(编码甘油-3-磷酸脱氢酶的基因)和GPP2(编码甘油-3-磷酸酶的基因));(b)一组三个获得自肺炎克氏杆菌的外源基因(dhaB1(编码甘油脱水酶的“α”亚基的基因)、dhaB2(编码甘油脱水酶的“β”亚基的基因)和dhaB3(编码甘油脱水酶的“γ”亚基的基因));和(c)一组两个获得自肺炎克氏杆菌的外源基因(dhaBX(编码脱水酶再活化因子的“α”亚基的基因)和orfX(编码脱水酶再活化因子的“β”亚基的基因))。在pSYCO103中,DAR1/GPP2操纵子的方向与orf操纵子和dhaB操纵子的方向相同。
将NheI限制片段(含pAH105来源的DAR1/GPP2表达盒)亚克隆进pSYCO12的XbaI位点,获得pSYCO106(SEQ IN NO:73)。DAR1/GPP2操纵子的方向与orf操纵子和dhaB操纵子的方向相同。将pSYCO106中的PmlI/NotI限制片段移除,取代以pSYCO106来源的重叠StuI/NotI限制片段,导致orfW的3’末端附近缺失141个碱基对,获得pSYCO109(SEQ ID NO:74)。
实施例8
具有10个用于克隆的稀有限制酶位点的新型核苷酸序列
设计新型核苷酸序列,编码10个用于克隆其它基因、操纵子或盒的稀有限制性内切酶位点,这些位点还用作将盒从某一质粒转移至另一质粒的位点。质粒pSYCO106ΔS是通过下述步骤构建的,即采用SpeI限制pSYCO106,将Klenow填充在末端,进行再连接。采用EcoRI消化pSYCO106ΔS,分离该载体主链,继而通过连接再次环化,形成pSpREPds。60℃退火寡核苷酸(SEQ ID NOs:75-76),并采用KpnI/StuI消化。多克隆片段(SEQ ID NO:77)含有下列酶的识别位点:NheI、RsrII、SacI、AgeI、SnaBI、AscI、PacI、NsiI、MluI和SapI。凝胶纯化该片段,将其克隆进pSpREPds,形成pSpREPmcs。采用EcoRI线性化pSpREPmcs,并将EcoRI片段(含pSYCO106ΔS和pSYCO109来源的途径基因)与pSpREPmcs连接,分别形成pSYCO106mcs(SEQ IDNO:78)和pSYCO109mcs(SEQ ID NO:30)。
实施例9
利用大肠杆菌菌株RJ8n/pSYCO101生成1,3-丙二醇
采用质粒pSYCO101(SEQ ID NO:71)转化电感受态大肠杆菌RJ8n细胞,获得大肠杆菌菌株RJ8n/pSYCO101。
在含有50mg/L奇霉素的2YT培养基(10g/L酵母提取物、16g/L蛋白胨和10g/L NaCl)中预培养接种发酵罐所需的RJ8n/pSYCO101。培养开始于将冷冻保存菌株(10%甘油作为冷冻保护剂)接种于2L锥瓶中的500mL培养基内,在摇床中250rpm,35℃条件下生长,直至OD550达到大约1.0,将其用于接种发酵罐。
下列组分是在发酵罐内同时灭菌:45g KH2PO4、12g柠檬酸一水化物、12g MgSO4·7H2O、30g酵母提取物、1.8g柠檬酸铁铵、5mL Mazu DF204作为消泡剂、1.2g CaCl2·2H2O、7.2mL硫酸和60mL微量元素溶液。灭菌后,采用20-28%NH4OH将pH提高至6.8,并添加下列组分:0.30g奇霉素和葡萄糖(获得自67%(重量百分比)的补料)。微量元素溶液含有(g/L):柠檬酸·H2O(4.0)、MnSO4·H2O(3.0)、NaCl(1.0)、FeSO4·7H2O(0.10)、CoCl2·6H2O(0.10)、ZnSO4·7H2O(0.10)、CuSO4·5H2O(0.010)、H3BO3(0.010)和Na2MoO4·2H2O(0.010)。接种后,体积为6.0L,葡萄糖浓度为10g/L。
采用上述培养基准备15升搅拌发酵罐。温度控制在34℃,并采用氨水(20-28重量百分比(w/w))控制pH为6.8。溶氧(DO)控制设定为10%,并将反压控制在0.5bar。除了较小的偏移外,通过67%(wt)补料将葡萄糖维持在10g/L与25g/L之间。发酵的第10小时添加10毫克维他命B12,并于1小时后开始协同补料(0.0167mg/mL溶液以2.64mg/h的流速补料)。64小时后获得滴定浓度为99g/L的1,3-丙二醇。
序列表
<110>纳幕尔杜邦公司
<120>用于遗传工程的启动子和质粒系统
<130>CL1998 PCT
<150>60/374931
<151>2002-04-22
<160>83
<170>Microsoft Office 97
<210>1
<211>199
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>1
gaattcacta gtcgatctgt gctgtttgcc acggtatgca gcaccagcgc gagattatgg 60
gctcgcacgc tcgactgtcg gacgggggca ctggaacgag aagtcaggcg agccgtcacg 120
cccttgacaa tgccacatcc tgagcaaata attcaaccac taaacaaatc aaccgcgttt 180
cccggaggta accaagctt 199
<210>2
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>2
cgggaattcc ctaggcgatc tgtgctgttt gccacg 36
<210>3
<211>84
<212>DNA
<213>人工序列
<220>
<223>引物
<220>
<221>misc_特征
<222>(74)..(74)
<223>N=A,T,C,或G
<400>3
cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60
caggatgtgg catngtcaag ggcg 84
<210>4
<211>84
<212>DNA
<213>人工序列
<220>
<223>引物
<220>
<221>misc_特征
<222>(75)..(75)
<223>N=A,T, C,或G
<400>4
cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60
caggatgtgg cattntcaag ggcg 84
<210>5
<211>84
<212>DNA
<213>人工序列
<220>
<223>引物
<220>
<221>misc_特征
<222>(76)..(76)
<223>N=A,T,C,或G
<400>5
cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60
caggatgtgg cattgncaag ggcg 84
<210>6
<211>84
<212>DNA
<213>人工序列
<220>
<223>引物
<220>
<221>misc_特征
<222>(77)..(77)
<223>N=A,T,C,或G
<400>6
cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60
caggatgtgg cattgtnaag ggcg 84
<210>7
<211>84
<212>DNA
<213>人工序列
<220>
<223>引物
<220>
<221>misc_特征
<222>(78)..(78)
<223>N=A,T,C,或G
<400>7
cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60
caggatgtgg cattgtcnag ggcg 84
<210>8
<211>84
<212>DNA
<213>人工序列
<220>
<223>引物
<220>
<221>misc_特征
<222>(79)..(79)
<223>N=A,T,C,或G
<400>8
cttaagcttg gttacctccg ggaaacgcgg ttgatttgtt tagtggttga attatttgct 60
caggatgtgg cattgtcang ggcg 84
<210>9
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>9
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120
acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>10
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>10
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120
actatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>11
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>11
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120
acgatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>12
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>12
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120
accatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>13
<211>186
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>13
ctaggcgatc tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca 60
cgctcgactg tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga 120
aaatgccaca tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag 180
gtaacc 186
<210>14
<211>162
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>14
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120
acaatgccac atcctgagca aataattttc ccggaggtaa cc 162
<210>15
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>15
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120
ccaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>16
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>16
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgccctta 120
acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>17
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>17
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttc 120
acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>18
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>18
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgccctcg 120
acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>19
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>19
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgccctag 120
acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>20
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>20
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgccctgg 120
acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>21
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>21
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccgtg 120
acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>22
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>22
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccatg 120
acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>23
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>23
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccctg 120
acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>24
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>24
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120
agaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>25
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>25
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120
ataatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>26
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>26
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120
gcaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>27
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>27
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttg 120
tcaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>28
<211>187
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>28
cctaggcgat ctgtgctgtt tgccacggta tgcagcacca gcgcgagatt atgggctcgc 60
acgctcgact gtcggacggg ggcactggaa cgagaagtca ggcgagccgt cacgcccttt 120
acaatgccac atcctgagca aataattcaa ccactaaaca aatcaaccgc gtttcccgga 180
ggtaacc 187
<210>29
<211>1164
<212>DNA
<213>Escherichia ccli K-12
<400>29
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210>30
<211>13470
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>30
ccttaagtga gtcgtattac ggactggccg tcgttttaca acgtcgtgac tgggaaaacc 60
ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata 120
gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatggc 180
gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca 240
ctctcagtac aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac 300
ccgctgacga gcttagtaaa gccctcgcta gattttaatg cggatgttgc gattacttcg 360
ccaactattg cgataacaag aaaaagccag cctttcatga tatatctccc aatttgtgta 420
gggcttatta tgcacgctta aaaataataa aagcagactt gacctgatag tttggctgtg 480
agcaattatg tgcttagtgc atctaacgct tgagttaagc cgcgccgcga agcggcgtcg 540
gcttgaacga attgttagac attatttgcc gactaccttg gtgatctcgc ctttcacgta 600
gtggacaaat tcttccaact gatctgcgcg cgaggccaag cgatcttctt cttgtccaag 660
ataagcctgt ctagcttcaa gtatgacggg ctgatactgg gccggcaggc gctccattgc 720
ccagtcggca gcgacatcct tcggcgcgat tttgccggtt actgcgctgt accaaatgcg 780
ggacaacgta agcactacat ttcgctcatc gccagcccag tcgggcggcg agttccatag 840
cgttaaggtt tcatttagcg cctcaaatag atcctgttca ggaaccggat caaagagttc 900
ctccgccgct ggacctacca aggcaacgct atgttctctt gcttttgtca gcaagatagc 960
cagatcaatg tcgatcgtgg ctggctcgaa gatacctgca agaatgtcat tgcgctgcca 1020
ttctccaaat tgcagttcgc gcttagctgg ataacgccac ggaatgatgt cgtcgtgcac 1080
aacaatggtg acttctacag cgcggagaat ctcgctctct ccaggggaag ccgaagtttc 1140
caaaaggtcg ttgatcaaag ctcgccgcgt tgtttcatca agccttacgg tcaccgtaac 1200
cagcaaatca atatcactgt gtggcttcag gccgccatcc actgcggagc cgtacaaatg 1260
tacggccagc aacgtcggtt cgagatggcg ctcgatgacg ccaactacct ctgatagttg 1320
agtcgatact tcggcgatca ccgcttccct catgatgttt aactttgttt tagggcgact 1380
gccctgctgc gtaacatcgt tgctgctcca taacatcaaa catcgaccca cggcgtaacg 1440
cgcttgctgc ttggatgccc gaggcataga ctgtacccca aaaaaacagt cataacaagc 1500
catgaaaacc gccactgcgc cgttaccacc gctgcgttcg gtcaaggttc tggaccagtt 1560
gcgtgagcgc atacgctact tgcattacag cttacgaacc gaacaggctt atgtccactg 1620
ggttcgtgcc ttcatccgtt tccacggtgt gcgtcacccg gcaaccttgg gcagcagcga 1680
agtcgaggca tttctgtcct ggctggcgaa cgagcgcaag gtttcggtct ccacgcatcg 1740
tcaggcattg gcggccttgc tgttcttcta cggcaaggtg ctgtgcacgg atctgccctg 1800
gcttcaggag atcggaagac ctcggccgtc gcggcgcttg ccggtggtgc tgaccccgga 1860
tgaagtggtt cgcatcctcg gttttctgga aggcgagcat cgtttgttcg cccagcttct 1920
gtatggaacg ggcatgcgga tcagtgaggg tttgcaactg cgggtcaagg atctggattt 1980
cgatcacggc acgatcatcg tgcgggaggg caagggctcc aaggatcggg ccttgatgtt 2040
acccgagagc ttggcaccca gcctgcgcga gcaggggaat taattcccac gggttttgct 2100
gcccgcaaac gggctgttct ggtgttgcta gtttgttatc agaatcgcag atccggcttc 2160
agccggtttg ccggctgaaa gcgctatttc ttccagaatt gccatgattt tttccccacg 2220
ggaggcgtca ctggctcccg tgttgtcggc agctttgatt cgataagcag catcgcctgt 2280
ttcaggctgt ctatgtgtga ctgttgagct gtaacaagtt gtctcaggtg ttcaatttca 2340
tgttctagtt gctttgtttt actggtttca cctgttctat taggtgttac atgctgttca 2400
tctgttacat tgtcgatctg ttcatggtga acagctttga atgcaccaaa aactcgtaaa 2460
agctctgatg tatctatctt ttttacaccg ttttcatctg tgcatatgga cagttttccc 2520
tttgatatgt aacggtgaac agttgttcta cttttgtttg ttagtcttga tgcttcactg 2580
atagatacaa gagccataag aacctcagat ccttccgtat ttagccagta tgttctctag 2640
tgtggttcgt tgtttttgcg tgagccatga gaacgaacca ttgagatcat acttactttg 2700
catgtcactc aaaaattttg cctcaaaact ggtgagctga atttttgcag ttaaagcatc 2760
gtgtagtgtt tttcttagtc cgttatgtag gtaggaatct gatgtaatgg ttgttggtat 2820
tttgtcacca ttcattttta tctggttgtt ctcaagttcg gttacgagat ccatttgtct 2880
atctagttca acttggaaaa tcaacgtatc agtcgggcgg cctcgcttat caaccaccaa 2940
tttcatattg ctgtaagtgt ttaaatcttt acttattggt ttcaaaaccc attggttaag 3000
ccttttaaac tcatggtagt tattttcaag cattaacatg aacttaaatt catcaaggct 3060
aatctctata tttgccttgt gagttttctt ttgtgttagt tcttttaata accactcata 3120
aatcctcata gagtatttgt tttcaaaaga cttaacatgt tccagattat attttatgaa 3180
tttttttaac tggaaaagat aaggcaatat ctcttcacta aaaactaatt ctaatttttc 3240
gcttgagaac ttggcatagt ttgtccactg gaaaatctca aagcctttaa ccaaaggatt 3300
cctgatttcc acagttctcg tcatcagctc tctggttgct ttagctaata caccataagc 3360
attttcccta ctgatgttca tcatctgagc gtattggtta taagtgaacg ataccgtccg 3420
ttctttcctt gtagggtttt caatcgtggg gttgagtagt gccacacagc ataaaattag 3480
cttggtttca tgctccgtta agtcatagcg actaatcgct agttcatttg ctttgaaaac 3540
aactaattca gacatacatc tcaattggtc taggtgattt taatcactat accaattgag 3600
atgggctagt caatgataat tactagctag tccttttcct ttgagttgtg ggtatctgta 3660
aattctgcta gacctttgct ggaaaacttg taaattctgc tagaccctct gtaaattccg 3720
ctagaccttt gtgtgttttt tttgtttata ttcaagtggt tataatttat agaataaaga 3780
aagaataaaa aaagataaaa agaatagatc ccagccctgt gtataactca ctactttagt 3840
cagttccgca gtattacaaa aggatgtcgc aaacgctgtt tgctcctcta caaaacagac 3900
cttaaaaccc taaaggctta agtagcaccc tcgcaagctc gggcaaatcg ctgaatattc 3960
cttttgtctc cgaccatcag gcacctgagt cgctgtcttt ttcgtgacat tcagttcgct 4020
gcgctcacgg ctctggcagt gaatgggggt aaatggcact acaggcgcct tttatggatt 4080
catgcaagga aactacccat aatacaagaa aagcccgtca cgggcttctc agggcgtttt 4140
atggcgggtc tgctatgtgg tgctatctga ctttttgctg ttcagcagtt cctgccctct 4200
gattttccag tctgaccact tcggattatc ccgtgacagg tcattcagac tggctaatgc 4260
acccagtaag gcagcggtat catcaacagg cttacccgtc ttactgtcgg gaattcattt 4320
aaatagtcaa aagcctccga ccggaggctt ttgactgcta ggcgatctgt gctgtttgcc 4380
acggtatgca gcaccagcgc gagattatgg gctcgcacgc tcgactgtcg gacgggggca 4440
ctggaacgag aagtcaggcg agccgtcacg cccttgacaa tgccacatcc tgagcaaata 4500
attcaaccac taaacaaatc aaccgcgttt cccggaggta accaagcttg cgggagagaa 4560
tgatgaacaa gagccaacaa gttcagacaa tcaccctggc cgccgcccag caaatggcgg 4620
cggcggtgga aaaaaaagcc actgagatca acgtggcggt ggtgttttcc gtagttgacc 4680
gcggaggcaa cacgctgctt atccagcgga tggacgaggc cttcgtctcc agctgcgata 4740
tttccctgaa taaagcctgg agcgcctgca gcctgaagca aggtacccat gaaattacgt 4800
cagcggtcca gccaggacaa tctctgtacg gtctgcagct aaccaaccaa cagcgaatta 4860
ttatttttgg cggcggcctg ccagttattt ttaatgagca ggtaattggc gccgtcggcg 4920
ttagcggcgg tacggtcgag caggatcaat tattagccca gtgcgccctg gattgttttt 4980
ccgcattata acctgaagcg agaaggtata ttatgagcta tcgtatgttc cgccaggcat 5040
tctgagtgtt aacgagggga ccgtcatgtc gctttcaccg ccaggcgtac gcctgtttta 5100
cgatccgcgc gggcaccatg ccggcgccat caatgagctg tgctgggggc tggaggagca 5160
gggggtcccc tgccagacca taacctatga cggaggcggt gacgccgctg cgctgggcgc 5220
cctggcggcc agaagctcgc ccctgcgggt gggtatcggg ctcagcgcgt ccggcgagat 5280
agccctcact catgcccagc tgccggcgga cgcgccgctg gctaccggac acgtcaccga 5340
tagcgacgat caactgcgta cgctcggcgc caacgccggg cagctggtta aagtcctgcc 5400
gttaagtgag agaaactgaa tgtatcgtat ctatacccgc accggggata aaggcaccac 5460
cgccctgtac ggcggcagcc gcatcgagaa agaccatatt cgcgtcgagg cctacggcac 5520
cgtcgatgaa ctgatatccc agctgggcgt ctgctacgcc acgacccgcg acgccgggct 5580
gcgggaaagc ctgcaccata ttcagcagac gctgttcgtg ctgggggctg aactggccag 5640
cgatgcgcgg ggcctgaccc gcctgagcca gacgatcggc gaagaggaga tcaccgccct 5700
ggagcggctt atcgaccgca atatggccga gagcggcccg ttaaaacagt tcgtgatccc 5760
ggggaggaat ctcgcctctg cccagctgca ccctgatgct tgcgcttgaa ctggcctagc 5820
aaacacagaa aaaagcccgc acctgacagt gcgggctttt tttttcctag gcgatctgtg 5880
ctgtttgcca cggtatgcag caccagcgcg agattatggg ctcgcacgct cgactgtcgg 5940
acgggggcac tggaacgaga agtcaggcga gccgtcacgc ccttgacaat gccacatcct 6000
gagcaaataa ttcaaccact aaacaaatca accgcgtttc ccggaggtaa ccaagcttca 6060
ccttttgagc cgatgaacaa tgaaaagatc aaaacgattt gcagtactgg cccagcgccc 6120
cgtcaatcag gacgggctga ttggcgagtg gcctgaagag gggctgatcg ccatggacag 6180
cccctttgac ccggtctctt cagtaaaagt ggacaacggt ctgatcgtcg aactggacgg 6240
caaacgccgg gaccagtttg acatgatcga ccgatttatc gccgattacg cgatcaacgt 6300
tgagcgcaca gagcaggcaa tgcgcctgga ggcggtggaa atagcccgta tgctggtgga 6360
tattcacgtc agccgggagg agatcattgc catcactacc gccatcacgc cggccaaagc 6420
ggtcgaggtg atggcgcaga tgaacgtggt ggagatgatg atggcgctgc agaagatgcg 6480
tgcccgccgg accccctcca accagtgcca cgtcaccaat ctcaaagata atccggtgca 6540
gattgccgct gacgccgccg aggccgggat ccgcggcttc tcagaacagg agaccacggt 6600
cggtatcgcg cgctacgcgc cgtttaacgc cctggcgctg ttggtcggtt cgcagtgcgg 6660
ccgccccggc gtgttgacgc agtgctcggt ggaagaggcc accgagctgg agctgggcat 6720
gcgtggctta accagctacg ccgagacggt gtcggtctac ggcaccgaag cggtatttac 6780
cgacggcgat gatacgccgt ggtcaaaggc gttcctcgcc tcggcctacg cctcccgcgg 6840
gttgaaaatg cgctacacct ccggcaccgg atccgaagcg ctgatgggct attcggagag 6900
caagtcgatg ctctacctcg aatcgcgctg catcttcatt actaaaggcg ccggggttca 6960
gggactgcaa aacggcgcgg tgagctgtat cggcatgacc ggcgctgtgc cgtcgggcat 7020
tcgggcggtg ctggcggaaa acctgatcgc ctctatgctc gacctcgaag tggcgtccgc 7080
caacgaccag actttctccc actcggatat tcgccgcacc gcgcgcaccc tgatgcagat 7140
gctgccgggc accgacttta ttttctccgg ctacagcgcg gtgccgaact acgacaacat 7200
gttcgccggc tcgaacttcg atgcggaaga ttttgatgat tacaacatcc tgcagcgtga 7260
cctgatggtt gacggcggcc tgcgtccggt gaccgaggcg gaaaccattg ccattcgcca 7320
gaaagcggcg cgggcgatcc aggcggtttt ccgcgagctg gggctgccgc caatcgccga 7380
cgaggaggtg gaggccgcca cctacgcgca cggcagcaac gagatgccgc cgcgtaacgt 7440
ggtggaggat ctgagtgcgg tggaagagat gatgaagcgc aacatcaccg gcctcgatat 7500
tgtcggcgcg ctgagccgca gcggctttga ggatatcgcc agcaatattc tcaatatgct 7560
gcgccagcgg gtcaccggcg attacctgca gacctcggcc attctcgatc ggcagttcga 7620
ggtggtgagt gcggtcaacg acatcaatga ctatcagggg ccgggcaccg gctatcgcat 7680
ctctgccgaa cgctgggcgg agatcaaaaa tattccgggc gtggttcagc ccgacaccat 7740
tgaataaggc ggtattcctg tgcaacagac aacccaaatt cagccctctt ttaccctgaa 7800
aacccgcgag ggcggggtag cttctgccga tgaacgcgcc gatgaagtgg tgatcggcgt 7860
cggccctgcc ttcgataaac accagcatca cactctgatc gatatgcccc atggcgcgat 7920
cctcaaagag ctgattgccg gggtggaaga agaggggctt cacgcccggg tggtgcgcat 7980
tctgcgcacg tccgacgtct cctttatggc ctgggatgcg gccaacctga gcggctcggg 8040
gatcggcatc ggtatccagt cgaaggggac cacggtcatc catcagcgcg atctgctgcc 8100
gctcagcaac ctggagctgt tctcccaggc gccgctgctg acgctggaga cctaccggca 8160
gattggcaaa aacgctgcgc gctatgcgcg caaagagtca ccttcgccgg tgccggtggt 8220
gaacgatcag atggtgcggc cgaaatttat ggccaaagcc gcgctatttc atatcaaaga 8280
gaccaaacat gtggtgcagg acgccgagcc cgtcaccctg cacatcgact tagtaaggga 8340
gtgaccatga gcgagaaaac catgcgcgtg caggattatc cgttagccac ccgctgcccg 8400
gagcatatcc tgacgcctac cggcaaacca ttgaccgata ttaccctcga gaaggtgctc 8460
tctggcgagg tgggcccgca ggatgtgcgg atctcccgcc agacccttga gtaccaggcg 8520
cagattgccg agcagatgca gcgccatgcg gtggcgcgca atttccgccg cgcggcggag 8580
cttatcgcca ttcctgacga gcgcattctg gctatctata acgcgctgcg cccgttccgc 8640
tcctcgcagg cggagctgct ggcgatcgcc gacgagctgg agcacacctg gcatgcgaca 8700
gtgaatgccg cctttgtccg ggagtcggcg gaagtgtatc agcagcggca taagctgcgt 8760
aaaggaagct aagcggaggt cagcatgccg ttaatagccg ggattgatat cggcaacgcc 8820
accaccgagg tggcgctggc gtccgactac ccgcaggcga gggcgtttgt tgccagcggg 8880
atcgtcgcga cgacgggcat gaaagggacg cgggacaata tcgccgggac cctcgccgcg 8940
ctggagcagg ccctggcgaa aacaccgtgg tcgatgagcg atgtctctcg catctatctt 9000
aacgaagccg cgccggtgat tggcgatgtg gcgatggaga ccatcaccga gaccattatc 9060
accgaatcga ccatgatcgg tcataacccg cagacgccgg gcggggtggg cgttggcgtg 9120
gggacgacta tcgccctcgg gcggctggcg acgctgccgg cggcgcagta tgccgagggg 9180
tggatcgtac tgattgacga cgccgtcgat ttccttgacg ccgtgtggtg gctcaatgag 9240
gcgctcgacc gggggatcaa cgtggtggcg gcgatcctca aaaaggacga cggcgtgctg 9300
gtgaacaacc gcctgcgtaa aaccctgccg gtggtggatg aagtgacgct gctggagcag 9360
gtccccgagg gggtaatggc ggcggtggaa gtggccgcgc cgggccaggt ggtgcggatc 9420
ctgtcgaatc cctacgggat cgccaccttc ttcgggctaa gcccggaaga gacccaggcc 9480
atcgtcccca tcgcccgcgc cctgattggc aaccgttccg cggtggtgct caagaccccg 9540
cagggggatg tgcagtcgcg ggtgatcccg gcgggcaacc tctacattag cggcgaaaag 9600
cgccgcggag aggccgatgt cgccgagggc gcggaagcca tcatgcaggc gatgagcgcc 9660
tgcgctccgg tacgcgacat ccgcggcgaa ccgggcaccc acgccggcgg catgcttgag 9720
cgggtgcgca aggtaatggc gtccctgacc ggccatgaga tgagcgcgat atacatccag 9780
gatctgctgg cggtggatac gtttattccg cgcaaggtgc agggcgggat ggccggcgag 9840
tgcgccatgg agaatgccgt cgggatggcg gcgatggtga aagcggatcg tctgcaaatg 9900
caggttatcg cccgcgaact gagcgcccga ctgcagaccg aggtggtggt gggcggcgtg 9960
gaggccaaca tggccatcgc cggggcgtta accactcccg gctgtgcggc gccgctggcg 10020
atcctcgacc tcggcgccgg ctcgacggat gcggcgatcg tcaacgcgga ggggcagata 10080
acggcggtcc atctcgccgg ggcggggaat atggtcagcc tgttgattaa aaccgagctg 10140
ggcctcgagg atctttcgct ggcggaagcg ataaaaaaat acccgctggc caaagtggaa 10200
agcctgttca gtattcgtca cgagaatggc gcggtggagt tctttcggga agccctcagc 10260
ccggcggtgt tcgccaaagt ggtgtacatc aaggagggcg aactggtgcc gatcgataac 10320
gccagcccgc tggaaaaaat tcgtctcgtg cgccggcagg cgaaagagaa agtgtttgtc 10380
accaactgcc tgcgcgcgct gcgccaggtc tcacccggcg gttccattcg cgatatcgcc 10440
tttgtggtgc tggtgggcgg ctcatcgctg gactttgaga tcccgcagct tatcacggaa 10500
gccttgtcgc actatggcgt ggtcgccggg cagggcaata ttcggggaac agaagggccg 10560
cgcaatgcgg tcgccaccgg gctgctactg gccggtcagg cgaattaaac gggcgctcgc 10620
gccagcctct aggtacaaat aaaaaaggca cgtcagatga cgtgcctttt ttct tgtcta 10680
gcgtgcacca atgcttctgg cgtcaggcag ccatcggaag ctgtggtatg gctgtgcagg 10740
tcgtaaatca ctgcataatt cgtgtcgctc aaggcgcact cccgttctgg ataatgtttt 10800
ttgcgccgac atcataacgg ttctggcaaa tattctgaaa tgagctgttg acaattaatc 10860
atccggctcg tataatgtgt ggaattgtga gcggataaca atttcacaca ggaaacagac 10920
catgactagt aaggaggaca attccatggc tgctgctgct gatagattaa acttaacttc 10980
cggccacttg aatgctggta gaaagagaag ttcctcttct gtttctttga aggctgccga 11040
aaagcctttc aaggttactg tgattggatc tggtaactgg ggtactacta ttgccaaggt 11100
ggttgccgaa aattgtaagg gatacccaga agttttcgct ccaatagtac aaatgtgggt 11160
gttcgaagaa gagatcaatg gtgaaaaatt gactgaaatc ataaatacta gacatcaaaa 11220
cgtgaaatac ttgcctggca tcactctacc cgacaatttg gttgctaatc cagacttgat 11280
tgattcagtc aaggatgtcg acatcatcgt tttcaacatt ccacatcaat ttttgccccg 11340
tatctgtagc caattgaaag gtcatgttga ttcacacgtc agagctatct cctgtctaaa 11400
gggttttgaa gttggtgcta aaggtgtcca attgctatcc tcttacatca ctgaggaact 11460
aggtattcaa tgtggtgctc tatctggtgc taacattgcc accgaagtcg ctcaagaaca 11520
ctggtctgaa acaacagttg cttaccacat tccaaaggat ttcagaggcg agggcaagga 11580
cgtcgaccat aaggttctaa aggccttgtt ccacagacct tacttccacg ttagtgtcat 11640
cgaagatgtt gctggtatct ccatctgtgg tgctttgaag aacgttgttg ccttaggttg 11700
tggtttcgtc gaaggtctag gctggggtaa caacgcttct gctgccatcc aaagagtcgg 11760
tttgggtgag atcatcagat tcggtcaaat gtttttccca gaatctagag aagaaacata 11820
ctaccaagag tctgctggtg ttgctgattt gatcaccacc tgcgctggtg gtagaaacgt 11880
caaggttgct aggctaatgg ctacttctgg taaggacgcc tgggaatgtg aaaaggagtt 11940
gttgaatggc caatccgctc aaggtttaat tacctgcaaa gaagttcacg aatggttgga 12000
aacatgtggc tctgtcgaag acttcccatt atttgaagcc gtataccaaa tcgtttacaa 12060
caactaccca atgaagaacc tgccggacat gattgaagaa ttagatctac atgaagatta 12120
gatttattgg atccaggaaa cagactagaa ttatgggatt gactactaaa cctctatctt 12180
tgaaagttaa cgccgctttg ttcgacgtcg acggtaccat tatcatctct caaccagcca 12240
ttgctgcatt ctggagggat ttcggtaagg acaaacctta tttcgatgct gaacacgtta 12300
tccaagtctc gcatggttgg agaacgtttg atgccattgc taagttcgct ccagactttg 12360
ccaatgaaga gtatgttaac aaattagaag ctgaaattcc ggtcaagtac ggtgaaaaat 12420
ccattgaagt cccaggtgca gttaagctgt gcaacgcttt gaacgctcta ccaaaagaga 12480
aatgggctgt ggcaacttcc ggtacccgtg atatggcaca aaaatggttc gagcatctgg 12540
gaatcaggag accaaagtac ttcattaccg ctaatgatgt caaacagggt aagcctcatc 12600
cagaaccata tctgaagggc aggaatggct taggatatcc gatcaatgag caagaccctt 12660
ccaaatctaa ggtagtagta tttgaagacg ctccagcagg tattgccgcc ggaaaagccg 12720
ccggttgtaa gatcattggt attgccacta ctttcgactt ggacttccta aaggaaaaag 12780
gctgtgacat cattgtcaaa aaccacgaat ccatcagagt tggcggctac aatgccgaaa 12840
cagacgaagt tgaattcatt tttgacgact acttatatgc taaggacgat ctgttgaaat 12900
ggtaacccgg gctgcaggca tgcaagcttg gctgttttgg cggatgagag aagattttca 12960
gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat ttgcctggcg 13020
gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg 13080
ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca tcaaataaaa 13140
cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct 13200
ctcctgagta ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca acggcccgga 13260
gggtggcggg caggacgccc gccataaact gccaggcatc aaattaagca gaaggccatc 13320
ctgacggatg gcctttttgc gtttctacaa actccagctg gatcgggcgc tagagtatac 13380
atttaaatgg taccggcgcg ccgctagctt aattaacgga ccgatgcatg agctcacgcg 13440
taccggtgct cttcgatcta cgtaagaagg 13470
<210>31
<211>42
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>31
gcccttgact atgccacatc ctgagcaaat aattcaacca ct 42
<210>32
<211>42
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>32
gcccttgacg atgccacatc ctgagcaaat aattcaacca ct 42
<210>33
<211>42
<212>DNA
<213>人工序列
<220>
<223>启动子
<400>33
gcccttgaca atgccacatc ctgagcaaat aattcaacca ct 42
<210>34
<211>81
<212>DNA
<213>人工序列
<220>
<223>引物
<400>34
cattcggacc ggcccttgac tatgccacat cctgagcaaa taattcaacc actacagcaa 60
agggagcaag taatgaacaa c 81
<210>35
<211>81
<212>DNA
<213>人工序列
<220>
<223>引物
<400>35
cattcggacc ggcccttgac gatgccacat cctgagcaaa taattcaacc actacagcaa 60
agggagcaag taatgaacaac 81
<210>36
<211>81
<212>DNA
<213>人工序列
<220>
<223>引物
<400>36
cattcggacc ggcccttgac aatgccacat cctgagcaaa taattcaacc actacagcaa 60
agggagcaag taatgaacaa c 81
<210>37
<211>82
<212>DNA
<213>人工序列
<220>
<223>引物
<400>37
cattgagctc aaaaaaaaag cccgcactgt caggtgcggg cttttttctg tgtttaagct 60
tagcgggcgg cttcgtatat ac 82
<210>38
<211>62
<212>DNA
<213>人工序列
<220>
<223>引物
<400>38
atgtgcgcgc caacgtcatg tgggcggcga ctcaggcgct gagtgtaggc tggagctgct 60
tc 62
<210>39
<211>67
<212>DNA
<213>人工序列
<220>
<223>引物
<400>39
cagacgcgtt cagcatattg cagcagctta gcgcgcttgg tatcgcgatt ccggggatcc 60
gtcgacc 67
<210>40
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>40
gccagcaagc ggcaaatctc ttcac 25
<210>41
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>41
gaggcgtaaa aagcttagcg ggcgg 25
<210>42
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>42
gcttcctcgt gctttacggt atcg 24
<210>43
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>43
cctgcgtgca atccatcttg ttc 23
<210>44
<211>100
<212>DNA
<213>人工序列
<220>
<223>引物
<400>44
cgatttttta acatttccat aagttacgct tatttaaagc gtcgtgaatt taatgacgta 60
aattcctgct atttattcgt gtgtaggctg gagctgcttc 100
<210>45
<211>100
<212>DNA
<213>人工序列
<220>
<223>引物
<400>45
tcgcattggc gcgaatatgc tcgggctttg cttttcgtca gtggttgaat tatttgctca 60
ggatgtggca ttgtcaaggg catatgaata tcctccttag 100
<210>46
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>46
gcggaatatt gttcgttcat attaccccag 30
<210>47
<211>94
<212>DNA
<213>人工序列
<220>
<223>终止子
<400>47
agcttaggag tctagaatat tgagctcgaa ttcccgggca tgcggtaccg gatccagaaa 60
aaagcccgca cctgacagtg cgggcttttt tttt 94
<210>48
<211>12145
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>48
gtcgaccacc acggtggtga ctttaatgcc gctctcatgc agcagctcgg tggcggtctc 60
aaaattcagg atgtcgccgg tatagttttt gataatcagc aagacgcctt cgccgccgtc 120
aatttgcatc gcgcattcaa acattttgtc cggcgtcggc gaggtgaata tttcccccgg 180
acaggcgccg gagagcatgc cctggccgat atagccgcag tgcatcggtt catgtccgct 240
gccgccgccg gagagcaggg ccaccttgcc agccaccggc gcgtcggtgc gggtcacata 300
cagcgggtcc tgatgcaggg tcagctgcgg atgggcttta gccagcccct gtaattgttc 360
attcagtaca tcttcaacac ggttaatcag ctttttcatt attcagtgct ccgttggaga 420
aggttcgatg ccgcctctct gctggcggag gcggtcatcg cgtaggggta tcgtctgacg 480
gtggagcgtg cctggcgata tgatgattct ggctgagcgg acgaaaaaaa gaatgccccg 540
acgatcgggt ttcattacga aacattgctt cctgattttg tttctttatg gaacgttttt 600
gctgaggata tggtgaaaat gcgagctggc gcgctttttt tcttctgcca taagcggcgg 660
tcaggatagc cggcgaagcg ggtgggaaaa aattttttgc tgattttctg ccgactgcgg 720
gagaaaaggc ggtcaaacac ggaggattgt aagggcatta tgcggcaaag gagcggatcg 780
ggatcgcaat cctgacagag actagggttt tttgttccaa tatggaacgt aaaaaattaa 840
cctgtgtttc atatcagaac aaaaaggcga aagatttttt tgttccctgc cggccctaca 900
gtgatcgcac tgctccggta cgctccgttc aggccgcgct tcactggccg gcgcggataa 960
cgccagggct catcatgtct acatgcgcac ttatttgagg gtgaaaggaa tgctaaaagt 1020
tattcaatct ccagccaaat atcttcaggg tcctgatgct gctgttctgt tcggtcaata 1080
tgccaaaaac ctggcggaga gcttcttcgt catcgctgac gatttcgtaa tgaagctggc 1140
gggagagaaa gtggtgaatg gcctgcagag ccacgatatt cgctgccatg cggaacggtt 1200
taacggcgaa tgcagccatg cggaaatcaa ccgtctgatg gcgattttgc aaaaacaggg 1260
ctgccgcggc gtggtcggga tcggcggtgg taaaaccctc gataccgcga aggcgatcgg 1320
ttactaccag aagctgccgg tggtggtgat cccgaccatc gcctcgaccg atgcgccaac 1380
cagcgcgctg tcggtgatct acaccgaagc gggcgagttt gaagagtatc tgatctatcc 1440
gaaaaacccg gatatggtgg tgatggacac ggcgattatc gccaaagcgc cggtacgcct 1500
gctggtctcc ggcatgggcg atgcgctctc cacctggttc gaggccaaag cttgctacga 1560
tgcgcgcgcc accagcatgg ccggaggaca gtccaccgag gcggcgctga gcctcgcccg 1620
cctgtgctat gatacgctgc tggcggaggg cgaaaaggcc cgtctggcgg cgcaggccgg 1680
ggtagtgacc gaagcgctgg agcgcatcat cgaggcgaac acttacctca gcggcattgg 1740
ctttgaaagc agtggcctgg ccgctgccca tgcaatccac aacggtttca ccattcttga 1800
agagtgccat cacctgtatc acggtgagaa agtggccttc ggtaccctgg cgcagctggt 1860
gctgcagaac agcccgatgg acgagattga aacggtgcag ggcttctgcc agcgcgtcgg 1920
cctgccggtg acgctcgcgc agatgggcgt caaagagggg atcgacgaga aaatcgccgc 1980
ggtggcgaaa gctacctgcg cggaagggga aaccatccat aatatgccgt ttgcggtgac 2040
cccggagagc gtccatgccg ctatcctcac cgccgatctg ttaggccagc agtggctggc 2100
gcgttaattc gcggtggcta aaccgctggc ccaggtcagc ggtttttctt tctcccctcc 2160
ggcagtcgct gccggagggg ttctctatgg tacaacgcgg aaaaggatat gactgttcag 2220
actcaggata ccgggaaggc ggtctcttcc gtcattgccc agtcatggca ccgctgcagc 2280
aagtttatgc agcgcgaaac ctggcaaacg ccgcaccagg cccagggcct gaccttcgac 2340
tccatctgtc ggcgtaaaac cgcgctgctc accatcggcc aggcggcgct ggaagacgcc 2400
tgggagttta tggacggccg cccctgcgcg ctgtttattc ttgatgagtc cgcctgcatc 2460
ctgagccgtt gcggcgagcc gcaaaccctg gcccagctgg ctgccctggg atttcgcgac 2520
ggcagctatt gtgcggagag cattatcggc acctgcgcgc tgtcgctggc cgcgatgcag 2580
ggccagccga tcaacaccgc cggcgatcgg cattttaagc aggcgctaca gccatggagt 2640
ttttgctcga cgccggtgtt tgataaccac gggcggctgt tcggctctat ctcgctttgc 2700
tgtctggtcg agcaccagtc cagcgccgac ctctccctga cgctggccat cgcccgcgag 2760
gtgggtaact ccctgcttac cgacagcctg ctggcggaat ccaaccgtca cctcaatcag 2820
atgtacggcc tgctggagag catggacgat ggggtgatgg cgtggaacga acagggcgtg 2880
ctgcagtttc tcaatgttca ggcggcgaga ctgctgcatc ttgatgctca ggccagccag 2940
gggaaaaata tcgccgatct ggtgaccctc ccggcgctgc tgcgccgcgc catcaaacac 3000
gcccgcggcc tgaatcacgt cgaagtcacc tttgaaagtc agcatcagtt tgtcgatgcg 3060
gtgatcacct taaaaccgat tgtcgaggcg caaggcaaca gttttattct gctgctgcat 3120
ccggtggagc agatgcggca gctgatgacc agccagctcg gtaaagtcag ccacaccttt 3180
gagcagatgt ctgccgacga tccggaaacc cgacgcctga tccactttgg ccgccaggcg 3240
gcgcgcggcg gcttcccggt gctactgtgc ggcgaagagg gggtcgggaa agagctgctg 3300
agccaggcta ttcacaatga aagcgaacgg gcgggcggcc cctacatctc cgtcaactgc 3360
cagctatatg ccgacagcgt gctgggccag gactttatgg gcagcgcccc taccgacgat 3420
gaaaatggtc gcctgagccg ccttgagctg gccaacggcg gcaccctgtt tctggaaaag 3480
atcgagtatc tggcgccgga gctgcagtcg gctctgctgc aggtgattaa gcagggcgtg 3540
ctcacccgcc tcgacgcccg gcgcctgatc ccggtggatg tgaaggtgat tgccaccacc 3600
accgtcgatc tggccaatct ggtggaacag aaccgcttta gccgccagct gtactatgcg 3660
ctgcactcct ttgagatcgt catcccgccg ctgcgcgccc gacgcaacag tattccgtcg 3720
ctggtgcata accggttgaa gagcctggag aagcgtttct cttcgcgact gaaagtggac 3780
gatgacgcgc tggcacagct ggtggcctac tcgtggccgg ggaatgattt tgagctcaac 3840
agcgtcattg agaatatcgc catcagcagc gacaacggcc acattcgcct gagtaatctg 3900
ccggaatatc tcttttccga gcggccgggc ggggatagcg cgtcatcgct gctgccggcc 3960
agcctgactt ttagcgccat cgaaaaggaa gctattattc acgccgcccg ggtgaccagc 4020
gggcgggtgc aggagatgtc gcagctgctc aatatcggcc gcaccaccct gtggcgcaaa 4080
atgaagcagt acgatattga cgccagccag ttcaagcgca agcatcaggc ctagtctctt 4140
cgattcgcgc catggagaac agggcatccg acaggcgatt gctgtagcgt ttgagcgcgt 4200
cgcgcagcgg atgcgcgcgg tccatggccg tcagcaggcg ttcgagccga cgggactggg 4260
tgcgcgccac gtgcagctgg gcagaggcga gattcctccc cgggatcacg aactgtttta 4320
acgggccgct ctcggccata ttgcggtcga taagccgctc cagggcggtg atctcctctt 4380
cgccgatcgt ctggctcagg cgggtcaggc cccgcgcatc gctggccagt tcagccccca 4440
gcacgaacag cgtctgctga atatggtgca ggctttcccg cagcccggcg tcgcgggtcg 4500
tggcgtagca gacgcccagc tgggatatca gttcatcgac ggtgccgtag gcctcgacgc 4560
gaatatggtc tttctcgatg cggctgccgc cgtacagggc ggtggtgcct ttatccccgg 4620
tgcgggtata gatacgatac attcagtttc tctcacttaa cggcaggact ttaaccagct 4680
gcccggcgtt ggcgccgagc gtacgcagtt gatcgtcgct atcggtgacg tgtccggtag 4740
ccagcggcgc gtccgccggc agctgggcat gagtgagggc tatctcgccg gacgcgctga 4800
gcccgatacc cacccgcagg ggcgagcttc tggccgccag ggcgcccagc gcagcggcgt 4860
caccgcctcc gtcataggtt atggtctggc aggggacccc ctgctcctcc agcccccagc 4920
acagctcatt gatggcgccg gcatggtgcc cgcgcggatc gtaaaacagg cgtacgcctg 4980
gcggtgaaag cgacatgacg gtcccctcgt taacactcag aatgcctggc ggaaaatcgc 5040
ggcaatctcc tgctcgttgc ctttacgcgg gttcgagaac gcattgccgt cttttagagc 5100
catctccgcc atgtagggga agtcggcctc ttttaccccc agatcgcgca gatgctgcgg 5160
aataccgata tccatcgaca gacgcgtgat agcggcgatg gctttttccg ccgcgtcgag 5220
agtggacagt ccggtgatat tttcgcccat cagttcagcg atatcggcga atttctccgg 5280
gttggcgatc aggttgtagc gcgccacatg cggcagcagg acagcgttgg ccacgccgtg 5340
cggcatgtcg tacaggccgc ccagctggtg cgccatggcg tgcacgtagc cgaggttggc 5400
gttattgaaa gccatcccgg ccagcagaga agcataggcc atgttttccc gcgcctgcag 5460
attgctgccg agggccacgg cctggcgcag gttgcgggcg atgaggcgga tcgcctgcat 5520
ggcggcggcg tccgtcaccg ggttagcgtc tttggagata taggcctcta cggcgtgggt 5580
cagggcatcc atcccggtcg ccgcggtcag ggcggccggt ttaccgatca tcagcagtgg 5640
atcgttgata gagaccgacg gcagtttgcg ccagctgacg atcacaaact tcactttggt 5700
ttcggtgttg gtcaggacgc agtggcgggt gacctcgctg gcggtgccgg cggtggtatt 5760
gaccgcgacg ataggcggca gcgggttggt cagggtctcg attccggcat actggtacag 5820
atcgccctca tgggtggcgg cgatgccgat gcctttgccg caatcgtgcg ggctgccgcc 5880
gcccacggtg acgatgatgt cgcactgttc gcggcgaaac acggcgaggc cgtcgcgcac 5940
gttggtgtct ttcgggttcg gctcgacgcc gtcaaagatc gccacctcga tcccggcctc 6000
ccgcagataa tgcagggttt tgtccaccgc gccatcttta attgcccgca ggcctttgtc 6060
ggtgaccagc agggcttttt tcccccccag cagctggcag cgttcgccga ctacggaaat 6120
ggcgttgggg ccaaaaaaat taacgtttgg caccagataa tcaaacatac gatagctcat 6180
aatatacctt ctcgcttcag gttataatgc ggaaaaacaa tccagggcgc actgggctaa 6240
taattgatcc tgctcgaccg taccgccgct aacgccgacg gcgccaatta cctgctcatt 6300
aaaaataact ggcaggccgc cgccaaaaat aataattcgc tgttggttgg ttagctgcag 6360
accgtacaga gattgtcctg gctggaccgc tgacgtaatt tcatgggtac cttgcttcag 6420
gctgcaggcg ctccaggctt tattcaggga aatatcgcag ctggagacga aggcctcgtc 6480
catccgctgg ataagcagcg tgttgcctcc gcggtcaact acggaaaaca ccaccgccac 6540
gttgatctca gtggcttttt tttccaccgc cgccgccatt tgctgggcgg cggccagggt 6600
gattgtctga acttgttggc tcttgttcat cattctctcc cgcaccagga taacgctggc 6660
gcgaatagtc agtagggggc gatagtaaaa aactattacc attcggttgg cttgctttat 6720
ttttgtcagc gttattttgt cgcccgccat gatttagtca atagggttaa aatagcgtcg 6780
gaaaaacgta attaagggcg ttttttatta attgatttat atcattgcgg gcgatcacat 6840
tttttatttt tgccgccgga gtaaagtttc atagtgaaac tgtcggtaga tttcgtgtgc 6900
caaattgaaa cgaaattaaa tttatttttt tcaccactgg ctcatttaaa gttccgctat 6960
tgccggtaat ggccgggcgg caacgacgct ggcccggcgt attcgctacc gtctgcggat 7020
ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 7080
gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 7140
acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 7200
acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 7260
acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 7320
tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 7380
aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 7440
tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 7500
tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 7560
cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 7620
gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 7680
gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 7740
ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 7800
gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 7860
agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 7920
ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 7980
gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 8040
ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 8100
agatgctgcc gggcaccgac tttattttct ccggctacag cgcggtgccg aactacgaca 8160
acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 8220
gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 8280
gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 8340
ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 8400
acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 8460
atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 8520
tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 8580
tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 8640
gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 8700
ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 8760
tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 8820
gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 8880
cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 8940
gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 9000
cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 9060
tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 9120
ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 9180
tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 9240
aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 9300
gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 9360
cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 9420
gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 9480
ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 9540
ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 9600
ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 9660
gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tgtcagcagc ggcataagct 9720
gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 9780
cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 9840
cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 9900
cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 9960
tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 10020
tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 10080
cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 10140
ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 10200
tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 10260
gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 10320
gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 10380
gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 10440
ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 10500
cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 10560
aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 10620
cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 10680
tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 10740
ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 10800
cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 10860
aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 10920
cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 10980
ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 11040
gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 11100
gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 11160
ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 11220
cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 11280
taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 11340
tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttcca ttcgcgatat 11400
cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 11460
ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 11520
gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 11580
tcgcgccagc ctctctcttt aacgtgctat ttcaggatgc cgataatgaa ccagacttct 11640
accttaaccg ggcagtgcgt ggccgagttt cttggcaccg gattgctcat tttcttcggc 11700
gcgggctgcg tcgctgcgct gcgggtcgcc ggggccagct ttggtcagtg ggagatcagt 11760
attatctggg gccttggcgt cgccatggcc atctacctga cggccggtgt ctccggcgcg 11820
cacctaaatc cggcggtgac cattgccctg tggctgttcg cctgttttga acgccgcaag 11880
gtgctgccgt ttattgttgc ccagacggcc ggggccttct gcgccgccgc gctggtgtat 11940
gggctctatc gccagctgtt tctcgatctt gaacagagtc agcatatcgt gcgcggcact 12000
gccgccagtc ttaacctggc cggggtcttt tccacgtacc cgcatccaca tatcactttt 12060
atacaagcgt ttgccgtgga gaccaccatc acggcaatcc tgatggcgat gatcatggcc 12120
ctgaccgacg acggcaacgg aattc 12145
<210>49
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物
<400>49
ggaattcaga tctcagcaat gagcgagaaa accatgc 37
<210>50
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物
<400>50
gctctagatt agcttccttt acgcagc 27
<210>51
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>51
ggccaagctt aaggaggtta attaaatgaa aag 33
<210>52
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>52
gctctagatt attcaatggt gtcggg 26
<210>53
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>53
gctctagatt attcaatggt gtcggg 26
<210>54
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物
<400>54
gcgccgtcta gaattatgag ctatcgtatg tttgattatc tg 42
<210>55
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物
<400>55
tcgacgaatt caggagga 18
<210>56
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物
<400>56
ctagtcctcc tgaattcg 18
<210>57
<211>133
<212>DNA
<213>人工序列
<220>
<223>片段
<400>57
agtcaaaagc ctccgaccgg aggcttttga ctgctagcaa acacagaaaa aagcccgcac 60
ctgacagtgc gggctttttt tttcctaggt acaaataaaa aaggcacgtc agatgacgtg 120
ccttttttct tgt 133
<210>58
<211>100
<212>DNA
<213>人工序列
<220>
<223>引物
<400>58
ggaattcatt taaatagtca aaagcctccg accggaggct tttgactgct agcaaacaca 60
gaaaaaagcc cgcacctgac agtgcgggct ttttttttcc 100
<210>59
<211>100
<212>DNA
<213>人工序列
<220>
<223>引物
<400>59
ggggtaccat ttaaatgtat actctagaca agaaaaaagg cacgtcatct gacgtgcctt 60
ttttatttgt acctaggaaa aaaaaagccc gcactgtcag 100
<210>60
<211>175
<212>DNA
<213>人工序列
<220>
<223>片段
<400>60
ggaattcatt taaatagtca aaagcctccg accggaggct tttgactgct agcaaacaca 60
gaaaaaagcc cgcacctgac agtgcgggct ttttttttcc taggtacaaa taaaaaaggc 120
acgtcagatg acgtgccttt tttcttgtct agagtataca tttaaatggt acccc 175
<210>61
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>61
ggaattcatt taaatagtca 20
<210>62
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>62
ggggtaccat ttaaatgtat 20
<210>63
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>63
gacgcaacag tattccgtcg c 21
<210>64
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物
<400>64
atgagctatc gtatgttccg ccaggcattc tgagtgttaa cg 42
<210>65
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>65
gcctggcgga acatacgata gctcataata tac 33
<210>66
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>66
cggggcgctg ggccagtact g 21
<210>67
<211>53
<212>DNA
<213>人工序列
<220>
<223>接头
<400>67
tctagaggat ccgctagcac tagtagcccg ggcgctagcg cggccgcccc ggg 53
<210>68
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物
<400>68
tattcagctg gctagcgtgc accaatgctt ctggcgt 37
<210>69
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>69
gatccagctg gagtttgtag aaacgcaaaa aggcc 35
<210>70
<211>7283
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>70
tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60
taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240
gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300
tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360
gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420
acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480
actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540
tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600
cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660
atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720
agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780
tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840
atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900
tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960
gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020
gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080
acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140
gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260
cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320
atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380
ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440
gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500
ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560
atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620
atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680
atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740
gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800
ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100
cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960
tatcatcaac aggcttaccc gtcttactgt cgggaattcg cgttggccga ttcattaatg 4020
cagctggcac gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt 4080
gagttagctc actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt 4140
gtgtggaatt gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc 4200
caagcttgca tgcctgcagg tcgactctag aggatccgct agcactagta gccctattca 4260
gctggctagc gtgcaccaat gcttctggcg tcaggcagcc atcggaagct gtggtatggc 4320
tgtgcaggtc gtaaatcact gcataattcg tgtcgctcaa ggcgcactcc cgttctggat 4380
aatgtttttt gcgccgacat cataacggtt ctggcaaata ttctgaaatg agctgttgac 4440
aattaatcat ccggctcgta taatgtgtgg aattgtgagc ggataacaat ttcacacagg 4500
aaacagacca tgactagtaa ggaggacaat tccatggctg ctgctgctga tagattaaac 4560
ttaacttccg gccacttgaa tgctggtaga aagagaagtt cctcttctgt ttctttgaag 4620
gctgccgaaa agcctttcaa ggttactgtg attggatctg gtaactgggg tactactatt 4680
gccaaggtgg ttgccgaaaa ttgtaaggga tacccagaag ttttcgctcc aatagtacaa 4740
atgtgggtgt tcgaagaaga gatcaatggt gaaaaattga ctgaaatcat aaatactaga 4800
catcaaaacg tgaaatactt gcctggcatc actctacccg acaatttggt tgctaatcca 4860
gacttgattg attcagtcaa ggatgtcgac atcatcgttt tcaacattcc acatcaattt 4920
ttgccccgta tctgtagcca attgaaaggt catgttgatt cacacgtcag agctatctcc 4980
tgtctaaagg gttttgaagt tggtgctaaa ggtgtccaat tgctatcctc ttacatcact 5040
gaggaactag gtattcaatg tggtgctcta tctggtgcta acattgccac cgaagtcgct 5100
caagaacact ggtctgaaac aacagttgct taccacattc caaaggattt cagaggcgag 5160
ggcaaggacg tcgaccataa ggttctaaag gccttgttcc acagacctta cttccacgtt 5220
agtgtcatcg aagatgttgc tggtatctcc atctgtggtg ctttgaagaa cgttgttgcc 5280
ttaggttgtg gtttcgtcga aggtctaggc tggggtaaca acgcttctgc tgccatccaa 5340
agagtcggtt tgggtgagat catcagattc ggtcaaatgt ttttcccaga atctagagaa 5400
gaaacatact accaagagtc tgctggtgtt gctgatttga tcaccacctg cgctggtggt 5460
agaaacgtca aggttgctag gctaatggct acttctggta aggacgcctg ggaatgtgaa 5520
aaggagttgt tgaatggcca atccgctcaa ggtttaatta cctgcaaaga agttcacgaa 5580
tggttggaaa catgtggctc tgtcgaagac ttcccattat ttgaagccgt ataccaaatc 5640
gtttacaaca actacccaat gaagaacctg ccggacatga ttgaagaatt agatctacat 5700
gaagattaga tttattggat ccaggaaaca gactagaatt atgggattga ctactaaacc 5760
tctatctttg aaagttaacg ccgctttgtt cgacgtcgac ggtaccatta tcatctctca 5820
accagccatt gctgcattct ggagggattt cggtaaggac aaaccttatt tcgatgctga 5880
acacgttatc caagtctcgc atggttggag aacgtttgat gccattgcta agttcgctcc 5940
agactttgcc aatgaagagt atgttaacaa attagaagct gaaattccgg tcaagtacgg 6000
tgaaaaatcc attgaagtcc caggtgcagt taagctgtgc aacgctttga acgctctacc 6060
aaaagagaaa tgggctgtgg caacttccgg tacccgtgat atggcacaaa aatggttcga 6120
gcatctggga atcaggagac caaagtactt cattaccgct aatgatgtca aacagggtaa 6180
gcctcatcca gaaccatatc tgaagggcag gaatggctta ggatatccga tcaatgagca 6240
agacccttcc aaatctaagg tagtagtatt tgaagacgct ccagcaggta ttgccgccgg 6300
aaaagccgcc ggttgtaaga tcattggtat tgccactact ttcgacttgg acttcctaaa 6360
ggaaaaaggc tgtgacatca ttgtcaaaaa ccacgaatcc atcagagttg gcggctacaa 6420
tgccgaaaca gacgaagttg aattcatttt tgacgactac ttatatgcta aggacgatct 6480
gttgaaatgg taacccgggc tgcaggcatg caagcttggc tgttttggcg gatgagagaa 6540
gattttcagc ctgatacaga ttaaatcaga acgcagaagc ggtctgataa aacagaattt 6600
gcctggcggc agtagcgcgg tggtcccacc tgaccccatg ccgaactcag aagtgaaacg 6660
ccgtagcgcc gatggtagtg tggggtctcc ccatgcgaga gtagggaact gccaggcatc 6720
aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg 6780
tgaacgctct cctgagtagg acaaatccgc cgggagcgga tttgaacgtt gcgaagcaac 6840
ggcccggagg gtggcgggca ggacgcccgc cataaactgc caggcatcaa attaagcaga 6900
aggccatcct gacggatggc ctttttgcgt ttctacaaac tccagctgga tcgggcgcta 6960
gcgcggccgc cccgggtacc gagctcgaat tcactggccg tcgttttaca acgtcgtgac 7020
tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc 7080
tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 7140
ggcgaatggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 7200
atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca gccccgacac 7260
ccgccaacac ccgctgacga gct 7283
<210>71
<211>13669
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>71
tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60
taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240
gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300
tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360
gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420
acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480
actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540
tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600
cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660
atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720
agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780
tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840
atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900
tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960
gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020
gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080
acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140
gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260
cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320
atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380
ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440
gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500
ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560
atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620
atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680
atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740
gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800
ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100
cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagcg 2820
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960
tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020
cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080
cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140
gcgagccgtc acgcccttga caatgccaca tcctgagcaa ataattcaac cactaaacaa 4200
atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260
caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320
gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380
cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440
tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500
caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560
ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620
gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680
gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740
ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800
atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860
ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920
cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980
agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040
gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100
gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160
gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220
cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280
atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340
cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400
gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460
ctgcccagct gcacgtggcg cgcacccagt cccgtcggct cgaacgcctg ctgacggcca 5520
tggaccgcgc gcatccgctg cgcgacgcgc tcaaacgcta cagcaatcgc ctgtcggatg 5580
ccctgttctc catggcgcga atcgaagaga ctaggcctga tgcttgcgct tgaactggcc 5640
tagcaaacac agaaaaaagc ccgcacctga cagtgcgggc tttttttttc ctaggcgatc 5700
tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca cgctcgactg 5760
tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga caatgccaca 5820
tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag gtaaccaagc 5880
ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 5940
gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 6000
acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 6060
acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 6120
acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 6180
tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 6240
aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 6300
tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 6360
tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 6420
cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 6480
gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 6540
gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 6600
ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 6660
gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 6720
agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 6780
ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 6840
gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 6900
ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 6960
agatgctgcc gggcaccgac tttattttc tccggctacag cgcggtgccg aactacgaca 7020
acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 7080
gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 7140
gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 7200
ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 7260
acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 7320
atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 7380
tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 7440
tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 7500
gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 7560
ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 7620
tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 7680
gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 7740
cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 7800
gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 7860
cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 7920
tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 7980
ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 8040
tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 8100
aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 8160
gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 8220
cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 8280
gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 8340
ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 8400
ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 8460
ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 8520
gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct 8580
gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 8640
cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 8700
cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 8760
cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 8820
tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 8880
tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 8940
cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 9000
ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 9060
tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 9120
gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 9180
gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 9240
gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 9300
ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 9360
cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 9420
aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 9480
cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 9540
tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 9600
ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 9660
cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 9720
aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 9780
cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 9840
ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 9900
gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 9960
gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 10020
ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 10080
cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 10140
taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 10200
tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttcca ttcgcgatat 10260
cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 10320
ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 10380
gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 10440
tcgcgccagc ctctaggtac aaataaaaaa ggcacgtcag atgacgtgcc ttttttcttg 10500
tctagagtac tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 10560
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tcgagctcgg tacccggggc 10620
ggccgcgcta gcgcccgatc cagctggagt ttgtagaaac gcaaaaaggc catccgtcag 10680
gatggccttc tgcttaattt gatgcctggc agtttatggc gggcgtcctg cccgccaccc 10740
tccgggccgt tgcttcgcaa cgttcaaatc cgctcccggc ggatttgtcc tactcaggag 10800
agcgttcacc gacaaacaac agataaaacg aaaggcccag tctttcgact gagcctttcg 10860
ttttatttga tgcctggcag ttccctactc tcgcatgggg agaccccaca ctaccatcgg 10920
cgctacggcg tttcacttct gagttcggca tggggtcagg tgggaccacc gcgctactgc 10980
cgccaggcaa attctgtttt atcagaccgc ttctgcgttc tgatttaatc tgtatcaggc 11040
tgaaaatctt ctctcatccg ccaaaacagc caagcttgca tgcctgcagc ccgggttacc 11100
atttcaacag atcgtcctta gcatataagt agtcgtcaaa aatgaattca acttcgtctg 11160
tttcggcatt gtagccgcca actctgatgg attcgtggtt tttgacaatg atgtcacagc 11220
ctttttcctt taggaagtcc aagtcgaaag tagtggcaat accaatgatc ttacaaccgg 11280
cggcttttcc ggcggcaata cctgctggag cgtcttcaaa tactactacc ttagatttgg 11340
aagggtcttg ctcattgatc ggatatccta agccattcct gcccttcaga tatggttctg 11400
gatgaggctt accctgtttg acatcattag cggtaatgaa gtactttggt ctcctgattc 11460
ccagatgctc gaaccatttt tgtgccatat cacgggtacc ggaagttgcc acagcccatt 11520
tctcttttgg tagagcgttc aaagcgttgc acagcttaac tgcacctggg acttcaatgg 11580
atttttcacc gtacttgacc ggaatttcag cttctaattt gttaacatac tcttcattgg 11640
caaagtctgg agcgaactta gcaatggcat caaacgttct ccaaccatgc gagacttgga 11700
taacgtgttc agcatcgaaa taaggtttgt ccttaccgaa atccctccag aatgcagcaa 11760
tggctggttg agagatgata atggtaccgt cgacgtcgaa caaagcggcg ttaactttca 11820
aagatagagg tttagtagtc aatcccataa ttctagtctg tttcctggat ccaataaatc 11880
taatcttcat gtagatctaa ttcttcaatc atgtccggca ggttcttcat tgggtagttg 11940
ttgtaaacga tttggtatac ggcttcaaat aatgggaagt cttcgacaga gccacatgtt 12000
tccaaccatt cgtgaacttc tttgcaggta attaaacctt gagcggattg gccattcaac 12060
aactcctttt cacattccca ggcgtcctta ccagaagtag ccattagcct agcaaccttg 12120
acgtttctac caccagcgca ggtggtgatc aaatcagcaa caccagcaga ctcttggtag 12180
tatgtttctt ctctagattc tgggaaaaac atttgaccga atctgatgat ctcacccaaa 12240
ccgactcttt ggatggcagc agaagcgttg ttaccccagc ctagaccttc gacgaaacca 12300
caacctaagg caacaacgtt cttcaaagca ccacagatgg agataccagc aacatcttcg 12360
atgacactaa cgtggaagta aggtctgtgg aacaaggcct ttagaacctt atggtcgacg 12420
tccttgccct cgcctctgaa atcctttgga atgtggtaag caactgttgt ttcagaccag 12480
tgttcttgag cgacttcggt ggcaatgtta gcaccagata gagcaccaca ttgaatacct 12540
agttcctcag tgatgtaaga ggatagcaat tggacacctt tagcaccaac ttcaaaaccc 12600
tttagacagg agatagctct gacgtgtgaa tcaacatgac ctttcaattg gctacagata 12660
cggggcaaaa attgatgtgg aatgttgaaa acgatgatgt cgacatcctt gactgaatca 12720
atcaagtctg gattagcaac caaattgtcg ggtagagtga tgccaggcaa gtatttcacg 12780
ttttgatgtc tagtatttat gatttcagtc aatttttcac cattgatctc ttcttcgaac 12840
acccacattt gtactattgg agcgaaaact tctgggtatc ccttacaatt ttcggcaacc 12900
accttggcaa tagtagtacc ccagttacca gatccaatca cagtaacctt gaaaggcttt 12960
tcggcagcct tcaaagaaac agaagaggaa cttctctttc taccagcatt caagtggccg 13020
gaagttaagt ttaatctatc agcagcagca gccatggaat tgtcctcctt actagtcatg 13080
gtctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacattata cgagccggat 13140
gattaattgt caacagctca tttcagaata tttgccagaa ccgttatgat gtcggcgcaa 13200
aaaacattat ccagaacggg agtgcgcctt gagcgacacg aattatgcag tgatttacga 13260
cctgcacagc cataccacag cttccgatgg ctgcctgacg ccagaagcat tggtgcacgc 13320
tagccagtac atttaaatgg taccctctag tcaaggcctt aagtgagtcg tattacggac 13380
tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 13440
ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 13500
cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct gatgcggtat tttctcctta 13560
cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc tgctctgatg 13620
ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgagct 13669
<210>72
<211>13543
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>72
tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60
taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240
gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300
tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360
gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420
acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480
actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540
tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600
cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660
atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720
agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780
tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840
atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900
tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960
gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020
gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080
acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140
gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260
cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320
atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380
ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440
gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500
ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560
atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620
atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680
atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740
gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800
ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100
cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960
tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020
cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080
cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140
gcgagccgtc acgcccttga ctatgccaca tcctgagcaa ataattcaac cactaaacaa 4200
atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260
caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320
gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380
cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440
tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500
caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560
ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620
gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680
gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740
ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800
atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860
ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920
cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980
agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040
gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100
gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160
gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220
cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280
atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340
cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400
gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460
ctgcccagct gcacgtggcg cgcacccagt cccgtcggct cgaacgcctg ctgacggcca 5520
tggaccgcgc gcatccgctg cgcgacgcgc tcaaacgcta cagcaatcgc ctgtcggatg 5580
ccctgttctc catggcgcga atcgaagaga ctaggcctga tgcttgcgct tgaactggcc 5640
tagcaaacac agaaaaaagc ccgcacctga cagtgcgggc tttttttttc ctaggcgatc 5700
tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca cgctcgactg 5760
tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga ctatgccaca 5820
tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag gtaaccaagc 5880
ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 5940
gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 6000
acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 6060
acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 6120
acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 6180
tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 6240
aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 6300
tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 6360
tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 6420
cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 6480
gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 6540
gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 6600
ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 6660
gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 6720
agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 6780
ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 6840
gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 6900
ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 6960
agatgctgcc gggcaccgac tttattttct ccggctacag cgcggtgccg aactacgaca 7020
acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 7080
gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 7140
gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 7200
ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 7260
acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 7320
atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 7380
tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 7440
tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 7500
gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 7560
ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 7620
tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 7680
gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 7740
cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 7800
gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 7860
cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 7920
tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 7980
ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 8040
tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 8100
aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 8160
gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 8220
cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 8280
gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 8340
ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 8400
ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 8460
ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 8520
gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct 8580
gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 8640
cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 8700
cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 8760
cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 8820
tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 8880
tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 8940
cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 9000
ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 9060
tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 9120
gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 9180
gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 9240
gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 9300
ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 9360
cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 9420
aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 9480
cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 9540
tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 9600
ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 9660
cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 9720
aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 9780
cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 9840
ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 9900
gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 9960
gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 10020
ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 10080
cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 10140
taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 10200
tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttccat tcgcgatat 10260
cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 10320
ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 10380
gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 10440
tcgcgccagc ctctaggtac aaataaaaaa ggcacgtcag atgacgtgcc ttttttcttg 10500
tctagcgtgc accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tatggctgtg 10560
caggtcgtaa atcactgcat aattcgtgtc gctcaaggcg cactcccgtt ctggataatg 10620
ttttttgcgc cgacatcata acggttctgg caaatattct gaaatgagct gttgacaatt 10680
aatcatccgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca cacaggaaac 10740
agaccatgac tagtaaggag gacaattcca tggctgctgc tgctgataga ttaaacttaa 10800
cttccggcca cttgaatgct ggtagaaaga gaagttcctc ttctgtttct ttgaaggctg 10860
ccgaaaagcc tttcaaggtt actgtgattg gatctggtaa ctggggtact actattgcca 10920
aggtggttgc cgaaaattgt aagggatacc cagaagtttt cgctccaata gtacaaatgt 10980
gggtgttcga agaagagatc aatggtgaaa aattgactga aatcataaat actagacatc 11040
aaaacgtgaa atacttgcct ggcatcactc tacccgacaa tttggttgct aatccagact 11100
tgattgattc agtcaaggat gtcgacatca tcgttttcaa cattccacat caatttttgc 11160
cccgtatctg tagccaattg aaaggtcatg ttgattcaca cgtcagagct atctcctgtc 11220
taaagggttt tgaagttggt gctaaaggtg tccaattgct atcctcttac atcactgagg 11280
aactaggtat tcaatgtggt gctctatctg gtgctaacat tgccaccgaa gtcgctcaag 11340
aacactggtc tgaaacaaca gttgcttacc acattccaaa ggatttcaga ggcgagggca 11400
aggacgtcga ccataaggtt ctaaaggcct tgttccacag accttacttc cacgttagtg 11460
tcatcgaaga tgttgctggt atctccatct gtggtgcttt gaagaacgtt gttgccttag 11520
gttgtggttt cgtcgaaggt ctaggctggg gtaacaacgc ttctgctgcc atccaaagag 11580
tcggtttggg tgagatcatc agattcggtc aaatgttttt cccagaatct agagaagaaa 11640
catactacca agagtctgct ggtgttgctg atttgatcac cacctgcgct ggtggtagaa 11700
acgtcaaggt tgctaggcta atggctactt ctggtaagga cgcctgggaa tgtgaaaagg 11760
agttgttgaa tggccaatcc gctcaaggtt taattacctg caaagaagtt cacgaatggt 11820
tggaaacatg tggctctgtc gaagacttcc cattatttga agccgtatac caaatcgttt 11880
acaacaacta cccaatgaag aacctgccgg acatgattga agaattagat ctacatgaag 11940
attagattta ttggatccag gaaacagact agaattatgg gattgactac taaacctcta 12000
tctttgaaag ttaacgccgc tttgttcgac gtcgacggta ccattatcat ctctcaacca 12060
gccattgctg cattctggag ggatttcggt aaggacaaac cttatttcga tgctgaacac 12120
gttatccaag tctcgcatgg ttggagaacg tttgatgcca ttgctaagtt cgctccagac 12180
tttgccaatg aagagtatgt taacaaatta gaagctgaaa ttccggtcaa gtacggtgaa 12240
aaatccattg aagtcccagg tgcagttaag ctgtgcaacg ctttgaacgc tctaccaaaa 12300
gagaaatggg ctgtggcaac ttccggtacc cgtgatatgg cacaaaaatg gttcgagcat 12360
ctgggaatca ggagaccaaa gtacttcatt accgctaatg atgtcaaaca gggtaagcct 12420
catccagaac catatctgaa gggcaggaat ggcttaggat atccgatcaa tgagcaagac 12480
ccttccaaat ctaaggtagt agtatttgaa gacgctccag caggtattgc cgccggaaaa 12540
gccgccggtt gtaagatcat tggtattgcc actactttcg acttggactt cctaaaggaa 12600
aaaggctgtg acatcattgt caaaaaccac gaatccatca gagttggcgg ctacaatgcc 12660
gaaacagacg aagttgaatt catttttgac gactacttat atgctaagga cgatctgttg 12720
aaatggtaac ccgggctgca ggcatgcaag cttggctgtt ttggcggatg agagaagatt 12780
ttcagcctga tacagattaa atcagaacgc agaagcggtc tgataaaaca gaatttgcct 12840
ggcggcagta gcgcggtggt cccacctgac cccatgccga actcagaagt gaaacgccgt 12900
agcgccgatg gtagtgtggg gtctccccat gcgagagtag ggaactgcca ggcatcaaat 12960
aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa 13020
cgctctcctg agtaggacaa atccgccggg agcggatttg aacgttgcga agcaacggcc 13080
cggagggtgg cgggcaggac gcccgccata aactgccagg catcaaatta agcagaaggc 13140
catcctgacg gatggccttt ttgcgtttct acaaactcca gctggatcgg gcgctagagt 13200
atacatttaa atggtaccct ctagtcaagg ccttaagtga gtcgtattac ggactggccg 13260
tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 13320
cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc 13380
aacagttgcg cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc 13440
tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat 13500
agttaagcca gccccgacac ccgccaacac ccgctgacga gct 13543
<210>73
<211>13543
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>73
tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60
taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240
gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300
tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360
gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420
acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480
actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540
tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600
cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660
atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720
agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780
tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840
atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900
tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960
gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020
gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080
acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140
gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260
cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320
atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380
ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440
gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500
ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560
atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620
atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680
atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740
gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800
ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100
cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960
tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020
cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080
cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140
gcgagccgtc acgcccttga caatgccaca tcctgagcaa ataattcaac cactaaacaa 4200
atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260
caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320
gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380
cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440
tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500
caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560
ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620
gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680
gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740
ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800
atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860
ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920
cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980
agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040
gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100
gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160
gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220
cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280
atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340
cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400
gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460
ctgcccagct gcacgtggcg cgcacccagt cccgtcggct cgaacgcctg ctgacggcca 5520
tggaccgcgc gcatccgctg cgcgacgcgc tcaaacgcta cagcaatcgc ctgtcggatg 5580
ccctgttctc catggcgcga atcgaagaga ctaggcctga tgcttgcgct tgaactggcc 5640
tagcaaacac agaaaaaagc ccgcacctga cagtgcgggc tttttttttc ctaggcgatc 5700
tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca cgctcgactg 5760
tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga caatgccaca 5820
tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag gtaaccaagc 5880
ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 5940
gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 6000
acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 6060
acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 6120
acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 6180
tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 6240
aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 6300
tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 6360
tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 6420
cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 6480
gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 6540
gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 6600
ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 6660
gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 6720
agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 6780
ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 6840
gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 6900
ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 6960
agatgctgcc gggcaccgac tttattttct ccggctacag cgcggtgccg aactacgaca 7020
acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 7080
gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 7140
gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 7200
ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 7260
acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 7320
atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 7380
tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 7440
tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 7500
gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 7560
ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 7620
tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 7680
gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 7740
cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 7800
gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 7860
cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 7920
tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 7980
ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 8040
tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 8100
aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 8160
gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 8220
cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 8280
gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 8340
ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 8400
ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 8460
ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 8520
gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct 8580
gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 8640
cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 8700
cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 8760
cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 8820
tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 8880
tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 8940
cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 9000
ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 9060
tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 9120
gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 9180
gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 9240
gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 9300
ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 9360
cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 9420
aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 9480
cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 9540
tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 9600
ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 9660
cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 9720
aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 9780
cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 9840
ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 9900
gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 9960
gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 10020
ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 10080
cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 10140
taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 10200
tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttcca ttcgcgatat 10260
cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 10320
ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 10380
gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 10440
tcgcgccagc ctctaggtac aaataaaaaa ggcacgtcag atgacgtgcc ttttttcttg 10500
tctagcgtgc accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tatggctgtg 10560
caggtcgtaa atcactgcat aattcgtgtc gctcaaggcg cactcccgtt ctggataatg 10620
ttttttgcgc cgacatcata acggttctgg caaatattct gaaatgagct gttgacaatt 10680
aatcatccgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca cacaggaaac 10740
agaccatgac tagtaaggag gacaattcca tggctgctgc tgctgataga ttaaacttaa 10800
cttccggcca cttgaatgct ggtagaaaga gaagttcctc ttctgtttct ttgaaggctg 10860
ccgaaaagcc tttcaaggtt actgtgattg gatctggtaa ctggggtact actattgcca 10920
aggtggttgc cgaaaattgt aagggatacc cagaagtttt cgctccaata gtacaaatgt 10980
gggtgttcga agaagagatc aatggtgaaa aattgactga aatcataaat actagacatc 11040
aaaacgtgaa atacttgcct ggcatcactc tacccgacaa tttggttgct aatccagact 11100
tgattgattc agtcaaggat gtcgacatca tcgttttcaa cattccacat caatttttgc 11160
cccgtatctg tagccaattg aaaggtcatg ttgattcaca cgtcagagct atctcctgtc 11220
taaagggttt tgaagttggt gctaaaggtg tccaattgct atcctcttac atcactgagg 11280
aactaggtat tcaatgtggt gctctatctg gtgctaacat tgccaccgaa gtcgctcaag 11340
aacactggtc tgaaacaaca gttgcttacc acattccaaa ggatttcaga ggcgagggca 11400
aggacgtcga ccataaggtt ctaaaggcct tgttccacag accttacttc cacgttagtg 11460
tcatcgaaga tgttgctggt atctccatct gtggtgcttt gaagaacgtt gttgccttag 11520
gttgtggttt cgtcgaaggt ctaggctggg gtaacaacgc ttctgctgcc atccaaagag 11580
tcggtttggg tgagatcatc agattcggtc aaatgttttt cccagaatct agagaagaaa 11640
catactacca agagtctgct ggtgttgctg atttgatcac cacctgcgct ggtggtagaa 11700
acgtcaaggt tgctaggcta atggctactt ctggtaagga cgcctgggaa tgtgaaaagg 11760
agttgttgaa tggccaatcc gctcaaggtt taattacctg caaagaagtt cacgaatggt 11820
tggaaacatg tggctctgtc gaagacttcc cattatttga agccgtatac caaatcgttt 11880
acaacaacta cccaatgaag aacctgccgg acatgattga agaattagat ctacatgaag 11940
attagattta ttggatccag gaaacagact agaattatgg gattgactac taaacctcta 12000
tctttgaaag ttaacgccgc tttgttcgac gtcgacggta ccattatcat ctctcaacca 12060
gccattgctg cattctggag ggatttcggt aaggacaaac cttatttcga tgctgaacac 12120
gttatccaag tctcgcatgg ttggagaacg tttgatgcca ttgctaagtt cgctccagac 12180
tttgccaatg aagagtatgt taacaaatta gaagctgaaa ttccggtcaa gtacggtgaa 12240
aaatccattg aagtcccagg tgcagttaag ctgtgcaacg ctttgaacgc tctaccaaaa 12300
gagaaatggg ctgtggcaac ttccggtacc cgtgatatgg cacaaaaatg gttcgagcat 12360
ctgggaatca ggagaccaaa gtacttcatt accgctaatg atgtcaaaca gggtaagcct 12420
catccagaac catatctgaa gggcaggaat ggcttaggat atccgatcaa tgagcaagac 12480
ccttccaaat ctaaggtagt agtatttgaa gacgctccag caggtattgc cgccggaaaa 12540
gccgccggtt gtaagatcat tggtattgcc actactttcg acttggactt cctaaaggaa 12600
aaaggctgtg acatcattgt caaaaaccac gaatccatca gagttggcgg ctacaatgcc 12660
gaaacagacg aagttgaatt catttttgac gactacttat atgctaagga cgatctgttg 12720
aaatggtaac ccgggctgca ggcatgcaag cttggctgtt ttggcggatg agagaagatt 12780
ttcagcctga tacagattaa atcagaacgc agaagcggtc tgataaaaca gaatttgcct 12840
ggcggcagta gcgcggtggt cccacctgac cccatgccga actcagaagt gaaacgccgt 12900
agcgccgatg gtagtgtggg gtctccccat gcgagagtag ggaactgcca ggcatcaaat 12960
aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa 13020
cgctctcctg agtaggacaa atccgccggg agcggatttg aacgttgcga agcaacggcc 13080
cggagggtgg cgggcaggac gcccgccata aactgccagg catcaaatta agcagaaggc 13140
catcctgacg gatggccttt ttgcgtttct acaaactcca gctggatcgg gcgctagagt 13200
atacatttaa atggtaccct ctagtcaagg ccttaagtga gtcgtattac ggactggccg 13260
tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 13320
cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc 13380
aacagttgcg cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc 13440
tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat 13500
agttaagcca gccccgacac ccgccaacac ccgctgacga gct 13543
<210>74
<211>13402
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>74
tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60
taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240
gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300
tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360
gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420
acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480
actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540
tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600
cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660
atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720
agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780
tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840
atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900
tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960
gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020
gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080
acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140
gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260
cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320
atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380
ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440
gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500
ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560
atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620
atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680
atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740
gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800
ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100
cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960
tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020
cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080
cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140
gcgagccgtc acgcccttga caatgccaca tcctgagcaa ataattcaac cactaaacaa 4200
atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260
caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320
gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380
cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440
tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500
caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560
ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620
gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680
gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740
ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800
atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860
ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920
cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980
agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040
gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100
gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160
gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220
cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280
atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340
cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400
gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460
ctgcccagct gcaccctgat gcttgcgctt gaactggcct agcaaacaca gaaaaaagcc 5520
cgcacctgac agtgcgggct ttttttttcc taggcgatct gtgctgtttg ccacggtatg 5580
cagcaccagc gcgagattat gggctcgcac gctcgactgt cggacggggg cactggaacg 5640
agaagtcagg cgagccgtca cgcccttgac aatgccacat cctgagcaaa taattcaacc 5700
actaaacaaa tcaaccgcgt ttcccggagg taaccaagct tcaccttttg agccgatgaa 5760
caatgaaaag atcaaaacga tttgcagtac tggcccagcg ccccgtcaat caggacgggc 5820
tgattggcga gtggcctgaa gaggggctga tcgccatgga cagccccttt gacccggtct 5880
cttcagtaaa agtggacaac ggtctgatcg tcgaactgga cggcaaacgc cgggaccagt 5940
ttgacatgat cgaccgattt atcgccgatt acgcgatcaa cgttgagcgc acagagcagg 6000
caatgcgcct ggaggcggtg gaaatagccc gtatgctggt ggatattcac gtcagccggg 6060
aggagatcat tgccatcact accgccatca cgccggccaa agcggtcgag gtgatggcgc 6120
agatgaacgt ggtggagatg atgatggcgc tgcagaagat gcgtgcccgc cggaccccct 6180
ccaaccagtg ccacgtcacc aatctcaaag ataatccggt gcagattgcc gctgacgccg 6240
ccgaggccgg gatccgcggc ttctcagaac aggagaccac ggtcggtatc gcgcgctacg 6300
cgccgtttaa cgccctggcg ctgttggtcg gttcgcagtg cggccgcccc ggcgtgttga 6360
cgcagtgctc ggtggaagag gccaccgagc tggagctggg catgcgtggc ttaaccagct 6420
acgccgagac ggtgtcggtc tacggcaccg aagcggtatt taccgacggc gatgatacgc 6480
cgtggtcaaa ggcgttcctc gcctcggcct acgcctcccg cgggttgaaa atgcgctaca 6540
cctccggcac cggatccgaa gcgctgatgg gctattcgga gagcaagtcg atgctctacc 6600
tcgaatcgcg ctgcatcttc attactaaag gcgccggggt tcagggactg caaaacggcg 6660
cggtgagctg tatcggcatg accggcgctg tgccgtcggg cattcgggcg gtgctggcgg 6720
aaaacctgat cgcctctatg ctcgacctcg aagtggcgtc cgccaacgac cagactttct 6780
cccactcgga tattcgccgc accgcgcgca ccctgatgca gatgctgccg ggcaccgact 6840
ttattttctc cggctacagc gcggtgccga actacgacaa catgttcgcc ggctcgaact 6900
tcgatgcgga agattttgat gattacaaca tcctgcagcg tgacctgatg gttgacggcg 6960
gcctgcgtcc ggtgaccgag gcggaaacca ttgccattcg ccagaaagcg gcgcgggcga 7020
tccaggcggt tttccgcgag ctggggctgc cgccaatcgc cgacgaggag gtggaggccg 7080
ccacctacgc gcacggcagc aacgagatgc cgccgcgtaa cgtggtggag gatctgagtg 7140
cggtggaaga gatgatgaag cgcaacatca ccggcctcga tattgtcggc gcgctgagcc 7200
gcagcggctt tgaggatatc gccagcaata ttctcaatat gctgcgccag cgggtcaccg 7260
gcgattacct gcagacctcg gccattctcg atcggcagtt cgaggtggtg agtgcggtca 7320
acgacatcaa tgactatcag gggccgggca ccggctatcg catctctgcc gaacgctggg 7380
cggagatcaa aaatattccg ggcgtggttc agcccgacac cattgaataa ggcggtattc 7440
ctgtgcaaca gacaacccaa attcagccct cttttaccct gaaaacccgc gagggcgggg 7500
tagcttctgc cgatgaacgc gccgatgaag tggtgatcgg cgtcggccct gccttcgata 7560
aacaccagca tcacactctg atcgatatgc cccatggcgc gatcctcaaa gagctgattg 7620
ccggggtgga agaagagggg cttcacgccc gggtggtgcg cattctgcgc acgtccgacg 7680
tctcctttat ggcctgggat gcggccaacc tgagcggctc ggggatcggc atcggtatcc 7740
agtcgaaggg gaccacggtc atccatcagc gcgatctgct gccgctcagc aacctggagc 7800
tgttctccca ggcgccgctg ctgacgctgg agacctaccg gcagattggc aaaaacgctg 7860
cgcgctatgc gcgcaaagag tcaccttcgc cggtgccggt ggtgaacgat cagatggtgc 7920
ggccgaaatt tatggccaaa gccgcgctat ttcatatcaa agagaccaaa catgtggtgc 7980
aggacgccga gcccgtcacc ctgcacatcg acttagtaag ggagtgacca tgagcgagaa 8040
aaccatgcgc gtgcaggatt atccgttagc cacccgctgc ccggagcata tcctgacgcc 8100
taccggcaaa ccattgaccg atattaccct cgagaaggtg ctctctggcg aggtgggccc 8160
gcaggatgtg cggatctccc gccagaccct tgagtaccag gcgcagattg ccgagcagat 8220
gcagcgccat gcggtggcgc gcaatttccg ccgcgcggcg gagcttatcg ccattcctga 8280
cgagcgcatt ctggctatct ataacgcgct gcgcccgttc cgctcctcgc aggcggagct 8340
gctggcgatc gccgacgagc tggagcacac ctggcatgcg acagtgaatg ccgcctttgt 8400
ccgggagtcg gcggaagtgt atcagcagcg gcataagctg cgtaaaggaa gctaagcgga 8460
ggtcagcatg ccgttaatag ccgggattga tatcggcaac gccaccaccg aggtggcgct 8520
ggcgtccgac tacccgcagg cgagggcgtt tgttgccagc gggatcgtcg cgacgacggg 8580
catgaaaggg acgcgggaca atatcgccgg gaccctcgcc gcgctggagc aggccctggc 8640
gaaaacaccg tggtcgatga gcgatgtctc tcgcatctat cttaacgaag ccgcgccggt 8700
gattggcgat gtggcgatgg agaccatcac cgagaccatt atcaccgaat cgaccatgat 8760
cggtcataac ccgcagacgc cgggcggggt gggcgttggc gtggggacga ctatcgccct 8820
cgggcggctg gcgacgctgc cggcggcgca gtatgccgag gggtggatcg tactgattga 8880
cgacgccgtc gatttccttg acgccgtgtg gtggctcaat gaggcgctcg accgggggat 8940
caacgtggtg gcggcgatcc tcaaaaagga cgacggcgtg ctggtgaaca accgcctgcg 9000
taaaaccctg ccggtggtgg atgaagtgac gctgctggag caggtccccg agggggtaat 9060
ggcggcggtg gaagtggccg cgccgggcca ggtggtgcgg atcctgtcga atccctacgg 9120
gatcgccacc ttcttcgggc taagcccgga agagacccag gccatcgtcc ccatcgcccg 9180
cgccctgatt ggcaaccgtt ccgcggtggt gctcaagacc ccgcaggggg atgtgcagtc 9240
gcgggtgatc ccggcgggca acctctacat tagcggcgaa aagcgccgcg gagaggccga 9300
tgtcgccgag ggcgcggaag ccatcatgca ggcgatgagc gcctgcgctc cggtacgcga 9360
catccgcggc gaaccgggca cccacgccgg cggcatgctt gagcgggtgc gcaaggtaat 9420
ggcgtccctg accggccatg agatgagcgc gatatacatc caggatctgc tggcggtgga 9480
tacgtttatt ccgcgcaagg tgcagggcgg gatggccggc gagtgcgcca tggagaatgc 9540
cgtcgggatg gcggcgatgg tgaaagcgga tcgtctgcaa atgcaggtta tcgcccgcga 9600
actgagcgcc cgactgcaga ccgaggtggt ggtgggcggc gtggaggcca acatggccat 9660
cgccggggcg ttaaccactc ccggctgtgc ggcgccgctg gcgatcctcg acctcggcgc 9720
cggctcgacg gatgcggcga tcgtcaacgc ggaggggcag ataacggcgg tccatctcgc 9780
cggggcgggg aatatggtca gcctgttgat taaaaccgag ctgggcctcg aggatctttc 9840
gctggcggaa gcgataaaaa aatacccgct ggccaaagtg gaaagcctgt tcagtattcg 9900
tcacgagaat ggcgcggtgg agttctttcg ggaagccctc agcccggcgg tgttcgccaa 9960
agtggtgtac atcaaggagg gcgaactggt gccgatcgat aacgccagcc cgctggaaaa 10020
aattcgtctc gtgcgccggc aggcgaaaga gaaagtgttt gtcaccaact gcctgcgcgc 10080
gctgcgccag gtctcacccg gcggttccat tcgcgatatc gcctttgtgg tgctggtggg 10140
cggctcatcg ctggactttg agatcccgca gcttatcacg gaagccttgt cgcactatgg 10200
cgtggtcgcc gggcagggca atattcgggg aacagaaggg ccgcgcaatg cggtcgccac 10260
cgggctgcta ctggccggtc aggcgaatta aacgggcgct cgcgccagcc tctaggtaca 10320
aataaaaaag gcacgtcaga tgacgtgcct tttttcttgt ctagcgtgca ccaatgcttc 10380
tggcgtcagg cagccatcgg aagctgtggt atggctgtgc aggtcgtaaa tcactgcata 10440
attcgtgtcg ctcaaggcgc actcccgttc tggataatgt tttttgcgcc gacatcataa 10500
cggttctggc aaatattctg aaatgagctg ttgacaatta atcatccggc tcgtataatg 10560
tgtggaattg tgagcggata acaatttcac acaggaaaca gaccatgact agtaaggagg 10620
acaattccat ggctgctgct gctgatagat taaacttaac ttccggccac ttgaatgctg 10680
gtagaaagag aagttcctct tctgtttctt tgaaggctgc cgaaaagcct ttcaaggtta 10740
ctgtgattgg atctggtaac tggggtacta ctattgccaa ggtggttgcc gaaaattgta 10800
agggataccc agaagttttc gctccaatag tacaaatgtg ggtgttcgaa gaagagatca 10860
atggtgaaaa attgactgaa atcataaata ctagacatca aaacgtgaaa tacttgcctg 10920
gcatcactct acccgacaat ttggttgcta atccagactt gattgattca gtcaaggatg 10980
tcgacatcat cgttttcaac attccacatc aatttttgcc ccgtatctgt agccaattga 11040
aaggtcatgt tgattcacac gtcagagcta tctcctgtct aaagggtttt gaagttggtg 11100
ctaaaggtgt ccaattgcta tcctcttaca tcactgagga actaggtatt caatgtggtg 11160
ctctatctgg tgctaacatt gccaccgaag tcgctcaaga acactggtct gaaacaacag 11220
ttgcttacca cattccaaag gatttcagag gcgagggcaa ggacgtcgac cataaggttc 11280
taaaggcctt gttccacaga ccttacttcc acgttagtgt catcgaagat gttgctggta 11340
tctccatctg tggtgctttg aagaacgttg ttgccttagg ttgtggtttc gtcgaaggtc 11400
taggctgggg taacaacgct tctgctgcca tccaaagagt cggtttgggt gagatcatca 11460
gattcggtca aatgtttttc ccagaatcta gagaagaaac atactaccaa gagtctgctg 11520
gtgttgctga tttgatcacc acctgcgctg gtggtagaaa cgtcaaggtt gctaggctaa 11580
tggctacttc tggtaaggac gcctgggaat gtgaaaagga gttgttgaat ggccaatccg 11640
ctcaaggttt aattacctgc aaagaagttc acgaatggtt ggaaacatgt ggctctgtcg 11700
aagacttccc attatttgaa gccgtatacc aaatcgttta caacaactac ccaatgaaga 11760
acctgccgga catgattgaa gaattagatc tacatgaaga ttagatttat tggatccagg 11820
aaacagacta gaattatggg attgactact aaacctctat ctttgaaagt taacgccgct 11880
ttgttcgacg tcgacggtac cattatcatc tctcaaccag ccattgctgc attctggagg 11940
gatttcggta aggacaaacc ttatttcgat gctgaacacg ttatccaagt ctcgcatggt 12000
tggagaacgt ttgatgccat tgctaagttc gctccagact ttgccaatga agagtatgtt 12060
aacaaattag aagctgaaat tccggtcaag tacggtgaaa aatccattga agtcccaggt 12120
gcagttaagc tgtgcaacgc tttgaacgct ctaccaaaag agaaatgggc tgtggcaact 12180
tccggtaccc gtgatatggc acaaaaatgg ttcgagcatc tgggaatcag gagaccaaag 12240
tacttcatta ccgctaatga tgtcaaacag ggtaagcctc atccagaacc atatctgaag 12300
ggcaggaatg gcttaggata tccgatcaat gagcaagacc cttccaaatc taaggtagta 12360
gtatttgaag acgctccagc aggtattgcc gccggaaaag ccgccggttg taagatcatt 12420
ggtattgcca ctactttcga cttggacttc ctaaaggaaa aaggctgtga catcattgtc 12480
aaaaaccacg aatccatcag agttggcggc tacaatgccg aaacagacga agttgaattc 12540
atttttgacg actacttata tgctaaggac gatctgttga aatggtaacc cgggctgcag 12600
gcatgcaagc ttggctgttt tggcggatga gagaagattt tcagcctgat acagattaaa 12660
tcagaacgca gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc 12720
ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtgggg 12780
tctccccatg cgagagtagg gaactgccag gcatcaaata aaacgaaagg ctcagtcgaa 12840
agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctcctga gtaggacaaa 12900
tccgccggga gcggatttga acgttgcgaa gcaacggccc ggagggtggc gggcaggacg 12960
cccgccataa actgccaggc atcaaattaa gcagaaggcc atcctgacgg atggcctttt 13020
tgcgtttcta caaactccag ctggatcggg cgctagagta tacatttaaa tggtaccctc 13080
tagtcaaggc cttaagtgag tcgtattacg gactggccgt cgttttacaa cgtcgtgact 13140
gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 13200
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 13260
gcgaatggcg cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca 13320
tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc 13380
cgccaacacc cgctgacgag ct 13402
<210>75
<211>110
<212>DNA
<213>人工序列
<220>
<223>引物
<400>75
gcagtacaaa tgttacgggg taccggcgcg ccgctagctt aattaacgga ccgatgcatg 60
agctcacgcg taccggtgct cttcgatcta cgtaagaagg ccttcctatc 110
<210>76
<211>110
<212>DNA
<213>人工序列
<220>
<223>引物
<400>76
gataggaagg ccttcttacg tagatcgaag agcaccggta cgcgtgagct catgcatcgg 60
tccgttaatt aagctagcgg cgcgccggta ccccgtaaca tttgtactgc 110
<210>77
<211>77
<212>DNA
<213>人工序列
<220>
<223>片段
<400>77
cggcgcgccg ctagcttaat taacggaccg atgcatgagc tcacgcgtac cggtgctctt 60
cgatctacgt aagaagg 77
<210>78
<211>13611
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>78
aagtgagtcg tattacggac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 60
cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 120
agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct 180
gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct 240
cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc 300
tgacgagctt agtaaagccc tcgctagatt ttaatgcgga tgttgcgatt acttcgccaa 360
ctattgcgat aacaagaaaa agccagcctt tcatgatata tctcccaatt tgtgtagggc 420
ttattatgca cgcttaaaaa taataaaagc agacttgacc tgatagtttg gctgtgagca 480
attatgtgct tagtgcatct aacgcttgag ttaagccgcg ccgcgaagcg gcgtcggctt 540
gaacgaattg ttagacatta tttgccgact accttggtga tctcgccttt cacgtagtgg 600
acaaattctt ccaactgatc tgcgcgcgag gccaagcgat cttcttcttg tccaagataa 660
gcctgtctag cttcaagtat gacgggctga tactgggccg gcaggcgctc cattgcccag 720
tcggcagcga catccttcgg cgcgattttg ccggttactg cgctgtacca aatgcgggac 780
aacgtaagca ctacatttcg ctcatcgcca gcccagtcgg gcggcgagtt ccatagcgtt 840
aaggtttcat ttagcgcctc aaatagatcc tgttcaggaa ccggatcaaa gagttcctcc 900
gccgctggac ctaccaaggc aacgctatgt tctcttgctt ttgtcagcaa gatagccaga 960
tcaatgtcga tcgtggctgg ctcgaagata cctgcaagaa tgtcattgcg ctgccattct 1020
ccaaattgca gttcgcgctt agctggataa cgccacggaa tgatgtcgtc gtgcacaaca 1080
atggtgactt ctacagcgcg gagaatctcg ctctctccag gggaagccga agtttccaaa 1140
aggtcgttga tcaaagctcg ccgcgttgtt tcatcaagcc ttacggtcac cgtaaccagc 1200
aaatcaatat cactgtgtgg cttcaggccg ccatccactg cggagccgta caaatgtacg 1260
gccagcaacg tcggttcgag atggcgctcg atgacgccaa ctacctctga tagttgagtc 1320
gatacttcgg cgatcaccgc ttccctcatg atgtttaact ttgttttagg gcgactgccc 1380
tgctgcgtaa catcgttgct gctccataac atcaaacatc gacccacggc gtaacgcgct 1440
tgctgcttgg atgcccgagg catagactgt accccaaaaa aacagtcata acaagccatg 1500
aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga ccagttgcgt 1560
gagcgcatac gctacttgca ttacagctta cgaaccgaac aggcttatgt ccactgggtt 1620
cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc 1680
gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac gcatcgtcag 1740
gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gccctggctt 1800
caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac cccggatgaa 1860
gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca gcttctgtat 1920
ggaacgggca tgcggatcag tgagggtttg caactgcggg tcaaggatct ggatttcgat 1980
cacggcacga tcatcgtgcg ggagggcaag ggctccaagg atcgggcctt gatgttaccc 2040
gagagcttgg cacccagcct gcgcgagcag gggaattaat tcccacgggt tttgctgccc 2100
gcaaacgggc tgttctggtg ttgctagttt gttatcagaa tcgcagatcc ggcttcagcc 2160
ggtttgccgg ctgaaagcgc tatttcttcc agaattgcca tgattttttc cccacgggag 2220
gcgtcactgg ctcccgtgtt gtcggcagct ttgattcgat aagcagcatc gcctgtttca 2280
ggctgtctat gtgtgactgt tgagctgtaa caagttgtct caggtgttca atttcatgtt 2340
ctagttgctt tgttttactg gtttcacctg ttctattagg tgttacatgc tgttcatctg 2400
ttacattgtc gatctgttca tggtgaacag ctttgaatgc accaaaaact cgtaaaagct 2460
ctgatgtatc tatctttttt acaccgtttt catctgtgca tatggacagt tttccctttg 2520
atatgtaacg gtgaacagtt gttctacttt tgtttgttag tcttgatgct tcactgatag 2580
atacaagagc cataagaacc tcagatcctt ccgtatttag ccagtatgtt ctctagtgtg 2640
gttcgttgtt tttgcgtgag ccatgagaac gaaccattga gatcatactt actttgcatg 2700
tcactcaaaa attttgcctc aaaactggtg agctgaattt ttgcagttaa agcatcgtgt 2760
agtgtttttc ttagtccgtt atgtaggtag gaatctgatg taatggttgt tggtattttg 2820
tcaccattca tttttatctg gttgttctca agttcggtta cgagatccat ttgtctatct 2880
agttcaactt ggaaaatcaa cgtatcagtc gggcggcctc gcttatcaac caccaatttc 2940
atattgctgt aagtgtttaa atctttactt attggtttca aaacccattg gttaagcctt 3000
ttaaactcat ggtagttatt ttcaagcatt aacatgaact taaattcatc aaggctaatc 3060
tctatatttg ccttgtgagt tttcttttgt gttagttctt ttaataacca ctcataaatc 3120
ctcatagagt atttgttttc aaaagactta acatgttcca gattatattt tatgaatttt 3180
tttaactgga aaagataagg caatatctct tcactaaaaa ctaattctaa tttttcgctt 3240
gagaacttgg catagtttgt ccactggaaa atctcaaagc ctttaaccaa aggattcctg 3300
atttccacag ttctcgtcat cagctctctg gttgctttag ctaatacacc ataagcattt 3360
tccctactga tgttcatcat ctgagcgtat tggttataag tgaacgatac cgtccgttct 3420
ttccttgtag ggttttcaat cgtggggttg agtagtgcca cacagcataa aattagcttg 3480
gtttcatgct ccgttaagtc atagcgacta atcgctagtt catttgcttt gaaaacaact 3540
aattcagaca tacatctcaa ttggtctagg tgattttaat cactatacca attgagatgg 3600
gctagtcaat gataattact agctagtcct tttcctttga gttgtgggta tctgtaaatt 3660
ctgctagacc tttgctggaa aacttgtaaa ttctgctaga ccctctgtaa attccgctag 3720
acctttgtgt gttttttttg tttatattca agtggttata atttatagaa taaagaaaga 3780
ataaaaaaag ataaaaagaa tagatcccag ccctgtgtat aactcactac tttagtcagt 3840
tccgcagtat tacaaaagga tgtcgcaaac gctgtttgct cctctacaaa acagacctta 3900
aaaccctaaa ggcttaagta gcaccctcgc aagctcgggc aaatcgctga atattccttt 3960
tgtctccgac catcaggcac ctgagtcgct gtctttttcg tgacattcag ttcgctgcgc 4020
tcacggctct ggcagtgaat gggggtaaat ggcactacag gcgcctttta tggattcatg 4080
caaggaaact acccataata caagaaaagc ccgtcacggg cttctcaggg cgttttatgg 4140
cgggtctgct atgtggtgct atctgacttt ttgctgttca gcagttcctg ccctctgatt 4200
ttccagtctg accacttcgg attatcccgt gacaggtcat tcagactggc taatgcaccc 4260
agtaaggcag cggtatcatc aacaggctta cccgtcttac tgtcgggaat tcatttaaat 4320
agtcaaaagc ctccgaccgg aggcttttga ctgctaggcg atctgtgctg tttgccacgg 4380
tatgcagcac cagcgcgaga ttatgggctc gcacgctcga ctgtcggacg ggggcactgg 4440
aacgagaagt caggcgagcc gtcacgccct tgacaatgcc acatcctgag caaataattc 4500
aaccactaaa caaatcaacc gcgtttcccg gaggtaacca agcttgcggg agagaatgat 4560
gaacaagagc caacaagttc agacaatcac cctggccgcc gcccagcaaa tggcggcggc 4620
ggtggaaaaa aaagccactg agatcaacgt ggcggtggtg ttttccgtag ttgaccgcgg 4680
aggcaacacg ctgcttatcc agcggatgga cgaggccttc gtctccagct gcgatatttc 4740
cctgaataaa gcctggagcg cctgcagcct gaagcaaggt acccatgaaa ttacgtcagc 4800
ggtccagcca ggacaatctc tgtacggtct gcagctaacc aaccaacagc gaattattat 4860
ttttggcggc ggcctgccag ttatttttaa tgagcaggta attggcgccg tcggcgttag 4920
cggcggtacg gtcgagcagg atcaattatt agcccagtgc gccctggatt gtttttccgc 4980
attataacct gaagcgagaa ggtatattat gagctatcgt atgttccgcc aggcattctg 5040
agtgttaacg aggggaccgt catgtcgctt tcaccgccag gcgtacgcct gttttacgat 5100
ccgcgcgggc accatgccgg cgccatcaat gagctgtgct gggggctgga ggagcagggg 5160
gtcccctgcc agaccataac ctatgacgga ggcggtgacg ccgctgcgct gggcgccctg 5220
gcggccagaa gctcgcccct gcgggtgggt atcgggctca gcgcgtccgg cgagatagcc 5280
ctcactcatg cccagctgcc ggcggacgcg ccgctggcta ccggacacgt caccgatagc 5340
gacgatcaac tgcgtacgct cggcgccaac gccgggcagc tggttaaagt cctgccgtta 5400
agtgagagaa actgaatgta tcgtatctat acccgcaccg gggataaagg caccaccgcc 5460
ctgtacggcg gcagccgcat cgagaaagac catattcgcg tcgaggccta cggcaccgtc 5520
gatgaactga tatcccagct gggcgtctgc tacgccacga cccgcgacgc cgggctgcgg 5580
gaaagcctgc accatattca gcagacgctg ttcgtgctgg gggctgaact ggccagcgat 5640
gcgcggggcc tgacccgcct gagccagacg atcggcgaag aggagatcac cgccctggag 5700
cggcttatcg accgcaatat ggccgagagc ggcccgttaa aacagttcgt gatcccgggg 5760
aggaatctcg cctctgccca gctgcacgtg gcgcgcaccc agtcccgtcg gctcgaacgc 5820
ctgctgacgg ccatggaccg cgcgcatccg ctgcgcgacg cgctcaaacg ctacagcaat 5880
cgcctgtcgg atgccctgtt ctccatggcg cgaatcgaag agactaggcc tgatgcttgc 5940
gcttgaactg gcctagcaaa cacagaaaaa agcccgcacc tgacagtgcg ggcttttttt 6000
ttcctaggcg atctgtgctg tttgccacgg tatgcagcac cagcgcgaga ttatgggctc 6060
gcacgctcga ctgtcggacg ggggcactgg aacgagaagt caggcgagcc gtcacgccct 6120
tgacaatgcc acatcctgag caaataattc aaccactaaa caaatcaacc gcgtttcccg 6180
gaggtaacca agcttcacct tttgagccga tgaacaatga aaagatcaaa acgatttgca 6240
gtactggccc agcgccccgt caatcaggac gggctgattg gcgagtggcc tgaagagggg 6300
ctgatcgcca tggacagccc ctttgacccg gtctcttcag taaaagtgga caacggtctg 6360
atcgtcgaac tggacggcaa acgccgggac cagtttgaca tgatcgaccg atttatcgcc 6420
gattacgcga tcaacgttga gcgcacagag caggcaatgc gcctggaggc ggtggaaata 6480
gcccgtatgc tggtggatat tcacgtcagc cgggaggaga tcattgccat cactaccgcc 6540
atcacgccgg ccaaagcggt cgaggtgatg gcgcagatga acgtggtgga gatgatgatg 6600
gcgctgcaga agatgcgtgc ccgccggacc ccctccaacc agtgccacgt caccaatctc 6660
aaagataatc cggtgcagat tgccgctgac gccgccgagg ccgggatccg cggcttctca 6720
gaacaggaga ccacggtcgg tatcgcgcgc tacgcgccgt ttaacgccct ggcgctgttg 6780
gtcggttcgc agtgcggccg ccccggcgtg ttgacgcagt gctcggtgga agaggccacc 6840
gagctggagc tgggcatgcg tggcttaacc agctacgccg agacggtgtc ggtctacggc 6900
accgaagcgg tatttaccga cggcgatgat acgccgtggt caaaggcgtt cctcgcctcg 6960
gcctacgcct cccgcgggtt gaaaatgcgc tacacctccg gcaccggatc cgaagcgctg 7020
atgggctatt cggagagcaa gtcgatgctc tacctcgaat cgcgctgcat cttcattact 7080
aaaggcgccg gggttcaggg actgcaaaac ggcgcggtga gctgtatcgg catgaccggc 7140
gctgtgccgt cgggcattcg ggcggtgctg gcggaaaacc tgatcgcctc tatgctcgac 7200
ctcgaagtgg cgtccgccaa cgaccagact ttctcccact cggatattcg ccgcaccgcg 7260
cgcaccctga tgcagatgct gccgggcacc gactttattt tctccggcta cagcgcggtg 7320
ccgaactacg acaacatgtt cgccggctcg aacttcgatg cggaagattt tgatgattac 7380
aacatcctgc agcgtgacct gatggttgac ggcggcctgc gtccggtgac cgaggcggaa 7440
accattgcca ttcgccagaa agcggcgcgg gcgatccagg cggttttccg cgagctgggg 7500
ctgccgccaa tcgccgacga ggaggtggag gccgccacct acgcgcacgg cagcaacgag 7560
atgccgccgc gtaacgtggt ggaggatctg agtgcggtgg aagagatgat gaagcgcaac 7620
atcaccggcc tcgatattgt cggcgcgctg agccgcagcg gctttgagga tatcgccagc 7680
aatattctca atatgctgcg ccagcgggtc accggcgatt acctgcagac ctcggccatt 7740
ctcgatcggc agttcgaggt ggtgagtgcg gtcaacgaca tcaatgacta tcaggggccg 7800
ggcaccggct atcgcatctc tgccgaacgc tgggcggaga tcaaaaatat tccgggcgtg 7860
gttcagcccg acaccattga ataaggcggt attcctgtgc aacagacaac ccaaattcag 7920
ccctctttta ccctgaaaac ccgcgagggc ggggtagctt ctgccgatga acgcgccgat 7980
gaagtggtga tcggcgtcgg ccctgccttc gataaacacc agcatcacac tctgatcgat 8040
atgccccatg gcgcgatcct caaagagctg attgccgggg tggaagaaga ggggcttcac 8100
gcccgggtgg tgcgcattct gcgcacgtcc gacgtctcct ttatggcctg ggatgcggcc 8160
aacctgagcg gctcggggat cggcatcggt atccagtcga aggggaccac ggtcatccat 8220
cagcgcgatc tgctgccgct cagcaacctg gagctgttct cccaggcgcc gctgctgacg 8280
ctggagacct accggcagat tggcaaaaac gctgcgcgct atgcgcgcaa agagtcacct 8340
tcgccggtgc cggtggtgaa cgatcagatg gtgcggccga aatttatggc caaagccgcg 8400
ctatttcata tcaaagagac caaacatgtg gtgcaggacg ccgagcccgt caccctgcac 8460
atcgacttag taagggagtg accatgagcg agaaaaccat gcgcgtgcag gattatccgt 8520
tagccacccg ctgcccggag catatcctga cgcctaccgg caaaccattg accgatatta 8580
ccctcgagaa ggtgctctct ggcgaggtgg gcccgcagga tgtgcggatc tcccgccaga 8640
cccttgagta ccaggcgcag attgccgagc agatgcagcg ccatgcggtg gcgcgcaatt 8700
tccgccgcgc ggcggagctt atcgccattc ctgacgagcg cattctggct atctataacg 8760
cgctgcgccc gttccgctcc tcgcaggcgg agctgctggc gatcgccgac gagctggagc 8820
acacctggca tgcgacagtg aatgccgcct ttgtccggga gtcggcggaa gtgtatcagc 8880
agcggcataa gctgcgtaaa ggaagctaag cggaggtcag catgccgtta atagccggga 8940
ttgatatcgg caacgccacc accgaggtgg cgctggcgtc cgactacccg caggcgaggg 9000
cgtttgttgc cagcgggatc gtcgcgacga cgggcatgaa agggacgcgg gacaatatcg 9060
ccgggaccct cgccgcgctg gagcaggccc tggcgaaaac accgtggtcg atgagcgatg 9120
tctctcgcat ctatcttaac gaagccgcgc cggtgattgg cgatgtggcg atggagacca 9180
tcaccgagac cattatcacc gaatcgacca tgatcggtca taacccgcag acgccgggcg 9240
gggtgggcgt tggcgtgggg acgactatcg ccctcgggcg gctggcgacg ctgccggcgg 9300
cgcagtatgc cgaggggtgg atcgtactga ttgacgacgc cgtcgatttc cttgacgccg 9360
tgtggtggct caatgaggcg ctcgaccggg ggatcaacgt ggtggcggcg atcctcaaaa 9420
aggacgacgg cgtgctggtg aacaaccgcc tgcgtaaaac cctgccggtg gtggatgaag 9480
tgacgctgct ggagcaggtc cccgaggggg taatggcggc ggtggaagtg gccgcgccgg 9540
gccaggtggt gcggatcctg tcgaatccct acgggatcgc caccttcttc gggctaagcc 9600
cggaagagac ccaggccatc gtccccatcg cccgcgccct gattggcaac cgttccgcgg 9660
tggtgctcaa gaccccgcag ggggatgtgc agtcgcgggt gatcccggcg ggcaacctct 9720
acattagcgg cgaaaagcgc cgcggagagg ccgatgtcgc cgagggcgcg gaagccatca 9780
tgcaggcgat gagcgcctgc gctccggtac gcgacatccg cggcgaaccg ggcacccacg 9840
ccggcggcat gcttgagcgg gtgcgcaagg taatggcgtc cctgaccggc catgagatga 9900
gcgcgatata catccaggat ctgctggcgg tggatacgtt tattccgcgc aaggtgcagg 9960
gcgggatggc cggcgagtgc gccatggaga atgccgtcgg gatggcggcg atggtgaaag 10020
cggatcgtct gcaaatgcag gttatcgccc gcgaactgag cgcccgactg cagaccgagg 10080
tggtggtggg cggcgtggag gccaacatgg ccatcgccgg ggcgttaacc actcccggct 10140
gtgcggcgcc gctggcgatc ctcgacctcg gcgccggctc gacggatgcg gcgatcgtca 10200
acgcggaggg gcagataacg gcggtccatc tcgccggggc ggggaatatg gtcagcctgt 10260
tgattaaaac cgagctgggc ctcgaggatc tttcgctggc ggaagcgata aaaaaatacc 10320
cgctggccaa agtggaaagc ctgttcagta ttcgtcacga gaatggcgcg gtggagttct 10380
ttcgggaagc cctcagcccg gcggtgttcg ccaaagtggt gtacatcaag gagggcgaac 10440
tggtgccgat cgataacgcc agcccgctgg aaaaaattcg tctcgtgcgc cggcaggcga 10500
aagagaaagt gtttgtcacc aactgcctgc gcgcgctgcg ccaggtctca cccggcggtt 10560
ccattcgcga tatcgccttt gtggtgctgg tgggcggctc atcgctggac tttgagatcc 10620
cgcagcttat cacggaagcc ttgtcgcact atggcgtggt cgccgggcag ggcaatattc 10680
ggggaacaga agggccgcgc aatgcggtcg ccaccgggct gctactggcc ggtcaggcga 10740
attaaacggg cgctcgcgcc agcctctagg tacaaataaa aaaggcacgt cagatgacgt 10800
gccttttttc ttgtctagcg tgcaccaatg cttctggcgt caggcagcca tcggaagctg 10860
tggtatggct gtgcaggtcg taaatcactg cataattcgt gtcgctcaag gcgcactccc 10920
gttctggata atgttttttg cgccgacatc ataacggttc tggcaaatat tctgaaatga 10980
gctgttgaca attaatcatc cggctcgtat aatgtgtgga attgtgagcg gataacaatt 11040
tcacacagga aacagaccat gactagtaag gaggacaatt ccatggctgc tgctgctgat 11100
agattaaact taacttccgg ccacttgaat gctggtagaa agagaagttc ctcttctgtt 11160
tctttgaagg ctgccgaaaa gcctttcaag gttactgtga ttggatctgg taactggggt 11220
actactattg ccaaggtggt tgccgaaaat tgtaagggat acccagaagt tttcgctcca 11280
atagtacaaa tgtgggtgtt cgaagaagag atcaatggtg aaaaattgac tgaaatcata 11340
aatactagac atcaaaacgt gaaatacttg cctggcatca ctctacccga caatttggtt 11400
gctaatccag acttgattga ttcagtcaag gatgtcgaca tcatcgtttt caacattcca 11460
catcaatttt tgccccgtat ctgtagccaa ttgaaaggtc atgttgattc acacgtcaga 11520
gctatctcct gtctaaaggg ttttgaagtt ggtgctaaag gtgtccaatt gctatcctct 11580
tacatcactg aggaactagg tattcaatgt ggtgctctat ctggtgctaa cattgccacc 11640
gaagtcgctc aagaacactg gtctgaaaca acagttgctt accacattcc aaaggatttc 11700
agaggcgagg gcaaggacgt cgaccataag gttctaaagg ccttgttcca cagaccttac 11760
ttccacgtta gtgtcatcga agatgttgct ggtatctcca tctgtggtgc tttgaagaac 11820
gttgttgcct taggttgtgg tttcgtcgaa ggtctaggct ggggtaacaa cgcttctgct 11880
gccatccaaa gagtcggttt gggtgagatc atcagattcg gtcaaatgtt tttcccagaa 11940
tctagagaag aaacatacta ccaagagtct gctggtgttg ctgatttgat caccacctgc 12000
gctggtggta gaaacgtcaa ggttgctagg ctaatggcta cttctggtaa ggacgcctgg 12060
gaatgtgaaa aggagttgtt gaatggccaa tccgctcaag gtttaattac ctgcaaagaa 12120
gttcacgaat ggttggaaac atgtggctct gtcgaagact tcccattatt tgaagccgta 12180
taccaaatcg tttacaacaa ctacccaatg aagaacctgc cggacatgat tgaagaatta 12240
gatctacatg aagattagat ttattggatc caggaaacag actagaatta tgggattgac 12300
tactaaacct ctatctttga aagttaacgc cgctttgttc gacgtcgacg gtaccattat 12360
catctctcaa ccagccattg ctgcattctg gagggatttc ggtaaggaca aaccttattt 12420
cgatgctgaa cacgttatcc aagtctcgca tggttggaga acgtttgatg ccattgctaa 12480
gttcgctcca gactttgcca atgaagagta tgttaacaaa ttagaagctg aaattccggt 12540
caagtacggt gaaaaatcca ttgaagtccc aggtgcagtt aagctgtgca acgctttgaa 12600
cgctctacca aaagagaaat gggctgtggc aacttccggt acccgtgata tggcacaaaa 12660
atggttcgag catctgggaat caggagacc aaagtacttc attaccgcta atgatgtcaa 12720
acagggtaag cctcatccag aaccatatct gaagggcagg aatggcttag gatatccgat 12780
caatgagcaa gacccttcca aatctaaggt agtagtattt gaagacgctc cagcaggtat 12840
tgccgccgga aaagccgccg gttgtaagat cattggtatt gccactactt tcgacttgga 12900
cttcctaaag gaaaaaggct gtgacatcat tgtcaaaaac cacgaatcca tcagagttgg 12960
cggctacaat gccgaaacag acgaagttga attcattttt gacgactact tatatgctaa 13020
ggacgatctg ttgaaatggt aacccgggct gcaggcatgc aagcttggct gttttggcgg 13080
atgagagaag attttcagcc tgatacagat taaatcagaa cgcagaagcg gtctgataaa 13140
acagaatttg cctggcggca gtagcgcggt ggtcccacct gaccccatgc cgaactcaga 13200
agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc catgcgagag tagggaactg 13260
ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 13320
gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gggagcggat ttgaacgttg 13380
cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa 13440
ttaagcagaa ggccatcctg acggatggcc tttttgcgtt tctacaaact ccagctggat 13500
cgggcgctag agtatacatt taaatggtac cggcgcgccg ctagcttaat taacggaccg 13560
atgcatgagc tcacgcgtac cggtgctctt cgatctacgt aagaaggcct t 13611
<210>79
<211>4490
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>79
tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60
taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240
gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300
tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360
gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420
acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480
actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540
tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600
cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660
atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720
agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780
tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840
atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900
tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960
gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020
gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080
acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140
gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260
cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320
atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380
ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440
gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500
ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560
atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620
atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680
atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740
gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800
ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100
cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900
acttcggatt atcccgtga caggtcattca gactggctaa tgcacccagt aaggcagcgg 3960
tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020
cgaccggagg cttttgactg ctagcaaaca cagaaaaaag cccgcacctg acagtgcggg 4080
cttttttttt cctaggtaca aataaaaaag gcacgtcaga tgacgtgcct tttttcttgt 4140
ctagagtata catttaaatg gtaccctcta gtcaaggcct taagtgagtc gtattacgga 4200
ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca acttaatcgc 4260
cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg caccgatcgc 4320
ccttcccaac agttgcgcag cctgaatggc gaatggcgcc tgatgcggta ttttctcctt 4380
acgcatctgt gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat 4440
gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgagct 4490
<210>80
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>80
cataagcttg cgggagagaa tgatgaacaa gag 33
<210>81
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>81
acgcctaggc cagttcaagc gcaagcatca g 31
<210>82
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>82
ctttaatctg cacaccccaa cccgc 25
<210>83
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>83
ggcggtatca atcgagcgat aaccc 25
Claims (13)
1.一种分离或重组多核苷酸,包含了编码浅青紫链霉菌葡萄糖异构酶变体的核酸序列,该核酸序列包括SEQ ID NOs:9-28中的任意一个。
2.一种分离或重组多核苷酸,包含了编码浅青紫链霉菌葡萄糖异构酶变体的核酸序列,该核酸序列选自SEQ ID NOs:9-28。
3.一个包含了编码浅青紫链霉菌葡萄糖异构酶变体的核酸序列的分离或重组多核苷酸文库,该文库包括SRQ ID NOs:9-28的核酸序列。
4.一种表达盒,其包含的多核苷酸具有编码权利要求1的浅青紫链霉菌葡萄糖异构酶变体的核酸序列。
5.一种试剂盒,其包含的多核苷酸具有编码权利要求1的浅青紫链霉菌葡萄糖异构酶变体的核酸序列。
6.一种DNA构建体,包含至少三个转录终止子和至少一个位于任意两个转录终止子之间的克隆位点。
7.权利要求6的DNA构建体,其中转录终止子为tonB、thrA或aspA,克隆位点选自AvrII、NheI、BfaI、Cac8I、BsaJI和StyI。
8.一个DNA构建体文库,各DNA构建体均包含至少三个转录终止子和至少一个位于任意两个转录终止子之间的克隆位点。
9.一种DNA构建体,选自下组
(a)由SEQ ID NO:30组成的pSYCO109mcs质粒,
(b)由SEQ ID NO:31组成的短1.5GI启动子的DNA构建体,
(c)由SEQ ID NO:32组成的短1.20GI启动子的DNA构建体,
(d)由SEQ ID NO:70组成的pAH105质粒的DNA构建体,
(e)由SEQ ID NO:71组成的pSYCO101质粒的DNA构建体,
(f)由SEQ ID NO:72组成的pSYCO103质粒的DNA构建体,
(g)由SEQ ID NO:73组成的pSYCO106质粒的DNA构建体,
(h)由SEQ ID NO:74组成的pSYCO109质粒的DNA构建体,
(i)由SEQ ID NO:78组成的pSYCO106mcs质粒的DNA构建体,
(j)由SEQ ID NO:79组成的pRJ50质粒的DNA构建体,
10.一种具有多克隆位点的载体,含有特异于限制性内切酶AscI、NheI、PacI、RsrII、NsiI、SacII、MluI、AgeI、SapI和SnaBI的限制性识别位点序列。
11.权利要求10的载体,其中多克隆位点具有SEQ ID NO:77的核苷酸序列。
12.一种转化的宿主细胞,包含了编码权利要求1或9的浅青紫链霉菌葡萄糖异构酶变体的多核苷酸。
13.权利要求12的转化的宿主细胞,其中宿主细胞为RJ8n。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US37493102P | 2002-04-22 | 2002-04-22 | |
US60/374,931 | 2002-04-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1646680A true CN1646680A (zh) | 2005-07-27 |
CN100366730C CN100366730C (zh) | 2008-02-06 |
Family
ID=29251224
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB038091224A Expired - Fee Related CN100366730C (zh) | 2002-04-22 | 2003-04-22 | 用于遗传工程的启动子和质粒系统 |
Country Status (9)
Country | Link |
---|---|
US (5) | US8192959B2 (zh) |
EP (2) | EP2374879A3 (zh) |
JP (3) | JP2005523020A (zh) |
KR (1) | KR20040104581A (zh) |
CN (1) | CN100366730C (zh) |
AU (1) | AU2003225123A1 (zh) |
CA (1) | CA2481414C (zh) |
MX (1) | MXPA04010366A (zh) |
WO (1) | WO2003089621A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110066820A (zh) * | 2019-04-29 | 2019-07-30 | 华南农业大学 | 一种荧光菌株E.coli C600及构建方法与应用 |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MXPA04010366A (es) * | 2002-04-22 | 2005-02-17 | Du Pont | Sistema promotor y plasmido para ingenieria genetica. |
WO2004033421A2 (en) * | 2002-10-04 | 2004-04-22 | Genencor International, Inc. | Improved production of bacterial strains |
KR101148255B1 (ko) * | 2002-10-04 | 2012-08-08 | 다니스코 유에스 인크. | 고수율을 갖는 1,3-프로판디올의 생물학적 제조 방법 |
US9297028B2 (en) | 2005-09-29 | 2016-03-29 | Butamax Advanced Biofuels Llc | Fermentive production of four carbon alcohols |
US20080274526A1 (en) | 2007-05-02 | 2008-11-06 | Bramucci Michael G | Method for the production of isobutanol |
UA96928C2 (ru) | 2005-10-26 | 2011-12-26 | Э.И. Дю Пон Де Немур Энд Компани | Ферментативное продуцирование спиртов с четырьмя атомами углерода |
US8962298B2 (en) | 2006-05-02 | 2015-02-24 | Butamax Advanced Biofuels Llc | Recombinant host cell comprising a diol dehydratase |
EP2195435B1 (en) | 2007-09-12 | 2012-10-10 | Danisco US Inc. | Trichoderma promoter |
SG162265A1 (en) | 2007-12-13 | 2010-07-29 | Danisco Us Inc | Compositions and methods for producing isoprene |
US8173410B2 (en) | 2008-04-23 | 2012-05-08 | Danisco Us Inc. | Isoprene synthase variants for improved microbial production of isoprene |
MY156256A (en) * | 2008-07-02 | 2016-01-29 | Danisco Us Inc | Compositions and methods for producing isoprene free of c5 hydrocarbons under decoupling conditions and/or safe operating ranges |
CA2729839A1 (en) * | 2008-07-03 | 2010-01-07 | Diane Retallack | High throughput screening method and use thereof to identify a production platform for a multifunctional binding protein |
BRPI0918453A2 (pt) | 2008-09-15 | 2019-12-17 | Danisco Us Inc | sistemas usando cultura de células para a produção de isopreno |
WO2010031062A1 (en) | 2008-09-15 | 2010-03-18 | Danisco Us Inc. | Increased isoprene production using the archaeal lower mevalonate pathway |
SG169640A1 (en) * | 2008-09-15 | 2011-04-29 | Danisco Us Inc | Increased isoprene production using mevalonate kinase and isoprene synthase |
WO2010031068A1 (en) * | 2008-09-15 | 2010-03-18 | Danisco Us Inc. | Reduction of carbon dioxide emission during isoprene production by fermentation |
CA2737195A1 (en) * | 2008-09-15 | 2010-03-18 | The Goodyear Tire & Rubber Company | Conversion of prenyl derivatives to isoprene |
US8652823B2 (en) | 2008-12-03 | 2014-02-18 | Butamax(Tm) Advanced Biofuels Llc | Strain for butanol production with increased membrane unsaturated trans fatty acids |
CA2748887A1 (en) | 2008-12-30 | 2010-07-08 | Danisco Us Inc. | Methods of producing isoprene and a co-product |
WO2010124146A2 (en) | 2009-04-23 | 2010-10-28 | Danisco Us Inc. | Three-dimensional structure of isoprene synthase and its use thereof for generating variants |
TW201120213A (en) | 2009-06-17 | 2011-06-16 | Danisco Us Inc | Polymerization of isoprene from renewable resources |
TW201412988A (zh) * | 2009-06-17 | 2014-04-01 | Danisco Us Inc | 使用dxp及mva途徑之改良之異戊二烯製造 |
TWI434921B (zh) | 2009-06-17 | 2014-04-21 | Danisco Us Inc | 從生物異戊二烯組合物製造燃料成分之方法及系統 |
US20110143408A1 (en) * | 2009-06-18 | 2011-06-16 | E. I. Du Pont De Nemours And Company | Zymomonas with improved arabinose utilization |
US8852903B2 (en) | 2009-10-23 | 2014-10-07 | E I Du Pont De Nemours And Company | Co-metabolism of fructose and glucose in microbial production strains |
US20110136190A1 (en) | 2009-12-04 | 2011-06-09 | E. I. Du Pont De Nemours And Company | Recombinant bacteria for producing glycerol and glycerol-derived products from sucrose |
BR112012015117A2 (pt) * | 2009-12-22 | 2019-09-24 | Danisco Us Inc | "biorreator de membrana para produção aumentada de gás isopreno" |
WO2011079314A2 (en) | 2009-12-23 | 2011-06-30 | Danisco Us Inc. | Compositions and methods of pgl for the increased production of isoprene |
US8933282B2 (en) | 2010-06-17 | 2015-01-13 | Danisco Us Inc. | Fuel compositions comprising isoprene derivatives |
CN103443271A (zh) | 2010-10-27 | 2013-12-11 | 丹尼斯科美国公司 | 用于增加异戊二烯产量的异戊二烯合酶变体 |
US8129170B1 (en) | 2010-12-06 | 2012-03-06 | E.I. Du Pont De Nemours And Company | Recombinant bacteria having the ability to metabolize sucrose |
US8691541B2 (en) | 2010-12-22 | 2014-04-08 | Danisco Us Inc. | Biological production of pentose sugars using recombinant cells |
WO2012088462A1 (en) | 2010-12-22 | 2012-06-28 | Danisco Us Inc. | Compositions and methods for improved isoprene production using two types of ispg enzymes |
DK2788491T3 (en) | 2011-12-09 | 2019-04-01 | Danisco Us Inc | RIBOSOMAL PROMOTERS FROM B. SUBTILIS FOR PROTEIN PRODUCTION IN MICRO-ORGANISMS |
US9017961B2 (en) | 2012-03-05 | 2015-04-28 | E.I. Du Pont De Nemours And Company | Recombinant bacteria comprising novel sucrose transporters |
US8686114B2 (en) | 2012-03-05 | 2014-04-01 | E I Du Pont De Nemours And Company | Variant sucrose transporter polypeptides |
US9163263B2 (en) | 2012-05-02 | 2015-10-20 | The Goodyear Tire & Rubber Company | Identification of isoprene synthase variants with improved properties for the production of isoprene |
AU2015207472B2 (en) * | 2014-01-20 | 2018-11-22 | Octapharma Ag | A process for manufacturing factor VIII having an improved ratio of FVIII:C/FVIII:Ag |
WO2015115610A1 (ja) * | 2014-01-31 | 2015-08-06 | 国立大学法人徳島大学 | 発現カセット |
BR112017000621B1 (pt) * | 2014-07-11 | 2024-03-12 | Pioneer Hi-Bred International, Inc | Método para melhorar um traço agronômico de uma planta de milho ou de soja |
ES2778727T3 (es) | 2014-08-25 | 2020-08-11 | Geneweave Biosciences Inc | Partículas de transducción no replicativas y sistemas indicadores basados en partículas de transducción |
CN109071615A (zh) | 2016-03-04 | 2018-12-21 | 丹尼斯科美国公司 | 用于在微生物中产生蛋白质的工程化核糖体启动子 |
US11008602B2 (en) | 2017-12-20 | 2021-05-18 | Roche Molecular Systems, Inc. | Non-replicative transduction particles and transduction particle-based reporter systems |
CN108118058B (zh) * | 2017-12-29 | 2021-06-29 | 苏州金唯智生物科技有限公司 | 一种改进的启动子及其应用 |
CN108118059B (zh) * | 2017-12-30 | 2021-03-19 | 苏州金唯智生物科技有限公司 | 一种改进的启动子及其组成的载体和应用 |
CN110438138A (zh) * | 2019-07-04 | 2019-11-12 | 深圳市深研生物科技有限公司 | 质粒载体 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06153964A (ja) * | 1992-11-20 | 1994-06-03 | Nakano Vinegar Co Ltd | プラスミド pMVC18 |
JP3535535B2 (ja) * | 1993-02-26 | 2004-06-07 | 天野エンザイム株式会社 | 糸状菌の形質転換用プラスミドおよびそれを用いた糸状菌の育種法 |
JP3383341B2 (ja) * | 1993-02-26 | 2003-03-04 | 天野エンザイム株式会社 | 糸状菌および酵母で使用可能なポリペプチド発現用プラスミドおよびそれを用いたポリペプチドの製造法 |
US5547862A (en) | 1993-07-29 | 1996-08-20 | Ambion Inc. | Vectors containing multiple promoters in the same orientation |
JP3556965B2 (ja) * | 1993-11-08 | 2004-08-25 | 天野エンザイム株式会社 | 糸状菌および酵母で使用可能なポリペプチド分泌発現用プラスミドおよびそれを用いたポリペプチドの製造法 |
US5633362A (en) | 1995-05-12 | 1997-05-27 | E. I. Du Pont De Nemours And Company | Production of 1,3-propanediol from glycerol by recombinant bacteria expressing recombinant diol dehydratase |
US5599689A (en) | 1995-05-12 | 1997-02-04 | E. I. Du Pont De Nemours And Company | Process for making 1,3-propanediol from carbohydrates using mixed microbial cultures |
US5686276A (en) * | 1995-05-12 | 1997-11-11 | E. I. Du Pont De Nemours And Company | Bioconversion of a fermentable carbon source to 1,3-propanediol by a single microorganism |
JPH09322779A (ja) * | 1996-04-01 | 1997-12-16 | Nippon Steel Corp | Dna結合性タンパク質のスクリーニング法およびそれに用いられるプラスミド並びにdna結合性タンパク質 |
DE69739121D1 (de) * | 1996-08-23 | 2009-01-02 | Peter Ruhdal Jensen | Künstliche promotorbibliotheken für ausgewählte organismen sowie daraus entstammende promotoren |
ATE452979T1 (de) | 1996-11-13 | 2010-01-15 | Du Pont | Herstellungsverfahren von 1,3-propandiol durch rekombinante organismen |
CN1186856A (zh) | 1996-12-31 | 1998-07-08 | 中国科学院武汉病毒研究所 | 含三个启动子的杆状病毒转移载体 |
CN1202253C (zh) | 1997-12-02 | 2005-05-18 | 纳幕尔杜邦公司 | 用重组生物体生产甘油的方法 |
US6432686B1 (en) * | 1998-05-12 | 2002-08-13 | E. I. Du Pont De Nemours And Company | Method for the production of 1,3-propanediol by recombinant organisms comprising genes for vitamin B12 transport |
CA2733616C (en) * | 1999-08-18 | 2016-09-27 | E.I. Du Pont De Nemours And Company | Process for the biological production of 1,3-propanediol with high titer |
AU2002252704A1 (en) | 2001-04-20 | 2002-11-05 | E.I. Du Pont De Nemours And Company | A product removal process for use in a biofermentation system |
MXPA04010366A (es) * | 2002-04-22 | 2005-02-17 | Du Pont | Sistema promotor y plasmido para ingenieria genetica. |
-
2003
- 2003-04-22 MX MXPA04010366A patent/MXPA04010366A/es unknown
- 2003-04-22 JP JP2003586334A patent/JP2005523020A/ja active Pending
- 2003-04-22 EP EP10193565A patent/EP2374879A3/en not_active Withdrawn
- 2003-04-22 AU AU2003225123A patent/AU2003225123A1/en not_active Abandoned
- 2003-04-22 KR KR10-2004-7016903A patent/KR20040104581A/ko not_active Application Discontinuation
- 2003-04-22 WO PCT/US2003/012566 patent/WO2003089621A2/en active Application Filing
- 2003-04-22 US US10/420,587 patent/US8192959B2/en not_active Expired - Fee Related
- 2003-04-22 CA CA2481414A patent/CA2481414C/en not_active Expired - Fee Related
- 2003-04-22 EP EP03721832A patent/EP1499709B1/en not_active Expired - Lifetime
- 2003-04-22 CN CNB038091224A patent/CN100366730C/zh not_active Expired - Fee Related
- 2003-12-18 US US10/739,542 patent/US7132527B2/en not_active Expired - Fee Related
-
2006
- 2006-10-02 US US11/541,810 patent/US7510869B2/en not_active Expired - Fee Related
-
2009
- 2009-02-13 US US12/370,864 patent/US20090156430A1/en not_active Abandoned
- 2009-08-24 JP JP2009193493A patent/JP2009279007A/ja active Pending
-
2010
- 2010-07-08 JP JP2010156143A patent/JP5291673B2/ja not_active Expired - Fee Related
- 2010-11-05 US US12/940,225 patent/US8168608B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110066820A (zh) * | 2019-04-29 | 2019-07-30 | 华南农业大学 | 一种荧光菌株E.coli C600及构建方法与应用 |
CN110066820B (zh) * | 2019-04-29 | 2021-03-16 | 华南农业大学 | 一种荧光菌株E.coli C600及构建方法与应用 |
Also Published As
Publication number | Publication date |
---|---|
EP1499709A2 (en) | 2005-01-26 |
JP2010268807A (ja) | 2010-12-02 |
EP1499709A4 (en) | 2006-08-02 |
EP2374879A2 (en) | 2011-10-12 |
JP5291673B2 (ja) | 2013-09-18 |
US20040235099A1 (en) | 2004-11-25 |
JP2005523020A (ja) | 2005-08-04 |
US8192959B2 (en) | 2012-06-05 |
WO2003089621A2 (en) | 2003-10-30 |
US8168608B2 (en) | 2012-05-01 |
US7132527B2 (en) | 2006-11-07 |
CN100366730C (zh) | 2008-02-06 |
US20070065867A1 (en) | 2007-03-22 |
US7510869B2 (en) | 2009-03-31 |
CA2481414C (en) | 2013-04-09 |
AU2003225123A1 (en) | 2003-11-03 |
US20110046014A1 (en) | 2011-02-24 |
US20090156430A1 (en) | 2009-06-18 |
JP2009279007A (ja) | 2009-12-03 |
CA2481414A1 (en) | 2003-10-30 |
WO2003089621A3 (en) | 2004-04-15 |
US20050147968A1 (en) | 2005-07-07 |
EP1499709B1 (en) | 2012-01-04 |
MXPA04010366A (es) | 2005-02-17 |
WO2003089621A8 (en) | 2004-12-29 |
KR20040104581A (ko) | 2004-12-10 |
EP2374879A3 (en) | 2012-01-11 |
AU2003225123A8 (en) | 2003-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1646680A (zh) | 用于遗传工程的启动子的质粒系统 | |
CN1298852C (zh) | 用于生产高效价1,3-丙二醇的生物学方法 | |
CN1202253C (zh) | 用重组生物体生产甘油的方法 | |
CN1297662C (zh) | 用含有维生素b12转运基因的重组生物体生产1,3-丙二醇的方法 | |
CN1236063C (zh) | 用重组生物体生产1,3-丙二醇的方法 | |
CN1500877A (zh) | 利用单一微生物将可发酵碳源生物转化为1,3-丙二醇 | |
CN1174100C (zh) | 用重组生物体生产甘油的方法 | |
CN1860221A (zh) | 高产量生物生产1,3-丙二醇的方法 | |
CN1842598A (zh) | 适合含油酵母内的基因表达的甘油醛-3-磷酸脱氢酶和磷酸甘油酸变位酶启动子 | |
KR20130125785A (ko) | 수크로스 대사능을 갖는 재조합 박테리아 | |
CN1250733C (zh) | 一种用于生物发酵系统的产物收取方法 | |
AU2012296494A1 (en) | Variant sucrose transporter polypeptides that enable faster sucrose utilization in bacteria | |
JP2010158170A (ja) | グルコース・マンノース・キシロース並行発酵性菌およびそれを用いるバイオエタノールの製造方法 | |
KR102109763B1 (ko) | 2,3―부탄디올의 생성능이 증강된 재조합 미생물 및 이를 이용한 2,3―부탄디올의 생산 방법 | |
CN1795270A (zh) | 编码具有d-乳酸脱氢酶活性蛋白质的dna及其用途 | |
CN1788087A (zh) | 醋酸菌的乙醇脱氢酶基因 | |
CN1247230A (zh) | 醋酸杆菌的木糖醇脱氢酶及其基因 | |
CN1125181C (zh) | 在酵母细胞中表达n-末端延伸蛋白质的载体 | |
CN1213402A (zh) | 表层蛋白的重组表达 | |
CN1894404A (zh) | 有机酸存在下的启动子及其用途 | |
AU2013230227A1 (en) | Variant sucrose transporter polypeptides | |
CN1571838A (zh) | 实现基因高表达的系统 | |
CN1564868A (zh) | 参与聚酯合成的酶基因和使用该基因的聚酯制造方法 | |
CN1249001A (zh) | 来自游动放线菌SE50/110的Acarboseacb基因簇 | |
CN1254536C (zh) | 新型(r)-2-羟基-3-苯基丙酸(d-苯基乳酸)脱氢酶及其编码基因 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1081231 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1081231 Country of ref document: HK |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080206 Termination date: 20200422 |
|
CF01 | Termination of patent right due to non-payment of annual fee |