CN104204205A - 克隆方法 - Google Patents
克隆方法 Download PDFInfo
- Publication number
- CN104204205A CN104204205A CN201380017487.8A CN201380017487A CN104204205A CN 104204205 A CN104204205 A CN 104204205A CN 201380017487 A CN201380017487 A CN 201380017487A CN 104204205 A CN104204205 A CN 104204205A
- Authority
- CN
- China
- Prior art keywords
- sequence
- target site
- carrier
- connector
- assembling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 209
- 238000010367 cloning Methods 0.000 title description 20
- 230000014509 gene expression Effects 0.000 claims abstract description 222
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 96
- 239000003550 marker Substances 0.000 claims abstract description 74
- 108091008146 restriction endonucleases Proteins 0.000 claims abstract description 50
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 36
- 230000007017 scission Effects 0.000 claims abstract description 36
- 238000002360 preparation method Methods 0.000 claims abstract description 16
- 238000001976 enzyme digestion Methods 0.000 claims abstract description 4
- 210000004027 cell Anatomy 0.000 claims description 115
- 108700026244 Open Reading Frames Proteins 0.000 claims description 76
- 230000010354 integration Effects 0.000 claims description 66
- 238000006243 chemical reaction Methods 0.000 claims description 65
- 230000006801 homologous recombination Effects 0.000 claims description 58
- 238000002744 homologous recombination Methods 0.000 claims description 58
- 102000004190 Enzymes Human genes 0.000 claims description 56
- 108090000790 Enzymes Proteins 0.000 claims description 56
- 150000007523 nucleic acids Chemical class 0.000 claims description 43
- 239000002253 acid Substances 0.000 claims description 38
- 101100256850 Drosophila melanogaster EndoA gene Proteins 0.000 claims description 30
- 102000039446 nucleic acids Human genes 0.000 claims description 24
- 108020004707 nucleic acids Proteins 0.000 claims description 24
- 238000005520 cutting process Methods 0.000 claims description 19
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 claims description 16
- 102000057593 human F8 Human genes 0.000 claims description 16
- 229940047431 recombinate Drugs 0.000 claims description 16
- 108700007698 Genetic Terminator Regions Proteins 0.000 claims description 11
- 238000011084 recovery Methods 0.000 claims description 7
- 230000006798 recombination Effects 0.000 claims description 6
- 238000005215 recombination Methods 0.000 claims description 6
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 3
- 239000013598 vector Substances 0.000 abstract description 18
- 108020004414 DNA Proteins 0.000 description 90
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 68
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 68
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 68
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 68
- 229940088598 enzyme Drugs 0.000 description 52
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 46
- 238000013459 approach Methods 0.000 description 46
- 241000894006 Bacteria Species 0.000 description 41
- 239000012634 fragment Substances 0.000 description 41
- 230000000694 effects Effects 0.000 description 37
- 241000959173 Rasamsonia emersonii Species 0.000 description 34
- LVHBHZANLOWSRM-UHFFFAOYSA-N itaconic acid Chemical compound OC(=O)CC(=C)C(O)=O LVHBHZANLOWSRM-UHFFFAOYSA-N 0.000 description 34
- 239000002773 nucleotide Substances 0.000 description 34
- 230000001580 bacterial effect Effects 0.000 description 31
- 108091028043 Nucleic acid sequence Proteins 0.000 description 30
- 125000003729 nucleotide group Chemical group 0.000 description 30
- 235000018102 proteins Nutrition 0.000 description 30
- 102000004169 proteins and genes Human genes 0.000 description 30
- 238000013461 design Methods 0.000 description 28
- 239000013612 plasmid Substances 0.000 description 27
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 26
- 102100038910 Alpha-enolase Human genes 0.000 description 25
- 101000882335 Homo sapiens Alpha-enolase Proteins 0.000 description 25
- VLMZMRDOMOGGFA-WDBKCZKBSA-N festuclavine Chemical compound C1=CC([C@H]2C[C@H](CN(C)[C@@H]2C2)C)=C3C2=CNC3=C1 VLMZMRDOMOGGFA-WDBKCZKBSA-N 0.000 description 25
- 108010054624 red fluorescent protein Proteins 0.000 description 25
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 20
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 20
- 241000351920 Aspergillus nidulans Species 0.000 description 20
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 20
- 108091026890 Coding region Proteins 0.000 description 19
- 101710140859 E3 ubiquitin ligase TRAF3IP2 Proteins 0.000 description 19
- 102100026620 E3 ubiquitin ligase TRAF3IP2 Human genes 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 19
- 239000008103 glucose Substances 0.000 description 17
- 241000678519 Rasamsonia Species 0.000 description 16
- 240000008042 Zea mays Species 0.000 description 16
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 16
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 16
- 235000009973 maize Nutrition 0.000 description 16
- 239000000203 mixture Substances 0.000 description 16
- 239000010902 straw Substances 0.000 description 16
- 230000008859 change Effects 0.000 description 15
- 230000002068 genetic effect Effects 0.000 description 15
- 229920001184 polypeptide Polymers 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 239000000047 product Substances 0.000 description 14
- 239000006228 supernatant Substances 0.000 description 14
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 13
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 13
- 101710092857 Integrator complex subunit 1 Proteins 0.000 description 13
- 102100024061 Integrator complex subunit 1 Human genes 0.000 description 13
- 241001138401 Kluyveromyces lactis Species 0.000 description 13
- 150000001875 compounds Chemical class 0.000 description 13
- 230000008034 disappearance Effects 0.000 description 13
- 238000006073 displacement reaction Methods 0.000 description 13
- 239000005090 green fluorescent protein Substances 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 241000233866 Fungi Species 0.000 description 12
- 230000004060 metabolic process Effects 0.000 description 12
- 230000037361 pathway Effects 0.000 description 12
- 230000009466 transformation Effects 0.000 description 12
- 108010059892 Cellulase Proteins 0.000 description 11
- 150000001413 amino acids Chemical class 0.000 description 11
- 229940106157 cellulase Drugs 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- 238000003780 insertion Methods 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 230000002441 reversible effect Effects 0.000 description 11
- 101150104383 ALOX5AP gene Proteins 0.000 description 10
- 229920001817 Agar Polymers 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 10
- 101100236114 Mus musculus Lrrfip1 gene Proteins 0.000 description 10
- 239000008272 agar Substances 0.000 description 10
- 230000003321 amplification Effects 0.000 description 10
- 101150073906 gpdA gene Proteins 0.000 description 10
- 101150095733 gpsA gene Proteins 0.000 description 10
- 238000003199 nucleic acid amplification method Methods 0.000 description 10
- 108091033319 polynucleotide Proteins 0.000 description 10
- 102000040430 polynucleotide Human genes 0.000 description 10
- 239000002157 polynucleotide Substances 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- 108010051219 Cre recombinase Proteins 0.000 description 9
- 108010076504 Protein Sorting Signals Proteins 0.000 description 9
- 108700008625 Reporter Genes Proteins 0.000 description 9
- 239000000969 carrier Substances 0.000 description 9
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 9
- 238000010276 construction Methods 0.000 description 9
- 244000005700 microbiome Species 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- 239000000758 substrate Substances 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 101150081655 GPM1 gene Proteins 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 101150084612 gpmA gene Proteins 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 7
- 101000891113 Homo sapiens T-cell acute lymphocytic leukemia protein 1 Proteins 0.000 description 7
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 7
- 238000012408 PCR amplification Methods 0.000 description 7
- 241000589516 Pseudomonas Species 0.000 description 7
- 101000702553 Schistosoma mansoni Antigen Sm21.7 Proteins 0.000 description 7
- 101000714192 Schistosoma mansoni Tegument antigen Proteins 0.000 description 7
- 102100040365 T-cell acute lymphocytic leukemia protein 1 Human genes 0.000 description 7
- 239000001913 cellulose Substances 0.000 description 7
- 229920002678 cellulose Polymers 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000010790 dilution Methods 0.000 description 7
- 239000012895 dilution Substances 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 6
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 description 6
- 101100054218 Penicillium chrysogenum penDE gene Proteins 0.000 description 6
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 6
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 6
- 101100028327 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) OYE2 gene Proteins 0.000 description 6
- 101100317186 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) VPS68 gene Proteins 0.000 description 6
- 101150001810 TEAD1 gene Proteins 0.000 description 6
- 101150074253 TEF1 gene Proteins 0.000 description 6
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 238000006555 catalytic reaction Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 230000029087 digestion Effects 0.000 description 6
- 238000006062 fragmentation reaction Methods 0.000 description 6
- 230000002538 fungal effect Effects 0.000 description 6
- 230000012010 growth Effects 0.000 description 6
- 230000000968 intestinal effect Effects 0.000 description 6
- 101150065808 pre3 gene Proteins 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 150000003839 salts Chemical class 0.000 description 6
- 230000001954 sterilising effect Effects 0.000 description 6
- QRBLKGHRWFGINE-UGWAGOLRSA-N 2-[2-[2-[[2-[[4-[[2-[[6-amino-2-[3-amino-1-[(2,3-diamino-3-oxopropyl)amino]-3-oxopropyl]-5-methylpyrimidine-4-carbonyl]amino]-3-[(2r,3s,4s,5s,6s)-3-[(2s,3r,4r,5s)-4-carbamoyl-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-4,5-dihydroxy-6-(hydroxymethyl)- Chemical compound N=1C(C=2SC=C(N=2)C(N)=O)CSC=1CCNC(=O)C(C(C)=O)NC(=O)C(C)C(O)C(C)NC(=O)C(C(O[C@H]1[C@@]([C@@H](O)[C@H](O)[C@H](CO)O1)(C)O[C@H]1[C@@H]([C@](O)([C@@H](O)C(CO)O1)C(N)=O)O)C=1NC=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C QRBLKGHRWFGINE-UGWAGOLRSA-N 0.000 description 5
- 108020005065 3' Flanking Region Proteins 0.000 description 5
- 108020005029 5' Flanking Region Proteins 0.000 description 5
- 101100434663 Bacillus subtilis (strain 168) fbaA gene Proteins 0.000 description 5
- 101100351264 Candida albicans (strain SC5314 / ATCC MYA-2876) PDC11 gene Proteins 0.000 description 5
- 101150095274 FBA1 gene Proteins 0.000 description 5
- 102100028652 Gamma-enolase Human genes 0.000 description 5
- 101001058231 Homo sapiens Gamma-enolase Proteins 0.000 description 5
- 108090000364 Ligases Proteins 0.000 description 5
- 102000003960 Ligases Human genes 0.000 description 5
- 101100313266 Mus musculus Tead1 gene Proteins 0.000 description 5
- 101150050255 PDC1 gene Proteins 0.000 description 5
- 101150111781 PGL1 gene Proteins 0.000 description 5
- LTQCLFMNABRKSH-UHFFFAOYSA-N Phleomycin Natural products N=1C(C=2SC=C(N=2)C(N)=O)CSC=1CCNC(=O)C(C(O)C)NC(=O)C(C)C(O)C(C)NC(=O)C(C(OC1C(C(O)C(O)C(CO)O1)OC1C(C(OC(N)=O)C(O)C(CO)O1)O)C=1NC=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C LTQCLFMNABRKSH-UHFFFAOYSA-N 0.000 description 5
- 108010035235 Phleomycins Proteins 0.000 description 5
- 108010091086 Recombinases Proteins 0.000 description 5
- 102000018120 Recombinases Human genes 0.000 description 5
- 235000001014 amino acid Nutrition 0.000 description 5
- 101150102092 ccdB gene Proteins 0.000 description 5
- 239000007979 citrate buffer Substances 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000004151 fermentation Effects 0.000 description 5
- 101150066555 lacZ gene Proteins 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 230000002018 overexpression Effects 0.000 description 5
- 230000010474 transient expression Effects 0.000 description 5
- 241000228245 Aspergillus niger Species 0.000 description 4
- 101000979117 Curvularia clavata Nonribosomal peptide synthetase Proteins 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 4
- 108700039887 Essential Genes Proteins 0.000 description 4
- 101100264215 Gallus gallus XRCC6 gene Proteins 0.000 description 4
- 101000801742 Homo sapiens Triosephosphate isomerase Proteins 0.000 description 4
- 239000007836 KH2PO4 Substances 0.000 description 4
- 241000226677 Myceliophthora Species 0.000 description 4
- 241000228150 Penicillium chrysogenum Species 0.000 description 4
- 108700038210 Penicillium chrysogenum PAF Proteins 0.000 description 4
- 241000235648 Pichia Species 0.000 description 4
- 241001123227 Saccharomyces pastorianus Species 0.000 description 4
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 4
- 102100033598 Triosephosphate isomerase Human genes 0.000 description 4
- 102100036976 X-ray repair cross-complementing protein 6 Human genes 0.000 description 4
- 230000002411 adverse Effects 0.000 description 4
- 229940041514 candida albicans extract Drugs 0.000 description 4
- 239000007795 chemical reaction product Substances 0.000 description 4
- 239000013611 chromosomal DNA Substances 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 239000000428 dust Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 238000000855 fermentation Methods 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000012239 gene modification Methods 0.000 description 4
- 230000005017 genetic modification Effects 0.000 description 4
- 235000013617 genetically modified food Nutrition 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 101150085005 ku70 gene Proteins 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 4
- 235000019796 monopotassium phosphate Nutrition 0.000 description 4
- 239000006916 nutrient agar Substances 0.000 description 4
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 4
- 238000004064 recycling Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 239000001509 sodium citrate Substances 0.000 description 4
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 4
- 229910000162 sodium phosphate Inorganic materials 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 101150016309 trpC gene Proteins 0.000 description 4
- 210000002268 wool Anatomy 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 3
- 241000228212 Aspergillus Species 0.000 description 3
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 3
- 241000223198 Humicola Species 0.000 description 3
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 3
- 101150059802 KU80 gene Proteins 0.000 description 3
- 241000235395 Mucor Species 0.000 description 3
- 241000221960 Neurospora Species 0.000 description 3
- 241000228143 Penicillium Species 0.000 description 3
- 241000235527 Rhizopus Species 0.000 description 3
- 241000228341 Talaromyces Species 0.000 description 3
- 241000223259 Trichoderma Species 0.000 description 3
- 102100036973 X-ray repair cross-complementing protein 5 Human genes 0.000 description 3
- 241000235013 Yarrowia Species 0.000 description 3
- 241000235015 Yarrowia lipolytica Species 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000011449 brick Substances 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 230000004087 circulation Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 231100000673 dose–response relationship Toxicity 0.000 description 3
- 239000003480 eluent Substances 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 3
- 229940097277 hygromycin b Drugs 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 235000019799 monosodium phosphate Nutrition 0.000 description 3
- 239000001965 potato dextrose agar Substances 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- -1 promotor Proteins 0.000 description 3
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- 241000222518 Agaricus Species 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 241001225321 Aspergillus fumigatus Species 0.000 description 2
- 240000006439 Aspergillus oryzae Species 0.000 description 2
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 2
- 241000131386 Aspergillus sojae Species 0.000 description 2
- 241000223651 Aureobasidium Species 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 101001074427 Bacillus subtilis (strain 168) Polyketide synthase PksJ Proteins 0.000 description 2
- 101001074418 Bacillus subtilis (strain 168) Polyketide synthase PksL Proteins 0.000 description 2
- 239000002028 Biomass Substances 0.000 description 2
- 241000123346 Chrysosporium Species 0.000 description 2
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 2
- 241000235646 Cyberlindnera jadinii Species 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 102100033195 DNA ligase 4 Human genes 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 101000803786 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) Conidial yellow pigment biosynthesis polyketide synthase Proteins 0.000 description 2
- 101000701349 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) Putative sterigmatocystin biosynthesis polyketide synthase Proteins 0.000 description 2
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 101150009006 HIS3 gene Proteins 0.000 description 2
- 241001149669 Hanseniaspora Species 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 101000927810 Homo sapiens DNA ligase 4 Proteins 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- 101100269250 Kluyveromyces lactis (strain ATCC 8585 / CBS 2359 / DSM 70799 / NBRC 1267 / NRRL Y-1140 / WM37) ADH2 gene Proteins 0.000 description 2
- 101100445272 Kluyveromyces lactis (strain ATCC 8585 / CBS 2359 / DSM 70799 / NBRC 1267 / NRRL Y-1140 / WM37) ENO gene Proteins 0.000 description 2
- 101100335727 Kluyveromyces lactis (strain ATCC 8585 / CBS 2359 / DSM 70799 / NBRC 1267 / NRRL Y-1140 / WM37) GAP1 gene Proteins 0.000 description 2
- 101100297528 Kluyveromyces lactis (strain ATCC 8585 / CBS 2359 / DSM 70799 / NBRC 1267 / NRRL Y-1140 / WM37) KLLA0B14839g gene Proteins 0.000 description 2
- 101100136397 Kluyveromyces lactis (strain ATCC 8585 / CBS 2359 / DSM 70799 / NBRC 1267 / NRRL Y-1140 / WM37) PGK gene Proteins 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 229910009891 LiAc Inorganic materials 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 241000228347 Monascus <ascomycete fungus> Species 0.000 description 2
- 241000235575 Mortierella Species 0.000 description 2
- 101000905241 Mus musculus Heart- and neural crest derivatives-expressed protein 1 Proteins 0.000 description 2
- 101001031591 Mus musculus Heart- and neural crest derivatives-expressed protein 2 Proteins 0.000 description 2
- 241000256259 Noctuidae Species 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 101150040663 PGI1 gene Proteins 0.000 description 2
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 2
- 241000228153 Penicillium citrinum Species 0.000 description 2
- 244000082204 Phyllostachys viridis Species 0.000 description 2
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 2
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 2
- 241000190967 Rhodospirillum Species 0.000 description 2
- 101150014136 SUC2 gene Proteins 0.000 description 2
- 241000235072 Saccharomyces bayanus Species 0.000 description 2
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- 101000730455 Serratia sp. (strain ATCC 39006) Beta-ketoacyl synthase PigJ Proteins 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 101000691656 Streptomyces venezuelae Narbonolide/10-deoxymethynolide synthase PikA1, modules 1 and 2 Proteins 0.000 description 2
- 101000691655 Streptomyces venezuelae Narbonolide/10-deoxymethynolide synthase PikA2, modules 3 and 4 Proteins 0.000 description 2
- 101000691658 Streptomyces venezuelae Narbonolide/10-deoxymethynolide synthase PikA3, module 5 Proteins 0.000 description 2
- 101001125873 Streptomyces venezuelae Narbonolide/10-deoxymethynolide synthase PikA4, module 6 Proteins 0.000 description 2
- 108020005038 Terminator Codon Proteins 0.000 description 2
- 241001554087 Thiobacterium Species 0.000 description 2
- 241001149964 Tolypocladium Species 0.000 description 2
- 241000222354 Trametes Species 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 101710124921 X-ray repair cross-complementing protein 5 Proteins 0.000 description 2
- DPDMMXDBJGCCQC-UHFFFAOYSA-N [Na].[Cl] Chemical compound [Na].[Cl] DPDMMXDBJGCCQC-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 101150078331 ama-1 gene Proteins 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960003311 ampicillin trihydrate Drugs 0.000 description 2
- 229940091771 aspergillus fumigatus Drugs 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 235000013877 carbamide Nutrition 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000007599 discharging Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 238000012252 genetic analysis Methods 0.000 description 2
- WHWDWIHXSPCOKZ-UHFFFAOYSA-N hexahydrofarnesyl acetone Natural products CC(C)CCCC(C)CCCC(C)CCCC(C)=O WHWDWIHXSPCOKZ-UHFFFAOYSA-N 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 101150095344 niaD gene Proteins 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 231100000614 poison Toxicity 0.000 description 2
- 230000007096 poisonous effect Effects 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 229910052702 rhenium Inorganic materials 0.000 description 2
- WUAPFZMCVAUBPE-UHFFFAOYSA-N rhenium atom Chemical compound [Re] WUAPFZMCVAUBPE-UHFFFAOYSA-N 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 239000003643 water by type Substances 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- TVZRAEYQIKYCPH-UHFFFAOYSA-N 3-(trimethylsilyl)propane-1-sulfonic acid Chemical compound C[Si](C)(C)CCCS(O)(=O)=O TVZRAEYQIKYCPH-UHFFFAOYSA-N 0.000 description 1
- DUJGMZAICVPCBJ-VDAHYXPESA-N 4-amino-1-[(1r,4r,5s)-4,5-dihydroxy-3-(hydroxymethyl)cyclopent-2-en-1-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)C(CO)=C1 DUJGMZAICVPCBJ-VDAHYXPESA-N 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- FRXSZNDVFUDTIR-UHFFFAOYSA-N 6-methoxy-1,2,3,4-tetrahydroquinoline Chemical compound N1CCCC2=CC(OC)=CC=C21 FRXSZNDVFUDTIR-UHFFFAOYSA-N 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 241000588624 Acinetobacter calcoaceticus Species 0.000 description 1
- 241000228431 Acremonium chrysogenum Species 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 241000224489 Amoeba Species 0.000 description 1
- 208000037259 Amyloid Plaque Diseases 0.000 description 1
- 241000235349 Ascomycota Species 0.000 description 1
- 241001370055 Aspergillus niger CBS 513.88 Species 0.000 description 1
- 101100216041 Aspergillus niger GLAA gene Proteins 0.000 description 1
- 241001465318 Aspergillus terreus Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 241000588565 Caenorhabditis tropicalis Species 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000222178 Candida tropicalis Species 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241000191363 Chlorobium limicola Species 0.000 description 1
- 241000192731 Chloroflexus aurantiacus Species 0.000 description 1
- 241000398616 Chloronema Species 0.000 description 1
- 241000881804 Chromatium okenii Species 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- ODBLHEXUDAPZAU-ZAFYKAAXSA-N D-threo-isocitric acid Chemical compound OC(=O)[C@H](O)[C@@H](C(O)=O)CC(O)=O ODBLHEXUDAPZAU-ZAFYKAAXSA-N 0.000 description 1
- 102100039116 DNA repair protein RAD50 Human genes 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 102100033996 Double-strand break repair protein MRE11 Human genes 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 101000743929 Homo sapiens DNA repair protein RAD50 Proteins 0.000 description 1
- 101000591400 Homo sapiens Double-strand break repair protein MRE11 Proteins 0.000 description 1
- 101000642268 Homo sapiens Speckle-type POZ protein Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- ODBLHEXUDAPZAU-FONMRSAGSA-N Isocitric acid Natural products OC(=O)[C@@H](O)[C@H](C(O)=O)CC(O)=O ODBLHEXUDAPZAU-FONMRSAGSA-N 0.000 description 1
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 101100218669 Kluyveromyces lactis (strain ATCC 8585 / CBS 2359 / DSM 70799 / NBRC 1267 / NRRL Y-1140 / WM37) LAC4 gene Proteins 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241001599018 Melanogaster Species 0.000 description 1
- 241001123676 Metschnikowia pulcherrima Species 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 241000187654 Nocardia Species 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 241000233654 Oomycetes Species 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 241000192727 Pelodictyon luteolum Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 1
- GLUUGHFHXGJENI-UHFFFAOYSA-N Piperazine Chemical compound C1CNCCN1 GLUUGHFHXGJENI-UHFFFAOYSA-N 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 241000221945 Podospora Species 0.000 description 1
- 244000298647 Poinciana pulcherrima Species 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 244000294611 Punica granatum Species 0.000 description 1
- 235000014360 Punica granatum Nutrition 0.000 description 1
- 241000222644 Pycnoporus <fungus> Species 0.000 description 1
- 241000220324 Pyrus Species 0.000 description 1
- 244000281247 Ribes rubrum Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 101100409457 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CDC40 gene Proteins 0.000 description 1
- 101100128232 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) LIF1 gene Proteins 0.000 description 1
- 101100079811 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) NEJ1 gene Proteins 0.000 description 1
- 101100477614 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SIR4 gene Proteins 0.000 description 1
- 101100156959 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) XRS2 gene Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000228417 Sarocladium strictum Species 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 101100373279 Schizosaccharomyces pombe (strain 972 / ATCC 24843) xlf1 gene Proteins 0.000 description 1
- 241000311088 Schwanniomyces Species 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000607715 Serratia marcescens Species 0.000 description 1
- 108010052160 Site-specific recombinase Proteins 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 241000221948 Sordaria Species 0.000 description 1
- 102100036422 Speckle-type POZ protein Human genes 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 241001655322 Streptomycetales Species 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 1
- 108700025695 Suppressor Genes Proteins 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241001136490 Thermomyces dupontii Species 0.000 description 1
- 241000223258 Thermomyces lanuginosus Species 0.000 description 1
- 241001494489 Thielavia Species 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 238000010811 Ultra-Performance Liquid Chromatography-Tandem Mass Spectrometry Methods 0.000 description 1
- 241000589506 Xanthobacter Species 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 101150038738 ble gene Proteins 0.000 description 1
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000005056 cell body Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 231100000481 chemical toxicant Toxicity 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000005595 deprotonation Effects 0.000 description 1
- 238000010537 deprotonation reaction Methods 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000009585 enzyme analysis Methods 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 239000001530 fumaric acid Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 238000005469 granulation Methods 0.000 description 1
- 230000003179 granulation Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- YQYJSBFKSSDGFO-FWAVGLHBSA-N hygromycin A Chemical compound O[C@H]1[C@H](O)[C@H](C(=O)C)O[C@@H]1Oc1ccc(\C=C(/C)C(=O)N[C@@H]2[C@@H]([C@H]3OCO[C@H]3[C@@H](O)[C@@H]2O)O)cc1O YQYJSBFKSSDGFO-FWAVGLHBSA-N 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000003262 industrial enzyme Substances 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000011089 mechanical engineering Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000005580 one pot reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 238000011020 pilot scale process Methods 0.000 description 1
- 229960005141 piperazine Drugs 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 229930010796 primary metabolite Natural products 0.000 description 1
- 238000000425 proton nuclear magnetic resonance spectrum Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 229930000044 secondary metabolite Natural products 0.000 description 1
- 239000003352 sequestering agent Substances 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 235000011008 sodium phosphates Nutrition 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000011149 sulphuric acid Nutrition 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- ODBLHEXUDAPZAU-UHFFFAOYSA-N threo-D-isocitric acid Natural products OC(=O)C(O)C(C(O)=O)CC(O)=O ODBLHEXUDAPZAU-UHFFFAOYSA-N 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 150000003672 ureas Chemical class 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1024—In vivo mutagenesis using high mutation rate "mutator" host strains by inserting genetic material, e.g. encoding an error prone polymerase, disrupting a gene for mismatch repair
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/40—Systems of functionally co-operating vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/50—Vectors for producing vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明涉及用于制备两种或更多种标准化的表达盒的方法,所述方法包括:a.提供两组或更多组元件序列,每组元件序列一起构成至少一种功能性表达盒,各元件序列两侧侧翼为IIs型限制内切酶切割位点,之后是其识别位点,所述IIs型限制内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒;b.提供至少两种骨架进入载体,各骨架进入载体按以下这种顺序包含:(i)限制酶切割位点与其识别位点,和第一连接物序列(LF);(ii)包含可选择标记基因的载体骨架;以及(iii)第二连接物序列(RF),和限制酶识别位点与其切割序列;以及(iv)任选地,在(i)和(iii)的识别位点之间的插入物,任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列组装;以及c.使用基于经由所述切割位点使用限制酶消化和连接的方法,在至少两种骨架进入载体中组装所述两组或更多组元件序列作为功能性表达盒,从而制备两种或更多种标准化的表达盒。
Description
技术领域
本发明涉及用于制备标准化的表达盒的方法。本发明还涉及用于在宿主细胞中体内重组所述标准化的表达盒的方法。另外,本发明涉及用于将核酸序列整合在靶位点(target locus)的方法。本发明还涉及用于制备标准化的表达盒的系统,以及用于产生整合在靶位点的目的核酸构建体的系统。
背景技术
现代生物技术应用遗传改造来研发具有新型表型的以供在基于生物的转化过程中使用的生物体,所述转化过程应用在食品、饲料(feed)、医药、材料以及能源方面。这包括设计和产生正常情况下不会在目的生产宿主中发现或(在已知情况下)完全非天然的新型表型。应用的实例包括(但不限于)微生物产生化学前体、工业酶、抗生素以及生物燃料。
需要新型技术来设计更好、构筑更快且测试更多的DNA构建体,以用于更快并且更佳的菌株改造。这可以通过DNA构建的标准化、模块化以及自动化来着手进行。另外,再利用现有的元件或所谓的生物砖(biobrick)的能力将有助于更好地表征这些元件和降低构建体合成和/或组装的成本。所述生物砖可为例如启动子(P)、5’UTR(U)、信号序列(S)、开放阅读框架(O)、基因组序列(G)、终止子(T)以及其它功能或调节DNA元件。
科学家正仔细调查生物和改造工具来研发用于改造细胞的新型方法。复杂DNA盒可以被设计并且被需要来使改造细胞用于新型目的和高效的转化。因此,需要研发高通量低成本的DNA组装方法,以用于实际处理和探索更大组的设计。所需要的DNA盒可通过基因合成和连接来产生。然而,这通常是必需针对每种构建体进行重复的高成本的过程。已经提出再利用DNA构筑块和模块式盒来减少成本和时间。因此,对于基因组合的最佳使用和探索以及代谢途径的调谐(又称为合成生物学)来说,需要研发物理地组装含有大量呈多种排布的天然或人工基因的复杂DNA分子的新型方法。对于DNA盒的模块式构建来说,需要使用基本构筑块来物理组装和构筑这些盒的有效方法。当前可用的用于组装表达盒的方法由Wang T等人(2012)于Appl Microbiol Biotechnol(2012)93:1853-1863进行综述,并且包括如GoldenBraid(Sarrion-Perdigones A.(2012),PLoS ONE 6(7):e21622)和模块克隆(Modular Cloning)(Weber E.(2011),PLoS ONE 6(2):e16765以及EP2395087)。
然而,这些方法相当复杂,因为其包括连续的体外步骤或反复的重组(Wingler LM(2011)PNAS USA 108(37):15135-15140)来用于体内组装多基因途径的文库。
虽然在过去的数年已经取得很大进展,但大的重组DNA分子的物理构建仍代表着对于每种应用来说都尚没有适合解决方案的主要瓶颈(Weber E.(2011),PLoS ONE 6(2):e16765以及EP2395087)。重组DNA分子传统上使用II型限制酶和连接酶来构建。虽然极为通用,但这种方法缓慢且冗长,并且仅允许产生相对小尺寸且仅含有数个基因的构建体。具体来说,这种方法受到以下事实的限制:对于大的构建体来说,设计克隆策略变得极其困难,因为所有可用的限制酶将在所述构建体中切割许多次。在过去的数年中,已经研发许多不同的方法来克服这些限制。这些方法包括基于重组酶的克隆、不依赖连接的克隆、基于同源重组和基于PCR组装的克隆。基于重组酶的克隆消除了来自限制位点多次出现在大的构建体中的问题,但受以下事实限制:重组位点留在最终的构建体中,从而妨碍蛋白质编码序列的无缝组装(Weber E.(2011),PLoS ONE 6(2):e 16765以及EP2395087)。此外,基于重组酶的克隆受以下事实限制:迄今为止,仅4个片段可同时在一个构建体中组装。
尽管所有这些技术具有其自身的优势,并且对于特定应用来说极其有用,但无一满足产生多遗传变体组合的任务所需的所有要求,所述多遗传变异组合的产生是成功设计和构建具有新型表型的生物体所需的。
用于DNA构建体组装的方法由Wang等人于2012年描述。多组分蛋白复合体的结构生物学、代谢工程学以及合成生物学的研究经常依赖于这些亚单元或酶在同一细胞中的有效过度表达。作为第一步,如果使用基于经典且常规的消化和连接的克隆方法,构建多个表达盒将为复杂且耗时的工作。已经研发了一些更有效的方法,包括(1)采用多相容质粒表达系统;(2)载体的基于稀有切点的设计(rare-cutter-based design);(3)体外重组(不依赖于序列和连接的克隆,DNA分子在单一反应中的等温酶促组装);以及(4)使用有效重组的酵母进行体内重组(体内组装重叠片段,反复重组用于外源表达盒的染色体整合)。
最近,已经研发基于IIs型限制酶的克隆方法((WO 2008/095927),Engler等人.PLoS ONE 4(2009)e5553)描述了使用IIs型限制酶通过使10个未消化的输入质粒的混合物简单地经受限制-连接反应并且将所得混合物转化到感受态细胞中,一步并且在一个管中将至少九个独立的DNA片段一起组装到受体载体中的方案。这种方案称为“Golden Gate”克隆。
虽然合成生物学代表一个新的领域,但它利用遗传改造,并且因此应从现有成熟的技术如机械工程学来习得。复杂装置的成功工程化的重要考虑因素包括部件的标准化。对于合成生物学来说,标准化将允许从一个项目到下一个项目随意地再利用先前验证的模块,并且因此使得更有效地改造新生物学功能或生物体。标准化的一个重要方面在于可将预定值与各部分相关联,例如,启动子的限定活性(但应理解启动子活性可受附近序列中存在的增强子序列影响)或针对给定多肽的比酶活性。这是极为重要的,因为改造新功能或生物体将需要如此大量的部分一起工作,这样使得将需要针对许多项目进行测试的基因组合的数量有可能过大而在物理上不可能。这个要素是实现合成生物学的可能性所需要的必要要素。
发明内容
我们已经研发了一种体外/体内杂合方法,所述方法应用标准化的生物元件经由中间Golden Gate组装步骤(Engler C.(2008)PLoS ONE 3(11):e3647)形成复杂DNA盒用于在目的宿主中进行表达,并且应用专门设计的用于在标准化的盒组装中进一步使用的进入载体(entry vector)。
使用这种新型有效两步法允许以高效的方式构建模块式DNA盒。另外,我们已经研发并且显示了测量启动子强度的小型途径表征法(mini-pathway characterization method),其包括两个内部参照测量(参见实施例1)。在所述实施例中,GFP、LacZ以及RFP组合到一个途径中。所述方法还应用来表征终止子序列,并且可类似地用于表征信号序列,5’UTR或感兴趣的任何其它调节部分或突变、插入或缺失。
基于同源重组的方法是有用的,但要求模块之间共有最少量的序列,这限制了自由组合不同序列的标准模块的能力。然而,本发明的方法通过使用约9 bp(或更长)的标准化的连接物元件来用于体外组装或约25 bp(或更长)的标准化的连接物元件来用于体内组装,规避了这个问题。两种方法均可应用来组装表达盒,或研发敲除或插入序列,如下文中所解释的。此外,通过在连接物序列处有效使用利用标准化的引物的PCR法,可从含有标准化的连接物序列的骨架盒有效地回收模块式盒。连接物序列可含有IIS型限制酶识别位点,以在所要求位置处在所进行的步骤中进行准确切割,从而允许无缝体内同源重组,如果需要无缝体内同源重组来维持或恢复DNA构建体的功能性的话。
因此,本发明提供核酸分子的系统,所述系统可用于由期望数目优选至少3个片段来体内组装目的核酸盒,并且整合在靶位点处,其中至少一个片段含有功能性表达元件。功能性表达元件含有(但不限于)启动子DNA序列(pro)、开放阅读框架DNA序列(orf)、终止子DNA序列(ter)以及称为连接物(connector)的用于体内组装的左和右侧翼DNA序列(分别为lcon和rcon)。
DNA分子的系统含有一组至少2个或3个骨架(bbn)进入载体,其被设计成在进入载体中具有至少一个lcon和一个rcon序列,其可与元件载体一起应用在单锅(one-pot)Golden-Gate组装反应中,以产生功能性表达元件(M)和单一II型限制酶按功能性顺序的使用。例如,lcon-pro-orf-ter-rcon。
所述系统应可针对目的核酸构建体从许多表达元件的组装进行缩放,而同时避免对构建与构成目的核酸盒的片段或表达元件的数量一样多的骨架载体的需要。
本发明的核酸分子的系统允许组装数量比系统中所存在的骨架载体的数量少的表达元件,以及数量比系统中所存在的骨架载体的数量高的表达元件。本发明提供一种标准化的连接物核酸分子的系统,其可用于由期望数量的表达元件组装任何目的核酸盒。
因此,本发明提供用于制备两种或更多种标准化的表达盒的方法,所述方法包括:
a.提供两组或更多组元件序列,
每组元件序列一起构成至少一种功能性表达盒,
各元件序列的两侧侧翼为IIs型限制核酸内切酶切割位点,之后是其识别位点,
所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒;
b.提供至少两种骨架进入载体,
各骨架进入载体按以下这种顺序包含:(i)限制酶与其识别位点,和第一连接物序列(LF);(ii)包含可选择标记基因的载体骨架;以及(iii)第二连接物序列(RF),和限制酶识别位点与其切割序列;以及(iv)任选地,在(i)和(iii)的识别位点之间的插入物(insert),
任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装;
以及
c.使用基于经由切割位点使用限制酶消化和连接的方法,在所述至少两种骨架进入载体中组装两组或更多组元件序列作为功能性表达盒,
从而制备两种或更多种标准化的表达盒。
本发明还提供:
用于在宿主细胞中在靶位点处体内重组两种或更多种标准化的表达盒的方法,所述方法包括:
a.根据以上所述的方法制备两种或更多种标准化的表达盒,其中:
i.RF和LF连接物序列包含同源重组序列;以及
ii.任何骨架进入载体上的RF和LF序列被选择成使得其可通过体内重组分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装;以及
b.从包含LF和RF序列的骨架进入载体回收表达盒;以及
c.在宿主细胞中在靶位点处将所回收的表达盒彼此体内重组;和
用于在宿主细胞中在靶位点处将两种或更多种标准化的表达盒体内重组的方法,所述方法包括:
a.根据以上所述的方法制备两种或更多种标准化的模块式(modular)表达盒,其中:
i.RF和LF连接物序列包含至少9个碱基对的同源序列;以及
ii.任何骨架进入载体上的RF和LF序列被选择成使得其可使用这些序列通过体外方法分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装;以及
b.从通过LF和RF序列体外连接的骨架进入载体组装并且回收表达盒;以及
c.在宿主细胞中在靶位点处将所回收和组装的表达盒体内重组。
本发明进一步提供:
用于制备两种或更多种标准化的表达盒的系统,所述系统包括:
a.两组或更多组元件序列,
每组元件序列一起构成至少一种功能性表达盒,
各元件序列两侧侧翼为IIs型限制核酸内切酶切割位点,之后是其识别位点,
所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒;
b.至少两种骨架进入载体,
各骨架进入载体按以下这种顺序包含:(i)限制酶与其识别位点,和第一连接物序列(LF);(ii)包含可选择标记基因的载体骨架;以及(iii)第二连接物序列(RF),和限制酶识别位点与其切割序列;以及(iv)任选地,在(i)和(iii)的识别位点之间的插入物,
任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装;
和
用于产生整合在靶位点处的目的核酸构建体的系统,所述系统包含:
a.如以上所述的系统;以及
b.至少两种整合序列,其中一种与第一表达盒和靶位点的侧翼序列重组,并且其中第二种与第二表达盒和靶位点另一侧的侧翼序列重组。
附图说明
图1提供用于产生目的核酸构建体的2步克隆和转化系统的概况。水 平0:制备或可获得在适合的载体中的一组的元件序列,其具有IIs型限制核酸内切酶识别位点和标准化的切割位点(优选4-bp),所述位点被选择成使得在使用Golden gate克隆组装后,形成功能性表达盒。在水平0,还制备或可获得一组骨架载体,其含有适于使用序列同源性进行组装的左和右连接物序列,以用于在水平2组装模块式盒。选择元件序列的亚组与骨架(bbn)载体。在水平1,使用Golden Gate克隆将它们进行组装,从而产生含有至少一起编码启动子、orf以及终止子的序列的功能性表达盒。还可选择用于在水平2在靶位点处进行整合的左和右侧翼,并且添加左或右连接物序列或左和右连接物序列二者。例如,经由在适合的bbn载体中进行克隆或经由PCR反应,其中con序列为所使用的引物的一部分。水平2:在适合的宿主细胞中发生功能性表达盒与整合侧翼(int)和含有用于体内组装的连接物(con)序列的可能的其它DNA序列的体内组装并且在靶位点处重组。通常地,待组装的所有DNA部分可通过PCR反应从由水平1得到的载体中回收,以供在水平2使用,或例如使用经由第二适合的IIs限制酶以及其设计在con载体外侧的识别位点切出这些片段并且切割在其间包含DNA序列的con载体的方法。
选项A与B提供用于在靶位点处组装模块式盒的方案。在选项B中,添加另外的左和右整合位点用于第二宿主。选项B之后是水平3。水平3:例如经由PCR反应或其它方法从2B回收模块式盒(或部分)。所回收的DNA用于转化,并且随后在第二宿主在靶位点处整合模块式DNA盒。
图2提供用于产生目的核酸构建体的2步克隆和转化系统的概况。水 平0:制备或可获得在适合的载体中的一组元件序列,其具有IIs型限制核酸内切酶识别位点和标准化的切割位点(优选4-bp),所述位点被选择成使得在使用Golden gate克隆组装后,形成功能性表达盒。在水平0,还制备或可获得一组骨架载体,其含有适于使用序列同源性进行组装的左和右连接物序列,以用于在水平2组装模块式盒。选择元件序列的亚组连同骨架(bbn)载体。在水平1,使用Golden Gate克隆将它们进行组装,从而产生含有至少一起编码启动子、orf以及终止子的序列的功能性表达盒。还可选择用于在水平2步骤b在靶位点处进行整合的左和右侧翼,并且添加左或右连接物序列或者左和右连接物序列二者。例如,经由在适合的bbn载体中进行克隆或经由PCR反应,其中con序列为所使用的引物的一部分。
通常地,待组装的所有DNA部分可通过PCR反应从由水平1得到的载体中回收,以供在水平2步骤a中使用,或例如使用经由第二适合的IIs限制酶以及其设计在con载体外侧的识别位点切出这些片段并且切割在其间包含DNA序列的con载体的方法。
水平2步骤a:使用体外组装反应例如吉布森(Gibson)克隆将一个或更多个功能性表达盒和/或整合侧翼与连接物序列组装在一起,以形成模块式盒。接下来在水平2步骤b:在适合的宿主细胞中发生包括单独的或已经作为模块式盒的模块式盒、整合侧翼(int)以及含有用于体内组装的连接物(con)序列的可能的其它DNA序列的体内组装并且在靶位点处重组。选项A与B提供用于在靶位点处组装模块式盒的方案。在选项B中,添加另外的左和右整合位点用于第二宿主。选项B之后是水平3。水平3:例如经由PCR反应或其它方法从2B回收模块式盒(或部分)。所回收的DNA用于转化,并且随后在第二宿主在靶位点处整合模块式DNA盒。
图3示出水平1的组装选项(但不限于这些),其中第iii项为使用优选地单一IIS型核酸内切酶和4 bp伸出序列(overhang)在切割和连接后组装功能性表达盒的优选方法。ii.示出开放阅读框架可分开成信号序列和开放阅读框架的独立部分,或i.以及开放阅读框架为多个片段的形式,这例如是由于蛋白质的大小或模块式特征,例如具有独立的结构域的酶像PKS、NRPS、纤维素等,或仅仅由于大小或出于蛋白质改造目的,以产生orf部分的文库序列。第iv项示出orf分开成3片。第v项示出启动子中分开成这样的启动子,其中单独添加基因的5’UTR部分。应注意,这些为实例,并且基本上可设计以多部分的形式分开的DNA序列并且使用IIs型系统连接,以产生无痕的DNA序列。在所示情况下,在蛋白质的蛋氨酸起点使用AATG。此处,启动子序列的最后一个核苷酸始终被修饰为A。选择TAAA来桥接终止子,其中基因的终止密码子被修饰为TAA,并且终止子序列的第一位被修饰为A修饰或在5’延伸A。应注意,为有效使用Golden Gate(或其它依赖于IIS型的克隆系统),优选(使得)所有序列不含用于切割的限制酶的识别位点。
图4针对骨架(bbn)载体变体的连接物(con)部分示出这些载体。第v项示出通常地应用来在水平1(图1和图2)用指定的(但不限于)给定4 bp连接物产生功能性表达盒的变体。第iv项和第ii项提供bbn载体变体,其中连接物中的一个被分别用于在靶位点处进行整合的左和右整合侧翼置换或与其组合。第ii项和第i项为变体,其中仅左或右连接物为骨架的一部分。这些通常地为仅可用在模块式盒的末端的,例如以与整合侧翼一起使用,并且在载体中储存这些。第vi项示出可在用于插入元件序列的IIs型限制位点内使用逆选择标记物用于Golden Gate克隆(或其它)。应注意,所述方法不限于使用Bsal作为IIs型限制酶,也不限于使用IIS限制酶,只要由限制得到的侧翼与待插入的单一或模块式元件或int/侧翼序列的侧翼相容即可。
图5示出在此文件中所描述的方法和系统在水平1的模块性。通过从水平0选择多个元件并且用在单锅Golden Gate(或其它)克隆反应中,产生待在水平2(图1或2)用作文库的功能性表达盒的文库,并且可能地可与图6的步骤2组合。
图6示出在此文件中所描述的方法和系统在水平2的模块性(针对图1)。功能性表达盒的文库可添加待经由体内组装和重组组装的一个或更多个模块,从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库。任选地,可在水平3回收所述文库。
图7示出在此文件中所描述的方法和系统在水平2的模块性(针对图2)。类似于图6,但在水平2步骤a具有中间体外步骤:功能性表达盒的文库可添加待经由体外组装而组装的一个或更多个模块。这个步骤可通过所得(并且可能回收的)多部分DNA序列的体内组装来进行,从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库。任选地,可在水平3回收所述文库。
图8示出并且在水平2(A)-(E)的多个变体(但不限于这些)中描述:具有独特至少25 bp连接物序列的相同的骨架(bbn)载体可被应用来体内产生敲除或整合构建体,如以下所述。水平1示出水平0的不同元件(但不限于其)可如何插入骨架载体(还参见图4),可组装来产生侧翼为用于按规定顺序在水平2进行体内组装所需要的一个或两个连接物序列的模块式元件。这些独特连接物使得可以有效地再利用这些元件载体并且允许按组合方式直接使用或作为文库使用,以产生例如涵盖多个基因的DNA伸展序列的敲除,或在文库中与int-L和int-R序列(水平2C)产生在宿主细胞中具有减少的质粒、染色体或其它DNA片的宿主细胞的文库。通常地,将应用功能性标记物盒与至少一个int-L和一个int-R序列(按所述顺序处于靶位点处,但不一定连接)。以下为数种策略(但不限于此):(A)产生标记物的插入以置换靶位点处的orf;(B)产生标记物的插入以置换靶位点处的由int-L和int_R限定的所选择DNA部分;(C)产生标记物的插入以置换靶位点处的由作为文库添加的int-L和int_R序列的组合可能性限定的所选择DNA部分,从而导致小至较大的DNA部分被置换,这取决于选择用于至少一种染色体、质粒或其它靶DNA的int-L与int-R序列的最大距离;(D)示出部分(B)可被改变来在靶位点处插入特定元件或其一部分。这可应用来以标准化的模块式方式,通过合理设计或作为文库方法交换蛋白质中的信号序列、启动子、5’UTR或模块式部分。可行的实例为启动子调谐(promoter tuning),或另一种模块式蛋白像NRPS、PKS、纤维素酶以及其它模块式蛋白等的变体的产生;(E)示出当使用多于一种的标记物和第二组与第一种不相容的连接物序列时,可一次进行多个动作。
应注意对于(D),int-R需要与靶位点正确匹配,从而不扰乱原始阅读框架。
当然,图8的方法可与图1或图2组合来使一个或更多个模块式DNA盒插入一个或更多个靶位点,同时如图8所述、作为一个或更多个预定序列或作为文库方法(图5-7)将标记物插入在第二位置并且去除或插入DNA序列。
图9示出2步途径构筑法的一般方案,所述方法为一种快速、有效且灵活的方法,这是由于用于golden gate克隆的标准化的遗传元件与提供用于体内重组的同源性的标准化的连接物相组合。
图10示出基于所获得的GFP结果,启动子表达强度的排序。所述方法的功效通过小的标准差示出,这表明了大量的正确转化株。
图11示出在针对各个启动子的lacZ和GFP报告子测定中获得的结果之间的相关性是可接受的,报道基因测定证实并且加强了针对各启动子获得的结果。
图12阐述终止子对GFP表达的影响。再次,各系列的4个测试菌落的小标准差指示高百分比的正确转化株。以最暗灰色描述的终止子的所发现大标准差是由没有GFP信号的转化株(不正确转化株的几个例外的一个)引起。
图13阐述在凝胶上针对衣康酸途径的组装分析的PCR反应的结果。PCR反应产生正确的带大小,从而指示基因组中途径的正确整合与组装。
图14示出质粒Te pep.bbn的示意图,所述质粒用于组装EBA328和EBA332表达盒。所述载体包含在RePepA ORF上游1.5 kb用于靶向到RePepA位点中的1500 bp 5’侧翼区、lox66位点、由构巢曲霉(A.nidulans)gpdA启动子驱动的ble编码区的非功能5’部分(5’ble),以及ccdB基因。
图15示出质粒pEBA1006的示意图,所述质粒与pEBA328_EBA332组合用于二分基因靶向法中,目标为在Rasamsonia emersonii中通过两个GH61表达盒置换RePepA ORF和起始ATG密码子上游的约1500个核苷酸。所述载体包含ble编码区的3’部分、构巢曲霉trpC终止子、lox71位点、RePepA ORF的2500 bp 3’侧翼区以及pUC 19的骨架(Invitrogen,Breda,TheNetherlands)。通过用限制酶NotI消化去除大肠杆菌DNA,之后转化R.emersonii菌株。
图16示出质粒pEBA328的示意图,所述质粒用作PCR的模板,以使用吉布森克隆获得质粒pEBA328_EBA332。所述载体包含在RePepA ORF上游1.5 kb用于靶向到RePepA位点中的1500 bp 5’侧翼区,由黄青霉(P.chrysogenum)Paf启动子、嗜热篮状菌(Talaromyces thermophilus)GH61编码区以及黄青霉penDE终止子组成的EBA328表达盒,lox66位点、由构巢曲霉gpdA启动子驱动的ble编码区的非功能性5’部分(5’ble)。pEBA328为pEBA332的代表,其含有EBA332表达盒而非EBA328表达盒。EBA332表达盒由R.emersonii启动子2、绵毛嗜热丝孢菌(Thermomyces lanuginosa)GH61编码区以及构巢曲霉amdS终止子(TamdS)组成。
图17示出质粒pEBA328 EBA332的示意图,所述质粒与pEBA1006载体组合用于二分基因靶向法中,目标为在Rasamsonia emersonii中通过两个GH61表达盒置换RePepA ORF和起始ATG密码子上游的约1500个核苷酸。所述载体包含在RePepA ORF上游1.5 kb用于靶向到RePepA位点中的1500 bp 5’侧翼区,由黄青霉Paf启动子、嗜热篮状菌GH61编码区以及黄青霉penDE终止子组成的GH61表达盒EBA328,由R.emersonii启动子2、绵毛嗜热丝孢菌GH61编码区以及构巢曲霉amdS终止子(TamdS)组成的GH61表达盒EBA332,lox66位点、由构巢曲霉gpdA启动子驱动的ble编码区的非功能性5’部分(5’ble)。通过用限制酶NotI消化去除大肠杆菌DNA,之后转化R.emersonii菌株。
图18示出质粒pEBA1001的示意图,所述质粒与pEBA1002载体组合用于二分基因靶向法中,目标为在Rasamsonia emersonii中使ReKu80 ORF缺失。所述载体包含2500 bp 5’上游侧翼区、lox66位点、由构巢曲霉gpdA启动子驱动的ble编码序列的5’部分以及pUC19的骨架(Invitrogen,Breda,The Netherlands)。通过用限制酶NotI消化去除大肠杆菌DNA,之后转化R.emersonii菌株。
图19示出质粒pEBA1002的示意图,所述质粒与pEBA1001载体组合用于二分基因靶向法中,目标为在Rasamsonia emersonii中使ReKu80 ORF缺失。所述载体包含ble编码区的3’部分、构巢曲霉trpC终止子、lox71位点、ReKu80 ORF的2500 bp 3’下游侧翼区以及pUC19的骨架(Invitrogen,Breda,The Netherlands)。通过用限制酶NotI消化去除大肠杆菌DNA,之后转化R.emersonii菌株。
图20示出用于使R.emersonii的ReKu80基因缺失的策略。用于使ReKu80缺失的载体包含侧翼为loxP位点的重叠非功能性ble选择标记物片段(分开的(split)标记物)以及用于靶向的ReKu80基因的5’和3’同源区(1)。所述构建体通过三重同源重组(X)在基因组ReKu80位点以及重叠同源非功能性ble选择标记物片段处整合(2)并且置换基因组ReKu80基因拷贝(3)。随后,通过cre重组酶的瞬时表达去除选择标记物,从而在lox66与lox71位点之间引起重组,导致ble基因缺失,而剩余双重突变lox72位点留在基因组中(4)。使用这种总体策略,从基因组中去除ReKu80 ORF。
图21示出用于在真菌中瞬时表达cre重组酶的质粒pEBA513的示意图。pEBA513为pAMPF21衍生的载体,其含有AMA1区和CAT氯霉素抗性基因。描绘了cre重组酶基因(cre)表达盒,其含有黑曲霉(A.niger)glaA启动子(Pgla)、cre重组酶编码区以及niaD终止子。另外,示出了由构巢曲霉gpdA启动子(PgpdA)、hygB编码区以及黄青霉penDE终止子(TpenDE)组成的潮霉素抗性盒。
图22示出在2%玉米秸秆活性测定中测试的上清液的剂量应答曲线。将不同剂量的上清液的摇瓶发酵物与2%玉米秸秆一起孵育,并且在65℃下孵育72小时。使用NMR量化释放的糖。X轴:(稀释)上清液的蛋白浓度,将200μl上清液添加至800μl底物,得到1 ml的最终测定体积。Y轴:相对葡萄糖释放(ΔGlc,任意单位):针对酶溶液中存在的残余糖(由空白测量)以及酸预处理的玉米秸秆中存在的残余糖,校准样品中测量的葡萄糖。空心圆:pEBA328_EBA332转化株;空心方块:2个空参考菌株的曲线;虚线:pEBA328_EBA332曲线拟合的95%置信区间。
图23示出选择标记物盒的使用。在选项1中,可共用一个或更多个启动子-开放阅读框架-终止子(POT)盒,其编码可选择标记物,以用于在宿主1中进行组装并且在宿主2中应用,例如POT2。在选项2中,在内部侧翼之外的一个或更多个POT盒编码可选择标记物以用于在宿主1中组装,并且另外的在内部侧翼中的一个或更多个POT用于在宿主2中应用,例如POT2用于宿主1,并且POT3用于宿主2。
序列表说明
SEQ ID NO:1至30阐述启动子元件的序列如下:SEQ ID NO:1:启动子元件Sc.EN01.Pro;Seq ID NO:2:启动子元件Sc PDCI.pro;Seq ID NO:3:启动子元件Sc EN02.pro;Seq IDNO:4:启动子元件Sc FBA1.pro;Seq IDNO:5:启动子元件Sc PGI1.pro;Seq IDNO:6:启动子元件Sc PGK1.pro;Seq ID NO:7:启动子元件Sc GPM1.pro;Seq ID NO:8:启动子元件ScPMA1_1.pro;Seq ID NO:9:启动子元件Sc OYE2.pro;Seq ID N0:10:启动子元件Sc TAL1.pro;Seq ID NO:11:启动子元件Sc TDHI.pro;Seq IDNO:12:启动子元件Sc TDH3.pro;Seq ID NO:13:启动子元件Sc TEFI.pro;Seq ID NO:14:启动子元件Sc TPI1.pro;Seq ID NO:15:启动子元件ScACTI.pro;Seq ID NO:16:启动子元件Ag Tefl.pro;Seq ID NO:17:启动子元件Sc PRE3.pro;Seq ID NO:18:启动子元件Sc VPS68.pro;Seq ID NO:19:启动子元件KLLA0A09185g(乳酸克鲁维酵母(K.lactis)启动子1);Seq IDN0:20:启动子元件KLLA0A11011g(乳酸克鲁维酵母启动子2);Seq IDNO:21:启动子元件KLLA0B08998g(乳酸克鲁维酵母启动子3);Seq IDNO:22:启动子元件KLLA0B14839g(乳酸克鲁维酵母启动子4);Seq IDNO:23:启动子元件KLLA0B 14883g(乳酸克鲁维酵母启动子5);Seq IDNO:24:启动子元件KLLA0C05566g(乳酸克鲁维酵母启动子6);Seq IDNO:25:启动子元件KLLA0D00979g(乳酸克鲁维酵母启动子7);Seq IDNO:26:启动子元件KLLA0D07634g(乳酸克鲁维酵母启动子8);Seq IDNO:27:启动子元件KLLA0E01057g(乳酸克鲁维酵母启动子9);Seq IDNO:28:启动子元件KLLA0F18260g(乳酸克鲁维酵母启动子10);Seq IDNO:29:启动子元件KLLA0F20031g(乳酸克鲁维酵母启动子11);以及SeqID NO:30:启动子元件KLLA0F20988g(乳酸克鲁维酵母启动子12)。
SEQ ID NO:31至35阐述ORF的序列如下:Seq ID NO:31:ORF元件vGFP;Seq ID NO:32:ORF元件RFP;Seq ID NO:33:ORF元件LacZ;SeqID NO:34:ORF元件GFPmut3;以及Seq ID NO:35:ORF元件GFP-pest。
SEQ ID NO:36至49阐述终止子序列如下:Seq ID NO:36:元件ADH1终止子;Seq ID NO:37:元件ADH2终止子;Seq ID NO:38:元件ENO1终止子;Seq ID NO:39:元件GPM1终止子;Seq ID NO:40:元件PDC1终止子;Seq ID NO:41:元件PGI1终止子;Seq ID NO:42:元件PGK1终止子;Seq ID NO:43:元件PMA1终止子;Seq ID NO:44:元件TAL1终止子;Seq ID NO:45:元件TDH1终止子;Seq ID NO:46:元件TDH3终止子;Seq ID NO:47:元件TEF1终止子;Seq ID NO:48:元件TEF2终止子;以及Seq ID NO:49:元件TPI1终止子。
SEQ ID NO:50阐述用于SEQ ID NO:1至49的所有元件的大肠杆菌载体的序列。
SEQ ID NO:51至63阐述连接物的序列(参见实施例)。
Seq ID NO:64至SEQ ID NO:85阐述骨架进入载体的序列(参见实施例)。
Seq ID NO:86阐述用于SEQ ID NO:64至85的所有骨架进入载体的大肠杆菌载体的序列。
SEQ ID NO:87至SEQ ID NO:112阐述PCR引物序列如下:Seq IDNO:87:con5 forw;Seq ID NO:88:cona rev;Seq ID NO:89:cona forw;Seq ID NO:90:conb rev;Seq ID NO:91:conb forw;Seq ID NO:92:conc rev;Seq ID NO:93:conc forw;Seq ID NO:94:conD rev;Seq ID NO:95:conDforw;Seq ID NO:96:conE rev;Seq ID NO:97:conE forw;Seq ID NO:98:conF rev;Seq ID NO:99:conF forw;Seq ID NO:100:conG rev;Seq IDNO:101:conG forw;Seq ID NO:102:conH rev;Seq ID NO:103:conH forw:Seq ID NO:104:conl rev;Seq ID NO:105:conl forw;Seq ID NO:106:conJrev;Seq ID NO:107:conJ forw;Seq ID NO:108:conK rev;Seq ID NO:109:conK fw;Seq ID NO:110:con3 rev;Seq IDNO:111:KanMX添加连接物上的5950正向引物;以及Seq ID NO:112:KanMX添加连接物b上的5951反向引物。
Seq ID NO:113阐述装备有连接物a和b的PCR片段KanMX标记物的序列。
SEQ ID:114阐述左侧翼INT1上的正向引物的序列。
SEQ ID NO:115阐述左侧翼INT1添加连接物5上的反向引物序列。
SEQ ID NO:116阐述具有用于在INT1进行整合的连接物5的左侧翼的序列。
SEQ ID NO:117阐述右侧翼INT1添加连接物3上的正向引物的序列。
SEQ ID NO:118阐述左侧翼INT1上的反向引物的序列。
SEQ ID NO:119阐述具有用于在INT1进行整合的连接物3的右侧翼的序列。
SEQ ID NO:120、121、122、123、124以及125阐述针对在酿酒酵母中(S.cerevisiae)产生衣康酸的代谢途径的构建而特定合成的开放阅读框架(参见表5)。
SEQ ID NO:126阐述R.emersonii RePepA(包括侧翼的基因组序列)的序列。
SEQ ID NO:127阐述R.emersonii RePepA(cDNA)的序列。
SEQ ID NO:128阐述R.emersonii RePepA(蛋白质)的序列。
SEQ ID NO:129阐述构巢曲霉gpdA启动子和ble编码区的5’部分的序列。
SEQ ID NO:130阐述ble编码区的3’部分和构巢曲霉TrpC终止子的序列。
SEQ ID NO:131阐述黄青霉Paf启动子的序列。
SEQ ID NO:132阐述嗜热篮状菌GH61的序列。
SEQ ID NO:133阐述黄青霉penDE终止子的序列。
SEQ ID NO:134阐述R.emersonii启动子2的序列。
SEQ ID NO:135阐述绵毛嗜热丝孢菌GH61的序列。
SEQ ID NO:136阐述构巢曲霉AmdS终止子的序列。
SEQ ID NO:137阐述正向吉布森引物的序列。
用于接合pEBA1013载体部分与EBA328表达盒的5’RePepA区-Ppaf。
SEQ ID NO:138阐述反向吉布森引物TpenDE的序列。
SEQ ID NO:139阐述用于接合EBA328与EBA332表达盒的正向吉布森引物TpenDE-Ppra的序列。
SEQ ID NO:140阐述反向吉布森引物Tamds的序列。
SEQ ID NO:141阐述用于接合EBA332表达盒与pEBA1013载体部分的正向吉布森引物Tamds-loxP-gpd-ble的序列。
SEQ ID NO:142阐述反向吉布森引物5′RePepA的序列。
SEQ ID NO:143阐述ReKu80(基因组序列,具有侧翼的编码区)的序列。
SEQ ID NO:144阐述ReKu80(cDNA)的序列。
SEQ ID NO:145阐述ReKu80(蛋白质)的序列。
发明详述
贯穿本说明书和随附权利要求书,词语“包含”、“包括”和“具有”以及变型应解释为包括性的。即,这些词语旨在传达在上下文允许的情况下,可包含未具体列举的其它元件或整体。
在本文中未使用数量词时用来指语法对象有一个或一个以上(即一个或至少一个)。举例来说,“元件”可意指一个元件或一个以上的元件。
本发明的系统包含具有高多样性和灵活性的限定组的部件,借此给定系统可容易地应用于许多不同的应用。值得注意的是,给定系统可用于包含不同数量的待组装成目的核酸盒的表达元件的应用。本发明的极大优势在于许多不同的表达元件可与数量比待组合的表达元件的数量小的骨架载体组合。因此,所述系统可根据许多不同的表达元件的组合和表达元件数量进行缩放,而无需用于使连接物适合于大量表达元件的额外的克隆工作。
因此根据本发明,提供一种用于制备两种或更多种标准化的模块式表达盒的方法,所述方法包括:
a.提供两组或更多组元件序列,
每组元件序列一起构成至少一种功能性表达盒,
各元件序列两侧侧翼为IIs型限制核酸内切酶切割位点,之后是其识别位点,
所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒;
b.提供至少两种骨架进入载体,
各骨架进入载体按以下这种顺序包含:(i)限制酶与其识别位点,和通常地至少约9 bp长的第一连接物序列(LF);(ii)包含可选择标记基因的载体骨架;以及(iii)同样通常地至少约9 bp长的第二连接物序列(RF),和限制酶识别位点与其切割序列;以及(iv)任选地,在(i)和(iii)的识别位点之间的插入物,
任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装;
c.使用基于经由所述切割位点使用限制酶消化和连接的方法,在所述至少两种骨架进入载体中组装所述两组或更多组元件序列作为功能性表达盒,
从而制备两种或更多种标准化的表达盒。
所述标准化的表达盒可易于在体内重组。因此,本发明提供用于在宿主细胞中在靶位点处体内重组两种或更多种标准化的模块式表达盒的方法,所述方法包括:
a.根据本文以上所述的方法制备两种或更多种标准化的模块式表达盒,其中:
i.RF和LF连接物序列包含通常地至少25个碱基对长的同源重组序列;以及
ii.任何骨架进入载体上的RF和LF序列被选择成使得其可通过体内重组分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装;以及
b.从包含LF和RF序列的骨架进入载体回收表达盒;以及
c.在宿主细胞中在靶位点处将所回收的表达盒彼此体内重组。
还提供用于在宿主细胞中在靶位点处将两种或更多种标准化的表达盒体内重组的方法,所述方法包括:
a.根据以上所述的方法制备两种或更多种标准化的模块式表达盒,其中:
i.RF和LF连接物序列包含至少9个碱基对的同源序列;以及
ii.任何骨架进入载体上的RF和LF序列被选择成使得其可使用这些序列通过体外方法分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装;以及
b.从通过LF和RF序列体外连接的骨架进入载体组装并且回收表达盒;以及
c.在宿主细胞中在靶位点处将所回收和组装的表达盒体内重组。
在本发明中,组装目的核酸构建体并且通常地整合在靶位点处。通常地,可将一系列表达盒整合在靶位点处。
根据本发明的方法涉及核酸分子彼此以及与靶位点的重组。重组是指其中核酸分子断裂并且然后接合至不同核酸分子的过程。本发明的重组过程通常地涉及可来自相同或不同生物体的不同核酸分子的人工和有意重组,从而产生重组核酸。
本发明的方法通常地依赖于同源重组反应。“同源重组”是指具有含有相似核苷酸序列(即,同源序列)的对应位点的核苷酸序列之间的反应,通过其分子可相互作用(重组),从而形成新的重组核酸序列。相似核苷酸序列的位点在本文中各自称为“同源序列”。通常,同源重组的频率随着同源序列的长度增加而增加。因此,尽管同源重组可发生在不太一致的两个核酸序列之间,但重组频率(或效率)随着两个序列之间的相异性增加而下降。
可使用本发明的方法将一系列组装的表达盒整合在靶位点处(通常地通过同源重组)。
靶位点为期望整合组装的核酸的任何位置。位点可为染色体位点,即在宿主细胞的基因组内,或为染色体外位点,例如质粒或人工染色体。用于靶向所选择的靶位点的序列将通常地为靶位点侧翼的序列。核酸序列在靶位点处的整合可导致所述序列在没有序列丢失的情况下整合在靶位点处。或者,整合可伴随有序列从靶位点的丢失。因此,核酸序列在靶位点处的整合可导致编码序列的部分或完全缺失,例如这样使得一个或更多个基因被部分或完全敲除。
两种或更多种表达盒可根据本发明在2步法中按模块式方式进行组装(参见图1和图1.2)。
在水平1,将元件序列的组与含有允许组装功能盒的左和右连接物DNA序列的骨架DNA序列(LF和RF con序列)组装在一起,其通常地含有包括启动子、orf以及终止子序列的至少2个元件。
在水平2,发生至少一种表达盒、但通常地两种或更多种表达盒与用于靶向整合的5’DNA侧翼以及用于靶向整合的3’DNA侧翼的体内组装,并且在靶位点处发生整合。
另外,在水平3,可进行步骤来从宿主细胞获得组装的表达盒,以用于在宿主细胞外进行进一步处理和/或用来修饰另一宿主细胞,或作为DNA产物。这可通过以下方式来实现:提供用于与另外的序列进行整合的,被设计成允许在第二靶位点处、通常地在第二宿主细胞中进行整合的序列。
在图1中,水平2描述了模块式表达盒从功能性表达盒以及5’和‘3盒通过体内DNA重组在靶位点处的组装。图2描述了替代方案,其中水平2分成a和b,即首先进行体外组装步骤以获得模块式表达盒,其在水平2b在宿主中在靶位点处进一步体内重组成完整的模块式DNA表达盒。
在水平2a(图2),可应用但不限于称为SLIC、吉布森以及CPEC的方法。这些方法是提供标准化的、无痕(scarless)的、(大部分)不依赖于序列的、多部分DNA组装的相关方法。由于起始材料和最终产物对于这三种方法是相同的,因此均可使用至少9 bp并且对于具体方法的效率来说可需要更长的相同同源连接物序列来加以应用(http://j5.jbei.org/j5manual/pages/22.html)。
在水平1,通常地通过单一IIs型限制核酸内切酶来催化限制。然而,也可以应用多个IIs型限制核酸内切酶,或针对元件序列载体的IIs型限制核酸内切酶与产生伸出序列(overhang)的II型限制酶的组合,所述伸出序列与对用于组装功能性表达盒的元件或具有整合侧翼(int)的表达盒的左和右元件设计的那些相容。连接是通过连接酶来催化。
本发明的方法允许通过经由在片段两端形成的单链伸出序列、使用IIs型限制核酸内切酶来组装核酸片段构建体由元件序列组产生目的表达盒。在本发明中,可使用IIs型限制酶。IIs型限制核酸内切酶识别位点为限制核酸内切酶识别双链DNA并且在切割位点切割双链DNA的识别位点,所述切割位点在双链DNA的识别位点外。IIs型限制核酸内切酶进行切割,以使得产生3至6个核苷酸的伸出序列,这取决于具体IIs型限制核酸内切酶。通常地,在本发明的方法中,可使用产生4个核苷酸的伸出序列的酶。然而,还可使用产生更长单链伸出序列的IIs型核酸内切酶。在切割时形成伸出序列的核苷酸范围在本文中称为切割位点。由于切割位点的核苷酸不是识别位点的一部分,因此其可根据期望在不破坏IIs型限制核酸内切酶的切割活性的情况下进行选择。表5给出适于本发明的方法的IIs型限制核酸内切酶的实例。
对于实施本发明,可使用提供足以在其切割位点进行有效连接的“粘性”末端的任何IIs型限制酶。对所述酶的选择被提供在REBASE网页(rebase.neb.com/cgi-bin/asymmlist)和Szybalsky等人.(1991,Gene,100:13-26)的综述中。具有不对称识别位点的切割位点在识别位点之外并且在切割时提供至少三个、优选4个或更多个核苷酸残基伸出序列(例如BLi736I;BpuAI、VpaK321、SfaNI等)的II型限制酶(例如,此网页中示出的那些)可用在本发明中。
推荐识别位点含有至少4个、更优选至少6个或更多个碱基对,以便将在目的序列部分中发现所述位点的机会最小化。还可使用具有5 bp识别位点(例如SfaNI)的IIs型限制核酸酶。在消化片段的端点产生4 nt单链伸出序列的IIs型限制核酸内切酶在理论上可产生具有256种可能的序列的末端。具有甚至更长的识别位点、例如包含十个或更多个碱基对的IIs型限制酶已被工程化。天然IIs型酶中的最大识别位点是针对酶Sapl的,其具有7bp识别位点。一个优选解决方案是使用人工IIs型酶,其被改造以具有长的识别位点(Lippow等人,2009,Nucleic acides Res.,37:3061-3073)。例如,预期具有18 bp识别位点的IIs型酶仅至多切割每个真核基因组数次,并且将允许制作不必改变天然序列的任何核苷酸的最多进入模块。
水平2选项b(图1):可包含具有左和右DNA侧翼的另外的骨架用于在水平3回收后的之后的在第二宿主中的整合。
可进行本发明的方法,其中在两种整合序列存在下进行重组步骤,其中一个与第一表达盒和靶位点的侧翼序列重组,并且其中第二个与第二表达盒和靶位点的另一侧的侧翼序列重组。
或者,整合序列可由两种骨架进入载体来提供。因此,可进行本发明的方法,以使得在重组步骤中,第一表达盒包含与靶位点的侧翼序列重组的整合序列,并且第二表达盒包含与靶位点的另一侧的侧翼序列重组的整合序列。
整合序列可包含用于与第二靶位点、任选地与第一靶位点种类不同的宿主细胞中的位点进行重组的另外的序列。
整合序列将通常地允许在靶位点处经由同源重组来进行重组。也就是说,整合序列将通常地与靶位点处的序列具有足够的同源性,以使得能够经由同源重组在靶位点处整合两种或更多种表达盒。
介导组装的表达盒与靶位点之间的同源重组的序列的长度可为至少约20 bp、至少约30 bp、至少约50 bp、至少约0.1 kb、至少约0.2 kb、至少约0.5 kb、至少约1 kb或至少约2 kb。
或者,整合序列可为由位点特异性重组酶识别的序列。也就是说,整合序列可允许经由位点特异性重组在适合重组酶存在下进行整合。
在本发明的方法中,可提供整合序列,其提供在一个宿主细胞种类中与第一靶位点重组以及然后在第二宿主细胞种类中与靶位点的重组。可在所述整合序列之间常规地提供选择标记物(用于在第一宿主细胞种类中选择)。显然,一个必要是将所述标记物放置在位于表达盒一侧的两个整合位点之间。例如,整合位点可提供在表达盒的5’和3’端,其对于第一宿主细胞种类中的靶位点是特异的。选择标记物然后可被提供成邻近于一个整合位点、位于整合位点与表达盒一端之间。选择标记物将通常地适于在第一宿主细胞种类中进行选择。然后,可提供用于第二宿主细胞种类的另外的整合位点。这些整合位点中的一个将位于选择标记物与表达盒的一端之间。然后另一个将定位在表达盒的另一端与整合位点(对于第一宿主细胞种类特异)之间。
这种方法图解在图23中,其示出选择标记物盒的使用。在选项1中,可共用一个或更多个启动子-开放阅读框架-终止子(POT)盒,其编码可选择标记物以用于在宿主1中组装和在宿主2中应用,例如POT2。在选项2中,在内部侧翼之外的一个或更多个POT盒编码可选择标记物,以用于在宿主1中组装,并且另外的在内部侧翼中的一个或更多个POT用于在宿主2中应用,例如POT2用于宿主1,并且POT3用于宿主2。
在本发明的方法中,可在靶位点处按预定顺序顺次(in series)组装并且重组一系列表达盒,例如至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20或更多个表达盒。
可进行所述方法以使得至少一个表达盒能够表达标记物。也就是说,至少一个表达载体可编码可充当标记物的多肽。
在本发明的方法中,可使用不根据本发明的方法产生的一个或更多个表达盒。
在本发明的方法中,提供至少两组元件序列。每组元件序列将通常地能够组装成表达盒。在本发明的背景下,表达盒旨在指示引导细胞机器制作RNA和蛋白质的核酸序列。通常地,表达盒将包含编码序列和控制所述编码序列的表达的序列。通常地,表达盒可至少包含启动子、开放阅读框架以及终止子序列。
术语“控制序列”在本文中定义为包括对于mRNA或多肽在体外或在宿主细胞内的产生必要或有利的所有成分。各控制序列对于编码多肽的核酸序列可为天然的或外源的。所述控制序列包括但不限于前导子、Shine-Delgarno序列、最优翻译启始序列(如Kozak,1991,J.Biol.Chem.266:19867-19870所述)、聚腺苷酸化序列、肽原序列、前肽原序列、启动子、信号序列以及转录终止信号。至少,控制序列通常地包含启动子以及转录终止信号(终止子或终止信号)。还可通常地存在翻译起始和停止信号。控制序列可根据其具体目的而加以优化。
术语“启动子”在本文中定义为结合RNA聚合酶并且引导聚合酶至编码生物化合物的核酸序列的正确下游转录起始位点从而启始转录的DNA序列。RNA聚合酶有效地催化与编码区的适合DNA链互补的信使RNA的组装。还应理解,术语“启动子”包括用于在转录成mRNA后翻译的5′非编码区(在启动子与翻译起点之间)、顺式作用转录控制元件如增强子,以及能够与转录因子相互作用的其它核苷酸序列。
通常地进行本发明的方法,使得表达盒的元件在骨架进入载体中进行组装,这样使得它们处于可操作连接。术语“可操作连接(operable linkage)”或“可操作连接(operably linked)”等在本文中定义为以下构型,其中控制序列被适当地放置在相对于DNA序列的编码序列的位置处,这样使得控制序列引导mRNA或多肽的产生。
因此,在本发明的背景下的元件为表达盒的任何组成部分。元件的组为可一起产生表达盒的元件的组。本发明的方法需要提供两组元件序列。这意味着提供足够的元件以使得可产生至少两种不同的表达盒。这暗含必须提供至少两种不同种类的至少一种元件。也就是说,出于本发明的目的,一种启动子与两种ORF以及两种终止信号相组合构成两组元件序列。
在本发明的方法中,通常地元件序列组中的至少两组包含启动子元件、开放阅读框架元件以及终止信号元件。
在根据本发明的方法中,元件组中的一组或更多组可包含“部分”元件序列,如UTR、信号肽以及分开的(split)开放阅读框架。
按一种形式提供每组元件序列以使得所述组可在骨架进入载体中组装成功能性表达盒。因此通常地,各元件在两侧侧翼为IIs型限制核酸内切酶切割位点,之后是其识别位点,所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒。各元件序列和侧翼序列因此通常地按顺序从一端到另一端包含:IIs型限制核酸内切酶识别位点;其切割位点;元件序列;IIs型限制核酸内切酶切割位点;其识别位点。
因此,在合适载体中制备或提供的所述元件的组,其具有IIs型限制核酸内切酶识别位点和标准化的切割位点(优选4 bp)所述位点被选择成使得例如使用单锅法(如Golden gate克隆)组装后,形成功能性表达盒。
制备或提供骨架进入载体的组。这些载体含有适于使用序列同源性进行组装的左和右连接物序列,以用于在(参见图1和图2的水平1)组装模块式盒。
更详细来说,各骨架进入载体通常地按以下这种顺序包含:(i)限制酶切割位点与其识别位点,和第一连接物序列(LF);(ii)包含可选择标记基因的载体骨架;以及(iii)第二连接物序列(RF),和限制酶识别位点与其切割序列;以及(iv)任选地,在(i)和(iii)的识别位点之间的插入物,任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列组装。
选择元件序列的亚组与骨架(bbn)进入载体。可例如使用Golden Gate克隆将它们进行组装,从而产生包含在骨架进入载体中的功能性表达盒。
在根据本发明的方法中,每组中的元件被限定成使得按预定顺序组装表达盒。另外,骨架进入载体中的连接物序列还被选择成使得表达盒可按预定顺序组装。
用于在靶位点处进行整合的左和右侧翼(参见图1和图2的水平2)可通过骨架进入载体本身来提供,或可作为另外的序列来添加。可经由PCR反应提供整合序列,其中它们是所用引物的一部分。
在水平2,在适合的宿主细胞中发生功能性表达盒与整合侧翼(int)和含有用于体内组装的连接物(con)序列的可能的其它DNA序列的体内组装并且在靶位点处重组。
通常地,可通过PCR反应从由水平1得到的载体回收待组装的所有DNA部分,以供在水平2使用,或例如使用经由适合的IIs限制酶以及其设计在con-载体外侧的识别位点切出这些片段的方法,并且切割在其间包含DNA序列的con-载体。
图1中的选项a和b均提供用于在靶位点处组装模块式盒的方案。在选项b中,添加另外的左和右整合位点用于第二宿主。选项b之后可以是水平3。
在水平3(参见图1和图2),可例如经由PCR反应或其它方法从2b回收模块式盒(或部分)。所回收的DNA用于转化,并且随后在第二宿主在靶位点处整合模块式DNA盒。
在本发明的方法中,连接物序列使得能够在来自不同骨架进入载体的表达盒之间进行重组。所述序列的长度可改变,这取决于待进行的组装的类型,即体内或体外,和/或其中发生重组的种类。体内重组的连接物将通常地为约20bp至约500bp长,例如约25bp长(例如,在酵母的情况下)。例如,待在吉布森反应中体外重组的连接物长度可为约9bp、10bp、11bp、12bp、13bp、14bp、15bp或更长。
为了促进在所靶向的位点处的所靶向整合并且确保组装,提供用于整合的连接物序列。所述序列长度可为至少约20bp、至少约30bp、至少约50bp、至少约0.1 kb、至少约0.2kb至至少约0.5 kb、至少约1 kb、至少约2 kb,或至少约5kb。
图3示出水平1的组装选项(但不限于这些),其中第iii项为在切割和连接后使用优选地单一IIs型核酸内切酶和4 bp伸出序列来组装功能性表达盒的优选方法。ii.示出开放阅读框架可分开成信号序列和开放阅读框架的独立部分,或i.以及多个片段形式的开放阅读框架,这例如是由于蛋白质的大小或模块式特征,例如具有独立的结构域的酶像PKS、NRPS、纤维素等,或仅仅由于大小或出于蛋白质工程目的,以便产生orf部分的文库序列。第iv项示出分开成3片以用于orf。第v项示出启动子分开成启动子,其中单独添加基因的5’UTR部分。应注意,这些为实例,并且基本上可设计多部分的分开DNA序列并且使用IIs型系统连接,以产生无痕的DNA序列。在所示情况下,在蛋白质的蛋氨酸起点使用AATG。此处,启动子序列的最后一个核苷酸始终修饰为A。选择TAAA来桥接终止子,其中在TAA修饰基因的终止密码子,并且终止子序列的第一位置用A修饰或在5’延伸A。应注意,为有效使用Golden Gate(或其它依赖于IIs型的克隆系统),优选(使得)所有序列不含用于切割的限制酶的识别位点。
图4针对骨架(bbn)载体变体的连接物(con)部分示出这些载体。第v项示出通常地应用来在水平1(图1和图2)用指定的(但不限于)给定4 bp连接物产生功能性表达盒的变体。第iv项和第ii项提供bbn载体变体,其中连接物中的一个被分别用于在靶位点处进行整合的左和右整合侧翼置换或与其组合。第ii项和第i项为变体,其中仅左或右连接物为骨架的一部分。这些通常地为仅可用在模块式盒的末端的,例如以与整合侧翼一起使用,并且在载体中储存这些。第vi项示出可在用于插入元件序列的IIs型限制位点内使用逆选择标记物用于Golden Gate克隆(或其它)。应注意,所述方法不限于使用Bsal作为IIs型限制酶,也不限于使用IIS限制酶,只要由限制得到的侧翼与待插入的单一或模块式元件或int/侧翼序列的侧翼相容即可。
在本发明的方法中,可组装多个表达盒,每个盒包含生物途径成员。如本文所用,术语“途径”应广泛解释,并且可指一系列同时、连续或单独的化学反应,其通过经由一个或更多个中间物将底物或开始元件转化成终末化合物或期望产物的活性来实现。在某些实施方式中,活性有时是将底物转化为中间物或产物(例如,通过酶催化转化)并且有时是结合分子或配体。如本文所用,术语“一致途径”是指来自相关或不相关生物体的、具有相同数量和类型的活性并且产生相同的终末产物的途径。如本文所用,术语“相似途径”是指来自相关或不相关生物体的、具有以下一项或多项的途径:不同数量的活性、不同类型的活性、利用相同起始或中间分子,和/或产生相同终末产物。
根据前述权利要求中任一项所述的方法,其中在至少一组元件中的至少一种元件的变体被提供成使得产生至少一种标准化的模块式表达盒的变体。
以此方式,可例如通过利用天然存在的遗传多样性和/或改造的遗传多样性来实现途径改善和优化。可通过测试来自不同生物体的多核苷酸亚组来利用天然存在的遗传多样性。可通过测试例如已经密码子优化或突变的多核苷酸亚组来利用改造的遗传多样性。对于密码子优化的多样性,氨基酸密码子三联体可替换为其它密码子和/或可添加、去除或替换某些核苷酸序列。例如天然密码子可替换为更或更不优选的密码子。在某些实施方式中,可通过将相关或相似的活性替换为来自相似但不一致的途径的一个或多个步骤来优化途径。亚组中的多核苷酸还可遗传改变,以使得当编码时,实现不同于天然对应物的活性的活性,所述天然对应物用作起始材料用于遗传改变。本领域技术人员改变的核酸和/或氨基酸序列可称为“改造的”遗传多样性。
任何给定元件的所有变体可全部彼此共有至少约50%序列一致性。
代谢途径可视为一系列反应步骤,这些步骤将开始底物或元件转化成最终产物。各步骤可通过一种或更多种活性来催化。在其中底物A转化为终末产物D的途径中,中间物B和C产生并且通过所述途径中的特定活性转化。途径的各特定活性可视为一个种类的活性亚组,并且编码所述活性的多肽可视为一个种类的对应多肽亚组。
任何肽、多肽或蛋白质或通过一个或更多个肽、多肽或蛋白质催化的活性可通过多核苷酸亚组来编码。代表性蛋白质包括酶(例如代谢途径的部分或全部)、抗体、血清蛋白(例如白蛋白)、膜结合蛋白、激素(例如生长激素、红细胞生成素、胰岛素等)、细胞因子等,并且包括天然存在的与外源表达的多肽。代表性活性(例如,功能上相关联以在代谢途径中提供活性或活性组的酶或酶的组合)包括与期望代谢途径相关联的任何活性。如本文所用,术语“酶”可指充当催化剂以诱导其它化合物的化学变化、进而由一种或更多种底物产生一种或更多种产物的蛋白质。
应理解,在本文所呈现的实施方式中描述的方法和组合物可用于(i)优化产生期望终末产物的任何代谢途径;和/或(ii)优化代谢途径的活性亚组内的亚结构域。如本文所用,术语“蛋白质”指具有由肽键连接的氨基酸序列的分子。这个术语包括融合蛋白、寡肽、肽、环状肽、多肽以及多肽衍生物,无论是天然的还是重组的,并且还包括其片段、衍生物、同源物以及变体。蛋白质或多肽有时是胞内起源(例如体内位于宿主细胞的核内、细胞质内或间质间隙内)并且有时为体内细胞膜蛋白质。在一些实施方式中(以上所述,并且以下在改造与改变方法中进一步详细描述),遗传修饰可导致靶标活性的改变(例如,增大、基本增大、下降或基本下降)。
在本发明的方法中,所用表达盒可构成生物学途径,该途径使得能够在宿主细胞中产生目的化合物。目的化合物为初级代谢物、次级代谢物、多肽或多肽的混合物。
因此,本发明的方法可在水平1以模块式形式使用(参见图5)。通过从水平0选择多个元件并且用在单锅Golden Gate(或其它)克隆反应中使用,产生待在水平2(图1或2)用作文库的功能性表达盒的文库,并且可与图6的步骤2组合。
所述方法可在水平2以模块式形式使用(例如,在如图1阐述的方法中)。因此,功能性表达盒的文库可被添加待经由体内组装和重组组装的一个或更多个模块,从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库(参见图6)。任选地,可在水平3回收所述文库。
所述模块式方法水平2可在水平2以中间体外步骤来进行(例如在如图2所阐述的方法中)。因此,功能性表达盒的文库可添加待经由体外组装组装的一个或更多个模块(参见图7)。这个步骤可通过所得(并且可能回收的)多部分DNA序列的体内组装来进行,从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库。任选地,可在水平3回收所述文库。
在水平2(参见图8(A)-(E))的使用具有独特至少25 bp连接物序列的相同骨架(bbn)载体的多个变体可应用来体内产生敲除或整合构建体。水平1示出水平0的不同元件(但不限于此)可如何插入骨架载体(还参见图4),可组装来产生侧翼为用于按规定顺序在水平2进行体内组装所要求的一个或两个连接物序列的模块式元件。这些独特连接物使得有可有效地再利用这些元件载体并且允许按组合方式直接或作为文库进行利用,以产生例如涵盖多个基因的DNA伸展序列的敲除,或在具有int-L和int-R序列的文库中使用(水平2C),以产生在宿主细胞中具有减少的质粒、染色体或其它DNA片的宿主细胞的文库。通常地,将应用功能性标记物盒与至少一个int-L和一个int-R序列(按所述顺序处于靶位点处,但不一定连接)。
以下为数种策略(但不限于此):(A)产生标记物的插入以置换靶位点处的orf;(B)产生标记物的插入以置换靶位点处的由int-L和int-R限定的所选择DNA部分;(C)产生标记物的插入以置换靶位点处的由作为文库添加的int-L和int-R序列的组合可能性限定的所选择DNA部分,从而导致小至较大的DNA部分被置换,这取决于选择用于至少一种染色体、质粒或其它靶标DNA的int-L与int-R序列最大距离;(D)示出部分(B)可被改变来在靶位点处插入特定元件或其部分。这可应用来以标准化的模块式方式,通过合理设计或作为文库方法交换蛋白质中的信号序列、启动子、5’UTR或模块式部分。可能的实例为启动子调谐,或另一种模块式蛋白像NRPS、PKS、纤维素酶以及其它模块式蛋白等的变体的产生;(E)示出当使用多于一种的标记物和第二组与第一组不相容的连接物序列时,可一次进行多个动作。
应注意对于(D),int-R需要与靶位点正确匹配,从而不扰乱原始阅读框架。
当然,图8所示的方法可与图1或图2所示的方法组合来使一个或更多个模块式DNA盒插入到一个或更多个靶位点,同时如图8所述、作为一个或更多个预定序列或作为文库方法(图5-7),将标记物插入在第二位置并去除或插入DNA序列。
因此,本发明提供一般2步途径构筑法,其为快速、有效且灵活的方法,这是由于用于golden gate克隆的标准化的遗传元件与提供用于体内重组的同源性的标准化的连接物相组合。
本发明因此提供用于在靶位点处整合核酸序列的方法。
所述用于在靶位点处整合DNA序列的方法包括:
a.提供:(i)一组至少约200个碱基对长的至少两个左(int-L)和两个右(int-R)整合序列,用于同源重组至宿主细胞中的至少一个靶位点,其中:
所述左(int-L)序列侧翼为一个至少约25个碱基对的连接物序列;
所述右(int-R)序列侧翼为一个至少约25个碱基对的连接物序列;以及
(ii)至少一个表达盒,其在两侧侧翼为至少约25个碱基对的连接物序列;以及
b.通过在int-L和int-R序列的同源靶位点处重组来体内组装来自步骤(a)的至少三个序列的组,以使得至少一个左和至少一个右整合序列按照这种顺序处于所述宿主细胞的靶位点处,
其中体内组装后,至少一个表达盒存在于靶位点处,任选地所述表达盒能够表达功能性标记物。
在所述方法中,至少一个表达盒可经由两种或更多种核酸序列在步骤(b)中组装,从而产生例如含有标记物多肽编码ORF的至少一个功能性表达盒。
所述方法可包括:
a.根据权利要求1所述的方法制备两种或更多种标准化的模块式表达盒,其中
i.所述int-L和int-R序列为启动子、orf或终止子序列的一部分;
ii.所述RF和LF连接物序列包含至少25个碱基对的同源重组序列;以及
iii.任何骨架进入载体上的RF和LF序列被选择成使得其可分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列通过体内重组进行组装;以及
b.从包含LF和RF序列的所述骨架进入载体回收表达盒;以及
c.在宿主细胞中在所述靶位点处将所回收的表达盒彼此体内重组。
用于在靶位点处整合DNA序列的方法可包括:选择两个或更多个int-L和两个或更多个int-R序列,用于在一个体内组装和重组反应中使用,从而产生多个宿主细胞,所述细胞具有通过所选择的int-L和int-R序列靶向至少2个允许的组合的DNA组合,其中:
i.至少两个int-L序列在所述靶标DNA序列处在至少一个int-R序列的左侧;或
ii.至少两个int-R序列在所述靶标DNA序列处在至少一个int-L序列的右侧。
在这些方法中,第二功能标记物盒可整合在第二靶位点处。因此所述方法可用于产生双重或三重突变体,或含有4、5、6、7、8、9、10或更多个突变的突变体。
所述方法可产生一起处于所述靶位点处的功能基因或功能基因组的功能性敲除或下调。也就是说,本发明可用于在靶位点处进行基因的缺失或敲除或敲低。
在本发明的所述方法中,至少一个int-R序列可与开放阅读框架的至少开始200个碱基对同源,并且在左侧功能性联接至待插入在开放阅读框架之前的DNA序列,从而使得开放阅读框架具有至少50个碱基对的修饰的5’UTR序列。这使得能够插入新的启动子和/或置换信号序列。
最优选为以下IIs型限制核酸内切酶:Bsal、Bbsl、BsmBI、Sapl、BspMI、Aarl、Esp31、Bpil以及Hgal。许多列举的限制核酸内切酶可从New EnglandBiolabs获得。这些酶的来源还可见以上所述的REBASE网页。
待用于本发明的连接酶的实例包括T4 DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶,全部可从New England Biolabs商购获得。
适用于本发明的宿主细胞可包括以下特点中的一个或更多个:需氧菌、厌氧菌、丝状、非丝状、单倍体、二倍体、营养缺陷型和/或非营养缺陷型。
适用于本发明的宿主细胞可为原核微生物(例如细菌)或非原核微生物。适合的宿主细胞可为真核微生物(例如酵母、真菌、变形虫以及藻类)。适合的宿主细胞可来自非微生物来源,例如哺乳动物或昆虫细胞。
“真菌”在本文中定义为真核微生物并且包括所有真菌亚门的物种(Alexopoulos,C.J.,1962,见:Introductory Mycology,John Wiley&Sons,Inc.,New York)。术语真菌因此包括丝状真菌和酵母。“丝状真菌”在本文中定义为包括所有丝状形式的真菌亚门和卵菌门的真核微生物(如上文的Hawksworth等人,1995所定义)。丝状真菌的特征在于菌丝体壁由壳聚糖、纤维素、葡聚糖、甲壳质、甘露聚糖以及其它复杂的多糖构成。营养生长是通过菌丝伸长,并且碳分解代谢是强制好氧的。丝状真菌菌株包括但不限于以下菌株:枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球菌属(Cryptococcus)、Filibasidium、铼孢属(Fusarium)、腐质霉属(Humicola)、稻痕菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、梨囊鞭菌属(Piromyces)、裂裙菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、草根霉属(Thielavia)、弯颈霉属(Tolypocladium)以及木霉属(Trichoderma)。
“酵母”在本文中定义为真核微生物,并且包括主要以单细胞形式生长的真菌亚门的所有物种。酵母可通过单细胞菌体的出芽生长或可通过生物体的裂体生长。
根据本发明的宿主细胞优选为真菌宿主细胞,其中真菌在本文中定义如上。优选的真菌宿主细胞为如下所述用于工业发酵过程以供生产发酵产物的真菌。很多种类的丝状真菌以及酵母用于所述过程中。优选的丝状真菌宿主细胞可选自以下属:曲霉属、木霉属、腐质霉属、枝顶孢属、铼孢属、根霉属(Rhizopus)、被孢霉属(Mortierella)、青霉属、毁丝霉属(Myceliophthora)、金孢子菌属(Chrysosporium)、毛霉属、类壳属(Sordaria)、脉孢菌属、粪壳菌属(Podospora)、红曲霉属(Monascus)、伞菌属(Agaricus)、密孔菌属(Pycnoporus)、裂榴菌属(Schizophylum)、栓菌属(Trametes)以及黄孢原毛平革菌属(Phanerochaete)。可用作宿主细胞、例如参考宿主细胞以便比较转化与未转化细胞的发酵特征的优选真菌菌株包括例如黑曲霉(Aspergillus niger)CBS120.49、CBS 513.88,米曲霉(Aspergillus oryzae)ATCC16868、ATCC 20423、IFO 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892,烟曲菌(Aspergillus fumigatus)AF293(CBS101355),黄青霉CBS 455.95、橘青霉(Penicillium citrinum)ATCC 38065、黄青霉P2,顶头孢霉(Acremonium chrysogenum)ATCC 36225、ATCC 48272,里氏木霉(Trichoderma reesei)ATCC 26921、ATCC 56765、ATCC 26921,酱油曲霉(Aspergillus sojae)ATCC 11906,Chrysosporiumlucknowense ATCC44006以及所有这些菌株的衍生物。特别优选作为丝状真菌宿主细胞的是黑曲霉CBS 513.88以及其衍生物。
任何适合的酵母可选择作为宿主细胞。优选的酵母宿主细胞可选自以下属:酵母属(Saccharomyces)(例如酿酒酵母、贝酵母(S.bayanus)、巴氏酵母(S.pastorianus)、卡氏酵母(S.carlsbergensis))、克鲁维酵母菌属(Kluyveromyces)、假丝酵母属(Candida)(例如C.revkaufi、铁红假丝酵母(C.pulcherrima)、热带假丝酵母(C.tropicalis)、产朊假丝酵母(C.utilis))、毕赤酵母属(Pichia)(例如巴斯德毕赤酵母(P.pastoris))、裂殖酵母属(Schizosaccharomyces)、汉森酵母属(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)以及耶罗威亚酵母属(Yarrowia)(例如解脂耶罗威亚酵母(Y.lipolytica)(先前归类为解脂假丝酵母菌(Candida lipolytica))。
任何适合的原核生物可选择作为宿主细胞。可选择革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于杆状细菌(例如枯草芽孢杆菌(B.subtilis)、禾谷巨大芽孢杆菌(B.megaterium))、不动杆菌(Acinetobacterbacteria)、诺卡氏菌(Norcardia baceteria)、黄色杆菌(Xanthobacter bacteria)、弗氏埃希菌(Escherichia bacteria)(例如大肠杆菌(例如菌株DH 1 OB、Stbl2、DH5-α、DB3、DB3.1)、DB4,DB5、JDP682以及ccdA-over(例如美国申请No.09/518,188)))、链霉菌、欧文氏菌、克雷伯氏菌、沙雷氏菌(例如粘质沙雷氏菌(S.marcessans))、假单胞菌(例如铜绿假单胞菌(P.aeruginosa))、沙门氏菌(例如鼠沙门氏伤寒杆菌(S.typhimurium)、伤寒杆菌(S.typhi))。细菌还包括但不限于光合细菌(例如绿色非硫细菌(例如绿弯菌(例如C.aurantiacus)、绿丝菌(例如C.gigateum)),绿色硫菌(例如绿硫细菌(例如C.limicola)、突柄绿菌(例如P.luteolum)),紫色硫菌(例如紫硫细菌(例如傲氏着色菌(C.okenii)))以及紫色非硫菌(例如红螺菌(例如深红红螺菌(R.rubrum))、红细菌(例如类球红细菌(R.sphaeroides)、荚膜红细菌(R.capsulatus))以及红微菌(例如R.vanellii))。
来自非细菌生物的细胞可用作宿主细胞。所述细胞的实例包括但不限于昆虫细胞(例如果蝇(例如黑腹果蝇(D.melanogaster))、灰夜蛾(例如草地贪夜蛾(S.frugiperda)Sf9或Sf21细胞)以及粉斑蛾(例如High-Five细胞);线虫细胞(例如秀丽隐杆线虫(C.elegans)细胞);禽类细胞;两栖动物细胞(例如非洲爪蟾(Xenopus laevis)细胞);爬虫类动物细胞;以及哺乳动物细胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、Bowes黑色素瘤以及HeLa细胞)。
在本发明中适用作宿主细胞的微生物或细胞可商购获得。
真核细胞具有至少两个独立的途径(一个经由同源重组(HR),并且一个经由非同源重组(NHR)),通过这两个途径核酸(特别是DNA)可整合到宿主基因组中。酿酒酵母为优先同源重组(HR)的生物体。此生物体的非同源与同源重组的比率(NHR/HR)可在约0.07至0.007之间变化。
WO 02/052026公开酿酒酵母的突变体,其具有改善的DNA序列靶向到其基因组的效率。所述突变体株缺乏NHR中涉及的基因(KU70)。
与酿酒酵母不同,最高等的真核生物如丝状真菌细胞至哺乳动物细胞优先NHR。在丝状真菌中,NHR/HR比率在1与大于100之间的范围内。在所述生物体中,靶向的整合频率相当低。
这样,为改善多核苷酸在靶位点组装的效率,优选在根据本发明的方法中提高宿主细胞中同源重组(HR)的效率。
因此,优选地在根据本发明的方法中,宿主细胞的同源重组(HR)的效率被优选地诱导型地增大。
因为NHR与HR途径互相关联,因此HR的效率可通过调节一个或两个途径来增大。增大HR部件的表达将增大HR的效率,并且降低NHR/HR的比率。降低NHR部件的表达也将降低NHR/HR的比率。根据本发明的载体-宿主系统的宿主细胞中HR效率的增大优选描述为NHR/HR比率的降低,并且优选相对于亲本宿主细胞来进行计算,在所述亲本细胞中HR和/或NHR途径未经过调节。HR与NHR的效率可通过所属领域的技术人员可用的不同方法来测量。优选方法包括测定单一载体构建体在亲本与经过调节的宿主细胞中的靶向整合和异位整合的效率。然后可针对两种细胞类型技术NHR/HR的比率。随后,可计算NHR/HR比率的下降。在WO2005/095624中,全面描述了这种优选方法。
与亲本细胞相比,具有降低的NHR/HR比的宿主细胞可通过增大HR途径的效率和/或通过增大NHR途径的效率来修饰基本真核细胞来获得。优选地,NHR/HR比率因而降低至少两倍、优选至少4倍、更优选至少10倍。优选地,与亲本宿主细胞相比,在根据本发明的载体-宿主系统的宿主细胞中NHR/HR比率降低至少5%、更优选至少10%、甚至更优选至少20%、甚至更优选至少30%、甚至更优选至少40%、甚至更优选至少50%、甚至更优选至少60%、甚至更优选至少70%、甚至更优选至少80%、甚至更优选至少90%并且最优选至少100%。
根据一个实施方式,通过增大HR部件的表达水平降低NHR/HR的比率。HR部件为所属领域的技术人员所熟知。HR部件在本文中定义为在控制多核苷酸靶向整合到宿主的基因组中涉及的所有基因和元件,所述多核苷酸与宿主基因组的某预定位点具有一定同源性,其中整合是靶向的。
可通过降低NHR部件的表达水平来降低NHR/HR的比率。NHR部件在本文中定义为在控制多核苷酸整合到宿主的基因组中涉及的所有基因和元件,而不考虑所述多核苷酸与宿主的基因组序列的同源性程度。NHR部件为所属领域的技术人员所熟知。优选的NHR部件为选自以下的部件:在NHR途径中涉及的酵母基因的根据本发明的载体-宿主系统的宿主细胞的同源物或直向同源物:KU70、KU80、RAD50、MRE11、XRS2、LIG4、LIF1、NEJ1以及SIR4(van den Bosch等人,2002,Biol.Chem.383:873-892;以及Allen等人,2003,Mol.Cancer Res.1:913-920)。最优选为以下中的一个:KU70、KU80和LIG4,以及KU70与KU80二者。可使用如本文所述的用于获得必要基因的缺乏的方法实现NHR部件的表达水平的降低。
由于降低NHR中涉及的部件的表达有可导致不利表型作用,因此优选在根据本发明的载体-宿主系统的宿主细胞中,同源重组效率的增大是可诱导的。这可通过所属领域的技术人员已知的方法来实现,例如通过使用针对NHR部件的可诱导过程(例如,通过将NHR部件放置在可诱导启动子之后)或通过使用NHR部件的瞬时破坏,或通过将编码NHR部件的基因放回到基因组中。
在本发明中,可使用标记物基因(或选择标记物或标记物等)。可使用任何适合的标记物基因,并且熟知所述基因是用来确定核酸是否包含在细胞中。根据本发明制备的组装的多核苷酸可包含两种或更多种标记物基因,其中在一种标记物基因在一种生物体中有效地起作用,并且另一种标记物基因在另一生物体中有效地起作用。
标记物基因的实例包括但不限于(1)编码提供针对否则有毒的化合物的抗性的产物(例如抗生素)的核酸片段;(2)编码否则在受体细胞中缺少的产物(例如必要产物、tRNA基因、营养缺陷标记物)的核酸片段;(3)编码抑制基因产物的活性的产物的核酸片段;(4)编码可易于鉴别的产物(例如表型标记物,如抗生素抗性标记物(例如β-内酰胺酶)、β-半乳糖苷酶、荧光或其它有色标记物,如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和青色荧光蛋白(CFP),以及细胞表面蛋白)的核酸片段;(5)结合否则对细胞存活和/或功能有害的产物的核酸片段;(6)以其它方式抑制的如以上1-5中所述的任何核酸片段的活性的核酸片段(例如反义寡核苷酸);(7)结合修饰底物的产物(例如限制内切酶)的核酸片段;(8)可用于分离或鉴别期望分子(例如特定蛋白结合位点)的核酸片段;(9)编码否则可为非功能性的特定核苷酸序列(例如,分子亚群的PCR扩增)的核酸片段;(10)当不存在时直接或间接赋予对具体化合物的抗性或敏感性的核酸片段;(11)编码在受体细胞中的有毒或将相对无毒性的化合物转化为毒性化合物的产物(例如单纯疱疹-胸腺激酶、胞嘧啶脱氨酶)的核酸片段;(12)抑制含有其的核酸分子的复制、分割或遗传力的核酸片段;(13)编码条件性复制功能的核酸片段,例如在某些宿主或宿主细胞株中或在某些环境条件下(例如温度、营养条件等)进行复制;和/或优选为以下的必要基因:尚未示出非必要性的基因,更优选地,缺乏致使宿主细胞不能生存的基因。更优选地,必要基因为缺乏致使宿主细胞在所有条件下并且在任何培养基、特别是复杂(未定义)培养基上均不能生存的基因。在本发明的背景下必要基因可为当已使得另一(非必要)基因缺乏时使得宿主细胞不能生存的基因。
当显示出某一水平的相似性时,认为氨基酸或核苷酸序列是同源的。两个序列同源指示共同进化起源。两个同源序列是紧密相关还是更远地相关由分别为高或低的“同一性百分比”或“相似性百分比”来指示。虽然有争议,但应指出频繁地可互换地使用“同一性百分比”或“相似性百分比”、“同源程度”或“同源百分比”。出于本发明的目的,可使用数学算法完成两个序列之间的序列比较和同一性百分比的确定。所属领域的技术人员应意识到以下事实:数种不同的计算机程序可用于比对两个序列并且测定两个序列之间的同源性(Kruskal,J.B.(1983)An overview of sequencecomparison,见D.Sankoff和J.B.Kruskal,(编),Time warps,string edits andmacromolecules:the theory and practice of sequence comparison,第1-44页Addison Wesley)。
可使用比对两个序列的Needleman和Wunsch算法测定两个核酸或氨基酸序列之间的同一性百分比(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。所述算法比对氨基酸序列以及核苷酸序列。Needleman-Wunsch算法已经在计算机程序NEEDLE中执行。出于本发明的目的,使用来自EMBOSS包的NEEDLE算法(2.8.0版或更高版,EMBOSS:欧洲分子生物学开放软件套件(The European Molecular BiologyOpen Software Suite)(2000)Rice,P.Longden,I.和Bleasby,A.Trends inGenetics 16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列,EBLOSUM62可用于取代矩阵。对于核苷酸序列,可使用EDNAFULL。可指定其它矩阵。用于比对氨基酸序列的任选参数为空位开放罚分10和空位扩展罚分0.5。所属领域的技术人员应理解所有这些不同参数将得到略微不同的结果,但当使用不同算法时两个序列的总同一性百分比不会显著改变。
同源性或同一性为两个完整序列之间的在包括任何空位或扩展的总比对区上的一致匹配的百分比。两个比对序列之间的同源性或同一性可计算如下:比对中在两个序列中示出一致氨基酸或核酸残基的对应位置的数量除以包括空位的比对的总长度。如本文所定义的同一性可由NEEDLE获得并且在程序的输出中标记为“同一性(IDENTITY)”。
两个比对序列之间的同源性或同一性可计算如下:比对中在两个序列中示出一致氨基酸或核酸残基的对应位置的数量除以减去排列中的总空位数量后排列的总长度。如本文所定义的一致性可使用NOBRIEF选项由NEEDLE获得并且在程序的输出中标记为“最长同一性(longest-identity)”。
序列同一性还可通过在严谨条件下进行的杂交测定来确定。如本文所用,术语“严谨条件”是指杂交和洗涤条件。杂交条件为所属领域的技术人员所已知,并且可见Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.,6.3.1-6.3.6(1989)。在所述文献中描述了水性和非水性方法,并且可使用任一种。严谨杂交条件的实例为在6X氯化钠/柠檬酸钠(SSC)中在约45℃下杂交,接着在0.2X SSC、0.1%SDS在50℃下洗涤一次或多次。严谨杂交条件的另一实例为在6X氯化钠/柠檬酸钠(SSC)中在约45℃下杂交,接着在0.2X SSC、0.1%SDS在55℃下洗涤一次或多次。严谨杂交条件的另一实例为在6X氯化钠/柠檬酸钠(SSC)中在约45℃下杂交,接着在0.2X SSC、0.1%SDS在60℃下洗涤一次或多次。通常,严谨杂交条件为在6X氯化钠/柠檬酸钠(SSC)中在约45℃下杂交,接着在0.2X SSC、0.1%SDS在65℃下洗涤一次或多次。更通常,严谨条件为0.5 M磷酸钠、7%SDS、65℃,接着在0.2X SSC、0.1%SDS在65℃下洗涤一次或多次。
本文中对专利文献或作为现有技术给出的其它事物的引用不应视为承认文献或事物为已知的或其所含的信息为任一权利要求的优先权日时的一般常识的一部分。
本文阐述的各参考文献的公开内容是以引用的方式全部整合本文中。
通过以下实施例来进一步说明本发明。
实施例
概述
标准遗传技术如酶在宿主细胞中的过度表达以及宿主细胞的另外遗传修饰在所属领域中是已知的方法,如在Sambrook和Russel(2001)″Molecular Cloning:A Laboratory Manual(第三版),Cold Spring HarborLaboratory,Cold Spring Harbor Laboratory Press;或F.Ausubel等人编,″Current protocols in molecular biology″,Green Publishing and WileyInterscience,New York(1987)中所述。
从酵母分离染色体DNA
使酵母细胞在旋转振荡器中在含2%葡萄糖的YEP培养基中生长(过夜、在30℃和280 rpm)。将1.5 ml这些培养物转移至埃彭道夫离心管(eppendorf tube)并且在最大速度下离心1分钟。倾倒出上清液并且使沉淀再悬浮在200μl YCPS(含0.1%SB3-14(Sigma Aldrich,荷兰)的10 mMTris.HCl pH 7.5、1 mM EDTA)以及1μl核糖核酸酶(20 mg/ml核糖核酸酶A,来自牛胰腺,Sigma,荷兰)中。将细胞悬浮液在65℃下孵育10分钟。将悬浮液在埃彭道夫离心机中在7000 rpm下离心1分钟。丢弃上清液。将沉淀小心溶解在200μl CLS(25mM EDTA、2%SDS)以及1μl核糖核酸酶A中。在65℃下孵育10分钟后,将悬浮液在冰上冷却。添加70μl PPS(10 M乙酸铵)之后,将溶液在旋涡混合器上彻底混合。离心(在埃彭道夫离心机中在最大速度下5分钟)后,将上清液与200μl冰冷异丙醇混合。DNA容易地沉积并且通过离心(5分钟,最大速度)来粒化。用400μl冰冷的70%乙醇洗涤沉淀。在室温下干燥沉淀并且溶解在50μl TE(10 mM Tris.HCl pH7.5,1mM EDTA)中。
用于Rasamsonia emersonii的一般方法
菌株
Rasamsonia(Talaromyces)emersonii菌株TEC-142于2009年7月1日保藏在CENTRAAL BUREAU VOOR SCHIMMELCULTURES,Uppsalalaan 8,邮箱85167,NL-3508 AD Utrecht,The Netherlands,保藏登记号为CBS 124902。TEC-142S为TEC-142的单一分离物。
其它适合的菌株如以上所述的菌株可同等地用在本发明的实施例中,以便示出本发明的作用和优势。例如TEC-101、TEC-142、TEC-192、TEC-201或TEC-210为适合的Rasamsonia菌株,其描述于WO2011/000949中。
培养基和溶液
马铃薯右旋糖琼脂,PDA(Fluka,目录号70139):每升:马铃薯提取物4g;右旋糖20g;细菌培养用琼脂15g;pH5.4;在120℃下灭菌20分钟。
Rasamsonia琼脂培养基:每升:盐部分编号3 15g;纤维素30g;细菌培养用蛋白胨7.5g;谷粉15g;KH2PO4 5g;CaCl2.2aq 1g;细菌培养用琼脂20g;pH6.0;在120℃下灭菌20分钟。
盐部分组成:“盐部分编号3”符合WO98/37179表1的公开内容。与此表的组成的偏差为CaCl2.2aq 1.0g/l、KCl 1.8g/L、柠檬酸1aq 0.45g/L(螯合剂)。
用于Rasamsonia的摇瓶培养基
Rasamsonia培养基1:每升:葡萄糖20g;酵母提取物(Difco)20g;Clerol FBA3107(AF)4滴;MES 30g;pH6.0;在120℃下灭菌20分钟。
Rasamsonia培养基2:每升:盐部分编号3 10g;葡萄糖10g;KH2PO45g;NaH2PO4 2g;(NH4)2SO4 5g;MES 30g;pH5.4;在120℃下灭菌20分钟。
Rasamsonia培养基3:每升:盐部分编号3 10g;纤维素20g;KH2PO45g;NaH2PO4 2g;(NH4)2SO4 5g;MES 30g;pH5.4;在120℃下灭菌20分钟。
Rasamsonia培养基4:每升:盐部分编号3 10q;纤维素 15g;葡萄糖5g;KH2PO4 5g;NaH2PO4 2g;(NH4)2SO4 5g;MES 30g;pH5.4;在120℃下灭菌20分钟。
Rasamsonia的孢子分批制剂
使菌株在直径10cm的培养皿中在40℃下自Rasamsonia琼脂培养基上从贮备物生长5-7天。对于MTP发酵,使菌株在含有Rasamsonia琼脂培养基的96孔板中生长。将菌株贮备物在-80℃下储存在10%甘油中。
染色体DNA分离
使菌株在YGG培养基(每升:8g KCl、16g葡萄糖.H2O,20ml 10%酵母提取物、10ml 100x pen/strep、6.66g YNB+氨基酸、1.5g柠檬酸以及6gK2HPO4)中在42℃、250rpm下生长16小时,并且使用DNeasy植物小型试剂盒(Qiagen,Hilden,Germany)分离染色体DNA。
Rasamsonia的摇瓶生长方案
将孢子接种在含有20 ml Rasamsonia培养基1的100 ml摇瓶中,并且在45℃、250 rpm下在孵育振荡器中孵育1天(预培养物1),将1或2 ml的生物质从预培养物1转移至含有20 ml Rasamsonia培养基2的100 ml摇瓶中,并且在如以上所述的条件下生长1天(预培养物2)。随后,将1或2 ml的生物质从预培养物2转移至含有20 ml Rasamsonia培养基3或4的100 ml摇瓶中,并且在如以上所述的条件下生长3天。
蛋白质分析
在还原条件下在NuPAGE 4-12%Bis-Tris凝胶(Invitrogen,Breda,荷兰)上制备蛋白质样品并且染色。将凝胶用InstantBlue(Expedeon,Cambridge,United Kingdom)、SimplyBlue safestain(Invitrogen,Breda,The Netherlands)或Sypro Ruby(Invitrogen,Breda,The Netherlands)根据制造商的说明书进行染色。
总蛋白含量
根据布拉德福(Bradford)法测定所回收上清液的蛋白含量。用布拉德福蛋白测定使用考马斯(Coomassie)蛋白试剂测定酶样品中的蛋白量。将25μl适当稀释的酶样品与1.2 ml考马斯试剂混合。在室温下10分钟后,使用分光光度计(Uvikon XL)测定混合物在595 nm下的吸光度。与BSA标准相比较来计算蛋白含量。
玉米秸秆测定
为了测量纤维素酶活性,进行玉米秸秆活性测定。在空菌株和转化株的上清液中(其中培养细胞的培养液的液体部分)测量纤维素酶活性。
制备预处理的玉米秸秆底物
如Schell,D.J.,Applied Biochemistry and Biotechnology(2003),第105-108卷,第69-85页所述获得稀酸预处理的玉米秸秆。使用在190℃、1分钟停留时间以及在液相中1.45%(w/w)有效H2SO4酸浓度的稳态条件下操作的试验性规模的预处理反应器。
在2%未洗涤的酸预处理的玉米秸秆上测量纤维素酶活性
由于纤维素酶的葡萄糖释放不是组合物中酶的量的线性函数,换句话说,在固定的时间点两倍的酶量不会自动产生两倍的葡萄糖量。因此,在基于剂量应答的测定中评价了纤维素酶混合物的活性,其中剂量是基于每单位所测试纤维素混合物相等量的蛋白。
用未洗涤的酸预处理的玉米秸秆作为底物测量混合物的总纤维素酶活性。将冷冻的酶样品解冻,在pH 4.5的50 mM柠檬酸盐缓冲液中逐步按两倍进行范围从未稀释至高达32倍的一系列6个稀释。
将200μl样品转移至含有800μL于50 mM柠檬酸盐缓冲液(缓冲在pH4.5)中酸预处理玉米秸秆的2.5%(w/w)干物质的小瓶中。将另外200μl样品转移至含有800μl的50 mM柠檬酸盐缓冲液(缓冲在pH 4.5)的称为空白的小瓶中。另外,通过用200μl的50 mM柠檬酸盐缓冲液孵育800μl的在50 mM柠檬酸盐缓冲液(缓冲在pH 4.5)中酸预处理玉米秸秆的2.5%(w/w)干物质来测定玉米秸秆的糖背景值。所有小瓶均在65℃下孵育72 h。
孵育后,将100μl内标溶液(20 g/L马来酸,于D2O中40 g/L EDTA)添加至小瓶。将含有预处理的玉米秸秆的所有小瓶在5300 g下离心30分钟,并且随后将600μl上清液转移至含有400μl H2O/D2O 9∶1的新小瓶。
使用具有水抑制的脉冲程序,在27℃的温度下,在于500 MHz的质子频率下操作的Avance III Bruker上记录1D 1H-NMR光谱。相对于与6.30ppm的内标信号有关的4,4-二甲基-4-硅杂戊烷磺酸,基于5.20 ppm的信号进行葡萄糖量化(任意单位)。通过酶溶液中存在的残余糖(由空白测量)和酸预处理的玉米秸秆中存在的残余糖来校准在样品中测量的葡萄糖,来计算相对葡萄糖释放(ΔGlc)。
由于样品的蛋白质浓度是已知的,因此糖释放可描述为所测试的稀释样品的蛋白质mg/ml与在时间点72小时的相对葡萄糖释放的函数。
实施例1:酵母的标准化的途径构筑系统
1.1酵母的标准化的途径构筑系统的一般介绍
此方法使得能够以大的灵活性将基因/途径快速引入酵母(酿酒酵母)基因组中。水平一(参见图9)聚焦于使用称为“Golden Gate克隆”的方法(EnglerC.等人(2008)PLoS ONE 3(11):e3647以及Engler C.等人(2009)PLoSONE 4(5):e5553),将所谓的标准化的遗传元件、启动子、开放阅读框架(ORF)以及终止子克隆到侧翼为标准化的50 bp连接物的功能性表达盒中。
标准化的50 bp连接物为骨架进入载体的一部分并且在水平二使用(参见图9),其中标准化的50 bp连接物提供多个表达盒之间的必要同源性,使得其经由体内同源重组作为途径构筑并整合到酵母基因组中。
期望的遗传元件(例如启动子、开放阅读框架(ORF)以及终止子)的设计的标准化与标准化的连接物的使用相结合在克隆和转化过程中实现最大速度和灵活性。
图9为标准化的途径构筑方法的示意性图示。在本文所述的实施例中,使用所述方法来测定一组启动子和终止子对五种所选报道基因的表达的影响。
1.2设计遗传元件启动子、ORF以及终止子
根据标准设计各遗传元件,使得可以用IIs型限制酶Bsal将元件克隆到载体中,因而产生包含启动子、ORF以及终止子的功能性表达盒。
首先,通过引入点突变,使所有元件的内部Bsal位点去除。对于ORF,避免氨基酸序列变化。对于启动子和终止子,选择点突变以不影响(就我们所知)元件的功能性。各元件在两侧提供有4nt桥与Bsal识别位点的组合。Bsal识别位点放置成使得用IIs型限制酶切割产生标准化的4核苷酸伸出序列,其称为“桥”。以此方式,设计了30个启动子(SEQ ID NO:1至30)、5个ORF(报道基因;SEQ ID NO:31至35)以及14个终止子(SEQ ID NO:36至49)的组。下文更详细地描述针对各元件的具体规则,以针对启动子的规则开始,接着是ORF和终止子。
启动子的具体设计规则
-如以上所述,从启动子序列去除所有Bsal位点
-对于大部分启动子,标准化的大小设定为600个碱基对;例外为先前已示出更大或更短启动子为较佳选择或历史上已设定为某一长度的情况。
-序列
5’GGTCTCGGTGC+(启动子序列-最后bp)+AATGGGAGACC 3’
-在启动子的5’部分的GTGC(加下划线)为至骨架进入载体的4核苷酸序列桥(1.3中进行讨论)
-在启动子的3’部分的AATG(加下划线)为至ORF的4核苷酸序列桥,其中ATG为ORF的起始密码子并且AATG的第一个A为启动子序列的标准化的最后碱基对A
ORF的具体设计规则
-从ORF序列去除所有Bsal位点
-序列
5’GGTCTCGAATG+(ORF序列)+TAAAGGAGACC 3’
ORF序列没有终止和起始密码子(包括在4 nt桥中)
-在ORF的5’部分的AATG(加下划线)为至启动子序列的4核苷酸桥
-在ORF的3’部分的TAAA(加下划线)为至终止子序列的4核苷酸桥
终止子的具体设计规则
-从终止子序列去除所有Bsal位点
-序列
5’GGTCTCGTAAA+(终止子序列)+CCTCGGAGACC
-在终止子的5’部分的TAAA(加下划线)为至ORF序列的4核苷酸桥
-在终止子的3’部分的CCTC(加下划线)为至骨架进入载体的4核苷酸桥(在1.3中讨论)
通过DNA2.0(Menlo Park,CA USA)在具有大肠杆菌氨比西林抗性标记物的标准载体中合成并克隆所有遗传元件(启动子、ORF以及终止子)。DNA2.0使用的标准大肠杆菌克隆载体在SEQ ID NO:50中阐述。
1.3设计骨架进入载体
骨架进入载体构建成具有两个Bsal位点,其在切割后产生克隆至表达载体中(即组装的启动子、ORF以及终止子组合)的4核苷酸桥/粘性端。为改善Golden Gate克隆反应的效率,将用于在大肠杆菌中逆选择的ccdB基因定位在Bsal位点之间。这防止选择原始骨架载体。此外,骨架进入载体具有用于骨架质粒在大肠杆菌中的增殖的卡那霉素选择标记物,这与用于含有输入元件(启动子、ORF以及终止子)的载体的氨比西林标记物不同。因此,使用对卡那霉素的选择来防止对元件载体的不需要的选择。
骨架进入载体的另一重要特征为标准化的50bp序列,其称作“连接物”。连接物提供用于在标准化的途径构筑方法的水平2进行重组所必要的同源性。连接物侧翼为4nt桥,其方式使得在载体中克隆启动子、ORF以及终止子后,所产生的表达盒左和右侧翼为连接物。
称为连接物5、连接物A至连接物K以及连接物3(SEQ ID NO:51至63)的十三个独特50 bp连接物设计成对酵母基因组不含任何同源性的随机序列。这些连接物序列用来设计表1中所列的22个骨架载体。
表1:具有连接物的所有骨架进入载体和对应SEQ ID识别符
SEQ ID NO:64至85中所列的序列为通过DNA2.0合成并且克隆到标准大肠杆菌载体中以产生骨架载体的具体序列。用于克隆SEQ ID NO:64至85的大肠杆菌载体含有卡那霉素标记物,且其序列示于SEQ ID NO:86。
骨架载体实现两个重要的供能。一,其含有至启动子和终止子的桥,从而使得有可以在Golden Gate反应中使环闭合。二,其用连接物修饰表达盒,以用于体内重组步骤(称为水平2)。例如,在Sc 5A.bbn中用Golden Gate反应克隆表达盒将在表达盒的左部分装备连接物5并且在右部分装备连接物A。表1中所列的具有所设计连接物的骨架进入载体的组在DNA2.0(Menlo Park,CA USA)定制并合成。在下文总结骨架进入载体的所有特征。
总结骨架的具体设计
-大肠杆菌载体序列具有卡那霉素标记物(SEQ ID NO:86)
-两个Bsal位点,其在切割后产生与启动子的5’和终止子的3’上的桥相容的4 nt桥
-用定位在Bsal位点之间的ccdB序列逆选择
-连接物序列在桥左和右
-通过DNA2.0在载体中定制并克隆的实际序列的设计:5’L con-GTGCGGAGACC-ccdB序列-GGTCTCGCCTC-R con 3’
○ GTGC(加下划线)至启动子的5’部分的桥
○ CCTC(加下划线)至终止子3’部分的桥
○ “L con”和“R con”分别为左连接物序列和右连接物序列
1.4用Golden Gate克隆组装表达盒
按照Golden Gate克隆的出版物(Engler C.等人(2008)PLoS ONE 3(11):e3647以及Engler C.等人(2009)PLoS ONE 4(5):e5553)中所描述的进行组装。在单锅反应中,与三元件输入载体以及骨架进入载体组合添加Bsal和连接酶。最优选的反应条件为37℃下2分钟并且16℃下5分钟的50个循环的反应。通常地,通过对完整插入物测序来检查2个克隆。当示出两个克隆均不正确时,用测序来检查其它克隆。所有组装的表达盒的列表可见表2。
表2:用golden gate反应克隆到骨架进入载体中的所有表达盒的概况
组装编号 | 启动子元件 | ORF 元件 | 终止子元件 | 骨架 |
组装1 | Sc ENO1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装2 | Sc PDC1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装3 | Sc ENO2.pro | vGFP | ADH1终止子 | Sc 5a.bbn |
组装4 | Sc FBA1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装5 | Sc PGl1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装6 | Sc PGK1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装7 | Sc GPM1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装8 | Sc PMA1_1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装9 | Sc OYE2.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装10 | Sc TAL1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装11 | Sc TDH1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装12 | Sc TDH3.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装13 | Sc TEF1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装14 | Sc TPl1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装15 | Sc ACT1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装16 | Ag Tef1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装17 | Sc PRE3.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装18 | Sc VPS68.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装19 | Sc ENO1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装20 | Sc PDC1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装21 | Sc ENO2.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装22 | Sc FBAI.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装23 | Sc PGl1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装24 | Sc PGK1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装25 | Sc GPM1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装26 | Sc PMA1_1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装27 | Sc OYE2.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装28 | Sc TAL1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装29 | Sc TDH1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装30 | Sc TDH3.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装31 | Sc TEF1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装32 | Sc TPl1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装33 | Sc ACT1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装34 | Ag Tef1.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装35 | Sc PRE3.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装36 | Sc VPS68.pro | LacZ | ADH2 终止子 | Sc bc.bbn |
组装37 | Sc ENO1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装38 | Sc PDCI.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装39 | Sc ENO2.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装40 | Sc FBA1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装41 | Sc PGl1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装42 | Sc PGK1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装43 | Sc GPM1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装44 | Sc PMA1_1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装45 | Sc OYE2.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装46 | Sc TAL1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装47 | Sc TDH1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装48 | Sc TDH3.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装49 | Sc TEF1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装50 | Sc TPl1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装51 | Sc ACT1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装52 | Ag Tef1.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装53 | Sc PRE3.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装54 | Sc VPS68.pro | RFP | ENO1 终止子 | Sc c3.bbn |
组装55 | Sc ACT1.pro | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装56 | Sc ACT1.pro | vGFP | ADH2 终止子 | Sc 5a.bbn |
组装57 | Sc ACT1.pro | vGFP | ENO1 终止子 | Sc 5a.bbn |
组装58 | Sc ACT1.pro | vGFP | GPM1 终止子 | Sc 5a.bbn |
组装59 | Sc ACT1.pro | vGFP | PDC1 终止子 | Sc 5a.bbn |
组装60 | Sc ACT1.pro | vGFP | PCI1 终止子 | Sc 5a.bbn |
组装61 | Sc ACT1.pro | vGFP | PGK1 终止子 | Sc 5a.bbn |
组装62 | Sc ACT1.pro | vGFP | PMA1 终止子 | Sc 5a.bbn |
组装63 | Sc ACT1.pro | vGFP | TAL1 终止子 | Sc 5a.bbn |
组装64 | Sc ACT1.pro | vGFP | TDH1 终止子 | Sc 5a.bbn |
组装65 | Sc ACT1.pro | vGFP | TDH3 终止子 | Sc 5a.bbn |
组装66 | Sc ACT1.pro | vGFP | TEF1 终止子 | Sc 5a.bbn |
组装67 | Sc ACT1.pro | vGFP | TEF2 终止子 | Sc 5a.bbn |
组装68 | Sc ACT1.pro | vGFP | TPI1 终止子 | Sc 5a.bbn |
组装69 | Sc ENO1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装70 | Sc PDC1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装71 | Sc ENO2.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装72 | Sc FBA1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装73 | Sc PGl1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装74 | Sc PGKI.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装75 | Sc GPM1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装76 | Sc PMA1_1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装77 | Sc OYE2.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装78 | Sc TAL1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装79 | Sc TDH1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装80 | Sc TDH3.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装81 | Sc TEF1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装82 | Sc TPI1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装83 | Sc ACT1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装84 | Ag Tef1.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装85 | Sc PRE3.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装86 | Sc VPS68.pro | GFPmut3 | ADH1 终止子 | Sc 5a.bbn |
组装87 | Sc ENO1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装88 | Sc PDCI.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装89 | Sc ENO2.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装90 | Sc FBA1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装91 | Sc PGl1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装92 | Sc PGKI.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装93 | Sc GPM1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装94 | Sc PMA1_1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装95 | Sc OYE2.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装96 | Sc TAL1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装97 | Sc TDH1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装98 | Sc TDH3.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装99 | Sc TEF1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装100 | Sc TPI1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装101 | Sc ACT1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装102 | Ag Tef1.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装103 | Sc PRE3.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装104 | Sc VPS68.pro | GFP-pest | ADH1 终止子 | Sc 5a.bbn |
组装105 | KLLA0A09185g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装106 | KLLA0A11011g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装107 | KLLA0B08998g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装108 | KLLA0B14839g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装109 | KLLA0B14883g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装110 | KLLA0C05566g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装111 | KLLA0D00979g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装112 | KLLA0D07634g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装113 | KLLA0E01057g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装114 | KLLA0F18260g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装115 | KLLA0F20031g | vGFP | ADH1 终止子 | Sc 5a.bbn |
组装116 | KLLA0F20988g | vGFP | ADH1 终止子 | Sc 5a.bbn |
1.5制备和纯化PCR片段用于转化
用一标准组的结合至连接物的引物进行自质粒对具有连接物序列的表达盒的扩增。引物阐述在SEQ ID NO:87至110中,并且按连接物和扩增的方向命名。例如,“con 5 fw”为连接物5上的正向引物。在此实验中,仅使用引物的亚组。表3示出用于在PCR反应中使用的对应PCR模板的引物。根据手册用Phusion聚合酶(Finnzymes)进行PCR反应。
表3:产生装备有在转化酿酒酵母中使用的连接物的表达盒的所有PCR反
应的概况
显性标记物KanMX(赋予G418抗性)用于在酵母中选择。用添加连接物a的正向引物5950(SEQ ID NO:111)和添加连接物b的反向引物5951(SEQ ID NO:112)使用含有此标记物的标准质粒作为模板进行PCR扩增。因此将标记物盒放置在位置ab。所得PCR片段用在所有转化中(SEQ ID NO:113)。
对于实施例,将构建体整合到本文称为INT1的染色体XV的基因间区中。用正向引物02500(SEQ ID NO:114)和添加连接物5的反向引物05510(SEQ ID NO:115)PCR扩增用于整合到酿酒酵母的基因组的染色体INT1位点的左侧翼。具有连接物5的左侧翼序列阐述为SEQ ID NO:116。用添加连接物序列3的正向引物05511(SEQ ID NO:117)和反向引物02523(SEQ ID NO:118)PCR扩增用于整合到酿酒酵母的基因组的染色体INT1位点中的右侧翼。具有连接物3的右侧翼序列示于SEQ ID NO:119中。从CenPK-1137D分离的染色体DNA用作模板。在侧翼上所添加的连接物5和3提供与表达盒的同源性。转化过程中添加的所有DNA片段、整合侧翼、表达盒以及标记物盒能够经由连接物重组,并且完整组装的片段能够在INT1位点整合到基因组中。
用标准琼脂糖电泳技术来检查所有扩增的PCR片段的大小。用来自Qiagen的PCR纯化试剂盒根据手册来纯化PCR扩增的DNA片段。使用A260/A280在Nanodrop ND-1000分光光度计上测量DNA浓度。在纯化后未获得足够的PCR产物时,进行另外的PCR反应和纯化直到可获得足够量的DNA。
1.6转化片段至酿酒酵母
如Gietz和Woods(2002;Transformation of the yeast by the LiAc/SScarrier DNA/PEG method.Methods in Enzymology 350:87-96)所述进行酿酒酵母的转化。用1μg各扩增和纯化的PCR片段来转化CEN.PK1137D(MATaURA3 HIS3 LEU2 TRP1 MAL2-8 SUC2)。
表4示出所进行的转化的概况,和针对各转化添加的PCR片段。各转化将产生GFP、KanMX标记物、lacZ以及RFP整合到基因组上的INT1位点中的“报道基因途径”。
表4:转化和针对各的转化添加的片段的概况
转化程序之后,并且在回收时,将混合物铺板在含有G418(400μg/ml)的YEPhD琼脂(BBL植物蛋白胨20.0g/l、酵母提取物10.0 g/l、氯化钠5.0g/l、琼脂15.0 g/l以及2%葡萄糖)上。在30℃下孵育3天后,菌落出现在板上,而阴性对照(即,未在转化实验中添加DNA)产生空板。每个转化挑取四个菌落,并且转移至含有具有G418(200μg/ml)的240μl YEPhD琼脂的MTP。将MTP板在30℃下孵育3天。这些板用作进一步分析菌株的来源。
1.9MTP孵育后对转化株的报道基因测定
使酵母菌株在MTP中在标准条件下生长至对数期末期。对于所有测定和测量,将培养物稀释10倍。
用uQuant微孔板分光光度计(BioTek Instruments,Inc,US)在每孔含有200μl的10倍稀释的培养物的MTP板中测量OD600。对于LacZ测定,将70μl的10倍稀释的培养物用在测定中,所述方法如所用的酵母β-半乳糖苷酶测定试剂盒(Thermo Scientific)的手册中所述进行。在420 nm用uQuant读板仪测量吸收,作为lacZ测定的结果。用针对所测量的OD600的校准因子计算各培养物的最终lacZ活性。用Fluostar读板仪(BMG Labtech,US)测量GFP荧光(激发485 nm,发射538 nm,增益55)和RFP荧光(激发544 nm,发射620 nm,增益70)。
将结果进一步处理成图像。图10示出基于所获得的vGFP表达结果的启动子的排序。大约90%的转化株示出一致的结果,来自相同转化的转化株组中的报道基因的表达水平的结果具有低差异,从而示出了所述方法的功效。例外主要为没有表达任何报道基因的转化株。这些转化株从图上省去;其被视为标记物的随机整合株。对于各启动子,不同报道基因测定之间有良好的相关性。这在图11中针对lacZ和vGFP的表达示出。此规则的例外为其中遗传元件在报道基因途径中被使用两次的转化。例如,当启动子pACT1用于表达vGFP和RFP时,结果示出表达数据的更大变化,从而指示由于内部同源性导致的可能的不正确整合。图12示出终止子对GFP表达的影响。再次,观察到了每个终止子各系列的4个测试菌落内的小差异,从而指示正确转化株的高百分比。结果清楚地示出终止子可显著影响GFP的表达。
GFP的不稳定蛋白变体GFPmut和GFP-pest不如vGFP那样进行良好(低至极低GFP信号),并且因此未携带在呈现的结果中。
可从这些结果得出以下结论:所述方法以高效率和功效实现了基因或完整途径到宿主的引入。
实施例2:在酿酒酵母中构筑用于衣康酸产生的代谢途径
2.1步骤1:由生物砖构筑表达构建体
如实施例1,启动子、开放阅读框架以及终止子为根据本专利中所述的标准规则设计的所有单独的DNA序列。通过DNA2.0在标准克隆载体中合成并且克隆序列。具体合成了SEQ ID NO:120、121、122、123、124以及125所有开放阅读框架的核苷酸序列,用于构建供在酿酒酵母产生衣康酸的代谢途径(对于细节,参见表5以及序列表)。开放阅读框架与实施例1所述启动子、终止子以及骨架载体的组一起用在golden gate反应中,从而产生如表6所示的盒。所形成的表达盒(盒117、盒120、盒133、盒136、盒124以及盒26)用作模板,以PCR扩增转化中所用的DNA片段。
表5:在酿酒酵母中构建至衣康酸的代谢途径中所涉及的ORF的说明
核酸 | Id* | UniProt | 生物体 |
SEQ ID NO:120 | ITE_01 | Q0C8L2 | 土曲霉(A.terreus) |
SEQ ID NO:121 | CAD_01 | mCAD3 | 土曲霉 |
SEQ ID NO:122 | ACO_01 | A7A1I8 | 酿酒酵母 |
SEQ ID NO:123 | PYC_01 | P32327 | 酿酒酵母 |
SEQ ID NO:124 | CTP 01 | Q04013 | 酿酒酵母 |
SEQ ID NO:125 | QTP_01 | P32332 | 酿酒酵母 |
2.2制备和纯化PCR片段用于转化
根据实施例1所述的方法进行衣康酸途径的组装和整合。用标准组的结合至连接物的引物进行自质粒对具有连接物序列的表达盒的扩增。引物阐述在SEQ ID NO:87至110中,并且按连接物和扩增的方向命名。例如,“con 5 fw”为连接物5上的正向引物。在此实验中,仅使用引物的亚组。
表6示出用于在PCR反应中的对应PCR模板的引物。根据手册用Phusion聚合酶(Finnzymes)进行PCR反应。
表6:用于产生在转化酿酒酵母中使用的装备有连接物的表达盒的所有盒、
盒的内容物以及引物组合的概况
扩增显性标记物KanMX,使用含有所述片段的标准质粒作为模板DNA。通过PCR使用CEN.PK113-7D基因组DNA作为模板扩增5’和3’INT1缺失侧翼。所用的显性标记物、整合侧翼以及引物与实施例1所描述的相同。用标准琼脂糖电泳技术检查PCR片段的大小。根据手册,用Macherey-Nagel的磁性珠粒试剂盒纯化PCR扩增的DNA片段。使用GC biotech的测量DNA浓度。
2.3转化片段至酿酒酵母
如Gietz和Woods(2002;Transformation of the yeast by the LiAc/SScarrier DNA/PEG method.Methods in Enzymology 350:87-96)所述进行酿酒酵母的转化。
用高至1μg的各扩增和纯化的PCR片段转化CEN.PK1137D(MATaURA3 HIS3 LEU2 TRP1 MAL2-8 SUC2)。转化将产生“衣康酸途径”,其中衣康酸盒和KanMX标记物整合到基因组上的INT1位点中。将转化混合物铺板在含有G418(400μg/ml)的YEPhD-琼脂(BBL植物蛋白胨20.0g/l、酵母提取物10.0 g/l、氯化钠5.0 g/l、琼脂15.0 g/l以及2%葡萄糖)上。在30℃下孵育3天后,菌落出现在板上,而阴性对照(即,未在转化实验中添加DNA)产生空板。
2.4培养转化株
挑取转化的两个单一菌落并且转移至含有200μl YEPhD-琼脂的MTP琼脂孔,YEPhD-琼脂含有400μg/ml G418。将板在30℃下孵育3天后,通过用针具转移一些菌落材料将菌落接种MTP板中,所述板具有标准盖,每孔含有200μL Verduyn培养基(Verduyn等人.,Yeast 8:501-517,1992,其中(NH4)2SO4用2 g/l脲置换),所述培养基具有基于淀粉的C源和在培养期间提供葡萄糖的释放的酶。作为对照,使空菌株CEN.PK1 137D在相同生长方案中生长。在MTP振荡器(INFORS HT Multitron)中在30℃、550 rpm以及80%湿度下孵育MTP 72小时。在此预培养阶段之后,通过将80μl的培养液转移至4 ml Verduyn培养基(同样用脲置换(NH4)2SO4)来开始产生阶段,所述培养基具有基于淀粉的C源和在培养期间提供葡萄糖的释放的酶。在振荡器中在550 rpm、30℃以及80%湿度下生长7天后,将板在HeraeusMultifuge 4中在2750 rpm下离心10分钟。用下文描述的LC-MS法测量上清液中的衣康酸水平。
2.5检测样品中的衣康酸
用于测定衣康酸和Krebs循环中的其它化合物的UPLC-MS/MS分析法。Waters HSS T3柱1.7μm、100 mm*2.1 mm用于通过梯度洗脱来分离衣康酸、丁二酸、柠檬酸、异柠檬酸、苹果酸以及富马酸。洗脱剂A由含有0.1%甲酸的LC/MS等级水组成,并且洗脱剂B由含有0.1%甲酸的乙腈组成。流速为0.35 ml/分钟并且柱温度保持恒定在40℃下。梯度始于95%A并且在10分钟内线性增加至30%B,在30%B保持2分钟,然后立即变化至95%A并且稳定5分钟。所用注射体积为2μl。
使用多反应监控(MRM),Waters Xevo API用在负电离模式的电喷(ESI)中。离子源温度保持在130℃,而脱溶剂温度为350℃,流速为500 L/小时。
对于衣康酸和Krebs循环的其它化合物,用10 eV使去质子化的分子碎裂,从而由失去H2O和CO2产生特定片段。分析掺入空白发酵培养液中的参考化合物标准以确认停留时间,计算各离子的应答因子,并且用于计算发酵样品中的浓度。将样品在洗脱剂A中适当稀释(5-25倍)以在LC-MS分析过程中克服离子抑制和基体效应。为确认所分析化合物的元素组成,用与以上所述相同的色谱系统进行准确质量分析,所述系统联接至LTQ orbitrap(ThermoFisher)。使用NaTFA混合物(参考)在恒定注入模式下进行质量校正,其方式使得在实验设置过程中,所分析的准确质量可拟合在距离所分析的所有化合物的理论质量2 ppm内。在所转化菌株的样品中发现95 mg/l的衣康酸浓度,空菌株不产生衣康酸。
2.6转化株的遗传分析
进行遗传分析以示出盒在转化株的基因组中的正确整合。分离基因组DNA并且使用PCR反应来示出盒的正确整合和组装。用phusion聚合酶根据手册进行PCR。用于分析的PCR反应和引物对列在表7中。在0.8%琼脂糖凝胶上使用标准电泳技术分析来自各PCR反应的5μl。
表7:PCR反应,其对应的引物对组合以及各PCR结果的预期带大小
PCR反应 | 克隆 | 正向引物 | 反向引物 | 预期带大小 |
1.1 | 1 | con 5 fw | con b rev | 3.8 kb |
2.1 | 2 | con 5 fw | con b rev | 3.8 kb |
1.2 | 1 | con b fw | con d rev | 5.7 kb |
2.2 | 2 | con b fw | con d rev | 5.7 kb |
1.3 | 1 | con d fw | con f rev | 6.5 kb |
2.3 | 2 | con d fw | con f rev | 6.5 kb |
图13示出来自结果的图片。转化株给出预期的带大小作为PCR的结果。PCR反应和衣康酸产生结果清楚地示出活性衣康酸代谢途径正确整合在酵母基因组中。因此证明了本文所述方法的效率和有效性。
实施例3:在Rasamsonia emersonii中的标准化的途径构筑
3.1 Rasamsonia emersonii中的标准化的途径构筑系统的总体介绍
此方法能够将基因/途径快速引入到丝状真菌Rasamsonia emersonii中。水平1(参见图9)聚焦于使用称为“Golden Gate克隆”的方法(Engler C.等人(2008)PLoS ONE 3(11):e3647;以及Engler C.等人(2009)PLoS ONE 4(5):e5553),将所谓的标准化的遗传元件启动子、开放阅读框架(ORF)以及终止子克隆到功能性表达盒中。使用吉布森克隆(Gibson DG,Young L,ChuangRY,Venter JC,Hutchison CA三世,Smith HO.(2009).″Enzymatic assemblyof DNA molecules up to several hundred kilobases″.Nature Methods 6(5):343-345)进行多个表达盒的组装(水平2)。
在两个载体的一个中克隆多个盒片段,其中插入片段一起可应用在所谓的“二分基因靶向法”中(Nielsen等人.,2006,43:54-64)。此方法使用选择标记物的重叠的两个非功能性DNA片段(对于二分法的进一步细节还参见WO2008113847)与基因靶向序列。在正确同源重组时,选择标记物通过整合在同源靶位点处变得有功能。在该实例中,盒靶向RePepA位点。如于WO 2008113847中所详述,设计两个不同的缺失载体Te pep.bbn和pEBA1006,并且将其构建成能够为二分基因靶向提供两个重叠的DNA分子。Te pep.bbn为适于Golden gate克隆的骨架进入载体。
3.2构建可应用在二分基因靶向中的骨架进入载体和第二表达载体
构建适合用于靶向整合到RePepA位点中的骨架进入载体。对Rasamsonia emersonii菌株CBS393.64的基因组DNA测序并分析。在基因组中鉴别具有注释为蛋白酶pepA的翻译蛋白的基因。包含ORF的基因组序列以及约3000 bp的5’区和2500 bp的3’侧翼区的Rasamsonia emersoniipepA(RePepA)序列、cDNA以及蛋白序列的分别示出在SEQ ID NO:126、127以及128中。
如以上所述,根据常规克隆程序构建两个载体用于靶向到RePepA位点中。第一载体Te pep.bbn(总体布局如图14)包含在RePepA ORF上游约1.5 kb用于靶向到RePepA位点中的1500 bp 5’侧翼区(ORF和约1500 bp的RePepA启动子)、lox66位点以及由构巢曲霉gpdA启动子驱动的ble编码区的非功能性5’部分(PgpdA-ble序列,其遗失了在ble的3’端的编码序列的最后104个碱基,SEQ ID NO:129)。为允许在大肠杆菌中有效克隆表达盒,将ccdB基因插入5’RePepA侧翼区与lox66位点之间。ccdB盒侧翼为桥和Bsal位点,其允许连接启动子、ORF、终止子盒,如实施例1所述。
第二pEBA1006载体(总体布局如图15)包含ble编码区的非功能3’部分和构巢曲霉trpC终止子(ble-TtrpC序列,其遗失在ble的5’端的编码序列的前12个碱基,SEQ ID NO:130)、lox71位点以及RePepA ORF的用于靶向到RePepA位点的2500 bp 3’侧翼区。在同源重组时,第一和第二非功能性片段变得有功能,从而产生功能性ble盒。RePepA上游和下游基因侧翼区靶向二分片段在预定RePepA基因组位点的同源重组。
3.3用Golden Gate克隆组装表达盒
如实施例1所述,使用Golden gate克隆通过表达盒置换载体Te pep.bbn中的ccdB基因,从而得到表达质粒pEBA328和pEBA332。pEBA328的表达盒由以下组成:由SEQ ID NO:131表示的黄青霉Paf启动子、由SEQ IDNO:132表示的嗜热篮状菌GH61 ORF以及由SEQ ID NO:133表示的黄青霉penDE终止子。pEBA332的表达盒由以下组成:由SEQ ID NO:134表示的R.emersonii启动子2、由SEQ ID NO:135表示的绵毛嗜热丝孢菌GH61ORF以及由SEQ ID NO:136表示的构巢曲霉AmdS终止子。pEBA328的示意性图解在图16中示出,其为pEBA332的代表。
3.4制备和纯化PCR片段用于吉布森克隆
使用表8中所列的引物和模板进行从pEBA328和pEBA332表达质粒的表达盒的扩增。
表8:用于扩增PCR片段以用于吉布森克隆的引物和模板的概况
吉布森片段 | 模板 | 正向引物 | 反向引物 |
EBA328盒 | pEBA328 | 5′pepA-Ppaf(SEQ ID NO:137) | TpenDE(SEQ ID NO:138) |
EBA332盒 | pEBA332 | TpenDE-Ppra(SEQ ID NO:139) | Tanid_amds(SEQ ID NO:140) |
载体 | pEBA328 | Tanid_amds-loxP-gpd-ble(SEQ ID NO:141) | 5′pepA(SEQ ID NO:142) |
2.5使用吉布森克隆组装多盒构建体
通过吉布森克隆获得表达载体pEBA328-332(总体布局如图17)。如Gibson DG,Young L,Chuang RY,Venter JC,Hutchison CA三世,Smith HO.(2009).″Enzymatic assembly of DNA molecules up to several hundredkilobases″.Nature Methods 6(5):343-345中所述进行吉布森克隆反应。更具体说,使用http://2010.igem.Org/Team:Newcastle/Gibson Cloning中所描述的方案。在吉布森反应中,使用75 ng的载体片段、37 ng的EBA328以及37ng的EBA332片段。根据常规克隆程序进行构建体的大肠杆菌转化、DNA分离以及限制酶分析。
实施例4:在Rasamsonia emersonii中灭活ReKu80基因以改善基因靶向
此实施例描述了R.emersonii Ku80基因的克隆和缺失,以改善基因靶向。
4.1克隆ReKu80缺失构建体
对Rasamsonia emersonii菌株CBS393.64的基因组DNA测序并分析。鉴别Rasamsonia emersonii Ku80基因(ReKu80)。包含ORF的基因组序列以及约2500 bp的5’区和2500 bp的3’侧翼区的ReKu80的序列、cDNA以及蛋白序列分别在SEQ ID NO:143、144以及145中示出。
根据常规克隆程序(参见图18和19),构建ReKu80的两个置换载体,即pEBA1001和pEBA1002。如实施例2所述,两个载体的插入片段一起可应用在所谓的“二分基因靶向”法中。pEBA1001载体包含ReKu80 ORF的用于靶向到ReKu80位点的2500 bp 5’侧翼区、lox66位点以及如实施例2所述由构巢曲霉gpdA启动子驱动的ble编码区的5’部分(图18)。pEBA1002载体包含如实施例2所述的ble编码区的3’部分、构巢曲霉trpC终止子、lox71位点以及ReKu80 ORF的用于靶向ReKu80位点的2500 bp 3’侧翼区(图19)。
4.2在Rasamsonia emersonii中缺失ReKu80
分离缺失构建体pEBA1001和pEBA1002的线性DNA并且用于使用如早先WO2011/054899中所述的方法转化Rasamsonia emersonii。这些线性DNA可在ReKu80位点处整合到基因组中,因而通过ble基因取代ReKu80基因,如图20所描绘。在腐草霉素培养基上选择转化株,并且根据如WO2011/054899中所述的程序来纯化并测试菌落。使用缺失盒的gpdA启动子中的引物和5’靶向区直接上游的基因组序列的引物,通过PCR针对在ReKu80位点处的整合来对生长菌落进行诊断。约250种转化株的池中,4种菌株示出基因组ReKu80基因去除。
4.3克隆编码ere重组酶的瞬时表达质粒pEBA513
通过DNA 2.0(Menlo Park,USA)构建pEBA513,并且其含有以下组分:由以下组成的表达盒:黑曲霉glaA启动子、编码cre重组酶(AAY56380)的ORF,以及构巢曲霉niaD终止子;由以下组成的表达盒:构巢曲霉gpdA启动子、编码潮霉素B抗性蛋白的ORF,以及黄青霉penDE终止子(Genbank:M31454.1,核苷酸1750-2219);pAMPF21衍生载体,其含有AMA1区和CAT氯霉素抗性基因。图21表示pEBA513的图。
4.4通过瞬时表达cre重组酶对腐草霉素抗性ReKu80缺失菌株进行标记物 去除
随后,用pEBA513转化3种候选ReKu80敲除菌株,以通过瞬时表达cre重组酶来去除ble选择标记物。将pEBA513转化株覆盖铺板在含有50μg/ml潮霉素B的再生培养基上。使潮霉素抗性转化株在含有50μg/ml潮霉素B的PDA上生长,从而允许表达cre重组酶。将单一菌落铺板在非选择性Rasamsonia琼脂培养基上,以获得纯化的孢子批。通过在具有和没有10μg/ml腐草霉素的培养基上生长转化株来在表型上测试ble标记物的去除。用pEBA513(具有cre重组酶)转化后,大多数(>90%)转化株是腐草霉素敏感性的,从而指示基于pEBA1001和pEBA1002的ble标记物的去除。随后,通过在具有和没有50μg/ml潮霉素的培养基上生长转化株来在表型上诊断ble阴性菌株中pEBA513构建体的去除。约50%的转化株由于自发失去pEBA513质粒而失去潮霉素抗性。
通过Southern分析和PCR针对ReKu80基因的缺失测试不含候选标记物的敲除菌株。获得不含标记物的ReKu80缺失菌株,并且代表性菌株用于双GH61 pEB328_EBA332构建体的靶向整合(实施例4)。
4.5用pEBA328 332和pEBA1006转化Rasamsonia emersonii
分离pEBA328_332和pEBA1006的线性DNA,并且用于使用如早先在WO2011/054899中所述的方法转化实施例3所述的Rasamsonia emersoniiReKu80敲除菌株。pEBA328_332的线性DNA可与pEBA1006一起在RePepA位点处整合到基因组中,因而通过pEBA328_332双表达盒和ble取代RePepA基因。在腐草霉素培养基上选择转化株,并且根据如WO2011/054899中所述的程序来纯化并测试菌落。通过PCR诊断生长菌落的在RePepA位点处的整合,使用缺失盒的黄青霉Paf启动子中的引物和5’靶向区直接上游的基因组序列的引物。获得其中RePepA被EBA328_EBA332/ble盒置换的候选转化株。
4.6双GH61过度表达菌株中的纤维素酶活性
如用于Rasamsonia emersonii的一般方法中所述,在摇瓶中发酵过度表达两种GH61酶的pEBA328_EBA332转化株的孢子。在2%玉米秸秆活性测定中分析上清液的纤维素酶活性。GH61过度表达和参考菌株的剂量应答曲线在图22中示出。需要得自pEBA328_EBA332转化株发酵的较低剂量的上清液来获得与得自参考菌株的上清液相比相同的玉米秸秆水解水平,从而指示GH61过度表达R.emersonii菌株中的纤维素酶活性改善。
4.7结论
通过使用Golden gate组装组合启动子、ORF以及终止子片段(水平1)并且随后使用吉布森克隆的多盒组装(水平2)成功地产生了多盒构建体。用双表达盒片段转化R.emersonii,并且将盒成功地整合到RePepA位点中。与参考菌株相比,转化株示出改善的纤维素酶活性,其指示多盒片段功能良好。总之,所述方法适于有效克隆多盒构建体并且适于在一个R.emersonii转化步骤中引入多个基因。
Claims (24)
1.一种用于制备两种或更多种标准化的表达盒的方法,所述方法包括:
a.提供两组或更多组元件序列,
每组元件序列一起构成至少一种功能性表达盒,
各元件序列的两侧侧翼为IIs型限制核酸内切酶切割位点,之后是其识别位点,
所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得元件序列的组可组装成功能性表达盒;
b.提供至少两种骨架进入载体,
各骨架进入载体按以下这种顺序包含:(i)限制酶切割位点与其识别位点,和第一连接物序列(LF);(ii)包含可选择标记基因的载体骨架;以及(iii)第二连接物序列(RF),和限制酶识别位点与其切割序列;以及(iv)任选地,在(i)和(iii)的所述识别位点之间的插入物,
任何骨架进入载体上的所述连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装;以及
c.使用基于使用限制酶消化和经由切割位点连接的方法,在至少两个骨架进入载体中组装所述两组或更多组元件序列作为功能性表达盒;
从而制备两种或更多种标准化的表达盒。
2.一种用于在宿主细胞中在靶位点处体内重组两种或更多种标准化的表达盒的方法,所述方法包括:
a.根据权利要求1所述的方法制备两种或更多种标准化的表达盒,其中:
i.RF和LF连接物序列包含同源重组序列;以及
ii.任何骨架进入载体上的RF和LF连接物序列被选择成使得其可通过体内重组分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装;以及
b.从包含所述LF和RF序列的骨架进入载体回收表达盒;以及
c.在宿主细胞中在靶位点处将所回收的表达盒彼此体内重组。
3.一种用于在宿主细胞中在靶位点处将两种或更多种标准化的表达盒体内重组的方法,所述方法包括:
a.根据权利要求1所述的方法制备两种或更多种标准化的模块式表达盒,其中:
i.RF和LF连接物序列包含至少约9个碱基对的同源序列;以及
ii.任何骨架进入载体上的RF和LF连接物序列被选择成使得其可使用这些序列通过体外方法分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装;以及
b.从骨架进入载体回收表达盒,并且通过LF和RF序列的体外连接对其进行组装;以及
c.在宿主细胞中在靶位点处将所组装和回收的表达盒体内重组。
4.根据前述权利要求中任一项所述的方法,其中至少两个骨架进入载体按以下这种顺序包含:(i)II型限制酶识别位点,之后是其切割位点,和至少25个碱基对的第一连接物序列(LF);(ii)包含可选择标记基因的载体骨架;以及(iii)至少25个碱基对的第二连接物序列(RF),和II型限制酶的另一切割位点,之后是所述切割位点的识别位点;以及(iv)任选地,在(i)和(iii)的所述识别位点之间的插入物。
5.根据权利要求2至4中任一项所述的方法,其中在两个整合序列存在下进行所述重组步骤,其中一个与第一表达盒和靶位点的侧翼序列重组,并且其中第二个与第二表达盒和靶位点的另一侧侧翼序列重组。
6.根据权利要求2至5中任一项所述的方法,其中,在所述重组步骤中,第一表达盒包含与靶位点的侧翼序列重组的整合序列,并且第二表达盒包含与靶位点的另一侧侧翼序列重组的整合序列。
7.根据权利要求2或6中任一项所述的方法,其中所述整合序列包含与用于第二靶位点、任选地不同于所述第一靶位点的种类的宿主细胞中的位点重组的另外的序列。
8.根据权利要求2至7中任一项所述的方法,其中所述整合序列介导经由同源重组或位点特异性重组的整合。
9.根据权利要求7或8所述的方法,其中所述整合序列、连接物或其它元件序列包含用于与所述第二靶位点重组的位点特异性重组序列,所述序列位于所组装的表达盒之外并且允许使用位点特异性重组在所述第二靶位点处、任选地在不同于所述第一靶位点的宿主细胞种类的宿主细胞种类中的靶位点处进行重组。
10.根据权利要求2至9中任一项所述的方法,其中在所述靶位点处按预定顺序顺次组装并重组两种或更多种表达盒。
11.根据前述权利要求中任一项所述的方法,其中至少一种表达盒为标记物表达盒。
12.根据权利要求11所述的方法,其中所述标记物表达盒的侧翼为至少两个位点特异性重组位点。
13.根据权利要求2至12中任一项所述的方法,其中使用不根据权利要求1所述的方法制备的表达盒。
14.根据前述权利要求中任一项所述的方法,其中至少两个元件序列组包含启动子元件、开放阅读框架元件以及终止子元件。
15.根据前述权利要求中任一项所述的方法,其中将每组元件在至少两个骨架进入载体中组装成为功能性表达盒在单锅反应中进行。
16.根据前述权利要求中任一项所述的方法,其中限定每组中的元件以使得按预定顺序组装所述表达盒。
17.一种用于在靶位点处整合DNA序列的方法,其包括:
a.提供:(i)至少约200个碱基对长的至少两个左(int-L)和两个右(int-R)整合序列的组,用于同源重组至宿主细胞中的至少一个靶位点,其中:
所述左(int-L)序列侧翼为一个至少约25个碱基对的连接物序列;
所述右(int-R)序列侧翼为一个至少约25个碱基对的连接物序列;以及
(ii)至少一个表达盒,其两侧侧翼为至少约25个碱基对的连接物序列;以及
b.通过在所述int-L和int-R序列的同源靶位点处重组来体内组装来自步骤(a)的至少三个序列的组,以使得至少一个左和至少一个右整合序列按照这种顺序处于所述宿主细胞的靶位点处,
其中体内组装后,至少一个表达盒存在于靶位点处,任选地所述表达盒能够表达功能性标记物。
18.根据权利要求17所述的方法,所述方法包括:
a.根据权利要求1所述的方法制备两种或更多种标准化的模块式表达盒,其中
i.int-L和int-R序列为启动子、orf或终止子序列的一部分;
ii.RF和LF连接物序列包含至少约25个碱基对的同源重组序列;以及
iii.任何骨架进入载体上的RF和LF序列被选择成使得其可通过分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行体内重组来组装;
b.从包含LF和RF序列的所述骨架进入载体回收表达盒;以及
c.在宿主细胞中在所述靶位点处将所回收的表达盒彼此体内重组。
19.根据权利要求17或18所述的方法,所述方法包括选择两个或更多个int-L和两个或更多个int-R序列,用于在一组体内组装和重组反应中使用,从而产生多个宿主细胞,所述细胞具有通过所选择的int-L和int-R序列靶向至少两个允许的组合的组合,其中
a.至少两个int_L序列在靶位点处在至少一个int-R序列的左侧;或
b.至少两个int_R序列在靶位点处在至少一个int-L序列的右侧。
20.根据权利要求17至19中任一项所述的方法,其中第二功能性标记物盒形成在第二靶位点处。
21.根据权利要求17至20中任一项所述的方法,其中在靶位点处的重组导致在所述靶位点处一个或更多个基因的功能性敲除或下调。
22.根据权利要求2至21中任一项所述的方法,其中所述宿主细胞为原核或真核细胞。
23.一种用于制备两种或更多种标准化的表达盒的系统,所述系统包括:
a.两组或更多组元件序列;
每组元件序列一起构成至少一种功能性表达盒,
各元件序列的两侧侧翼为IIs型限制核酸内切酶切割位点,之后是其识别位点,
所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得元件序列的组可组装成功能性表达盒;
b.至少两种骨架进入载体,
各骨架进入载体按以下这种顺序包含:(i)限制酶与其识别位点,和第一连接物序列(LF);(ii)包含可选择标记基因的载体骨架;以及(iii)第二连接物序列(RF),和限制酶识别位点与其切割序列;以及(iv)任选地,在(i)和(iii)的所述识别位点之间的插入物,
任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装。
24.一种用于产生整合在靶位点处的目的核酸构建体的系统,所述系统包含:
a.根据权利要求23所述的系统;以及
b.至少两个整合序列,其中一个与第一表达盒和靶位点的侧翼序列重组,并且其中第二个与第二表达盒和靶位点另一侧的侧翼序列重组。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261616254P | 2012-03-27 | 2012-03-27 | |
US61/616,254 | 2012-03-27 | ||
PCT/EP2013/056623 WO2013144257A1 (en) | 2012-03-27 | 2013-03-27 | Cloning method |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104204205A true CN104204205A (zh) | 2014-12-10 |
CN104204205B CN104204205B (zh) | 2017-06-27 |
Family
ID=48139896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380017487.8A Expired - Fee Related CN104204205B (zh) | 2012-03-27 | 2013-03-27 | 克隆方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US9738890B2 (zh) |
EP (1) | EP2831238B1 (zh) |
CN (1) | CN104204205B (zh) |
DK (1) | DK2831238T3 (zh) |
WO (1) | WO2013144257A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105802866A (zh) * | 2014-12-30 | 2016-07-27 | 天津大学 | 一种产紫杉二烯的重组真核菌株及利用该重组真核菌株制备紫杉二烯的方法 |
WO2019149288A1 (zh) * | 2018-02-02 | 2019-08-08 | 杭州菁因康生物科技有限公司 | 一种高效的基因工程载体 |
CN110214188A (zh) * | 2016-08-26 | 2019-09-06 | 艾美科健株式会社 | 7-氨基头孢烷酸的高浓度生产重组顶头孢霉菌株的制造方法及利用其方法所制造的菌株 |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX367033B (es) | 2013-05-31 | 2019-08-02 | Dsm Ip Assets Bv | Microorganismos para la produccion de diterpeno. |
AR097480A1 (es) | 2013-08-29 | 2016-03-16 | Dsm Ip Assets Bv | Células de levadura convertidoras de glicerol y ácido acético con una conversión de ácido acético mejorada |
WO2015181311A1 (en) * | 2014-05-29 | 2015-12-03 | Dsm Ip Assets B.V. | Process for producing itaconic acid and itaconic acid esters under anaerobic conditions |
US20170191091A1 (en) * | 2014-05-29 | 2017-07-06 | Dsm Ip Assets B.V. | Recombinant cells producing itaconic acid and methyl esters thereof |
WO2016012429A1 (en) | 2014-07-24 | 2016-01-28 | Dsm Ip Assets B.V. | Yeast cell with improved pentose transport |
WO2016110512A1 (en) | 2015-01-06 | 2016-07-14 | Dsm Ip Assets B.V. | A crispr-cas system for a yeast host cell |
US10590436B2 (en) | 2015-01-06 | 2020-03-17 | Dsm Ip Assets B.V. | CRISPR-CAS system for a lipolytic yeast host cell |
WO2016110453A1 (en) | 2015-01-06 | 2016-07-14 | Dsm Ip Assets B.V. | A crispr-cas system for a filamentous fungal host cell |
WO2016140925A1 (en) | 2015-03-02 | 2016-09-09 | Synthetic Genomics, Inc. | Regulatory elements from labyrinthulomycetes microorganisms |
EP3862426A3 (en) | 2015-03-16 | 2021-11-17 | DSM IP Assets B.V. | Udp-glycosyltransferases |
US11344051B2 (en) | 2015-04-03 | 2022-05-31 | Dsm Ip Assets B.V. | Steviol glycosides |
WO2017025649A1 (en) | 2015-08-13 | 2017-02-16 | Dsm Ip Assets B.V. | Steviol glycoside transport |
US20210161092A1 (en) * | 2016-02-16 | 2021-06-03 | Ajikumar Parayil KUMARAN | Secondary metabolite screening system |
EP3795586A3 (en) | 2016-03-16 | 2021-06-23 | Conagen Inc. | Production of proteins in labyrinthulomycetes |
BR112018074490A2 (pt) | 2016-06-14 | 2019-03-19 | Dsm Ip Assets B.V. | célula de levedura recombinante |
US10913938B2 (en) | 2016-07-29 | 2021-02-09 | Dsm Ip Assets B.V. | Polypeptides having cellulolytic enhancing activity and uses thereof |
US20200199599A1 (en) | 2016-09-23 | 2020-06-25 | Dsm Ip Assets B.V. | A guide-rna expression system for a host cell |
WO2018073107A1 (en) | 2016-10-19 | 2018-04-26 | Dsm Ip Assets B.V. | Eukaryotic cell comprising xylose isomerase |
US10633454B2 (en) | 2016-11-01 | 2020-04-28 | Conagen Inc. | Expression of modified glycoproteins and glycopeptides |
ES2900151T3 (es) * | 2016-11-07 | 2022-03-16 | Genovie Ab | Un dispositivo de dos partes para la síntesis del receptor de linfocitos T0 e integración genómica estable en células presentadoras del TCR |
EP4039800B1 (en) | 2016-11-07 | 2023-10-25 | Genovie AB | An engineered multi-component system for identification and characterisation of t-cell receptors and t-cell antigens |
WO2018172328A1 (en) | 2017-03-21 | 2018-09-27 | Dsm Ip Assets B.V. | Improved glycerol free ethanol production |
US20200032252A1 (en) | 2017-04-06 | 2020-01-30 | Dsm Ip Assets B.V. | Self-guiding integration construct (sgic) |
CN111315883B (zh) * | 2017-07-18 | 2024-06-18 | 杰诺维有限公司 | 用于全长t细胞受体可读框的快速装配和多样化的两组分载体文库系统 |
EP3891281A1 (en) | 2018-12-05 | 2021-10-13 | DSM IP Assets B.V. | Crispr guide-rna expression strategies for multiplex genome engineering |
WO2020141168A1 (en) | 2018-12-31 | 2020-07-09 | Dsm Ip Assets B.V. | Novel acetyl-transferases |
CN116348609A (zh) | 2020-10-05 | 2023-06-27 | 帝斯曼知识产权资产管理有限公司 | 酵母属酵母细胞及使用其的发酵方法 |
EP4320258A1 (en) | 2021-04-06 | 2024-02-14 | DSM IP Assets B.V. | Enzyme composition |
CN117178059A (zh) | 2021-04-06 | 2023-12-05 | 帝斯曼知识产权资产管理有限公司 | 酶组合物 |
BR112023020370A2 (pt) | 2021-04-06 | 2023-11-21 | Dsm Ip Assets Bv | Composição de enzimas |
WO2023285280A1 (en) | 2021-07-12 | 2023-01-19 | Dsm Ip Assets B.V. | Recombinant yeast cell |
MX2024000511A (es) | 2021-07-12 | 2024-03-11 | Danisco Us Inc | Celula de levadura recombinante. |
WO2023285279A1 (en) | 2021-07-12 | 2023-01-19 | Dsm Ip Assets B.V. | Recombinant yeast cell |
EP4426824A1 (en) | 2021-11-04 | 2024-09-11 | Danisco US Inc. | Recombinant yeast cell |
WO2023079049A1 (en) | 2021-11-04 | 2023-05-11 | Dsm Ip Assets B.V. | Variant polypeptide and recombinant yeast cell |
MX2024005284A (es) | 2021-11-04 | 2024-05-17 | Danisco Us Inc | Proceso para la produccion de etanol y celula de levadura recombinante. |
EP4365192A1 (en) | 2022-11-04 | 2024-05-08 | DSM IP Assets B.V. | Microbial production of growth factors |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008095927A1 (en) * | 2007-02-05 | 2008-08-14 | Philipps-Universität Marburg | Method of cloning at least one nucleic acid molecule of interest using type iis restriction endonucleases, and corresponding cloning vectors, kits and system using type iis restriction endonucleases |
WO2010059763A1 (en) * | 2008-11-19 | 2010-05-27 | Amyris Biotechnologies, Inc. | Compositions and methods for the assembly of polynucleotides |
WO2010113031A2 (en) * | 2009-03-30 | 2010-10-07 | Gene Bridges Gmbh | Method of altering nucleic acids |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020165175A1 (en) * | 2001-04-17 | 2002-11-07 | Xiaowu Liang | Fast and enzymeless cloning of nucleic acid fragments |
EP2395087A1 (en) * | 2010-06-11 | 2011-12-14 | Icon Genetics GmbH | System and method of modular cloning |
BR112013001685B1 (pt) * | 2010-07-23 | 2021-10-13 | Sigma-Aldrich Co. Llc | Método para editar pelo menos uma sequência cromossômica endógena em uma célula pela inserção de uma sequência na sequência cromossômica |
-
2013
- 2013-03-27 EP EP13716982.7A patent/EP2831238B1/en active Active
- 2013-03-27 US US14/386,354 patent/US9738890B2/en active Active
- 2013-03-27 WO PCT/EP2013/056623 patent/WO2013144257A1/en active Application Filing
- 2013-03-27 DK DK13716982.7T patent/DK2831238T3/en active
- 2013-03-27 CN CN201380017487.8A patent/CN104204205B/zh not_active Expired - Fee Related
-
2017
- 2017-07-13 US US15/648,983 patent/US10865407B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008095927A1 (en) * | 2007-02-05 | 2008-08-14 | Philipps-Universität Marburg | Method of cloning at least one nucleic acid molecule of interest using type iis restriction endonucleases, and corresponding cloning vectors, kits and system using type iis restriction endonucleases |
WO2010059763A1 (en) * | 2008-11-19 | 2010-05-27 | Amyris Biotechnologies, Inc. | Compositions and methods for the assembly of polynucleotides |
WO2010113031A2 (en) * | 2009-03-30 | 2010-10-07 | Gene Bridges Gmbh | Method of altering nucleic acids |
Non-Patent Citations (1)
Title |
---|
CAROLA ENGLER ET AL.: "A One Pot, One Step, Precision Cloning Method with High Throughput Capability", 《PLOS ONE》, vol. 3, no. 11, 31 December 2008 (2008-12-31) * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105802866A (zh) * | 2014-12-30 | 2016-07-27 | 天津大学 | 一种产紫杉二烯的重组真核菌株及利用该重组真核菌株制备紫杉二烯的方法 |
CN110214188A (zh) * | 2016-08-26 | 2019-09-06 | 艾美科健株式会社 | 7-氨基头孢烷酸的高浓度生产重组顶头孢霉菌株的制造方法及利用其方法所制造的菌株 |
CN110214188B (zh) * | 2016-08-26 | 2023-06-06 | 艾美科健株式会社 | 7-氨基头孢烷酸的高浓度生产重组顶头孢霉菌株的制造方法及利用其方法所制造的菌株 |
WO2019149288A1 (zh) * | 2018-02-02 | 2019-08-08 | 杭州菁因康生物科技有限公司 | 一种高效的基因工程载体 |
Also Published As
Publication number | Publication date |
---|---|
US10865407B2 (en) | 2020-12-15 |
US9738890B2 (en) | 2017-08-22 |
CN104204205B (zh) | 2017-06-27 |
WO2013144257A1 (en) | 2013-10-03 |
EP2831238B1 (en) | 2018-01-03 |
US20150050696A1 (en) | 2015-02-19 |
DK2831238T3 (en) | 2018-04-03 |
EP2831238A1 (en) | 2015-02-04 |
US20170314011A1 (en) | 2017-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104204205B (zh) | 克隆方法 | |
Li et al. | Developing Aspergillus niger as a cell factory for food enzyme production | |
Kluge et al. | Inducible promoters and functional genomic approaches for the genetic engineering of filamentous fungi | |
Visser et al. | Development of a mature fungal technology and production platform for industrial enzymes based on a Myceliophthora thermophila isolate, previously known as Chrysosporium lucknowense C1 | |
Wagner et al. | Synthetic biology and molecular genetics in non-conventional yeasts: current tools and future advances | |
CN105695485B (zh) | 一种用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用 | |
EP2825651B1 (en) | Recombination system | |
Su et al. | Heterologous gene expression in filamentous fungi | |
CN103975063A (zh) | 核酸组装系统 | |
US20170088845A1 (en) | Vectors and methods for fungal genome engineering by crispr-cas9 | |
CN101903531B (zh) | 用于蛋白质生产的酵母菌株 | |
Polli et al. | New promoters for strain engineering of Penicillium chrysogenum | |
US11891418B2 (en) | Yeast cell | |
CN109790510A (zh) | 在不存在诱导底物下丝状真菌细胞中的蛋白产生 | |
CN103502266A (zh) | 具有粘度改变表型的丝状真菌 | |
US9631197B2 (en) | Rasamsonia transformants | |
US20240263172A1 (en) | Crispr transient expression construct (ctec) | |
WO2021133171A1 (en) | Recombinant fungal cell | |
Rozhkova et al. | CRISPR/Cas genome editing in filamentous fungi | |
CN102933710A (zh) | 产生基因嵌合体的方法 | |
CN103261420B (zh) | 用于在真菌细胞中表达基因的启动子 | |
CN105683380B (zh) | 通过降低rna干扰来提高真核细胞中的转基因表达 | |
US20230111619A1 (en) | Non-viral transcription activation domains and methods and uses related thereto | |
US20240209383A1 (en) | Systems and methods for high yielding recombinant microorganisms and uses thereof | |
de Castro Leitão et al. | Biotechnological applications of CRISPR-Cas systems in fungi |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170627 |