CN109563522A - 真菌宿主细胞中dna片段的基因组整合 - Google Patents
真菌宿主细胞中dna片段的基因组整合 Download PDFInfo
- Publication number
- CN109563522A CN109563522A CN201780049670.4A CN201780049670A CN109563522A CN 109563522 A CN109563522 A CN 109563522A CN 201780049670 A CN201780049670 A CN 201780049670A CN 109563522 A CN109563522 A CN 109563522A
- Authority
- CN
- China
- Prior art keywords
- polynucleotide
- interest
- host cell
- gene
- partially
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002538 fungal effect Effects 0.000 title claims abstract description 41
- 238000006062 fragmentation reaction Methods 0.000 title description 5
- 238000013467 fragmentation Methods 0.000 title description 4
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 117
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 117
- 239000002157 polynucleotide Substances 0.000 claims abstract description 116
- 238000006243 chemical reaction Methods 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 37
- 230000002759 chromosomal effect Effects 0.000 claims abstract description 22
- 238000001727 in vivo Methods 0.000 claims abstract description 20
- 230000006801 homologous recombination Effects 0.000 claims abstract description 12
- 238000002744 homologous recombination Methods 0.000 claims abstract description 12
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 8
- 210000004027 cell Anatomy 0.000 claims description 106
- 108090000623 proteins and genes Proteins 0.000 claims description 63
- 102000004190 Enzymes Human genes 0.000 claims description 34
- 108090000790 Enzymes Proteins 0.000 claims description 34
- 229940088598 enzyme Drugs 0.000 claims description 34
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 claims description 23
- 241000223218 Fusarium Species 0.000 claims description 23
- 240000006439 Aspergillus oryzae Species 0.000 claims description 18
- 235000002247 Aspergillus oryzae Nutrition 0.000 claims description 17
- 241000351920 Aspergillus nidulans Species 0.000 claims description 15
- 241000233866 Fungi Species 0.000 claims description 15
- 241000228212 Aspergillus Species 0.000 claims description 14
- 230000035772 mutation Effects 0.000 claims description 13
- 239000002253 acid Substances 0.000 claims description 12
- 239000012634 fragment Substances 0.000 claims description 12
- 239000003550 marker Substances 0.000 claims description 12
- 108090001060 Lipase Proteins 0.000 claims description 11
- 102000004882 Lipase Human genes 0.000 claims description 11
- 239000004367 Lipase Substances 0.000 claims description 11
- 210000000349 chromosome Anatomy 0.000 claims description 11
- 235000019421 lipase Nutrition 0.000 claims description 11
- 230000006798 recombination Effects 0.000 claims description 11
- 238000005215 recombination Methods 0.000 claims description 11
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 10
- 239000004382 Amylase Substances 0.000 claims description 8
- 108010065511 Amylases Proteins 0.000 claims description 8
- 102000013142 Amylases Human genes 0.000 claims description 8
- 101100404840 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) niiA gene Proteins 0.000 claims description 8
- 108090000913 Nitrate Reductases Proteins 0.000 claims description 8
- 235000019418 amylase Nutrition 0.000 claims description 8
- 230000006780 non-homologous end joining Effects 0.000 claims description 8
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 claims description 7
- 101150054979 ligD gene Proteins 0.000 claims description 7
- 101150095344 niaD gene Proteins 0.000 claims description 7
- 241000228245 Aspergillus niger Species 0.000 claims description 6
- 241000589516 Pseudomonas Species 0.000 claims description 6
- 229930182470 glycoside Natural products 0.000 claims description 6
- -1 ribalgilase Proteins 0.000 claims description 6
- 108091005804 Peptidases Proteins 0.000 claims description 5
- 102000035195 Peptidases Human genes 0.000 claims description 5
- 229920002472 Starch Polymers 0.000 claims description 5
- 241000223259 Trichoderma Species 0.000 claims description 5
- 230000007547 defect Effects 0.000 claims description 5
- 150000002338 glycosides Chemical class 0.000 claims description 5
- 239000008107 starch Substances 0.000 claims description 5
- 235000019698 starch Nutrition 0.000 claims description 5
- 241000235349 Ascomycota Species 0.000 claims description 4
- 108010059892 Cellulase Proteins 0.000 claims description 4
- 101150059802 KU80 gene Proteins 0.000 claims description 4
- 101100342585 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) mus-51 gene Proteins 0.000 claims description 4
- 101100074054 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) mus-52 gene Proteins 0.000 claims description 4
- 108010025915 Nitrite Reductases Proteins 0.000 claims description 4
- 101100342589 Schizosaccharomyces pombe (strain 972 / ATCC 24843) pku70 gene Proteins 0.000 claims description 4
- 101100074057 Schizosaccharomyces pombe (strain 972 / ATCC 24843) pku80 gene Proteins 0.000 claims description 4
- 241000218636 Thuja Species 0.000 claims description 4
- 125000000188 beta-D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 4
- 101150085005 ku70 gene Proteins 0.000 claims description 4
- 101150071637 mre11 gene Proteins 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 101150010682 rad50 gene Proteins 0.000 claims description 4
- VWDWKYIASSYTQR-UHFFFAOYSA-N sodium nitrate Inorganic materials [Na+].[O-][N+]([O-])=O VWDWKYIASSYTQR-UHFFFAOYSA-N 0.000 claims description 4
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 claims description 3
- 241001513093 Aspergillus awamori Species 0.000 claims description 3
- 241001225321 Aspergillus fumigatus Species 0.000 claims description 3
- 241001480052 Aspergillus japonicus Species 0.000 claims description 3
- 241000222511 Coprinus Species 0.000 claims description 3
- 241000222356 Coriolus Species 0.000 claims description 3
- 241001337994 Cryptococcus <scale insect> Species 0.000 claims description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 3
- 241000223198 Humicola Species 0.000 claims description 3
- 108010029541 Laccase Proteins 0.000 claims description 3
- 241000235395 Mucor Species 0.000 claims description 3
- 241000221960 Neurospora Species 0.000 claims description 3
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 claims description 3
- 241000228143 Penicillium Species 0.000 claims description 3
- 241000222350 Pleurotus Species 0.000 claims description 3
- 241000228341 Talaromyces Species 0.000 claims description 3
- 241001494489 Thielavia Species 0.000 claims description 3
- 241001149964 Tolypocladium Species 0.000 claims description 3
- 241000222354 Trametes Species 0.000 claims description 3
- 102000004357 Transferases Human genes 0.000 claims description 3
- 108090000992 Transferases Proteins 0.000 claims description 3
- 210000001367 artery Anatomy 0.000 claims description 3
- 229940091771 aspergillus fumigatus Drugs 0.000 claims description 3
- 239000008103 glucose Substances 0.000 claims description 3
- 230000000415 inactivating effect Effects 0.000 claims description 3
- 239000000779 smoke Substances 0.000 claims description 3
- 210000003462 vein Anatomy 0.000 claims description 3
- 108010011619 6-Phytase Proteins 0.000 claims description 2
- 102000004400 Aminopeptidases Human genes 0.000 claims description 2
- 108090000915 Aminopeptidases Proteins 0.000 claims description 2
- 241000223651 Aureobasidium Species 0.000 claims description 2
- 108010006303 Carboxypeptidases Proteins 0.000 claims description 2
- 102000005367 Carboxypeptidases Human genes 0.000 claims description 2
- 108010053835 Catalase Proteins 0.000 claims description 2
- 108010031396 Catechol oxidase Proteins 0.000 claims description 2
- 102000030523 Catechol oxidase Human genes 0.000 claims description 2
- 108010022172 Chitinases Proteins 0.000 claims description 2
- 102000012286 Chitinases Human genes 0.000 claims description 2
- 241000235457 Chytridium Species 0.000 claims description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 claims description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 claims description 2
- 108090000371 Esterases Proteins 0.000 claims description 2
- 241000221999 Filobasidiaceae Species 0.000 claims description 2
- 102000004195 Isomerases Human genes 0.000 claims description 2
- 108090000769 Isomerases Proteins 0.000 claims description 2
- 108090000364 Ligases Proteins 0.000 claims description 2
- 102000003960 Ligases Human genes 0.000 claims description 2
- 108090000856 Lyases Proteins 0.000 claims description 2
- 102000004317 Lyases Human genes 0.000 claims description 2
- 241001344131 Magnaporthe grisea Species 0.000 claims description 2
- 102100024295 Maltase-glucoamylase Human genes 0.000 claims description 2
- 102000003992 Peroxidases Human genes 0.000 claims description 2
- 108060008539 Transglutaminase Proteins 0.000 claims description 2
- 102000005840 alpha-Galactosidase Human genes 0.000 claims description 2
- 108010030291 alpha-Galactosidase Proteins 0.000 claims description 2
- 108010028144 alpha-Glucosidases Proteins 0.000 claims description 2
- 108010051210 beta-Fructofuranosidase Proteins 0.000 claims description 2
- 102000005936 beta-Galactosidase Human genes 0.000 claims description 2
- 108010005774 beta-Galactosidase Proteins 0.000 claims description 2
- 108010089934 carbohydrase Proteins 0.000 claims description 2
- 229920002678 cellulose Polymers 0.000 claims description 2
- 239000001913 cellulose Substances 0.000 claims description 2
- 108010005400 cutinase Proteins 0.000 claims description 2
- 239000001573 invertase Substances 0.000 claims description 2
- 235000011073 invertase Nutrition 0.000 claims description 2
- 238000002372 labelling Methods 0.000 claims description 2
- 230000001590 oxidative effect Effects 0.000 claims description 2
- 239000001814 pectin Substances 0.000 claims description 2
- 229920001277 pectin Polymers 0.000 claims description 2
- 235000010987 pectin Nutrition 0.000 claims description 2
- 229940072417 peroxidase Drugs 0.000 claims description 2
- 108040007629 peroxidase activity proteins Proteins 0.000 claims description 2
- 229940085127 phytase Drugs 0.000 claims description 2
- 230000003248 secreting effect Effects 0.000 claims description 2
- 102000003601 transglutaminase Human genes 0.000 claims description 2
- 102000016938 Catalase Human genes 0.000 claims 1
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 claims 1
- 102000004157 Hydrolases Human genes 0.000 claims 1
- 108090000604 Hydrolases Proteins 0.000 claims 1
- 108010054377 Mannosidases Proteins 0.000 claims 1
- 102000001696 Mannosidases Human genes 0.000 claims 1
- 238000000653 depth-selective Mossbauer spectroscopy Methods 0.000 claims 1
- 230000010354 integration Effects 0.000 abstract description 12
- 108020004414 DNA Proteins 0.000 description 43
- 108090000765 processed proteins & peptides Proteins 0.000 description 39
- 102000004196 processed proteins & peptides Human genes 0.000 description 37
- 229920001184 polypeptide Polymers 0.000 description 36
- 241000499912 Trichoderma reesei Species 0.000 description 26
- 238000003752 polymerase chain reaction Methods 0.000 description 26
- 230000014509 gene expression Effects 0.000 description 16
- 150000007523 nucleic acids Chemical group 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 15
- 108020004707 nucleic acids Proteins 0.000 description 15
- 241000894006 Bacteria Species 0.000 description 12
- 230000004087 circulation Effects 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 239000000126 substance Substances 0.000 description 12
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 108091026890 Coding region Proteins 0.000 description 8
- 229920000742 Cotton Polymers 0.000 description 8
- 108010048241 acetamidase Proteins 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 210000001938 protoplast Anatomy 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 239000013604 expression vector Substances 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 150000001413 amino acids Chemical group 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 5
- 239000010931 gold Substances 0.000 description 5
- 229910052737 gold Inorganic materials 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 4
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 4
- 241000223221 Fusarium oxysporum Species 0.000 description 4
- 241000233654 Oomycetes Species 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 241000235403 Rhizomucor miehei Species 0.000 description 4
- 108090000637 alpha-Amylases Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000028327 secretion Effects 0.000 description 4
- 102000035101 Aspartic proteases Human genes 0.000 description 3
- 108091005502 Aspartic proteases Proteins 0.000 description 3
- 241000146399 Ceriporiopsis Species 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 102000010911 Enzyme Precursors Human genes 0.000 description 3
- 108010062466 Enzyme Precursors Proteins 0.000 description 3
- 241000221779 Fusarium sambucinum Species 0.000 description 3
- 241001480714 Humicola insolens Species 0.000 description 3
- 241000223258 Thermomyces lanuginosus Species 0.000 description 3
- 241000223260 Trichoderma harzianum Species 0.000 description 3
- 102000004139 alpha-Amylases Human genes 0.000 description 3
- 229940024171 alpha-amylase Drugs 0.000 description 3
- 239000002585 base Substances 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000010363 gene targeting Methods 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 239000013641 positive control Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 101150054232 pyrG gene Proteins 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- 108010037870 Anthranilate Synthase Proteins 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 108010084185 Cellulases Proteins 0.000 description 2
- 102000005575 Cellulases Human genes 0.000 description 2
- 229920002101 Chitin Polymers 0.000 description 2
- 241000123346 Chrysosporium Species 0.000 description 2
- 241000985909 Chrysosporium keratinophilum Species 0.000 description 2
- 241001674001 Chrysosporium tropicum Species 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 244000251987 Coprinus macrorhizus Species 0.000 description 2
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 2
- 108010001682 Dextranase Proteins 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 241000567163 Fusarium cerealis Species 0.000 description 2
- 241000223195 Fusarium graminearum Species 0.000 description 2
- 241000146406 Fusarium heterosporum Species 0.000 description 2
- 241001465753 Fusarium torulosum Species 0.000 description 2
- 229920001503 Glucan Polymers 0.000 description 2
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 2
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- 241000226677 Myceliophthora Species 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 244000252132 Pleurotus eryngii Species 0.000 description 2
- 235000001681 Pleurotus eryngii Nutrition 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 241000222480 Schizophyllum Species 0.000 description 2
- 241001540751 Talaromyces ruber Species 0.000 description 2
- 241001313536 Thermothelomyces thermophila Species 0.000 description 2
- 241000222355 Trametes versicolor Species 0.000 description 2
- 241000223261 Trichoderma viride Species 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 2
- 101150078331 ama-1 gene Proteins 0.000 description 2
- RWZYAGGXGHYGMB-UHFFFAOYSA-N anthranilic acid Chemical compound NC1=CC=CC=C1C(O)=O RWZYAGGXGHYGMB-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000004148 curcumin Substances 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 108010091371 endoglucanase 1 Proteins 0.000 description 2
- 108010092413 endoglucanase V Proteins 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 238000007857 nested PCR Methods 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- TWNIBLMWSKIRAT-RWOPYEJCSA-N (1r,2s,3s,4s,5r)-6,8-dioxabicyclo[3.2.1]octane-2,3,4-triol Chemical compound O1[C@@]2([H])OC[C@]1([H])[C@@H](O)[C@H](O)[C@@H]2O TWNIBLMWSKIRAT-RWOPYEJCSA-N 0.000 description 1
- FYGDTMLNYKFZSV-URKRLVJHSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](OC2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-URKRLVJHSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 1
- 101150108665 AMYC gene Proteins 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 240000007185 Albizia julibrissin Species 0.000 description 1
- 235000011468 Albizia julibrissin Nutrition 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 101000756530 Aspergillus niger Endo-1,4-beta-xylanase B Proteins 0.000 description 1
- 101100162670 Bacillus subtilis (strain 168) amyE gene Proteins 0.000 description 1
- 101100277447 Bacillus subtilis (strain 168) degQ gene Proteins 0.000 description 1
- 101100129919 Bacillus subtilis (strain 168) melC gene Proteins 0.000 description 1
- 241000221198 Basidiomycota Species 0.000 description 1
- 229920002498 Beta-glucan Polymers 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 241000222478 Bjerkandera adusta Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 241001466517 Ceriporiopsis aneirina Species 0.000 description 1
- 241001646018 Ceriporiopsis gilvescens Species 0.000 description 1
- 241001277875 Ceriporiopsis rivulosa Species 0.000 description 1
- 241000524302 Ceriporiopsis subrufa Species 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 241001556045 Chrysosporium merdarium Species 0.000 description 1
- 241000080524 Chrysosporium queenslandicum Species 0.000 description 1
- 241000355696 Chrysosporium zonatum Species 0.000 description 1
- 241001290175 Coriolopsis trogii Species 0.000 description 1
- 241001362614 Crassa Species 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 241001063191 Elops affinis Species 0.000 description 1
- 101710132690 Endo-1,4-beta-xylanase A Proteins 0.000 description 1
- 235000002756 Erythrina berteroana Nutrition 0.000 description 1
- 241000145614 Fusarium bactridioides Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 101000759028 Fusarium oxysporum Trypsin Proteins 0.000 description 1
- 241001112697 Fusarium reticulatum Species 0.000 description 1
- 241001014439 Fusarium sarcochroum Species 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000146398 Gelatoporia subvermispora Species 0.000 description 1
- 101100460773 Geobacillus stearothermophilus nprA gene Proteins 0.000 description 1
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 102100022624 Glucoamylase Human genes 0.000 description 1
- 239000005561 Glufosinate Substances 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- 101001035458 Humicola insolens Endoglucanase-5 Proteins 0.000 description 1
- 102100027612 Kallikrein-11 Human genes 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-M Nitrite anion Chemical compound [O-]N=O IOVCWXUNBOPUCH-UHFFFAOYSA-M 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 241000222397 Phlebia radiata Species 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 101710130181 Protochlorophyllide reductase A, chloroplastic Proteins 0.000 description 1
- 240000004350 Prunus spinosa Species 0.000 description 1
- 235000010829 Prunus spinosa Nutrition 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 101000968489 Rhizomucor miehei Lipase Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 101710155333 Site-specific recombinase Flp Proteins 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241001655322 Streptomycetales Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241001495429 Thielavia terrestris Species 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241000222357 Trametes hirsuta Species 0.000 description 1
- 241000217816 Trametes villosa Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 1
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 241000409279 Xerochrysium dermatitidis Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 101150069712 amyA gene Proteins 0.000 description 1
- 101150009288 amyB gene Proteins 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 238000005844 autocatalytic reaction Methods 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 235000014103 egg white Nutrition 0.000 description 1
- 210000000969 egg white Anatomy 0.000 description 1
- 108010091384 endoglucanase 2 Proteins 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 101150029559 hph gene Proteins 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 235000018102 proteins Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000001384 succinic acid Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 150000003641 trioses Chemical class 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/905—Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/65—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0036—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/036—Fusion polypeptide containing a localisation/targetting motif targeting to the medium outside of the cell, e.g. type III secretion
Abstract
本发明涉及在真菌宿主细胞中的特定染色体靶位点处体内组装和整合目的多核苷酸的方法,所述方法包括用以下转化该宿主细胞:iv.至少一种多核苷酸片段,其依次包含上游侧翼区和该目的多核苷酸的5’部分;v.至少一种多核苷酸片段,其依次包含该目的多核苷酸的3’部分和下游侧翼区;和,任选地vi.一种或多种另外的多核苷酸片段,每种多核苷酸片段包含该目的多核苷酸的5’部分和3’部分;其中每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至少20bp的重叠,因此这些片段覆盖整个目的多核苷酸,并且其中这些侧翼区具有足够的大小和同源性以实现与该特定靶位点的同源重组,用于染色体整合。
Description
对序列表的引用
本申请含有一个计算机可读形式的序列表。将该计算机可读形式通过引用结合在此。
技术领域
本发明涉及在真菌宿主细胞中的特定染色体靶位点处体内组装和整合目的多核苷酸的方法,所述方法包括用以下转化该宿主细胞:
i.至少一种多核苷酸片段,其依次包含上游侧翼区和该目的多核苷酸的5’部分;
ii.至少一种多核苷酸片段,其依次包含该目的多核苷酸的3’部分和下游侧翼区;和,任选地
iii.一种或多种另外的多核苷酸片段,每种多核苷酸片段包含该目的多核苷酸的5’部分和3’部分;
其中每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至少20bp的重叠,因此这些片段覆盖整个目的多核苷酸,并且其中这些侧翼区具有足够的大小和同源性以实现与该特定靶位点的同源重组,用于染色体整合。
背景技术
已经披露了用于使用位点特异性重组酶将目的多核苷酸文库重组到丝状真菌宿主细胞的染色体中的方法(WO 2016/026938)。
披露了一种有效的名为双分裂标记系统(DSMS)用于位点特异性和定向染色体整合,其中使启动子以及亚硝酸盐还原酶(niiA)基因和硝酸盐还原酶(niaD)基因二者的5'部分缺失,因此使它们的表达失活,并且其中通过双同源重组(重构这两种基因以允许在用NaNO3作为唯一氮源的基本培养基上进行选择)整合侧翼为每种基因的互补部分的进入的构建体(Nielsen M.L.等人2006,Efficient PCR-based gene targeting with arecyclable marker for Aspergillus nidulans[针对构巢曲霉的有效的基于PCR的用可再循环标记进行的基因靶向],Fungal Genetics and Biology[真菌遗传学和生物学]第43卷:54-64)。
还披露了用于丝状真菌宿主细胞中的基因文库的位点特异性染色体整合的方法,该方法采用自主复制序列和包含该基因文库的整合盒和名为分裂标记或双分裂标记系统(DSMS)(WO 2015/082535)。
本领域普遍认为,在丝状真菌宿主细胞中,如在曲霉属宿主细胞中,有效同源重组需要至少500bp。因此,习惯上使用重叠延伸剪接(SOE)PCR组装基因文库,然后将其转化至真菌宿主进行整合。
发明内容
本发明提供了用于成功地用2-5个DNA片段(各自具有少至20bp同源重叠)来转化丝状真菌米曲霉宿主细胞的方法,随后这些细胞体内重组,并且位点特异性地被整合至该染色体中。进行了几个若干实验以测试这些具有20-1000bp同源重叠的DNA片段是否可以体内组装。结果示出具有仅20bp重叠的2个片段的组装十分有效。该方法被应用于脂肪酶和核酸酶变体的生成以及脂肪酶编码序列的位点饱和文库生成。还进行了一些实验,成功组装了编码脂肪酶的3个片段。该方法消除了对许多应用(如变体生成、文库生成等)进行克隆或重叠延伸剪接(SOE)PCR组装的需要。
因此,在第一方面,本发明涉及用于在真菌宿主细胞中的特定染色体靶位点处体内组装和整合目的多核苷酸的方法,所述方法包括以下步骤:
a)用以下转化该宿主细胞:
i.至少一种多核苷酸片段,其依次包含上游侧翼区和该目的多核苷酸的5’部分;
ii.至少一种多核苷酸片段,其依次包含该目的多核苷酸的3’部分和下游侧翼区;和,任选地
iii.一种或多种另外的多核苷酸片段,每种多核苷酸片段包含该目的多核苷酸的5’部分和3’部分;
其中每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至少20bp的重叠,因此这些片段覆盖整个目的多核苷酸,并且其中这些侧翼区具有足够的大小并且与该特定染色体靶位点具有足够的同源性以实现与该特定靶位点的同源重组;
b)在有利于体内同源重组发生的条件下培养该转化的宿主细胞,其中重叠PCR片段重组以形成整个目的多核苷酸,并且这些侧翼区与该染色体重组以在该特定染色体靶位点处整合该目的多核苷酸;和
c)选择转化的宿主细胞,其中该目的多核苷酸被整合到该特定染色体靶位点中。
附图说明
图1示出用于体内组装具有20-1000bp重叠的两个片段的转化底物(片段A-G)的图解,如实例1和实例2所描述。
图2示出用于体内组装具有恰好20bp重叠的两至五个片段的转化底物(片段A-I)的图解,如实例3所描述。
图3示出用于体内组装具有恰好20bp重叠的两至五个片段的转化反应(反应I-V)的图解,如实例3所描述。
定义
cDNA:术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。初始的初级RNA转录物是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要通过一系列的步骤(包括剪接)进行加工。
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由可读框决定,所述可读框以起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码所述多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。这类控制序列包括但不限于前导序列、多聚腺苷酸化序列、前肽序列、启动子、信号肽序列、和转录终止子。最少,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的位点特异性限制性酶切位点的目的,所述控制序列可以提供有多个接头。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”意指线性或环状DNA分子,所述DNA分子包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的一种物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,所述物质至少部分地从与其性质相关的一种或多种或所有天然存在的成分中去除;(3)相对于自然界中发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如,宿主细胞中的重组产生;编码所述物质的基因的多个拷贝;以及使用比与编码所述物质的基因天然相关的启动子更强的启动子)。
核酸构建体:术语“核酸构建体”意指单-链或双链的核酸分子,所述核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成含有核酸的区段,或是合成的,所述核酸分子包含一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指如下配置:控制序列被放置在相对于多核苷酸的编码序列适当的位置处,这样使得所述控制序列引导所述编码序列的表达。
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联性由参数“序列同一性”描述。
出于本发明的目的,使用如在EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite[EMBOSS:欧洲分子生物学开放软件套件],Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选5.0.0版本或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列同一性。使用的参数是空位开放罚分10、空位延伸罚分0.5、以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且计算如下:
(同一的残基x 100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件包(EMBOSS:The European Molecular Biology Open Software Suite),Rice等人,2000,见上文)(优选5.0.0版或更新版)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)确定两个脱氧核糖核苷酸序列之间的序列同一性。使用的参数是空位开放罚分10、空位延伸罚分0.5、以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且计算如下:
(同一的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)
具体实施方式
在第一方面,本发明涉及用于在真菌宿主细胞中的特定染色体靶位点处体内组装和整合该目的多核苷酸的方法,所述方法包括以下步骤:
a)用以下转化该宿主细胞:
i.至少一种多核苷酸片段,其依次包含上游侧翼区和该目的多核苷酸的5’部分;
ii.至少一种多核苷酸片段,其依次包含该目的多核苷酸的3’部分和下游侧翼区;和,任选地
iii.一种或多种另外的多核苷酸片段,每种多核苷酸片段包含该目的多核苷酸的5’部分和3’部分;
其中每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至少20bp的重叠,因此这些片段覆盖整个目的多核苷酸,并且其中这些侧翼区具有足够的大小并且与该特定染色体靶位点具有足够的同源性以实现与该特定靶位点的同源重组;
b)在有利于体内同源重组发生的条件下培养该转化的宿主细胞,其中重叠PCR片段重组以形成整个目的多核苷酸,并且这些侧翼区与该染色体重组以在该特定染色体靶位点处整合该目的多核苷酸;和
c)选择转化的宿主细胞,其中该目的多核苷酸被整合到该特定染色体靶位点中。
宿主细胞
本发明还涉及重组宿主细胞,其包含编码目的多肽或目的酶的目的基因。该目的基因可操作地连接至指导该多肽的产生的一个或多个控制序列。将包含多核苷酸的构建体或载体引入宿主细胞中,从而该构建体或载体被维持为染色体整合体。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。宿主细胞的选择将在很大程度上取决于编码该多肽的基因及其来源。
宿主细胞可以是真菌细胞。如本文使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人所定义的,在:Ainsworth andBisby’s Dictionary of The Fungi[Ainsworth和Bisby的真菌大词典],第8版,1995,CABInternational[国际CAB],University Press[大学出版社],Cambridge[剑桥],英国)。
真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人,1995,同上)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳多糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长,而碳分解代谢是专性需氧的。
该丝状真菌宿主细胞可以是枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟腊菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、线黑粉菌科(Filibasidium)、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、链孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)、或木霉属(Trichoderma)细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporiuminops)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、毡金孢子菌(Chrysosporium pannicola)、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌(Chrysosporium tropicum)、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢(Fusarium bactridioides)、谷类镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusarium oxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtorulosum)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicilliumpurpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉(Thielavia terrestris)、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)细胞。
真菌细胞可以通过以下过程转化,所述过程涉及原生质体形成、原生质体的转化、以及以本身已知的方式的细胞壁的再生。用于转化曲霉属和木霉属宿主细胞的合适的程序描述于以下文献中:EP 238023,Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422。用于转化镰孢属物种的合适的方法由Malardier等人,1989,Gene[基因]78:147-156和WO 96/00787描述。
出于本发明的目的,使用非同源末端连接修复缺陷的真菌宿主细胞是有利的;优选地,该宿主细胞包含非同源末端连接修复所需的基因中的失活性突变或缺失;更优选地,该宿主细胞包含kusA、ligD、ku70、ku80、mre11、rad50、和/或xrs2,或其进化同系物中的失活性突变;更优选地,该真菌宿主细胞中缺失kusA、ligD、ku70、ku80、mre11、rad50、和/或xrs2,或其进化同系物。
在第一方面的优选的实施例中,该真菌宿主细胞的特定染色体靶位点和该上游和下游侧翼区一起包含双分裂选择标记系统(DSMS),因此可以选择转化的宿主细胞,其中该目的多核苷酸以特定方向被整合到该特定染色体靶位点中;优选地,该双分裂选择标记系统基于该宿主细胞中的分裂亚硝酸盐还原酶(niiA)基因和硝酸盐还原酶(niaD)基因或其进化同系物,从而允许在补充有NaN03的基本培养基上选择成功转化的宿主细胞,其中该目的多核苷酸以特定方向被整合到该特定染色体靶位点中,同时在该过程中重构亚硝酸盐还原酶(niiA)和硝酸盐还原酶。
在另一个优选的实施例中,在步骤(a)中用至多100种另外的多核苷酸片段,优选地至多90、80、70、60、50、40、30或20种另外的多核苷酸片段,更优选地至多10种另外的多核苷酸片段,甚至更优选地至多5种另外的多核苷酸片段,最优选地至多1种另外的多核苷酸片段转化该宿主细胞。
多核苷酸
本发明还涉及包含编码目的酶的基因的多核苷酸;优选地,该目的多核苷酸包含编码含有分泌信号肽的酶的基因;更优选地,该目的多核苷酸包含编码以下的基因:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;最优选地,该目的多核苷酸包含编码以下的基因:α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
在优选的实施例中,一种或多种转化到该宿主细胞的多核苷酸片段包含编码目的酶的基因中的至少一种突变,因此,当该重叠PCR片段重组以形成整个目的多核苷酸时,该至少一种突变将被包含于编码目的酶的基因中。
在另一个优选的实施例中,该目的多核苷酸包含选择性标记基因。
优选地,本发明的第一方面的每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至多1,000bp,优选地至多900bp,至多800bp、至多700bp、至多600bp、至多500bp、至多400bp、至多300bp、至多200bp、至多100bp、至多90bp、至多80bp、至多70bp、至多60bp、至多50bp、至多40bp的重叠并且最优选地,每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至多30bp的重叠。
用于分离或克隆多核苷酸的技术是本领域中已知的且包括从基因组DNA或cDNA或其组合进行分离。可以例如通过使用熟知的聚合酶链反应(PCR)或表达文库的抗体筛选来检测具有共有结构特征的克隆DNA片段,实现从基因组DNA克隆多核苷酸。参见例如,Innis等人,1990,PCR:A Guide to Methods and Application[PCR:方法和应用指南],学术出版社(Academic Press),纽约。可以使用其他核酸扩增程序如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。
编码本发明多肽的多核苷酸的修饰对于合成基本上类似于所述多肽的多肽可以是必需的。术语“基本上类似”于所述多肽是指多肽的非天然存在的形式。这些多肽可以因某种工程化方式而与从其天然来源分离的多肽不同,例如在比活性、热稳定性、最适pH等方面不同的变体。可以如下构建变体:基于作为成熟多肽编码序列(例如,其子序列)所提出的多核苷酸,和/或通过引入核苷酸置换,所述核苷酸置换不导致多肽的氨基酸序列变化,但是对应于旨在用于产生酶的宿主生物的密码子使用,或通过引入可以产生不同氨基酸序列的核苷酸置换。对于核苷酸取代的一般描述,参见例如Ford等人,1991,ProteinExpression and Purification[蛋白质表达与纯化]2:95-107。
核酸构建体
本发明还涉及核酸构建体,其包含可操作地连接至一个或多个控制序列的本发明的多核苷酸,在与控制序列相容的条件下,该一个或多个控制序列指导该编码序列在适合的宿主细胞中的表达。
可用许多方式操作所述多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可以是理想的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
所述控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明多肽的多核苷酸的多核苷酸。所述启动子包含转录控制序列,其介导所述多肽的表达。启动子可以在宿主细胞中显示转录活性的任何多核苷酸,包括突变型、截短型和杂合型启动子,并且可以是从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的适合启动子的实例是从以下的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰孢胰蛋白酶-样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(达莉亚)(WO 00/56900)、镶片镰孢Quinn(奎恩)(WO00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延伸因子,连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导序列替换未翻译的前导序列;非限制性实例包括来自黑曲霉中性α-淀粉酶基因的修饰的启动子,其中已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替换未翻译的前导序列);及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
控制序列也可为由宿主细胞识别以终止转录的转录终止子。所述终止子可操作地连接到编码所述多肽的多核苷酸的3'-末端。在宿主细胞中有功能的任何终止子可用于本发明中。
用于丝状真菌宿主细胞的优选终止子从以下酶的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶-样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
所述控制序列还可以是在启动子下游并且在基因编码序列上游的mRNA稳定子区域,它增加所述基因的表达。
控制序列也可以是前导序列,即对宿主细胞翻译很重要的mRNA的非翻译区域。所述前导序列可操作地连接至编码所述多肽的多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导序列。
用于丝状真菌宿主细胞的优选前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
控制序列也可以是多聚腺苷化序列,一种与多核苷酸3’-末端可操作地连接并在转录时由宿主细胞识别为向转录的mRNA添加聚腺苷酸残基的信号序列。可以使用在宿主细胞中有功能的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列从以下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖孢镰孢胰蛋白酶样蛋白酶。
控制序列也可为编码与多肽的N-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5'-端可固有地含有在翻译阅读框中与编码多肽的编码序列的区段天然地连接的信号肽编码序列。可替代地,编码序列的5'-端可含有对于编码序列为外源的信号肽编码序列。在编码序列天然地不含有信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶。
控制序列也可以是编码位于多肽N-末端处的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。
在信号肽序列和前肽序列二者都存在的情况下,所述前肽序列位于紧邻多肽的N-末端且所述信号肽序列位于紧邻所述前肽序列的N-末端。
也可希望的是添加调节序列,所述调节序列调节宿主细胞生长相关的多肽的表达。调节序列的实例是引起基因表达以响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是那些允许基因扩增的那些序列。在真核系统中,这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸会与调节序列可操作地连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可连接在一起以产生重组表达载体,其可包括一个或多个便利的限制位点以允许编码所述多肽的多核苷酸在此类位点处的插入或取代。可替代地,可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该用于表达的适当控制序列可操作地连接。
重组表达载体可以是可以方便地经受重组DNA程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性或闭合环状质粒。
载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总DNA,或可以使用转座子。
载体优选地含有允许方便地选择转化的细胞、转染的细胞、转导的细胞等细胞的一个或多个选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。
用于丝状真菌宿主细胞中的选择性标记包括但不限于:adeA(磷酸核糖酰氨基咪唑-琥珀酸甲酰胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰基转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。优选地用于木霉属细胞的是adeA、adeB、amdS、hph以及pyrG基因。
选择性标记可以是如描述于WO 2010/039889中的双选择性标记系统。在一方面,双选择性标记是hph-tk双选择性标记系统。
载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到所述宿主细胞基因组中,所述载体可以依靠编码所述多肽的多核苷酸序列或用于通过同源或非同源重组整合到所述基因组中的所述载体的任何其他元件。可替代地,该载体可含有用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,如100至10,000个碱基对、400至10,000个碱基对、和800至10,000个碱基对,所述核酸与对应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。
为了自主复制,载体还可以另外包含复制起点,所述复制起点使得载体在讨论中的宿主细胞中自主复制成为可能。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175;WO00/24883)。可根据WO 00/24883中披露的方法完成AMA1基因的分离和包含所述基因的质粒或载体的构建。
可将本发明多核苷酸的多于一个拷贝插入宿主细胞以增加多肽的产生。通过将序列的至少一种另外的拷贝整合到宿主细胞基因组中或者通过包括与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标记基因的经扩增的拷贝以及由此该多核苷酸的另外的拷贝的细胞。
用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如,Sambrook等人,1989,见上文)。
实例
材料与方法
根据制造商的说明,使用校对聚合酶Phusion(赛默飞世尔科技公司(ThermoFisher Scientific)),扩增所有用于转化的DNA。根据制造商的说明,使用QIAquick试剂盒纯化DNA。
根据制造商的说明,使用校对聚合酶KAPA HotStart ReadyMix(KAPA Biosystems公司)扩增用于测序的DNA。
通过缺失启动子以及亚硝酸盐还原酶(niiA)基因和硝酸盐还原酶(niaD)基因二者的5'部分,而从米曲霉PFJ0220(EP 2147107 B1)产生黑曲霉COLS1300(amyA、amyB、amyC、alpA、nprA、kusA、niaD、niiA、amdS+),因此使它们的表达失活(Nielsen M.L.等人2006,Efficient PCR-based gene targeting with a recyclable marker for Aspergillusnidulans[针对构巢曲霉的有效的基于PCR的用可再循环标记进行的基因靶向],FungalGenetics and Biology[真菌遗传学和生物学]第43卷:54-64)。
米曲霉菌株DAU716(ligDΔ)描述于WO 2016/026938实例5中。
真菌物种的转化可以使用用于酵母转化的一般方法实现。优选地,将曲霉属宿主菌株接种至补充有10mM尿苷的100ml YPG培养基中,并在80rpm下,在32℃孵育16hr。将球粒进行收集并且用0.6M KCl洗涤,并且将其再悬浮于包含商业β-葡聚糖酶产品(GLUCAN EXTM,诺维信公司(Novozymes A/S),鲍斯韦丹麦)的20ml 0.6M KCl(终浓度为20mg/ml)中。将悬浮液在32℃伴随振荡(80rpm)孵育直到形成原生质体,并且然后用STC缓冲液洗涤两次。将这些原生质体计数,并且在8:2:0.1的STC:STPC:DMSO溶液中重悬并调节至终浓度为2.5x 107个原生质体/ml。将大约4μg的质粒DNA添加至100μl的原生质体悬浮液中,轻轻混合,并在冰上孵育30分钟。添加1ml的SPTC,并且将原生质体悬浮液在37℃孵育20分钟。在添加10ml的50℃Cove或Cove-N顶层琼脂糖之后,将反应倾倒于Cove或Cove-N(tf)琼脂板上,并且将板于32℃孵育5天。
实例1.通过双分裂标记将2个片段转化至米曲霉中
本实验的目的是示出,与先前描述的直接应用选择组装选择标记的双分裂选择标记系统(DSMS)不同,在不直接选择组装事件的情况下,两个片段的体内组装是可能的(Nielsen M.L.等人2006,Efficient PCR-based gene targeting with a recyclablemarker for Aspergillus nidulans[针对构巢曲霉的有效的基于PCR的用可再循环标记进行的基因靶向],Fungal Genetics and Biology[真菌遗传学和生物学]第43卷:54-64)。然而,应用不直接选择体内组装,因为DSMS系统选择在整合位点的5’末端和3’末端进行整合。
此外,该目的是为示出当两个片段之间具有少至20bp同源重叠时,体内组装这两个片段是可能的。在本实例中,该同源重叠与野生型基因相同,但是该同源重叠可含有任何核苷酸序列,并且可例如用于引入特定突变。
具有20、30、50、100、和1000bp重叠的片段的制备:
如下所述并如图1所说明的,产生两个具有不同重叠长度的用于通过同源重组(HR)整合的PCR片段。通过表达经由双分裂标记系统(DSMS;见上文)整合的疏棉状嗜热丝孢菌脂肪酶来测试该系统。设计PCR片段以分别具有20bp、30bp、50bp、100bp、和1000bp的重叠。使用表1的引物对,通过来自pBGMH0021(WO 2015/082535)的PCR扩增这些片段:
表1.
将PCR反应编程为在95℃进行5分钟的1个循环;35个循环,每个循环在98℃持续30秒、58℃持续30秒、并且在72℃持续4分钟;和在72℃最终延伸5分钟。
COLS1300(kusAΔ)的转化:
如下所示并且如图1所说明的,将片段成对转化至COLS1300。将转化体铺在具有补充有NaN03的基本培养基的平板上。在整合盒已经成功地重组到宿主细胞的染色体中并在该过程中重构niiA和niaD位点的情况下,仅孢子可发芽和存活。在30℃孵育3天后计数转化体的数目。
片段 | 重叠长度(bp) | 转化体/μg DNA |
A+B | 20 | 11 |
A+C | 30 | 17 |
A+D | 50 | 60 |
A+E | 100 | 42 |
A+F | 1000 | 23 |
G(阳性对照) | 单个片段 | 30 |
无DNA(阴性对照) | - | 0 |
转化体测序:
使用如下引物从来自每个反应的8个转化体的基因组DNA对该疏棉状嗜热丝孢菌脂肪酶进行PCR扩增:
PKH1271:5’ccaactcaatttacctctatcca(SEQ ID NO:9)
PKH1274:5’acacccactacatacatgatca(SEQ ID NO:10)
将PCR反应编程为在95℃进行3分钟的1个循环;34个循环,每个循环在98℃持续20秒、68℃持续1秒、并且在72℃持续1分钟;和在72℃最终延伸4分钟。
结果
该米曲霉COLS1300菌株是kusAΔ(具有非同源末端连接(NHEJ)修复缺陷)。在此菌株中,在不应用直接选择组装事件的情况下,体内组装两个片段是可能的。此外,体内组装用于HR的含有少至20bp的同源重叠的两个片段是可能的。测序证实所有测试的转化体都整合了两个片段,并且在HR事件期间没有引入突变。
实例2.通过FLP/FRT系统在米曲霉中用两个片段转化
本实验的目的是示出,在不直接选择且不间接选择整合两个转化的PCR片段的情况下,体内组装这两个片段是可能的。该FLP/FRT系统仅选择在整合位点的3’末端进行整合,并且因此没有组装这两个片段的选择。
具有20、30、50、100、和1000bp重叠的片段的制备:
以如下方式产生用于整合HR用、具有不同重叠长度的两个片段的片段。经由位点特异性重组酶FLP/FRT系统,通过表达疏棉状嗜热丝孢菌脂肪酶来测试该系统(WO 2012/160093)。设计片段以分别具有20bp、30bp、50bp、100bp、和1000bp的重叠。使用表2的引物对,通过PCR从质粒pDAU724(WO 2016/026938;图7;其中的SEQ ID NO:30)扩增这些片段:
表2.
将PCR反应编程为在95℃进行5分钟的1个循环;35个循环,每个循环在98℃持续30秒、60℃持续30秒、并且在72℃持续3分钟;和在72℃最终延伸5分钟。
米曲霉菌株DAU716(ligDΔ)的转化:
如表3所示并且并如图1所说明的,将这些片段成对转化至DAU716中,并且在30℃孵育3天后对转化体计数。
表3.
片段 | 重叠长度(bp) | 转化体/μg DNA |
A+B | 20 | 8 |
A+C | 30 | 24 |
A+D | 50 | 21 |
A+E | 100 | 18 |
A+F | 1000 | 4 |
G(线性阳性对照) | 单个片段 | 0 |
pDAU724(环状阳性对照) | 单个环状质粒 | 35 |
无DNA(阴性对照) | - | 0 |
转化体测序:
使用引物从来自每个反应的8个转化体的基因组DNA对该疏棉状嗜热丝孢菌脂肪酶编码基因进行PCR扩增:
PKH1271:5’ccaactcaatttacctctatcca(SEQ ID NO:9)
PKH1274:5’acacccactacatacatgatca(SEQ ID NO:10)
将PCR反应编程为在95℃进行3分钟的1个循环;34个循环,每个循环在98℃持续20秒、68℃持续1秒、并且在72℃持续1分钟;和在72℃最终延伸4分钟。
结果
米曲霉DAU716是ligDΔ(具有NHEJ缺陷)。我们没有应用直接或间接选择组装和整合两个片段,但体内组装两个片段是可能的,其中这两个片段含有用于体内同源重组的少至20bp的同源重叠。
测序证实所有转化体都整合了两个片段,并且在重组期间没有引入突变。因此,具有短的同源重叠的两个片段的正确组装不限于使用特定的整合系统。
实例3.通过DSMS系统在米曲霉中用2-5个片段转化
本实验的目的是示出当仅具有20bp的同源重叠时,在不直接选择整合所有片段的情况下,体内组装多达五个片段是可能的。
具有20bp重叠的片段的制备:
按如下方式并如图2所说明的,产生2-5个具有20bp重叠的整合用片段。经由双分裂标记系统(DSMS),通过表达疏棉状嗜热丝孢菌脂肪酶来测试该系统。设计片段以整合2-5个片段,并且它们都具有恰好20bp的重叠。使用表4的引物对,通过PCR从pBGMH0021扩增这些片段:
表4
将PCR反应编程为在95℃进行5分钟的1个循环;35个循环,每个循环在98℃持续30秒、60℃持续30秒、并且在72℃持续3分钟;和在72℃最终延伸5分钟。
米曲霉COLS1300(kusAΔ)的转化:
如表5所示并如图3所说明的,将这些片段成对转化至COLS1300;在30℃孵育3天后计数转化体。
表5.
转化体测序:
使用如下引物从来自每个反应的8个转化体的基因组DNA对该疏棉状嗜热丝孢菌脂肪酶进行PCR扩增:
PKH1271:5’ccaactcaatttacctctatcca(SEQ ID NO:9)
PKH1274:5’acacccactacatacatgatca(SEQ ID NO:10)
将PCR反应编程为在95℃进行3分钟的1个循环;34个循环,每个循环在98℃持续20秒、68℃持续1秒、并且在72℃持续1分钟;和在72℃最终延伸4分钟。
结果
米曲霉COLS1300是kusAΔ(具有NHEJ缺陷)。在此菌株中,体内组装多达5个转化的PCR片段是可能的,每个片段与另一片段具有少至20bp的重叠用于同源重组。测序证实所有测试的转化体都整合了所有片段,并且在HR事件期间没有引入突变。
观察到转化效率随着片段数量的增加而降低;然而,如果增加宿主的一般转化效率,则有可能组装更多的片段。
序列表
<110> 诺维信公司(Novozymes A/S)
<120> 真菌宿主细胞中DNA片段的基因组整合
<130> 13082-WO-PCT
<160> 18
<170> PatentIn版本3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 dsms0003
<400> 1
atgaaccatg gcttctcatc 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0002
<400> 2
actgttgccg gagcagacct 20
<210> 3
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0003
<400> 3
gcattggcaa ctgttgcc 18
<210> 4
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0004
<400> 4
ccggacatag cttgggtggt g 21
<210> 5
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0005
<400> 5
gaaggtggag gatgctgtga g 21
<210> 6
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0006
<400> 6
aggaccacct ctaggcatcg ga 22
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0001
<400> 7
caggtctgct ccggcaacag 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 dsms0004
<400> 8
tgattgcact aacggcatac 20
<210> 9
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物 PKH1271
<400> 9
ccaactcaat ttacctctat cca 23
<210> 10
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物 PKH1274
<400> 10
acacccacta catacatgat ca 22
<210> 11
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物 flp0001
<400> 11
gaattcgagc tcggtacctt gaag 24
<210> 12
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物 flp0003
<400> 12
gaccatgatt acgccaagct tac 23
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0007
<400> 13
cattacgtgc acggccaatg 20
<210> 14
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0008
<400> 14
ataaatgaca tttgctccgg ct 22
<210> 15
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0009
<400> 15
gagacatcgt gaagatagaa ggca 24
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0010
<400> 16
cattggccgt gcacgtaatg 20
<210> 17
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0011
<400> 17
ccggagcaaa tgtcatttat ttc 23
<210> 18
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物 rec0012
<400> 18
ttctatcttc acgatgtctc gtc 23
Claims (9)
1.一种用于在真菌宿主细胞中的特定染色体靶位点处体内组装和整合目的多核苷酸的方法,所述方法包括以下步骤:
a)用以下转化该宿主细胞:
iv.至少一种多核苷酸片段,其依次包含上游侧翼区和该目的多核苷酸的5’部分;
v.至少一种多核苷酸片段,其依次包含该目的多核苷酸的3’部分和下游侧翼区;和,任选地
vi.一种或多种另外的多核苷酸片段,每种多核苷酸片段包含该目的多核苷酸的5’部分和3’部分;
其中每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至少20bp的重叠,因此这些片段覆盖整个目的多核苷酸,并且其中这些侧翼区具有足够的大小并且与该特定染色体靶位点具有足够的同源性以实现与该特定靶位点的同源重组;
b)在有利于体内同源重组发生的条件下培养该转化的宿主细胞,其中重叠PCR片段重组以形成整个目的多核苷酸,并且这些侧翼区与该染色体重组以在该特定染色体靶位点处整合该目的多核苷酸;和
c)选择经转化的宿主细胞,其中该目的多核苷酸被整合到该特定染色体靶位点中。
2.如权利要求1所述的方法,其中该真菌宿主细胞是丝状真菌宿主细胞,优选地该丝状真菌宿主细胞是以下属的:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、或木霉属;甚至更优选地,该丝状真菌宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉宿主细胞。
3.如前述权利要求中任一项所述的方法,其中该真菌宿主细胞具有非同源末端连接修复缺陷;优选地,该宿主细胞包含非同源末端连接修复所需的基因中的失活性突变或缺失;更优选地,该宿主细胞包含kusA、ligD、ku70、ku80、mre11、rad50、和/或xrs2,或其进化同系物中的失活性突变;更优选地,该真菌宿主细胞中缺失kusA、ligD、ku70、ku80、mre11、rad50、和/或xrs2,或其进化同系物。
4.如前述权利要求中任一项所述的方法,其中每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至多1,000bp,优选地至多900bp,至多800bp、至多700bp、至多600bp、至多500bp、至多400bp、至多300bp、至多200bp、至多100bp、至多90bp、至多80bp、至多70bp、至多60bp、至多50bp、至多40bp的重叠;并且最优选地,每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至多30bp的重叠。
5.如前述权利要求中任一项所述的方法,其中该目的多核苷酸包含编码目的酶的基因;优选地,该目的多核苷酸包含编码含有分泌信号肽的酶的基因;更优选地,该目的多核苷酸包含编码以下的基因:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;最优选地,该目的多核苷酸包含编码以下的基因:α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
6.如权利要求5所述的方法,其中一种或多种转化到该宿主细胞的多核苷酸片段包含编码目的酶的基因中的至少一种突变,因此,当该重叠PCR片段重组以形成整个目的多核苷酸时,该至少一种突变将被包含于编码目的酶的基因中。
7.如前述权利要求中任一项所述的方法,其中该目的多核苷酸包含选择性标记基因。
8.如前述权利要求中任一项所述的方法,其中该真菌宿主细胞的特定染色体靶位点和该上游和下游侧翼区一起包含双分裂选择标记系统(DSMS),因此可以选择经转化的宿主细胞,其中该目的多核苷酸以特定方向被整合到该特定染色体靶位点中;优选地,该双分裂选择标记系统基于该宿主细胞中的分裂亚硝酸盐还原酶(niiA)基因和硝酸盐还原酶(niaD)基因或其进化同系物,从而允许在补充有NaN03的基本培养基上选择成功转化的宿主细胞,其中该目的多核苷酸以特定方向被整合到该特定染色体靶位点中,同时在该过程中重构亚硝酸盐还原酶(niiA)和硝酸盐还原酶。
9.如前述权利要求中任一项所述的方法,其中在步骤(a)中用至多100种另外的多核苷酸片段,优选地至多90、80、70、60、50、40、30或20种另外的多核苷酸片段,更优选地至多10种另外的多核苷酸片段,甚至更优选地至多5种另外的多核苷酸片段,最优选地至多1种另外的多核苷酸片段转化该宿主细胞。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16189049.6 | 2016-09-15 | ||
EP16189049 | 2016-09-15 | ||
PCT/EP2017/072967 WO2018050666A1 (en) | 2016-09-15 | 2017-09-13 | Genomic integration of dna fragments in fungal host cells |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109563522A true CN109563522A (zh) | 2019-04-02 |
Family
ID=57083075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780049670.4A Pending CN109563522A (zh) | 2016-09-15 | 2017-09-13 | 真菌宿主细胞中dna片段的基因组整合 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20190225988A1 (zh) |
EP (1) | EP3512953A1 (zh) |
CN (1) | CN109563522A (zh) |
WO (1) | WO2018050666A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110184260A (zh) * | 2019-06-30 | 2019-08-30 | 华南理工大学 | 一种经优化的耐热亮氨酸氨肽酶Thelap及其编码基因与应用 |
CN110438018A (zh) * | 2019-08-21 | 2019-11-12 | 江南大学 | 一种快速构建曲霉重组菌株的方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3635112A2 (en) | 2017-06-06 | 2020-04-15 | Zymergen, Inc. | A htp genomic engineering platform for improving fungal strains |
KR20210018219A (ko) | 2018-06-06 | 2021-02-17 | 지머젠 인코포레이티드 | 발효 및 생산 중 곰팡이 형태를 제어하기 위한 신호 전달에 포함된 유전자의 조작 |
EP3830261A1 (en) | 2018-08-02 | 2021-06-09 | Novozymes A/S | Preparation of combinatorial libraries of dna constructs using introns |
US11479779B2 (en) | 2020-07-31 | 2022-10-25 | Zymergen Inc. | Systems and methods for high-throughput automated strain generation for non-sporulating fungi |
CN116322625A (zh) | 2020-08-24 | 2023-06-23 | 诺维信公司 | 包含果聚糖酶的口腔护理组合物 |
WO2023161245A1 (en) | 2022-02-22 | 2023-08-31 | Novozymes A/S | Oral care composition comprising enzymes |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008113847A2 (en) * | 2007-03-21 | 2008-09-25 | Dsm Ip Assets B.V. | Improved method for homologous recombination |
CN104603273A (zh) * | 2012-03-12 | 2015-05-06 | 帝斯曼知识产权资产管理有限公司 | 重组系统 |
WO2015082535A1 (en) * | 2013-12-03 | 2015-06-11 | Novozymes A/S | Fungal gene library by double split-marker integration |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
US5989870A (en) | 1986-04-30 | 1999-11-23 | Rohm Enzyme Finland Oy | Method for cloning active promoters |
ES2165420T3 (es) | 1994-06-03 | 2002-03-16 | Novozymes Biotech Inc | Lacasas myceliophthora purificadas y acidos nucleicos que las codifican. |
CN101659926A (zh) | 1994-06-30 | 2010-03-03 | 诺沃奇梅兹有限公司 | 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子 |
DE69932345T2 (de) | 1998-10-26 | 2007-07-19 | Novozymes A/S | Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen |
CN100482801C (zh) | 1999-03-22 | 2009-04-29 | 诺沃奇梅兹有限公司 | 用于在真菌细胞中表达基因的启动子 |
US20100221783A1 (en) | 2007-05-09 | 2010-09-02 | Novozymes A/S | Expression Cloning Method Suitable for Selecting Library Clones Producing a Polypeptide of Interest |
CN102224245B (zh) | 2008-09-30 | 2016-01-13 | 诺维信股份有限公司 | 在丝状真菌细胞中使用阳性和阴性选择性基因的方法 |
EP2527448A1 (en) | 2011-05-23 | 2012-11-28 | Novozymes A/S | Simultaneous site-specific integrations of multiple gene-copies in filamentous fungi |
EP3183343B1 (en) | 2014-08-20 | 2020-01-01 | Novozymes A/S | Recombinase-mediated integration of a polynucleotide library |
-
2017
- 2017-09-13 EP EP17768425.5A patent/EP3512953A1/en not_active Withdrawn
- 2017-09-13 WO PCT/EP2017/072967 patent/WO2018050666A1/en unknown
- 2017-09-13 US US16/333,191 patent/US20190225988A1/en not_active Abandoned
- 2017-09-13 CN CN201780049670.4A patent/CN109563522A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008113847A2 (en) * | 2007-03-21 | 2008-09-25 | Dsm Ip Assets B.V. | Improved method for homologous recombination |
CN104603273A (zh) * | 2012-03-12 | 2015-05-06 | 帝斯曼知识产权资产管理有限公司 | 重组系统 |
WO2015082535A1 (en) * | 2013-12-03 | 2015-06-11 | Novozymes A/S | Fungal gene library by double split-marker integration |
Non-Patent Citations (4)
Title |
---|
M.ARENTSHORST ET AL.: "Efficient Generation of Aspergillus niger Knock Out Strains by Combining NHEJ Mutants and a Split Marker Approach", 《FUNGAL BIOLOGY》 * |
NIELSEN ET AL.: "EYcient PCR-based gene targeting with a recyclable marker for Aspergillus nidulans", 《FUNGAL GENETICS AND BIOLOGY》 * |
NIELSEN ET AL.: "Transient disruption of non-homologous end-joining facilitates targeted genome manipulations in the filamentous fungus Aspergillus nidulans", 《FUNGAL GENETICS AND BIOLOGY》 * |
NIELSEN ET AL.: "Transient Marker System for Iterative Gene Targeting of a Prototrophic Fungus", 《APPLIED AND ENVIRONMENTAL MICROBIOLOGY》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110184260A (zh) * | 2019-06-30 | 2019-08-30 | 华南理工大学 | 一种经优化的耐热亮氨酸氨肽酶Thelap及其编码基因与应用 |
CN110184260B (zh) * | 2019-06-30 | 2021-08-10 | 华南理工大学 | 一种经优化的耐热亮氨酸氨肽酶Thelap及其编码基因与应用 |
CN110438018A (zh) * | 2019-08-21 | 2019-11-12 | 江南大学 | 一种快速构建曲霉重组菌株的方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2018050666A1 (en) | 2018-03-22 |
EP3512953A1 (en) | 2019-07-24 |
US20190225988A1 (en) | 2019-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109563522A (zh) | 真菌宿主细胞中dna片段的基因组整合 | |
US11840696B2 (en) | Methods of introducing multiple expression constructs into a eukaryotic cell | |
CA2834716C (en) | Simultaneous site-specific integrations of multiple gene-copies in filamentous fungi | |
CN105992821A (zh) | 真菌基因文库的双分裂标记物整合 | |
CN109312353A (zh) | 通过crispr-抑制来改善微生物 | |
CN104395454A (zh) | 改善的真菌选择 | |
CN102224245A (zh) | 在丝状真菌细胞中使用阳性和阴性选择性基因的方法 | |
CN104981542B (zh) | 重组系统 | |
CN107075451A (zh) | 丝状真菌双重突变体宿主细胞 | |
US11046736B2 (en) | Filamentous fungal host | |
JP2022513649A (ja) | 修飾された糸状菌宿主細胞 | |
US10550398B2 (en) | RlmA-inactivated filamentous fungal host cell | |
WO2022251056A1 (en) | Transcriptional regulators and polynucleotides encoding the same | |
US20220267783A1 (en) | Filamentous fungal expression system | |
US11667922B2 (en) | Fungal chaperone proteins | |
US20220073898A1 (en) | Tandem Protein Expression | |
CN107109424A (zh) | 真菌宿主菌株、dna构建体及使用方法 | |
DE69736520T2 (de) | Modifikation von kryptischen splicemotiven heterologer gene zur expression in pilzen | |
CN113056552A (zh) | 经修饰的丝状真菌宿主细胞 | |
WO2022090555A1 (en) | Leader peptides and polynucleotides encoding the same | |
US20220251581A1 (en) | Modified filamentous fungal host cell | |
WO2020025357A1 (en) | Preparation of combinatorial libraries of dna constructs using introns |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190402 |