CN115052477A - 在多肽生产中具有提高的生产力的丝状真菌细胞的突变体 - Google Patents
在多肽生产中具有提高的生产力的丝状真菌细胞的突变体 Download PDFInfo
- Publication number
- CN115052477A CN115052477A CN202180007046.4A CN202180007046A CN115052477A CN 115052477 A CN115052477 A CN 115052477A CN 202180007046 A CN202180007046 A CN 202180007046A CN 115052477 A CN115052477 A CN 115052477A
- Authority
- CN
- China
- Prior art keywords
- mutant
- polypeptide
- gtpase
- protein
- fusarium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 170
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 169
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 168
- 230000002538 fungal effect Effects 0.000 title claims abstract description 106
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 35
- 230000001965 increasing effect Effects 0.000 title claims description 18
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 108
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 89
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 89
- 239000002157 polynucleotide Substances 0.000 claims abstract description 89
- 238000000034 method Methods 0.000 claims abstract description 77
- 101100247323 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) ras-2 gene Proteins 0.000 claims abstract description 70
- 101150046104 racA gene Proteins 0.000 claims abstract description 34
- 238000006467 substitution reaction Methods 0.000 claims abstract description 18
- 230000002950 deficient Effects 0.000 claims abstract description 17
- 241000499912 Trichoderma reesei Species 0.000 claims description 112
- 125000003729 nucleotide group Chemical group 0.000 claims description 94
- 239000002773 nucleotide Substances 0.000 claims description 93
- 108090000790 Enzymes Proteins 0.000 claims description 63
- 101100139834 Drosophila melanogaster Rac1 gene Proteins 0.000 claims description 54
- 102000004190 Enzymes Human genes 0.000 claims description 53
- 229940088598 enzyme Drugs 0.000 claims description 50
- 241000223218 Fusarium Species 0.000 claims description 46
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 claims description 45
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 37
- 108010059892 Cellulase Proteins 0.000 claims description 30
- 108010047754 beta-Glucosidase Proteins 0.000 claims description 30
- 102000006995 beta-Glucosidase Human genes 0.000 claims description 28
- 102000004169 proteins and genes Human genes 0.000 claims description 23
- 108091006109 GTPases Proteins 0.000 claims description 21
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 claims description 20
- 241001494489 Thielavia Species 0.000 claims description 20
- 240000006439 Aspergillus oryzae Species 0.000 claims description 16
- 235000002247 Aspergillus oryzae Nutrition 0.000 claims description 16
- 241000123346 Chrysosporium Species 0.000 claims description 16
- 230000000295 complement effect Effects 0.000 claims description 16
- 239000002609 medium Substances 0.000 claims description 16
- 229940106157 cellulase Drugs 0.000 claims description 14
- 241000351920 Aspergillus nidulans Species 0.000 claims description 11
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 claims description 11
- 241001225321 Aspergillus fumigatus Species 0.000 claims description 10
- 241000228245 Aspergillus niger Species 0.000 claims description 10
- 241000223195 Fusarium graminearum Species 0.000 claims description 10
- 108010093941 acetylxylan esterase Proteins 0.000 claims description 10
- 229940091771 aspergillus fumigatus Drugs 0.000 claims description 10
- 108010002430 hemicellulase Proteins 0.000 claims description 10
- 241000223221 Fusarium oxysporum Species 0.000 claims description 9
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 claims description 9
- 241000146399 Ceriporiopsis Species 0.000 claims description 8
- 241000223259 Trichoderma Species 0.000 claims description 8
- 241000228212 Aspergillus Species 0.000 claims description 7
- 241000221779 Fusarium sambucinum Species 0.000 claims description 7
- 108010060309 Glucuronidase Proteins 0.000 claims description 7
- 102000053187 Glucuronidase Human genes 0.000 claims description 7
- 241000228143 Penicillium Species 0.000 claims description 7
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 7
- 241000567178 Fusarium venenatum Species 0.000 claims description 6
- 241000235403 Rhizomucor miehei Species 0.000 claims description 6
- 229940059442 hemicellulase Drugs 0.000 claims description 6
- 241000223261 Trichoderma viride Species 0.000 claims description 5
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 claims description 4
- 241001337994 Cryptococcus <scale insect> Species 0.000 claims description 4
- 241001495429 Thielavia terrestris Species 0.000 claims description 4
- 108091023040 Transcription factor Proteins 0.000 claims description 4
- 102000040945 Transcription factor Human genes 0.000 claims description 4
- 241000378866 Trichoderma koningii Species 0.000 claims description 4
- 125000000539 amino acid group Chemical group 0.000 claims description 4
- 239000004474 valine Substances 0.000 claims description 4
- 241001513093 Aspergillus awamori Species 0.000 claims description 3
- 241000892910 Aspergillus foetidus Species 0.000 claims description 3
- 241001480052 Aspergillus japonicus Species 0.000 claims description 3
- 241000223651 Aureobasidium Species 0.000 claims description 3
- 241000221955 Chaetomium Species 0.000 claims description 3
- 241000222511 Coprinus Species 0.000 claims description 3
- 241000146406 Fusarium heterosporum Species 0.000 claims description 3
- 241000233892 Neocallimastix Species 0.000 claims description 3
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 claims description 3
- 241000222385 Phanerochaete Species 0.000 claims description 3
- 241000222480 Schizophyllum Species 0.000 claims description 3
- 241000228341 Talaromyces Species 0.000 claims description 3
- 241000228178 Thermoascus Species 0.000 claims description 3
- 241001313536 Thermothelomyces thermophila Species 0.000 claims description 3
- 241001149964 Tolypocladium Species 0.000 claims description 3
- 241000223260 Trichoderma harzianum Species 0.000 claims description 3
- 241000223262 Trichoderma longibrachiatum Species 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 108010041969 feruloyl esterase Proteins 0.000 claims description 3
- 108700042778 Antimicrobial Peptides Proteins 0.000 claims description 2
- 102000044503 Antimicrobial Peptides Human genes 0.000 claims description 2
- 241000985909 Chrysosporium keratinophilum Species 0.000 claims description 2
- 241000223198 Humicola Species 0.000 claims description 2
- 241001480714 Humicola insolens Species 0.000 claims description 2
- 241000221960 Neurospora Species 0.000 claims description 2
- 241000959173 Rasamsonia emersonii Species 0.000 claims description 2
- 101710172711 Structural protein Proteins 0.000 claims description 2
- 241000223258 Thermomyces lanuginosus Species 0.000 claims description 2
- 239000000427 antigen Substances 0.000 claims description 2
- 108091007433 antigens Proteins 0.000 claims description 2
- 102000036639 antigens Human genes 0.000 claims description 2
- 239000003102 growth factor Substances 0.000 claims description 2
- 239000001963 growth medium Substances 0.000 claims description 2
- 239000005556 hormone Substances 0.000 claims description 2
- 229940088597 hormone Drugs 0.000 claims description 2
- 239000002955 immunomodulating agent Substances 0.000 claims description 2
- 229940121354 immunomodulator Drugs 0.000 claims description 2
- 230000002584 immunomodulator Effects 0.000 claims description 2
- 239000002858 neurotransmitter agent Substances 0.000 claims description 2
- 239000003910 polypeptide antibiotic agent Substances 0.000 claims description 2
- 102000005962 receptors Human genes 0.000 claims description 2
- 108020003175 receptors Proteins 0.000 claims description 2
- 241000222354 Trametes Species 0.000 claims 2
- 241000606125 Bacteroides Species 0.000 claims 1
- 241000222356 Coriolus Species 0.000 claims 1
- 241000567163 Fusarium cerealis Species 0.000 claims 1
- 241000223194 Fusarium culmorum Species 0.000 claims 1
- 102000013446 GTP Phosphohydrolases Human genes 0.000 claims 1
- 241000146398 Gelatoporia subvermispora Species 0.000 claims 1
- 241000235395 Mucor Species 0.000 claims 1
- 241001518671 Multiformis Species 0.000 claims 1
- 241000226677 Myceliophthora Species 0.000 claims 1
- 241000221961 Neurospora crassa Species 0.000 claims 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 claims 1
- 241000222395 Phlebia Species 0.000 claims 1
- 241000222397 Phlebia radiata Species 0.000 claims 1
- 241000222350 Pleurotus Species 0.000 claims 1
- 244000252132 Pleurotus eryngii Species 0.000 claims 1
- 235000001681 Pleurotus eryngii Nutrition 0.000 claims 1
- 241000231139 Pyricularia Species 0.000 claims 1
- 241000589180 Rhizobium Species 0.000 claims 1
- 241001540751 Talaromyces ruber Species 0.000 claims 1
- 241000222357 Trametes hirsuta Species 0.000 claims 1
- 241000031022 Xeromyces Species 0.000 claims 1
- 102220177125 rs886050090 Human genes 0.000 claims 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims 1
- 102000016731 rac GTP-Binding Proteins Human genes 0.000 abstract 2
- 108010092883 rac GTP-Binding Proteins Proteins 0.000 abstract 2
- 210000004027 cell Anatomy 0.000 description 168
- 108020004414 DNA Proteins 0.000 description 76
- 239000013612 plasmid Substances 0.000 description 46
- 239000013598 vector Substances 0.000 description 41
- 230000014509 gene expression Effects 0.000 description 39
- 108091026890 Coding region Proteins 0.000 description 35
- 108091034117 Oligonucleotide Proteins 0.000 description 31
- 230000000694 effects Effects 0.000 description 28
- 150000007523 nucleic acids Chemical group 0.000 description 25
- 125000006850 spacer group Chemical group 0.000 description 24
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 24
- 235000018102 proteins Nutrition 0.000 description 21
- 239000000523 sample Substances 0.000 description 21
- 239000002299 complementary DNA Substances 0.000 description 20
- 102000039446 nucleic acids Human genes 0.000 description 20
- 108020004707 nucleic acids Proteins 0.000 description 20
- 235000001014 amino acid Nutrition 0.000 description 19
- 230000001461 cytolytic effect Effects 0.000 description 18
- 238000000855 fermentation Methods 0.000 description 18
- 230000004151 fermentation Effects 0.000 description 18
- 239000003155 DNA primer Substances 0.000 description 17
- 238000003752 polymerase chain reaction Methods 0.000 description 17
- 239000013615 primer Substances 0.000 description 17
- 102220236734 rs1135401801 Human genes 0.000 description 17
- 239000000758 substrate Substances 0.000 description 17
- 108020001019 DNA Primers Proteins 0.000 description 16
- 239000008367 deionised water Substances 0.000 description 16
- 229910021641 deionized water Inorganic materials 0.000 description 16
- 101100247319 Drosophila melanogaster Ras64B gene Proteins 0.000 description 15
- 150000001413 amino acids Chemical class 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 15
- 238000009396 hybridization Methods 0.000 description 15
- 238000006460 hydrolysis reaction Methods 0.000 description 15
- 239000000243 solution Substances 0.000 description 15
- 239000000126 substance Substances 0.000 description 15
- 108010076504 Protein Sorting Signals Proteins 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 12
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 12
- 229920002678 cellulose Polymers 0.000 description 12
- 239000001913 cellulose Substances 0.000 description 12
- 235000010980 cellulose Nutrition 0.000 description 12
- 239000013604 expression vector Substances 0.000 description 12
- 230000007062 hydrolysis Effects 0.000 description 12
- 238000002703 mutagenesis Methods 0.000 description 12
- 231100000350 mutagenesis Toxicity 0.000 description 12
- 239000002853 nucleic acid probe Substances 0.000 description 12
- 230000009466 transformation Effects 0.000 description 12
- 101001065065 Aspergillus awamori Feruloyl esterase A Proteins 0.000 description 11
- 108091033409 CRISPR Proteins 0.000 description 11
- 239000003550 marker Substances 0.000 description 11
- 239000001965 potato dextrose agar Substances 0.000 description 11
- 210000001938 protoplast Anatomy 0.000 description 11
- 238000002105 Southern blotting Methods 0.000 description 10
- 239000012876 carrier material Substances 0.000 description 10
- 230000010076 replication Effects 0.000 description 10
- 238000002741 site-directed mutagenesis Methods 0.000 description 10
- -1 D-glucuronide esters Chemical class 0.000 description 9
- 108090000371 Esterases Proteins 0.000 description 9
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 9
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 9
- 238000010276 construction Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 108010038658 exo-1,4-beta-D-xylosidase Proteins 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 238000002744 homologous recombination Methods 0.000 description 9
- 230000006801 homologous recombination Effects 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 8
- 108020005004 Guide RNA Proteins 0.000 description 8
- 230000010354 integration Effects 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 241001149472 Clonostachys rosea Species 0.000 description 7
- 108010084650 alpha-N-arabinofuranosidase Proteins 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 229920001282 polysaccharide Polymers 0.000 description 7
- 239000005017 polysaccharide Substances 0.000 description 7
- 150000004804 polysaccharides Chemical class 0.000 description 7
- 108091008146 restriction endonucleases Proteins 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 239000004382 Amylase Substances 0.000 description 6
- 102000013142 Amylases Human genes 0.000 description 6
- 108010065511 Amylases Proteins 0.000 description 6
- 241000972773 Aulopiformes Species 0.000 description 6
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 6
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 6
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 6
- 108010048241 acetamidase Proteins 0.000 description 6
- 108090000637 alpha-Amylases Proteins 0.000 description 6
- 235000019418 amylase Nutrition 0.000 description 6
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 238000010362 genome editing Methods 0.000 description 6
- 239000008103 glucose Substances 0.000 description 6
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 6
- 229940097277 hygromycin b Drugs 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 238000002955 isolation Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 229910052760 oxygen Inorganic materials 0.000 description 6
- 239000001301 oxygen Substances 0.000 description 6
- 108010033674 rho GTP-Binding Proteins Proteins 0.000 description 6
- 235000019515 salmon Nutrition 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 101000757144 Aspergillus niger Glucoamylase Proteins 0.000 description 5
- 238000010354 CRISPR gene editing Methods 0.000 description 5
- 102000005575 Cellulases Human genes 0.000 description 5
- 108010084185 Cellulases Proteins 0.000 description 5
- 108010042407 Endonucleases Proteins 0.000 description 5
- 102000004533 Endonucleases Human genes 0.000 description 5
- 241000186394 Eubacterium Species 0.000 description 5
- 241000233866 Fungi Species 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- 241000589902 Leptospira Species 0.000 description 5
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- 239000001632 sodium acetate Substances 0.000 description 5
- 235000017281 sodium acetate Nutrition 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 229910021654 trace metal Inorganic materials 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- 229910001868 water Inorganic materials 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- BTJIUGUIPKRLHP-UHFFFAOYSA-M 4-nitrophenolate Chemical compound [O-]C1=CC=C([N+]([O-])=O)C=C1 BTJIUGUIPKRLHP-UHFFFAOYSA-M 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 239000002028 Biomass Substances 0.000 description 4
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 4
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 4
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 108091006027 G proteins Proteins 0.000 description 4
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 4
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 4
- 102000004157 Hydrolases Human genes 0.000 description 4
- 108090000604 Hydrolases Proteins 0.000 description 4
- 229920000057 Mannan Polymers 0.000 description 4
- 239000012901 Milli-Q water Substances 0.000 description 4
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 4
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 238000009004 PCR Kit Methods 0.000 description 4
- 238000003559 RNA-seq method Methods 0.000 description 4
- 238000011529 RT qPCR Methods 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 4
- 238000000246 agarose gel electrophoresis Methods 0.000 description 4
- 102000004139 alpha-Amylases Human genes 0.000 description 4
- 229940024171 alpha-amylase Drugs 0.000 description 4
- 108010061261 alpha-glucuronidase Proteins 0.000 description 4
- 101150078331 ama-1 gene Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 229920000617 arabinoxylan Polymers 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 229940041514 candida albicans extract Drugs 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000002779 inactivation Effects 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 230000003362 replicative effect Effects 0.000 description 4
- 239000000600 sorbitol Substances 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- OSBLTNPMIGYQGY-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid;boric acid Chemical compound OB(O)O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O OSBLTNPMIGYQGY-UHFFFAOYSA-N 0.000 description 3
- IFBHRQDFSNCLOZ-RMPHRYRLSA-N 4-nitrophenyl beta-D-glucoside Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=CC=C([N+]([O-])=O)C=C1 IFBHRQDFSNCLOZ-RMPHRYRLSA-N 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 3
- 241000223600 Alternaria Species 0.000 description 3
- 108010037870 Anthranilate Synthase Proteins 0.000 description 3
- 241000534000 Berula erecta Species 0.000 description 3
- 229920002498 Beta-glucan Polymers 0.000 description 3
- 102100032487 Beta-mannosidase Human genes 0.000 description 3
- 229920002134 Carboxymethyl cellulose Polymers 0.000 description 3
- 241001085790 Coprinopsis Species 0.000 description 3
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 238000007702 DNA assembly Methods 0.000 description 3
- 102000010911 Enzyme Precursors Human genes 0.000 description 3
- 108010062466 Enzyme Precursors Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 229920002488 Hemicellulose Polymers 0.000 description 3
- 101000952182 Homo sapiens Max-like protein X Proteins 0.000 description 3
- 102100027612 Kallikrein-11 Human genes 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- 108090001060 Lipase Proteins 0.000 description 3
- 102000004882 Lipase Human genes 0.000 description 3
- 239000004367 Lipase Substances 0.000 description 3
- 108010054377 Mannosidases Proteins 0.000 description 3
- 102000001696 Mannosidases Human genes 0.000 description 3
- 102100037423 Max-like protein X Human genes 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 108700005078 Synthetic Genes Proteins 0.000 description 3
- 239000008051 TBE buffer Substances 0.000 description 3
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- 101710152431 Trypsin-like protease Proteins 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 3
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 108010055059 beta-Mannosidase Proteins 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 108010092413 endoglucanase V Proteins 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000002573 hemicellulolytic effect Effects 0.000 description 3
- 235000019421 lipase Nutrition 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 101150054232 pyrG gene Proteins 0.000 description 3
- 102000016914 ras Proteins Human genes 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000037432 silent mutation Effects 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000001509 sodium citrate Substances 0.000 description 3
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- 229920001221 xylan Polymers 0.000 description 3
- 239000007222 ypd medium Substances 0.000 description 3
- CUVSTAMIHSSVKL-UWVGGRQHSA-N (4s)-4-[(2-aminoacetyl)amino]-5-[[(2s)-6-amino-1-(carboxymethylamino)-1-oxohexan-2-yl]amino]-5-oxopentanoic acid Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN CUVSTAMIHSSVKL-UWVGGRQHSA-N 0.000 description 2
- MLJYKRYCCUGBBV-YTWAJWBKSA-N 4-nitrophenyl beta-D-xyloside Chemical compound O[C@@H]1[C@@H](O)[C@H](O)CO[C@H]1OC1=CC=C([N+]([O-])=O)C=C1 MLJYKRYCCUGBBV-YTWAJWBKSA-N 0.000 description 2
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical compound CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 2
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 2
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 2
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 2
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 2
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 2
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 2
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 2
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 2
- XAPPCWUWHNWCPQ-PBCZWWQYSA-N Asp-Thr-His Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O XAPPCWUWHNWCPQ-PBCZWWQYSA-N 0.000 description 2
- 102000004580 Aspartic Acid Proteases Human genes 0.000 description 2
- 108010017640 Aspartic Acid Proteases Proteins 0.000 description 2
- 241000228215 Aspergillus aculeatus Species 0.000 description 2
- 101000690713 Aspergillus niger Alpha-glucosidase Proteins 0.000 description 2
- 101000756530 Aspergillus niger Endo-1,4-beta-xylanase B Proteins 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 101001110283 Canis lupus familiaris Ras-related C3 botulinum toxin substrate 1 Proteins 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 102000012286 Chitinases Human genes 0.000 description 2
- 241000221760 Claviceps Species 0.000 description 2
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 2
- LKUCSUGWHYVYLP-GHCJXIJMSA-N Cys-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N LKUCSUGWHYVYLP-GHCJXIJMSA-N 0.000 description 2
- PDRMRVHPAQKTLT-NAKRPEOUSA-N Cys-Ile-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O PDRMRVHPAQKTLT-NAKRPEOUSA-N 0.000 description 2
- HSAWNMMTZCLTPY-DCAQKATOSA-N Cys-Met-Leu Chemical compound SC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HSAWNMMTZCLTPY-DCAQKATOSA-N 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 241001218169 Dinophora Species 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 101710132690 Endo-1,4-beta-xylanase A Proteins 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241001092073 Filipendula Species 0.000 description 2
- 101000649352 Fusarium oxysporum f. sp. lycopersici (strain 4287 / CBS 123668 / FGSC 9935 / NRRL 34936) Endo-1,4-beta-xylanase A Proteins 0.000 description 2
- 241001112697 Fusarium reticulatum Species 0.000 description 2
- 241001014439 Fusarium sarcochroum Species 0.000 description 2
- 241000223192 Fusarium sporotrichioides Species 0.000 description 2
- 241001465753 Fusarium torulosum Species 0.000 description 2
- 102000034286 G proteins Human genes 0.000 description 2
- 108010072062 GEKG peptide Proteins 0.000 description 2
- 102000030782 GTP binding Human genes 0.000 description 2
- 108091000058 GTP-Binding Proteins 0.000 description 2
- 108010093031 Galactosidases Proteins 0.000 description 2
- 102000002464 Galactosidases Human genes 0.000 description 2
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 2
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 2
- HHQCBFGKQDMWSP-GUBZILKMSA-N Gln-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HHQCBFGKQDMWSP-GUBZILKMSA-N 0.000 description 2
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 2
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 2
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 2
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 2
- 229920001503 Glucan Polymers 0.000 description 2
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 2
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 2
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 2
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 101001000302 Homo sapiens Max-interacting protein 1 Proteins 0.000 description 2
- 101000957259 Homo sapiens Mitotic spindle assembly checkpoint protein MAD2A Proteins 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 2
- 102000004195 Isomerases Human genes 0.000 description 2
- 108090000769 Isomerases Proteins 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 108010029541 Laccase Proteins 0.000 description 2
- 241000589925 Leptospirillum Species 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 2
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 2
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 2
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 2
- 241001330975 Magnaporthe oryzae Species 0.000 description 2
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 2
- 241000207958 Microascus niger Species 0.000 description 2
- 102100038792 Mitotic spindle assembly checkpoint protein MAD2A Human genes 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 102000004316 Oxidoreductases Human genes 0.000 description 2
- 108090000854 Oxidoreductases Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 2
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- NAOVYENZCWFBDG-BZSNNMDCSA-N Phe-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 NAOVYENZCWFBDG-BZSNNMDCSA-N 0.000 description 2
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 2
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 2
- 241000383860 Pseudoplectania Species 0.000 description 2
- 241001529451 Pseudotrichomonas Species 0.000 description 2
- 108020004518 RNA Probes Proteins 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 239000003391 RNA probe Substances 0.000 description 2
- 241000235402 Rhizomucor Species 0.000 description 2
- 101800001697 Saposin-B Proteins 0.000 description 2
- 102400000830 Saposin-B Human genes 0.000 description 2
- 241000223255 Scytalidium Species 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 2
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 2
- 235000019892 Stellar Nutrition 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- 241000183057 Thielavia microspora Species 0.000 description 2
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 2
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 2
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 2
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 2
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 2
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 2
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 2
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 2
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 230000019552 anatomical structure morphogenesis Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- 150000004783 arabinoxylans Chemical class 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- AFYNADDZULBEJA-UHFFFAOYSA-N bicinchoninic acid Chemical compound C1=CC=CC2=NC(C=3C=C(C4=CC=CC=C4N=3)C(=O)O)=CC(C(O)=O)=C21 AFYNADDZULBEJA-UHFFFAOYSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 239000001768 carboxy methyl cellulose Substances 0.000 description 2
- 235000010948 carboxy methyl cellulose Nutrition 0.000 description 2
- 239000008112 carboxymethyl-cellulose Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004440 column chromatography Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- WBCMGDNFDRNGGZ-ACNVUDSMSA-N coumarate Natural products COC(=O)C1=CO[C@H](O[C@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]3[C@@H]1C=C[C@]34OC(=O)C(=C4)[C@H](C)OC(=O)C=Cc5ccc(O)cc5 WBCMGDNFDRNGGZ-ACNVUDSMSA-N 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000011033 desalting Methods 0.000 description 2
- 239000008121 dextrose Substances 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 108010091371 endoglucanase 1 Proteins 0.000 description 2
- 108010091384 endoglucanase 2 Proteins 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 239000003797 essential amino acid Substances 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- KSEBMYQBYZTDHS-HWKANZROSA-N ferulic acid Chemical compound COC1=CC(\C=C\C(O)=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-N 0.000 description 2
- 235000013312 flour Nutrition 0.000 description 2
- LNTHITQWFMADLM-UHFFFAOYSA-N gallic acid Chemical compound OC(=O)C1=CC(O)=C(O)C(O)=C1 LNTHITQWFMADLM-UHFFFAOYSA-N 0.000 description 2
- 239000010437 gem Substances 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 238000011223 gene expression profiling Methods 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 108010002685 hygromycin-B kinase Proteins 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 238000002966 oligonucleotide array Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 239000012266 salt solution Substances 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000010583 slow cooling Methods 0.000 description 2
- 239000001488 sodium phosphate Substances 0.000 description 2
- 229910000162 sodium phosphate Inorganic materials 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 2
- 239000012137 tryptone Substances 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 150000004823 xylans Chemical class 0.000 description 2
- FYGDTMLNYKFZSV-WFYNLLPOSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,3s,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](O[C@@H]2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-WFYNLLPOSA-N 0.000 description 1
- QGGOCWIJGWDKHC-FSIIMWSLSA-N (2s,3s,4r,5r)-2,4,5-trihydroxy-3-methoxy-6-oxohexanoic acid Chemical compound OC(=O)[C@@H](O)[C@@H](OC)[C@H](O)[C@@H](O)C=O QGGOCWIJGWDKHC-FSIIMWSLSA-N 0.000 description 1
- VIQDYVAKUJDZBD-YCRREMRBSA-N (4-nitrophenyl) (e)-3-(4-hydroxy-3-methoxyphenyl)prop-2-enoate Chemical compound C1=C(O)C(OC)=CC(\C=C\C(=O)OC=2C=CC(=CC=2)[N+]([O-])=O)=C1 VIQDYVAKUJDZBD-YCRREMRBSA-N 0.000 description 1
- YBADLXQNJCMBKR-UHFFFAOYSA-M (4-nitrophenyl)acetate Chemical compound [O-]C(=O)CC1=CC=C([N+]([O-])=O)C=C1 YBADLXQNJCMBKR-UHFFFAOYSA-M 0.000 description 1
- KSEBMYQBYZTDHS-HWKANZROSA-M (E)-Ferulic acid Natural products COC1=CC(\C=C\C([O-])=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-M 0.000 description 1
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- DMSDCBKFWUBTKX-UHFFFAOYSA-N 2-methyl-1-nitrosoguanidine Chemical compound CN=C(N)NN=O DMSDCBKFWUBTKX-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- 101150111329 ACE-1 gene Proteins 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000222518 Agaricus Species 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- JWUZOJXDJDEQEM-ZLIFDBKOSA-N Ala-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 JWUZOJXDJDEQEM-ZLIFDBKOSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- KHOITXIGCFIULA-UHFFFAOYSA-N Alophen Chemical compound C1=CC(OC(=O)C)=CC=C1C(C=1N=CC=CC=1)C1=CC=C(OC(C)=O)C=C1 KHOITXIGCFIULA-UHFFFAOYSA-N 0.000 description 1
- 101710199313 Alpha-L-arabinofuranosidase Proteins 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- 108010043324 Amyloid Precursor Protein Secretases Proteins 0.000 description 1
- 229920000189 Arabinogalactan Polymers 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- 240000003291 Armoracia rusticana Species 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 1
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 1
- 102000035101 Aspartic proteases Human genes 0.000 description 1
- 108091005502 Aspartic proteases Proteins 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 101001065063 Aspergillus niger Feruloyl esterase A Proteins 0.000 description 1
- 101001049242 Aspergillus niger Feruloyl esterase B Proteins 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 1
- 241000221377 Auricularia Species 0.000 description 1
- 108010007337 Azurin Proteins 0.000 description 1
- 238000000035 BCA protein assay Methods 0.000 description 1
- 101100394813 Bacillus subtilis (strain 168) hprT gene Proteins 0.000 description 1
- 229920002749 Bacterial cellulose Polymers 0.000 description 1
- 101710204694 Beta-xylosidase Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 108010051152 Carboxylesterase Proteins 0.000 description 1
- 102000013392 Carboxylesterase Human genes 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 108010031396 Catechol oxidase Proteins 0.000 description 1
- 102000030523 Catechol oxidase Human genes 0.000 description 1
- 241001057137 Chaetomium fimeti Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241000228437 Cochliobolus Species 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 229910021591 Copper(I) chloride Inorganic materials 0.000 description 1
- 244000251987 Coprinus macrorhizus Species 0.000 description 1
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 1
- 241001252397 Corynascus Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241001559589 Cullen Species 0.000 description 1
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 1
- CMYVIUWVYHOLRD-ZLUOBGJFSA-N Cys-Ser-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CMYVIUWVYHOLRD-ZLUOBGJFSA-N 0.000 description 1
- AEMOLEFTQBMNLQ-AQKNRBDQSA-N D-glucopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-AQKNRBDQSA-N 0.000 description 1
- 125000000214 D-xylosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)CO1)* 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 235000005903 Dioscorea Nutrition 0.000 description 1
- 244000281702 Dioscorea villosa Species 0.000 description 1
- 235000000504 Dioscorea villosa Nutrition 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical class O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 241000427940 Fusarium solani Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- IAJILQKETJEXLJ-UHFFFAOYSA-N Galacturonsaeure Natural products O=CC(O)C(O)C(O)C(O)C(O)=O IAJILQKETJEXLJ-UHFFFAOYSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 108010017544 Glucosylceramidase Proteins 0.000 description 1
- 102000004547 Glucosylceramidase Human genes 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- KTSZUNRRYXPZTK-BQBZGAKWSA-N Gly-Gln-Glu Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KTSZUNRRYXPZTK-BQBZGAKWSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 1
- 101001122938 Homo sapiens Lysosomal protective protein Proteins 0.000 description 1
- 101001035458 Humicola insolens Endoglucanase-5 Proteins 0.000 description 1
- 239000004354 Hydroxyethyl cellulose Substances 0.000 description 1
- 229920000663 Hydroxyethyl cellulose Polymers 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 1
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- 229920002097 Lichenin Polymers 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- OPTCSTACHGNULU-DCAQKATOSA-N Lys-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN OPTCSTACHGNULU-DCAQKATOSA-N 0.000 description 1
- LXNPMPIQDNSMTA-AVGNSLFASA-N Lys-Gln-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 LXNPMPIQDNSMTA-AVGNSLFASA-N 0.000 description 1
- 102100028524 Lysosomal protective protein Human genes 0.000 description 1
- 102100024295 Maltase-glucoamylase Human genes 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- 241001184659 Melanocarpus albomyces Species 0.000 description 1
- 235000017285 Melicoccus Nutrition 0.000 description 1
- 241000536286 Melicoccus Species 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- GMPKIPWJBDOURN-UHFFFAOYSA-N Methoxyamine Chemical compound CON GMPKIPWJBDOURN-UHFFFAOYSA-N 0.000 description 1
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 101100329389 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cre-1 gene Proteins 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-N Nitrous acid Chemical compound ON=O IOVCWXUNBOPUCH-UHFFFAOYSA-N 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- QGGOCWIJGWDKHC-UHFFFAOYSA-N O4-Methyl-D-glucuronsaeure Natural products OC(=O)C(O)C(OC)C(O)C(O)C=O QGGOCWIJGWDKHC-UHFFFAOYSA-N 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 241000233654 Oomycetes Species 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710113020 Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- 108010064785 Phospholipases Proteins 0.000 description 1
- 102000015439 Phospholipases Human genes 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 1
- 241000490567 Pinctada Species 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- 241001451060 Poitrasia Species 0.000 description 1
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101710148480 Putative beta-xylosidase Proteins 0.000 description 1
- 101150019218 RAS2 gene Proteins 0.000 description 1
- 241001506137 Rapa Species 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 1
- 241001533598 Septoria Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 1
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 241001085826 Sporotrichum Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 101150074253 TEF1 gene Proteins 0.000 description 1
- 241001215623 Talaromyces cellulolyticus Species 0.000 description 1
- 241000182980 Thielavia ovispora Species 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 108060008539 Transglutaminase Proteins 0.000 description 1
- 241000452385 Trichoderma reesei RUT C-30 Species 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- NKUIXQOJUAEIET-AQZXSJQPSA-N Trp-Asp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 NKUIXQOJUAEIET-AQZXSJQPSA-N 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 1
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241001523965 Xylaria Species 0.000 description 1
- 229920002000 Xyloglucan Polymers 0.000 description 1
- 108010027199 Xylosidases Proteins 0.000 description 1
- 241000949456 Zanthoxylum Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- AYCBPQJKWLTXNY-UHFFFAOYSA-N [N+](=O)([O-])C1=CC=C(C=C1)CC(=O)O.C(C)(=O)OC1=CC=C(C=C1)[N+](=O)[O-] Chemical compound [N+](=O)([O-])C1=CC=C(C=C1)CC(=O)O.C(C)(=O)OC1=CC=C(C=C1)[N+](=O)[O-] AYCBPQJKWLTXNY-UHFFFAOYSA-N 0.000 description 1
- 101150054399 ace2 gene Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000012867 alanine scanning Methods 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 102000005840 alpha-Galactosidase Human genes 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 235000019312 arabinogalactan Nutrition 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 239000005016 bacterial cellulose Substances 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 208000036815 beta tubulin Diseases 0.000 description 1
- 125000000188 beta-D-glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 125000002619 bicyclic group Chemical group 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 108010089934 carbohydrase Proteins 0.000 description 1
- 238000012219 cassette mutagenesis Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 239000002962 chemical mutagen Substances 0.000 description 1
- 229940114081 cinnamate Drugs 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- OXBLHERUFWYNTN-UHFFFAOYSA-M copper(I) chloride Chemical compound [Cu]Cl OXBLHERUFWYNTN-UHFFFAOYSA-M 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 108010005400 cutinase Proteins 0.000 description 1
- 230000003436 cytoskeletal effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 239000012470 diluted sample Substances 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000002003 electron diffraction Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000007824 enzymatic assay Methods 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108010000165 exo-1,3-alpha-glucanase Proteins 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000012526 feed medium Substances 0.000 description 1
- 229940114123 ferulate Drugs 0.000 description 1
- 229940114124 ferulic acid Drugs 0.000 description 1
- KSEBMYQBYZTDHS-UHFFFAOYSA-N ferulic acid Natural products COC1=CC(C=CC(O)=O)=CC=C1O KSEBMYQBYZTDHS-UHFFFAOYSA-N 0.000 description 1
- 235000001785 ferulic acid Nutrition 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 229940074391 gallic acid Drugs 0.000 description 1
- 235000004515 gallic acid Nutrition 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 229940097043 glucuronic acid Drugs 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 150000002391 heterocyclic compounds Chemical class 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 101150047832 hpt gene Proteins 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 235000019447 hydroxyethyl cellulose Nutrition 0.000 description 1
- 230000028644 hyphal growth Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 229910052741 iridium Inorganic materials 0.000 description 1
- GKOZUEZYRPOHIO-UHFFFAOYSA-N iridium atom Chemical compound [Ir] GKOZUEZYRPOHIO-UHFFFAOYSA-N 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 239000011572 manganese Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 1
- 239000008108 microcrystalline cellulose Substances 0.000 description 1
- 229940016286 microcrystalline cellulose Drugs 0.000 description 1
- 210000001724 microfibril Anatomy 0.000 description 1
- VYQNWZOUAUKGHI-UHFFFAOYSA-N monobenzone Chemical compound C1=CC(O)=CC=C1OCC1=CC=CC=C1 VYQNWZOUAUKGHI-UHFFFAOYSA-N 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000004899 motility Effects 0.000 description 1
- VGKONPUVOVVNSU-UHFFFAOYSA-N naphthalen-1-yl acetate Chemical compound C1=CC=C2C(OC(=O)C)=CC=CC2=C1 VGKONPUVOVVNSU-UHFFFAOYSA-N 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 229920002114 octoxynol-9 Polymers 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 108090000021 oryzin Proteins 0.000 description 1
- 239000000123 paper Substances 0.000 description 1
- 230000002351 pectolytic effect Effects 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 108010031697 phosphoribosylaminoimidazole synthase Proteins 0.000 description 1
- 238000005222 photoaffinity labeling Methods 0.000 description 1
- 229940085127 phytase Drugs 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- KCXFHTAICRTXLI-UHFFFAOYSA-N propane-1-sulfonic acid Chemical compound CCCS(O)(=O)=O KCXFHTAICRTXLI-UHFFFAOYSA-N 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 150000004053 quinones Chemical class 0.000 description 1
- 101150011960 rapA gene Proteins 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000001694 spray drying Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000010907 stover Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- QURCVMIEKCOAJU-UHFFFAOYSA-N trans-isoferulic acid Natural products COC1=CC=C(C=CC(O)=O)C=C1O QURCVMIEKCOAJU-UHFFFAOYSA-N 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 102000003601 transglutaminase Human genes 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 230000009105 vegetative growth Effects 0.000 description 1
- 230000028973 vesicle-mediated transport Effects 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H15/00—Fungi; Lichens
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y306/00—Hydrolases acting on acid anhydrides (3.6)
- C12Y306/05—Hydrolases acting on acid anhydrides (3.6) acting on GTP; involved in cellular and subcellular movement (3.6.5)
- C12Y306/05002—Small monomeric GTPase (3.6.5.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/885—Trichoderma
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y306/00—Hydrolases acting on acid anhydrides (3.6)
- C12Y306/05—Hydrolases acting on acid anhydrides (3.6) acting on GTP; involved in cellular and subcellular movement (3.6.5)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Botany (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及亲本丝状真菌细胞的突变体,该突变体包含:编码目的多肽的多核苷酸;编码Rho‑GTP酶RacA蛋白的racA基因,其中该racA基因经修饰,使得该突变体在该Rho‑GTP酶RacA蛋白的产生方面部分或完全缺陷;以及编码GTP酶Ras2蛋白的ras2基因,其中该GTP酶Ras2蛋白经修饰以产生GTP酶Ras2变体,该变体在与SEQ ID NO:11的位置16相对应的位置处包含取代,其中经修饰的racA基因和该Ras2变体的组合协同地增加了该突变体在该目的多肽产生中的生产力。本发明还涉及用此类突变体产生目的多肽的方法。
Description
序列表的引用
本申请含有计算机可读形式的序列表,将其通过引用并入本文。
背景技术
技术领域
本发明涉及在多肽生产中具有提高的生产力的突变体丝状真菌细胞。
相关技术说明
丝状真菌广泛用于生产各种工业应用的酶和其他生物制品。丝状真菌细胞在目的多肽的产生中的生产力取决于几个因素,如碳源、氮源、分泌、pH、温度和溶解氧。特别地,碳源可以确定诱导和/或抑制哪些分泌酶基因,和其的生产率。碳源通过转录因子和其相关的启动子起作用,根据碳源的水平激活或抑制这些启动子。
据报道,racA基因在丝状真菌的菌丝生长和菌丝分枝中起关键作用,并且racA基因失活有助于增加蛋白质产量,因为分泌潜力增强(Chen等人,2016,Biotech[生物技术]6:214;Fitz等人,2019,Fungal Biol.Biotechnology[真菌生物学与生物技术](2019),6:16;Fielder等人,2018,Microb.Cell.[微生物细胞]17:95;Virag,2007,MolecularMicrobiology[分子微生物学]66:1579-1596)。
还报道了Ras GTP酶ras2基因对于调节里氏木霉(Trichoderma reesei)中的形态发生和纤维素酶表达很重要,其中ras2G16V组成型活性变体在诱导条件下增加里氏木霉中的纤维素酶基因转录,尤其是Xyr1、Ace2、Cre1和Ace1转录因子控制下的纤维素酶基因(Zhang等人,2012,PLOS One[公共科学图书馆·综合]7:e48786)。
本发明提供了丝状真菌细胞的突变体,用于增加丝状真菌细胞在目的多肽生产中的生产力,其中经修饰的racA基因和Ras2变体的组合协同地增加了该突变体的生产力。
发明内容
本发明涉及亲本丝状真菌细胞的分离的突变体,该突变体包含:
(a)编码目的多肽的多核苷酸;
(b)编码Rho-GTP酶RacA蛋白的racA基因,其中该racA基因在该亲本丝状真菌细胞中经修饰以产生该突变体,使得该突变体在该Rho-GTP酶RacA蛋白的产生方面部分或完全缺陷;以及
(c)编码GTP酶Ras2蛋白的ras2基因,其中该GTP酶Ras2蛋白在该亲本丝状真菌细胞中经修饰以产生GTP酶Ras2变体,该变体在与SEQ ID NO:11的位置16相对应的位置处包含取代;
其中经修饰的racA基因和该GTP酶Ras2变体的组合协同地增加了该突变体在该目的多肽产生中的生产力。
本发明还涉及产生目的多肽的方法,该方法包括在用于产生该目的多肽的培养基中培养此类突变体丝状真菌细胞,以及任选地回收该目的多肽。
附图说明
图1示出了质粒pGMEr263的图谱。
图2示出了质粒pGMEr263-racA-proto3的图谱。
图3示出了质粒pGMEr263-ras2G16V-proto的图谱。
图4(以“箱线图”表示)示出了里氏木霉菌株O83E59、O83E58、以及O838XE和亲本里氏木霉菌株O44N7J相对于第7天总蛋白值的比较。黑色箱代表数据样本在第一和第三四分位数之间的分布。中间的白线代表中值。
图5(以“箱线图”表示))示出了里氏木霉菌株O83E59、O83E58、以及O838XE和亲本里氏木霉菌株O44N7J相对于第7天β-葡糖苷酶活性值的比较。黑色箱代表数据样本在第一和第三四分位数之间的分布。中间的白线代表中值。
图6(以“箱线图”表示)示出了里氏木霉菌株O83E59、O83E58、以及O838XE和亲本里氏木霉菌株O44N7J相对于第7天总补料(发酵运行中使用的总补料克数)的比较。黑色箱代表数据样本在第一和第三四分位数之间的分布。中间的白线代表中值。
定义
乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”意指羧基酯酶(EC 3.1.1.72),其催化乙酰基基团从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-萘酯(alpha-napthylacetate)和乙酸对硝基苯酯(p-nitrophenyl acetate)的水解。可以在含有0.01%TWEENTM20(聚氧乙烯脱水山梨糖醇单月桂酸酯)的50mM乙酸钠(pH 5.0)中使用0.5mM乙酸对硝基苯酯作为底物来确定乙酰木聚糖酯酶活性。将一个单位的乙酰木聚糖酯酶定义为在pH 5、25℃下每分钟能够释放1微摩尔对硝基酚根阴离子的酶的量。
α-L-阿拉伯呋喃糖苷酶:术语“α-L-阿拉伯呋喃糖苷酶”意指α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC 3.2.1.55),其催化α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯糖基木聚糖以及阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶还被称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或α-L-阿拉伯聚糖酶。可以使用每ml的100mM乙酸钠(pH 5)中5mg的中等粘度小麦阿拉伯糖基木聚糖(麦格酶国际爱尔兰股份有限公司(Megazyme International Ireland,Ltd.))以总体积200μl在40℃下持续30分钟,接着通过HPX-87H柱色谱法(伯乐实验室有限公司(Bio-RadLaboratories,Inc.))进行阿拉伯糖分析来确定α-L-阿拉伯呋喃糖苷酶活性。
α-葡糖醛酸糖苷酶:术语“α-葡糖醛酸糖苷酶”意指可催化α-D-葡萄糖苷酸水解成为D-葡萄糖醛酸酯和醇的α-D-葡萄糖苷酸葡萄糖醛酸水解酶(EC 3.2.1.139)。可以根据deVries,1998,J.Bacteriol.[细菌学杂志]180:243-249来确定α-葡糖醛酸糖苷酶活性。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5、40℃下每分钟释放1微摩尔的葡糖醛酸或4-O-甲基葡糖醛酸的酶的量。
辅助活性9多肽:术语“辅助活性9多肽”或“AA9多肽”或“AA9溶解性多糖单加氧酶”意指分类为溶解性多糖单加氧酶(Quinlan等人,2011,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]108:15079-15084;Phillips等人,2011,ACS Chem.Biol.[ACS化学生物学]6:1399-1406;Li等人,2012,Structure[结构]20:1051-1061)的多肽。根据Henrissat,1991,Biochem.J.[生物化学杂志]280:309-316以及Henrissat和Bairoch,1996,Biochem.J.[生物化学杂志]316:695-696,AA9多肽之前被分类为糖苷水解酶家族61(GH61)。
AA9多肽通过具有纤维素分解活性的酶增强纤维素材料的水解。可以通过测量在以下条件下来自由纤维素分解酶水解纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来确定纤维素分解增强活性:1-50mg总蛋白/g预处理的玉米秸秆(PCS)中的纤维素,其中总蛋白包括50%-99.5%w/w纤维素分解酶蛋白和0.5%-50%w/w AA9多肽蛋白,在适合的温度(如,40℃-80℃)和适合的pH(如,4-9)下持续1-7天,与不具有纤维素分解增强活性的相等的总蛋白负载的对照水解(1-50mg纤维素分解蛋白/g PCS中的纤维素)进行比较。
可以使用CELLUCLASTTM 1.5L(诺维信公司(Novozymes A/S),巴格斯瓦德(Bagsvaerd),丹麦)和β-葡糖苷酶的混合物作为纤维素分解活性的来源来确定AA9多肽增强活性,其中该β-葡糖苷酶是以纤维素酶蛋白负载的至少2%-5%蛋白的重量存在的。在一方面,β-葡糖苷酶是米曲霉(Aspergillus oryzae)β-葡糖苷酶(例如,根据WO 02/095014,在米曲霉中重组产生的)。在另一方面,β-葡糖苷酶是烟曲霉(Aspergillus fumigatus)β-葡糖苷酶(例如,如WO 02/095014中所述的,在米曲霉中重组产生的)。
AA9多肽增强活性还可以通过以下来确定:在40℃,将AA9多肽与0.5%磷酸溶胀纤维素(PASC)、100mM乙酸钠(pH 5)、1mM MnSO4、0.1%没食子酸、0.025mg/ml的烟曲霉β-葡糖苷酶,以及0.01%X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)一起孵育24-96小时,随后确定从PASC释放的葡萄糖。
还可以根据WO 2013/028928确定高温组合物的AA9多肽增强活性。
AA9多肽通过将达到相同的水解程度所需要的纤维素分解酶的量降低优选至少1.01倍,例如,至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、或至少20倍,来增强由具有纤维素分解活性的酶催化的纤维素材料的水解。
根据WO 2008/151043或WO 2012/122518,AA9多肽可以在可溶性活化二价金属阳离子(例如锰或铜)的存在下使用。
AA9多肽还可以在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从预处理的纤维素材料或半纤维素材料(例如预处理的玉米秸杆)获得的液体的存在下使用(WO 2012/021394、WO 2012/021395、WO 2012/021396、WO 2012/021399、WO2012/021400、WO 2012/021401、WO 2012/021408、以及WO 2012/021410)。
β-葡糖苷酶:术语“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(E.C.3.2.1.21),其催化末端非还原β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。可以根据Venturi等人,2002,J.Basic Microbiol.[基础微生物学杂志]42:55-66的程序使用对硝基苯基-β-D-吡喃葡萄糖苷作为底物来确定β-葡糖苷酶活性。一个单位的β-葡糖苷酶定义为在25℃、pH 4.8下,在含有0.01%20的50mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-吡喃葡萄糖苷每分钟产生1.0微摩尔的对硝基酚根阴离子。
β-木糖苷酶:术语“β-木糖苷酶”意指β-D-木糖苷木糖水解酶(β-D-xylosidexylohydrolase)(E.C.3.2.1.37),其催化短β(1→4)-低聚木糖的外切水解,以将连续的D-木糖残基从非还原端移除。可以在含有0.01%20的100mM柠檬酸钠中,在pH 5,40℃下,使用1mM对硝基苯基-β-D-木糖苷作为底物来确定β-木糖苷酶活性。一个单位的β-木糖苷酶定义为在40℃、pH 5下,在含有0.01%20的100mM柠檬酸钠中从1mM对硝基苯基-β-D-木糖苷每分钟产生1.0微摩尔的对硝基酚根阴离子。
cDNA:术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的,mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。初始的初级RNA转录物是mRNA的前体,其要通过一系列的步骤(包括剪接)进行加工,然后呈现为成熟的剪接的mRNA。
纤维二糖水解酶:术语“纤维二糖水解酶”意指1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和E.C.3.2.1.176),其催化纤维素、纤维寡糖、或任何含β-1,4-连接的葡萄糖的聚合物中的1,4-β-D-糖苷键的水解,从该链的还原端(纤维二糖水解酶I)或非还原端(纤维二糖水解酶II)释放纤维二糖(Teeri,1997,Trends in Biotechnology[生物技术趋势]15:160-167;Teeri等人,1998,Biochem.Soc.Trans.[生化学会会刊]26:173-178)。可以根据由以下所述的程序来确定纤维二糖水解酶活性:Lever等人,1972,Anal.Biochem.[分析生物化学]47:273-279;van Tilbeurgh等人,1982,FEBS Letters[欧洲生化学会联合会快报]149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters[欧洲生化学会联合会快报]187:283-288;和Tomme等人,1988,Eur.J.Biochem.[欧洲生物化学杂志],170:575-581。
纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指一种或多种水解纤维素材料的酶。此类酶包括一种或多种内切葡聚糖酶、一种或多种纤维二糖水解酶、一种或多种β-葡糖苷酶、或其组合。用于测量纤维素分解酶活性的两种基本方法包括:(1)测量总纤维素分解酶活性,以及(2)测量个体纤维素分解酶活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如在Zhang等人,2006,Biotechnology Advances[生物技术进展]24:452-481中所述的。可使用不溶性底物,包括沃特曼(Whatman)№1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、羧甲基纤维素、预处理的木质纤维素等,测量总纤维素分解酶活性。最常见的总纤维素分解活性测定是将沃特曼№1滤纸用作底物的滤纸测定。该测定是由国际纯粹与应用化学联合会(IUPAC)建立的(Ghose,1987,Pure Appl.Chem.[纯粹与应用化学]59:257-68)。
可以通过测量在以下条件下,由一种或多种纤维素分解酶进行的纤维素材料水解期间,糖的产生/释放的增加来确定纤维素分解酶活性:1-50mg纤维素分解酶蛋白/g预处理的玉米秸秆(PCS)(或其他预处理的纤维素材料)中的纤维素,在适合的温度(如40℃-80℃)和适合的pH(如4-9)下持续3-7天,与未添加纤维素分解酶蛋白的对照水解相比。典型条件为:1ml反应物,洗涤或未洗涤的PCS,5%不溶性固体(干重),50mM乙酸钠(pH 5),0.1mMCuCl2,50℃、55℃、或60℃,72小时,通过HPX-87H柱色谱法(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)进行糖分析。
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由开放阅读框确定,该开放阅读框以起始密码子(例如ATG、GTG或TTG)开始并且以终止密码子(例如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指对于多肽的编码序列的表达为必要的核酸序列。每个控制序列对于编码多肽的多核苷酸而言可以是天然的(即,来自相同基因)或异源的(即,来自不同基因),或者相对于彼此是天然的或异源的。此类控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。最少,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特异性限制性酶切位点的目的,这些控制序列可以提供有多个接头。
缺陷:术语“缺陷”意指将编码本发明的Rho-GTP酶RacA蛋白的racA基因在亲本丝状真菌细胞中修饰以产生突变体,使得与未修饰racA基因的亲本丝状真菌细胞相比,当在相同条件下培养时,该突变体在Rho-GTP酶RacA蛋白的产生方面有部分缺陷(至少少25%、更优选地至少少50%、甚至更优选地至少少75%、和最优选地至少少95%的Rho-GTP酶RacA蛋白)或完全缺陷(少100%的Rho-GTP酶RacA蛋白)。可以使用本文所述的或本领域已知的方法确定由丝状真菌细胞、亲本或突变体产生的Rho-GTP酶RacA蛋白的水平。
内切葡聚糖酶:术语“内切葡聚糖酶”意指4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键,混合β-1,3-1,4葡聚糖如谷类β-D-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β-1,4键的内切水解。可以通过测量底物粘度的降低或通过还原糖测定所确定的还原性末端的增加来确定内切葡聚糖酶活性(Zhang等人,2006,Biotechnology Advances[生物技术进展]24:452-481)。还可以根据Ghose,1987,Pure andAppl.Chem.[纯粹与应用化学]59:257-268的程序,在pH 5,40℃下,使用羧甲基纤维素(CMC)作为底物来确定内切葡聚糖酶活性。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”意指直链或环状DNA分子,其包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。
阿魏酸酯酶:术语“阿魏酸酯酶”意指一种4-羟基-3-甲氧基肉桂酰基-糖水解酶(EC 3.1.1.73),其催化4-羟基-3-甲氧基肉桂酰基(阿魏酰基)基团从酯化的糖(其在天然生物质底物中通常为阿拉伯糖)的水解,以产生阿魏酸酯(4-羟基-3-甲氧基肉桂酸酯)。阿魏酸酯酶(FAE)也被称为阿魏酸酯酶(ferulic acid esterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I、或FAE-II。可以在50mM乙酸钠(pH 5.0)中,使用0.5mM对硝基苯基阿魏酸酯作为底物确定对阿魏酸酯酶活性。一个单位的阿魏酸酯酶等于,在pH 5、25℃下,每分钟能够释放1μmol的对硝基酚根阴离子的酶的量。
半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指可对半纤维素材料进行水解的一种或多种酶。参见例如,Shallom和Shoham,2003,CurrentOpinion In Microbiology[微生物学当前观点]6(3):219-228)。半纤维素酶是植物生物质降解中的关键组分。半纤维素酶的实例包括但不限于:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、和木糖苷酶。这些酶的底物(半纤维素)是支链和直链多糖的异质性组,这些多糖经由氢键与植物细胞壁中的纤维素微纤维相结合,从而将它们交联成稳健的网络。半纤维素还共价附接至木质素,从而与纤维素一起形成高度复杂的结构。半纤维素的可变结构和组织要求许多酶的协同作用以使其完全降解。半纤维素酶的催化模块是水解糖苷键的糖苷水解酶(GH),或是水解乙酸或阿魏酸侧基团的酯键的碳水化合物酯酶(CE)。这些催化模块基于其一级序列的同源性,可以分配到GH和CE家族。一些家族(具有总体上类似的折叠)可以进一步分组为宗族(clan),以字母标记(例如,GH-A)。在碳水化合物活性酶(CAZy)数据库中可得到这些以及其他碳水化合物活性酶的最详实和最新的分类。半纤维素分解酶活性可根据Ghose和Bisaria,1987,Pure&AppI.Chem.[理论与应用化学]59:1739-1752,在适合的温度(如40℃-80℃)和适合的pH(如4-9)下进行测量。
宿主细胞:术语“宿主细胞”意指易于用包含编码目的多肽的多核苷酸的核酸构建体或表达载体转化、转染、转导等的突变体丝状真菌细胞,该丝状真菌细胞包含经修饰的racA基因且表达GTP酶Rac2变体。术语“宿主细胞”涵盖由于复制期间出现的突变而与细胞不相同的任何细胞子代。
提高的生产力:术语“提高的生产力”和其变型意指当在与不具有经修饰的racA基因和GTP酶Ras2变体的亲本丝状真菌细胞相同的培养基组成、温度、pH、细胞密度、溶解氧、和时间的条件下培养时,由本发明的突变体丝状真菌细胞(其包含经修饰的racA基因且表达GTP酶Rac2变体)产生的目的多肽的量增加了至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少11%、至少12%、至少13%、至少14%、至少15%、至少16%、至少17%、至少18%、至少19%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、或至少50%。在一方面,与亲本丝状真菌细胞相比,突变体丝状真菌细胞在目的多肽的产生量方面的生产力提高1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、或50%。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、或肽的任何物质,该物质至少部分地从与其性质相关的一种或多种或所有天然存在的成分中去除;(3)相对于自然界中发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分,增加物质的量而修饰的任何物质(例如,宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以原本不存在于自然界中的方式被修饰成含有核酸的区段,或者是合成的,该核酸分子包含一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指如下构型,在该构型中,控制序列被放置在相对于多核苷酸的编码序列适当的位置处,使得该控制序列指导该编码序列的表达。
Rho-GTP酶RacA蛋白:术语“Rho-GTP酶RacA蛋白”意指Rho-GTP酶家族的成员。Rho-GTP酶是信号传导G蛋白(鸟嘌呤核苷酸结合蛋白),并起到分子开关的作用。Rho-GTP酶存在于所有真核生物界,并已被证明可调节细胞内肌动蛋白动力学,在细胞器发育、细胞骨架动力学、细胞运动和其他细胞功能中发挥作用。
Ras2蛋白:术语“Ras2蛋白”意指Ras-GTP酶家族的成员。Ras-GTP酶是信号传导G蛋白(鸟嘌呤核苷酸结合蛋白),并起到分子开关的作用。Ras-GTP酶在控制细胞增殖、形态发生、囊泡运输和基因表达的各种信号通路中发挥重要作用。在里氏木霉中,Ras2蛋白在纤维素酶诱导条件下调节纤维素酶基因的表达。
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的相关性通过参数“序列同一性”来描述。
出于本发明的目的,使用尼德曼-翁施算法(Needleman-Wunsch algorithm)(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列同一性,该算法如EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite[欧洲分子生物学开放软件套件],Rice等人,2000,TrendsGenet.[遗传学趋势]16:276-277,优选5.0.0版本或其后的版本)的尼德尔(Needle)程序所实施的。使用的参数是空位开放罚分10、空位延伸罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的尼德尔的输出(使用非简化选项获得)用作同一性百分比并且计算如下:
(相同的残基×100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用尼德曼-翁施算法(Needleman和Wunsch,1970,同上)来确定两个脱氧核糖核苷酸序列之间的序列同一性,如EMBOSS软件包(EMBOSS:The EuropeanMolecular Biology Open Software Suite[欧洲分子生物学开放软件套件],Rice等人,2000,同上)(优选5.0.0版本或其后的版本)的尼德尔程序所实施的。使用的参数是空位开放罚分10、空位延伸罚分0.5以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。将标记为“最长同一性”的尼德尔的输出(使用非简化选项获得)用作同一性百分比并且计算如下:
(相同的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)
严格条件:术语“非常低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃,于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2X SSC、0.2%SDS,在45℃下洗涤三次,每次15分钟。
术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃,于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2X SSC、0.2%SDS,在50℃下洗涤三次,每次15分钟。
术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃,于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2X SSC、0.2%SDS,在55℃下洗涤三次,每次15分钟。
术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃,于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2X SSC、0.2%SDS,在60℃下洗涤三次,每次15分钟。
术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃,于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2X SSC、0.2%SDS,在65℃下洗涤三次,每次15分钟。
术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃,于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2X SSC、0.2%SDS,在70℃下洗涤三次,每次15分钟。
木聚糖酶:术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(1,4-β-D-xylan-xylohydrolase)(E.C.3.2.1.8),其催化木聚糖中1,4-β-D-木糖苷键的内切水解。木聚糖酶活性可以在37℃在0.01%X-100和200mM磷酸钠(pH 6)中用0.2%AZCL-阿拉伯糖基木聚糖作为底物来确定。一个单位的木聚糖酶活性定义为在37℃、pH 6,在200mM磷酸钠(pH 6)中从作为底物的0.2%AZCL-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白(azurine)。
变体:术语“变体”意指在对应于SEQ ID NO:11的位置16的位置处包含取代的GTP酶Ras2蛋白。取代意指用不同的氨基酸替换占据某一位置的氨基酸。本发明的变体在纤维素酶诱导条件下具有组成型活性。
野生型:提及氨基酸序列或核酸序列时术语“野生型”意指该氨基酸序列或核酸序列是天然或天然存在的序列。如本文所用,术语“天然存在的”是指在自然界中发现的任何物质(例如蛋白质、氨基酸或核酸序列)。相反,术语“非天然存在的”是指在自然界中未发现的任何物质(例如,在实验室中产生的重组核酸和蛋白质序列、或野生型序列的修饰)。
本文提及“约”值或参数包括针对该值或参数本身的方面。例如,提及“约X”的描述包括方面“X”。
如本文和所附权利要求中所用的,单数形式“一种/个(a/an)”、“或”以及“该/这些(the)”包括复数指代物,除非上下文另外清楚表明。应理解的是,本文所述的本发明的这些方面包括“由方面组成”和/或“基本由方面组成”。
除非另外定义或由上下文明确指示,否则本文所用的全部技术与科学术语具有如本发明所属领域的普通技术人员通常理解的相同含义。
变体命名惯例
出于本发明的目的,将SEQ ID NO:11中披露的GTP酶Ras2蛋白用作参考,来确定另一种GTP酶Ras2蛋白中的相对应氨基酸位置。另一种GTP酶Ras2蛋白的氨基酸序列与在SEQID NO:11中披露的GTP酶Ras2蛋白进行比对,并且基于比对,使用尼德曼-翁施算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定对应于SEQID NO:11中披露的多肽中的任何氨基酸残基的氨基酸位置编号,该算法如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite[欧洲分子生物学开放软件套件],Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277,优选5.0.0版本或其后的版本)的尼德尔(Needle)程序所实施的。所使用的参数是空位开放罚分10、空位延伸罚分0.5、和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。
在描述本发明的GTP酶Ras2蛋白变体中,调整以下所述的命名法以方便参考。采用了已接受的IUPAC单字母或三字母的氨基酸缩写。
对于氨基酸取代,使用以下命名法:原始氨基酸、位置、取代的氨基酸。相应地,将在位置16处的甘氨酸被缬氨酸取代表示为“Gly16Val”或“G16V”。
具体实施方式
本发明涉及亲本丝状真菌细胞的分离的突变体,该突变体包含:
(a)编码目的多肽的多核苷酸;
(b)编码Rho-GTP酶RacA蛋白的racA基因,其中该racA基因在该亲本丝状真菌细胞中经修饰以产生该突变体,使得该突变体在该Rho-GTP酶RacA蛋白的产生方面部分或完全缺陷;以及
(c)编码GTP酶Ras2蛋白的ras2基因,其中该GTP酶Ras2蛋白在该亲本丝状真菌细胞中经修饰以产生GTP酶Ras2变体,该变体在与SEQ ID NO:11的位置16相对应的位置处包含取代;
其中经修饰的racA基因和该GTP酶Ras2变体的组合协同地增加了该突变体在该目的多肽产生中的生产力。
本发明的优势在于经修饰的racA基因和GTP酶Ras2变体的组合协同地增加了突变体在目的多肽产生中的生产力。在一个实施例中,与亲本细胞相比,经修饰的racA基因和GTP酶Ras2变体的组合使得突变体丝状真菌细胞具有更多分枝的菌丝体表型。在另一个实施例中,与亲本细胞相比,经修饰的racA基因和GTP酶Ras2变体的组合增加了突变体丝状真菌细胞中目的多肽的分泌。在另一个实施例中,与亲本细胞相比,经修饰的racA基因和GTP酶Ras2变体的组合增加了突变体丝状真菌细胞在发酵中产生的总蛋白质的量。在另一个实施例中,与亲本细胞相比,经修饰的racA基因和GTP酶Ras2变体的组合增加了突变体丝状真菌细胞产生的纤维素酶的量。在优选的实施例中,与亲本细胞相比,经修饰的racA基因和GTP酶Ras2变体的组合增加了突变体丝状真菌细胞产生的β-葡糖苷酶的量。在另一个实施例中,与亲本细胞相比,经修饰的racA基因和GTP酶Ras2变体的组合降低了发酵中突变体丝状真菌细胞的粘度。在另一个实施例中,与亲本细胞相比,经修饰的racA基因和GTP酶Ras2变体的组合增加了发酵期间可以供应给突变体丝状真菌细胞的补料的总量。
Rho-GTP酶RacA蛋白
在本发明中,GTP酶RacA蛋白可以是任何GTP酶RacA蛋白。
在一方面,GTP酶RacA蛋白选自由以下组成的组:
(i)Rho-GTP酶RacA蛋白,其包含与SEQ ID NO:2具有至少70%序列同一性的氨基酸序列;
(ii)Rho-GTP酶RacA蛋白,其由包含与SEQ ID NO:1具有至少70%序列同一性的核苷酸序列的多核苷酸编码;以及
(iii)Rho-GTP酶RacA蛋白,其由包含如下核苷酸序列的多核苷酸编码,该核苷酸序列在高严格条件下与SEQ ID NO:1的全长互补序列杂交。
在另一方面,Rho-GTP酶RacA蛋白与SEQ ID NO:2的氨基酸序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。
在一个实施例中,Rho-GTP酶RacA蛋白包含与SEQ ID NO:2具有至少80%序列同一性的氨基酸序列。
在一个实施例中,Rho-GTP酶RacA蛋白包含与SEQ ID NO:2具有至少85%序列同一性的氨基酸序列。
在一个实施例中,Rho-GTP酶RacA蛋白包含与SEQ ID NO:2具有至少90%序列同一性的氨基酸序列。在一个实施例中,Rho-GTP酶RacA蛋白包含与SEQ ID NO:2具有至少95%序列同一性的氨基酸序列。
在一个实施例中,Rho-GTP酶RacA蛋白包含SEQ ID NO:2或由其组成。
在一个实施例中,Rho-GTP酶RacA蛋白与SEQ ID NO:2的氨基酸序列相差多达10个(例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。
在另一个实施例中,Rho-GTP酶RacA蛋白包含SEQ ID NO:2的氨基酸序列或其等位基因变体。在另一个实施例中,Rho-GTP酶RacA蛋白包含SEQ ID NO:2的氨基酸序列。在另一个实施例中,Rho-GTP酶RacA蛋白由SEQ ID NO:2的氨基酸序列组成。
在另一方面,Rho-GTP酶RacA蛋白由包含如下核苷酸序列的多核苷酸编码,该核苷酸序列与SEQ ID NO:1或其cDNA序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。
在一个实施例中,Rho-GTP酶RacA蛋白由如下多核苷酸编码,该多核苷酸包含SEQID NO:1的核苷酸序列。在另一个实施例中,Rho-GTP酶RacA蛋白由如下多核苷酸编码,该多核苷酸由SEQ ID NO:1的核苷酸序列组成。
在一个实施例中,Rho-GTP酶RacA蛋白由包含与SEQ ID NO:1具有至少80%序列同一性的核苷酸序列的多核苷酸编码。
在一个实施例中,Rho-GTP酶RacA蛋白由包含与SEQ ID NO:1具有至少85%序列同一性的核苷酸序列的多核苷酸编码。
在一个实施例中,Rho-GTP酶RacA蛋白由包含与SEQ ID NO:1具有至少90%序列同一性的核苷酸序列的多核苷酸编码。
在一个实施例中,Rho-GTP酶RacA蛋白由包含与SEQ ID NO:1具有至少95%序列同一性的核苷酸序列的多核苷酸编码。
在一个实施例中,Rho-GTP酶RacA蛋白由如下多核苷酸编码,该多核苷酸包含SEQID NO:1或由其组成。
在一个实施例中,Rho-GTP酶RacA蛋白由如下多核苷酸编码,该多核苷酸在非常高严格条件下与SEQ ID NO:1的全长互补序列杂交。
在另一方面,Rho-GTP酶RacA蛋白由包含如下核苷酸序列的多核苷酸编码,该核苷酸序列在非常低严格条件、低严格条件、中严格条件、中-高严格条件、高严格条件、或非常高严格条件下与以下杂交:(i)SEQ ID NO:1,(ii)其cDNA序列,或(iii)(i)或(ii)的全长互补序列(Sambrook等人,1989,Molecular Cloning,A Laboratory Manual[分子克隆实验指南],第2版,Cold Spring Harbor[冷泉港],纽约)。
包含SEQ ID NO:1的核苷酸序列或其子序列的多核苷酸,以及包含SEQ ID NO:2的氨基酸序列或其片段的多肽可用于设计核酸探针,以根据本领域熟知的方法从不同属或种的菌株鉴定和克隆编码Rho-GTP酶RacA蛋白的DNA。特别地,可以遵循标准DNA印迹程序,使用此类探针来与目的细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中的相应基因。此类探针可明显短于完整序列,但是长度应为至少15个,例如至少25个、至少35个或至少70个核苷酸。优选地,核酸探针长度为至少100个核苷酸,例如,长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),用于检测相应基因。此类探针涵盖于本发明中。
可以针对与上文所述的探针杂交并编码Rho-GTP酶RacA蛋白的DNA来筛选由此类其他菌株制备的基因组DNA或cDNA文库。来自此类其他菌株的基因组DNA或其他DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术来分离。可将来自文库的DNA或分离的DNA转移到并固定在硝化纤维素或其他适合的运载体材料上。为了鉴定与SEQ ID NO:1的核苷酸序列或其子序列杂交的克隆或DNA,将运载体材料用于DNA印迹中。
出于本发明的目的,杂交表示多核苷酸与对应于以下的标记的核酸探针杂交:(i)SEQ ID NO:1;(ii)其cDNA序列,(iii)其全长互补序列;或(iv)其子序列;杂交是在非常低至非常高严格条件下进行。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下与核酸探针杂交的分子。
在一个实施例中,核酸探针是SEQ ID NO:1或其cDNA序列。
在另一个实施例中,核酸探针是编码SEQ ID NO:2的Rho-GTP酶RacA蛋白或其片段的多核苷酸。
GTP酶Ras2蛋白
在本发明中,GTP酶Ras2蛋白可以是任何GTP酶Ras2蛋白。
在一方面,GTP酶Ras2选自下组,该组由以下组成:
(i)Rho-GTP酶RacA蛋白,其包含与SEQ ID NO:2具有至少70%序列同一性的氨基酸序列;
(ii)Rho-GTP酶RacA蛋白,其由包含与SEQ ID NO:1具有至少70%序列同一性的核苷酸序列的多核苷酸编码;以及
(iii)Rho-GTP酶RacA蛋白,其由包含如下核苷酸序列的多核苷酸编码,该核苷酸序列在高严格条件下与SEQ ID NO:1的全长互补序列杂交。
在另一方面,GTP酶Ras2蛋白与SEQ ID NO:11的氨基酸序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。
在一个实施例中,GTP酶Ras2蛋白包含与SEQ ID NO:11具有至少80%序列同一性的氨基酸序列。
在一个实施例中,GTP酶Ras2蛋白包含与SEQ ID NO:11具有至少85%序列同一性的氨基酸序列。
在一个实施例中,GTP酶Ras2蛋白包含与SEQ ID NO:11具有至少90%序列同一性的氨基酸序列。
在一个实施例中,GTP酶Ras2蛋白包含与SEQ ID NO:11具有至少95%序列同一性的氨基酸序列。
在一个实施例中,GTP酶Ras2蛋白包含SEQ ID NO:11或由其组成。
在一个实施例中,GTP酶Ras2蛋白与SEQ ID NO:11的氨基酸序列相差多达10个(例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。
在另一个实施例中,GTP酶Ras2蛋白包含SEQ ID NO:11的氨基酸序列或其等位基因变体。在另一个实施例中,GTP酶Ras2蛋白包含SEQ ID NO:11的氨基酸序列。在另一个实施例中,GTP酶Ras2蛋白由SEQ ID NO:11的氨基酸序列组成。
在另一方面,GTP酶Ras2蛋白由包含如下核苷酸序列的多核苷酸编码,该核苷酸序列与SEQ ID NO:10或其cDNA序列具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。
在一个实施例中,GTP酶Ras2蛋白由包含与SEQ ID NO:10具有至少80%序列同一性的核苷酸序列的多核苷酸编码。
在一个实施例中,GTP酶Ras2蛋白由包含与SEQ ID NO:10具有至少85%序列同一性的核苷酸序列的多核苷酸编码。
在一个实施例中,GTP酶Ras2蛋白由包含与SEQ ID NO:10具有至少90%序列同一性的核苷酸序列的多核苷酸编码。
在一个实施例中,GTP酶Ras2蛋白由包含与SEQ ID NO:10具有至少95%序列同一性的核苷酸序列的多核苷酸编码。
在一个实施例中,GTP酶Ras2蛋白由如下多核苷酸编码,该多核苷酸包含SEQ IDNO:10或由其组成。
在一个实施例中,GTP酶Ras2蛋白由如下多核苷酸编码,该多核苷酸在非常高严格条件下与SEQ ID NO:10的全长互补序列杂交。
在一个实施例中,GTP酶Ras2蛋白由如下多核苷酸编码,该多核苷酸包含SEQ IDNO:10的核苷酸序列。在另一个实施例中,GTP酶Ras2蛋白由如下多核苷酸编码,该多核苷酸由SEQ ID NO:10的核苷酸序列组成。
在另一方面,GTP酶Ras2蛋白由包含如下核苷酸序列的多核苷酸编码,该核苷酸序列在非常低严格条件、低严格条件、中严格条件、中-高严格条件、高严格条件、或非常高严格条件下与以下杂交:(i)SEQ ID NO:10,(ii)其cDNA序列,或(iii)(i)或(ii)的全长互补序列(Sambrook等人,1989,Molecular Cloning,A Laboratory Manual[分子克隆实验指南],第2版,Cold Spring Harbor[冷泉港],纽约)。
包含SEQ ID NO:10的核苷酸序列或其子序列的多核苷酸,以及包含SEQ ID NO:11的氨基酸序列或其片段的多肽可用于设计核酸探针,以根据本领域熟知的方法从不同属或种的菌株鉴定和克隆编码GTP酶Ras2蛋白的DNA。特别地,可以遵循标准DNA印迹程序,使用此类探针来与目的细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中的相应基因。此类探针可明显短于完整序列,但是长度应为至少15个,例如至少25个、至少35个或至少70个核苷酸。优选地,核酸探针长度为至少100个核苷酸,例如,长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),用于检测相应基因。此类探针涵盖于本发明中。
可以针对与上文所述的探针杂交并编码GTP酶Ras2蛋白的DNA来筛选由此类其他菌株制备的基因组DNA或cDNA文库。来自此类其他菌株的基因组DNA或其他DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术来分离。可将来自文库的DNA或分离的DNA转移到并固定在硝化纤维素或其他适合的运载体材料上。为了鉴定与SEQ ID NO:10的核苷酸序列或其子序列杂交的克隆或DNA,将运载体材料用于DNA印迹中。
出于本发明的目的,杂交表示多核苷酸与对应于以下的标记的核酸探针杂交:(i)SEQ ID NO:10;(ii)其cDNA序列,(iii)其全长互补序列;或(iv)其子序列;杂交是在非常低至非常高严格条件下进行。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下与核酸探针杂交的分子。
在一个实施例中,该核酸探针是SEQ ID NO:10或其cDNA序列。
在另一个实施例中,核酸探针是编码SEQ ID NO:11的GTP酶Ras2蛋白或其片段的多核苷酸。
GTP酶Ras2变体
在一方面,该变体在对应于SEQ ID NO:11的位置16的位置处包含取代或由其组成。在另一方面,对应于位置16的位置处的氨基酸是被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Val取代。在另一方面,该变体包含SEQ ID NO:11的多肽的取代G16V。在另一方面,该变体由SEQ ID NO:11的多肽的取代G16V组成。
在另一方面,GTP酶Ras2变体与亲本GTP酶Ras2蛋白的氨基酸序列具有至少70%,例如,至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但是小于100%的序列同一性。
在另一方面,该变体与SEQ ID NO:11的GTP酶Ras2蛋白具有至少70%,例如,至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。
可以根据本领域中已知的程序,如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science[科学]244:1081-1085)来鉴定多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变体分子的生物活性以鉴定对于所述分子的活性关键的氨基酸残基。还参见,Hilton等人,1996,J.Biol.Chem.[生物化学杂志]271:4699-4708。酶或其他生物学相互作用的活性位点还可通过对结构的物理分析来确定,如由下述技术确定:核磁共振、晶体学(crystallography)、电子衍射、或光亲和标记,连同对推定的接触位点氨基酸进行突变。参见例如,de Vos等人,1992,Science[科学]255:306-312;Smith等人,1992,J.Mol.Biol.[分子生物学杂志]224:899-904;Wlodaver等人,1992,FEBS Lett.[欧洲生化学会联合会快报]309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。
本发明还涉及用于获得GTP酶Ras2变体的方法,这些方法包括:(a)在对应于SEQID NO:11的多肽的位置16的位置处向亲本GTP酶Ras2蛋白引入取代,其中该GTP酶Ras2变体在纤维素酶诱导条件下具有组成型调节活性;以及(b)回收该变体。
可以通过由任何RNA指导的DNA内切核酸酶组成的CRISPR基因组编辑,使用例如MAD7(美国专利9,982,279)、MAD2(美国专利9,982,279)、Cas9(Doudna等人,2014,Science[科学]346:1258096)、“死”Cas9(dcas9;Qi等人,2013,Cell[细胞]152(5):1173)、Cas9切口酶(Satomura等人2017,Sci.Rep.[科学报告]7(1):2095)、或Cpf1内切核酸酶(Zetsche等人2015,Cell[细胞]163(3):759)(通过适当地设计的指导RNA和适当地设计的修复DNA被引导至基因的核苷酸序列)来构建丝状真菌细胞的RAS GTP酶ras2变体。
还可以使用本领域已知的任何诱变程序,如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组等制备变体。
定点诱变是其中在编码亲本GTP酶Ras2蛋白的多核苷酸的限定位点上引入突变的技术。
通过涉及使用含有所需突变的寡核苷酸引物的PCR可以体外实现定点诱变。也可以通过盒式诱变进行体外定点诱变,该盒式诱变涉及由限制酶在包含编码亲本GTP酶Ras2蛋白的多核苷酸的质粒中的位点处切割并且随后将含有突变的寡核苷酸连接在多核苷酸中。通常,消化质粒和寡核苷酸的限制酶是相同的,从而允许质粒和插入物的粘性末端彼此连接。参见例如,Scherer和Davis,1979,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]76:4949-4955;和Barton等人,1990,Nucleic Acids Res.[核酸研究]18:7349-4966。
还可以通过本领域中已知的方法在体内实现定点诱变。参见例如,美国专利申请公开号2004/0171154;Storici等人,2001,Nature Biotechnol.[自然生物技术]19:773-776;Kren等人,1998,Nat.Med.[自然医学]4:285-290;以及Calissano和Macino,1996,Fungal Genet.Newslett.[真菌遗传学时事通讯]43:15-16。
可以在本发明中使用任何定点诱变程序。存在可用于制备变体的许多可商购的试剂盒。
合成基因构建需要设计的多核苷酸分子的体外合成以编码目的多肽。基因合成可以利用多种技术来进行,例如由Tian等人(2004,Nature[自然]432:1050-1054)所述的基于多路微芯片的技术、以及其中在光可编程的微流芯片上合成并组装寡核苷酸的类似技术。
使用已知的诱变、重组和/或改组方法,随后进行相关的筛选程序可以做出单或多氨基酸取代、缺失和/或插入并对其进行测试,所述相关的筛选程序例如由Reidhaar-Olson和Sauer,1988,Science[科学]241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2152-2156;WO 95/17413;或WO 95/22625披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如Lowman等人,1991,Biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(Derbyshire等人,1986,Gene[基因]46:145;Ner等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人,1999,Nature Biotechnology[自然生物技术]17:893-896)。可从宿主细胞回收编码活性多肽的诱变的DNA分子,并使用本领域的标准方法快速测序。这些方法允许快速确定多肽中各个氨基酸残基的重要性。
通过组合合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的多方面来实现半合成基因构建。半合成构建典型地是利用合成的多核苷酸片段的过程结合PCR技术。因此,基因的限定区域可以从头合成,而其他区域可以使用位点特异性诱变引物来扩增,而还有其他区域可以进行易错PCR或非易错PCR扩增。然后可以对多核苷酸子序列进行改组。
目的多肽
目的多肽可以是任何对于突变体丝状真菌细胞是天然或外源(异源)的多肽。该多肽可以由单个基因或两个或更多个基因编码。术语“异源多肽”在本文定义为对宿主细胞不是天然的多肽;已进行结构修饰以改变天然多肽(例如,天然多肽的蛋白质序列)的天然多肽;或由于通过重组DNA技术(例如,不同的启动子、编码多肽的DNA的多拷贝)操纵多核苷酸或宿主细胞使其表达发生数量上变化的天然多肽。因此,本发明术语“异源多肽”的范围还涵盖了天然多肽的重组产生,其程度使得此种表达涉及使用对于丝状真菌细胞并非天然的遗传元件,或使用经操纵以丝状真菌细胞中非天然发生的方式起作用的天然元件。
在一方面,该多肽对于丝状真菌细胞是天然的。在另一方面,该多肽对于丝状真菌细胞是异源的。
该多肽可以是具有目的生物活性的任何多肽。术语“多肽”在本文中不意在是指特定长度的编码产物,并且因此,涵盖肽、寡肽和蛋白。术语“多肽”还涵盖组合以形成编码产物的两个或更多个多肽。多肽还包括融合多肽,其包含自至少两种不同多肽(其中一个或多个多肽对于丝状真菌细胞可以是异源的)获得的部分或完整多肽序列的组合。多肽进一步包括杂合多肽,这些杂合多肽包含来自两个或更多个多肽的结构域,例如,来自一个多肽的结合结构域和来自另一个多肽的催化结构域。结构域可以在N末端或C末端融合。
在一方面,该多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫调节剂、神经递质、受体、报告蛋白、结构蛋白或转录因子。
在另一方面,该多肽是氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。在另一方面,该多肽是乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨肽酶、α-淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、香豆酸酯酶、环糊精糖基转移酶、角质酶、环糊精糖基转移酶、脱酰胺酶、脱氧核糖核酸酶、分散素(dispersin)、内切葡聚糖酶、酯酶、阿魏酸酯酶、AA9溶解性多糖单加氧酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖脑苷脂酶、葡糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、卤素过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、溶菌酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、磷脂酶、植酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、α-1,6-转葡糖苷酶、转谷氨酰胺酶、尿激酶、黄原胶酶、木聚糖酶或β-木糖苷酶。
在另一方面,该多肽是纤维素酶。在另一方面,该纤维素酶选自由以下组成的组:内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶。
在另一方面,该多肽是半纤维素酶。在另一方面,该半纤维素酶选自由以下组成的组:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
在另一方面,该多肽是内切葡聚糖酶。在另一方面,该多肽是纤维二糖水解酶。在另一方面,该多肽是β-葡糖苷酶。在另一方面,该多肽是AA9溶解性多糖单加氧酶。在另一方面,该多肽是木聚糖酶。在另一方面,该多肽是β-木糖苷酶。在另一方面,该多肽是乙酰木聚糖酯酶。在另一方面,该多肽是阿魏酸酯酶。在另一方面,该多肽是阿拉伯呋喃糖苷酶。在另一方面,该多肽是葡糖醛酸糖苷酶。在另一方面,该多肽是乙酰甘露聚糖酯酶。在另一方面,该多肽是阿拉伯聚糖酶。在另一方面,该多肽是香豆酸酯酶。在另一方面,该多肽是半乳糖苷酶。在另一方面,该多肽是葡糖醛酸酯酶。在另一方面,该多肽是甘露聚糖酶。在另一方面,该多肽是甘露糖苷酶。
在本发明的方法中,突变体丝状真菌细胞是重组细胞,其包括编码异源多肽的多核苷酸,该突变体有利地用于多肽的重组产生。该细胞优选用包含编码异源多肽的多核苷酸的核酸构建体或表达载体转化,随后将该载体整合入染色体。“转化”意指将包括多核苷酸的载体引入进宿主细胞中,这样使得该载体被维持为染色体整合体或维持为自主复制的染色体外载体。通常认为整合是有利的,因为多核苷酸更有可能稳定地保持在细胞中。载体整合入染色体可以通过同源重组、非同源重组或转座发生。
编码异源多肽的多核苷酸可以从任何原核、真核或其他来源例如古细菌(archaeabacteria)获得。出于本发明的目的,如在此与给定来源结合使用的术语“从……中获得”应意指该多肽由该来源或有其中已经插入来自该来源的基因的细胞产生。
用来分离或克隆编码目的多肽的多核苷酸的技术在本领域中是已知的,并且包括从基因组DNA分离、从cDNA制备或其组合。可以例如通过使用熟知的聚合酶链式反应(PCR)实现从此类基因组DNA中克隆此类多核苷酸。参见例如,Innis等人,1990,PCR Protocols:AGuide to Methods and Application[PCR:方法和应用指南],Academic Press[学术出版社],纽约。克隆程序可涉及将包括编码多肽的多核苷酸的所需核酸片段切除并分离、将片段插入载体分子、以及将重组载体并入本发明的突变体丝状真菌细胞,其中会复制多核苷酸的一个或多个拷贝或克隆。多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或其任何组合。
可以使用本领域中的标准方法将编码目的多肽的多核苷酸引入突变体丝状真菌细胞。
亲本丝状真菌细胞
在本发明中,亲本丝状真菌细胞可以是任何丝状真菌细胞。丝状真菌细胞可以是野生型细胞或其突变体。
“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人,1995(同上)所定义的)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸来进行的,而碳分解代谢是专性需氧的。
在一方面,亲本丝状真菌细胞是枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、乳白蚁属(Coptotermes)、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、线黑粉酵母属(Filibasidium)、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、香菇属(Lentinula)、小腔球菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、黑果菌属(Melanocarpus)、亚灰树花菌属、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、链孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、假披发虫属(Pseudotrichonympha)、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳霉属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)细胞。
在实施例中,亲本丝状真菌细胞是解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillusawamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillus oryzae)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌(Chrysosporium keratinophilum)、拉克淖金孢子菌(Chrysosporiumlucknowense)、粪状金孢子菌(Chrysosporium merdarium)、毡金孢子菌(Chrysosporiumpannicola)、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌(Chrysosporium tropicum)、带纹金孢子菌(Chrysosporium zonatum)、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusariumcrookwellense)、黄色镰孢菌(Fusarium culmorum)、禾谷镰孢菌(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢菌(Fusarium oxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢菌(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟枝孢镰孢菌(Fusarium sporotrichioides)、硫色镰孢菌(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢菌(Fusariumtrichothecioides)、镶片镰孢菌(Fusarium venenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、白囊耙齿菌(Irpex lacteus)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurospora crassa)、绳状青霉菌(Penicilliumfuniculosum)、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaetechrysosporium)、埃默森篮状菌(Talaromyces emersonii)、无色梭孢壳(Thielaviaachromatica)、成层梭孢壳菌(Thielavia albomyces)、白毛梭孢壳(Thielaviaalbopilosa)、澳洲梭孢壳(Thielavia australeinsis)、粪梭孢壳(Thielavia fimeti)、小孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、秘鲁梭孢壳(Thielavia peruviana)、毛梭孢壳(Thielavia setosa)、瘤孢梭孢壳(Thielaviaspededonium)、耐热梭孢壳(Thielavia subthermophila)、土生梭孢壳(Thielaviaterrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)细胞。
在另一个实施例中,亲本丝状真菌细胞是嗜热毁丝霉细胞。
在另一个实施例中,亲本丝状真菌细胞是埃默森篮状菌细胞。
在另一个实施例中,亲本丝状真菌细胞是哈茨木霉细胞。
在另一个实施例中,亲本丝状真菌细胞是康宁木霉细胞。
在另一个实施例中,亲本丝状真菌细胞是长枝木霉细胞。
在另一个实施例中,亲本丝状真菌细胞是里氏木霉细胞。
在另一个实施例中,亲本丝状真菌细胞是绿色木霉细胞。
在优选的实施例中,亲本里氏木霉细胞是里氏木霉Rut-C30。
在另一个优选的实施例中,亲本里氏木霉细胞是里氏木霉的突变体。
在另一个优选的实施例中,亲本里氏木霉细胞是里氏木霉的形态突变体(参见WO97/26330)。
在另一个优选的实施例中,亲本里氏木霉细胞是里氏木霉的蛋白酶缺陷突变体(参见WO 2011/075677)。
应理解的是,对于前述物种,本发明涵盖完全和不完全阶段(perfect andimperfect states),和其他分类学等同物,例如无性型,而与它们已知的物种名无关。本领域的技术人员会容易地识别适当等同物的身份。
这些物种的菌株可容易地在许多培养物保藏中心为公众所获得,例如美国典型培养物保藏中心(American Type Culture Collection,ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures,CBS)、和美国农业研究服务专利培养物保藏中心北方地区研究中心(Agricultural Research Service Patent CultureCollection,Northern Regional Research Center,NRRL)。
突变体丝状真菌细胞
可通过使用本领域熟知的方法减少或消除(使失活)编码Rho-GTP酶RacA蛋白的基因的表达来构建在Rho-GTP酶RacA蛋白的产生方面存在缺陷的突变体丝状真菌细胞。可以修饰该基因的一部分,如编码区或为编码区的表达所需的控制序列。该基因的此类控制序列可以是启动子序列或其功能部分,即足以影响该基因的表达的部分。例如,可以将启动子序列失活从而无表达或可以将天然启动子替换为更弱的启动子以减少编码序列的表达。
可以通过基因缺失技术来构建突变体丝状真菌细胞,以减少或消除这些基因的表达。基因缺失技术使得可以部分或完全除去该基因,从而减少或消除其表达。在此类方法中,使用已经构建为邻接地含有侧翼于该基因的5'和3'区的质粒,通过同源重组完成该基因的缺失。
也可以通过任何RNA指导的DNA内切核酸酶使用,例如,MAD7(美国专利9,982,279)、MAD2(美国专利9,982,279)、Cas9(Doudna等人,2014,Science[科学]346:1258096)、“死”Cas9(dcas9;Qi等人,2013,Cell[细胞]152(5):1173)、Cas9切口酶(Satomura等人2017,Sci.Rep.[科学报告]7(1):2095)、或Cpf1内切核酸酶(Zetsche等人2015,Cell[细胞]163(3):759)(通过适当地设计的指导RNA被引导至基因的核苷酸序列)来构建突变体丝状真菌细胞。
还可以通过引入、取代和/或缺失该基因或为其转录或翻译所需的其控制序列中的一个或多个核苷酸来构建突变体丝状真菌细胞。例如,可以插入或除去核苷酸,用于引入终止密码子、除去起始密码子或移码开放阅读框。可以根据本领域已知的方法,通过定点诱变或PCR产生的诱变完成这样的修饰。参见,例如Botstein和Shortle,1985,Science[科学]229:4719;Lo等人,1985,Proceedings of the National Academy of Sciences USA[美国国家科学院院刊]81:2285;Higuchi等人,1988,Nucleic Acids Research[核酸研究]16:7351;Shimada,1996,Meth.Mol.Biol.[分子生物学方法]57:157;Ho等人,1989,Gene[基因]77:61;Horton等人,1989,Gene[基因]77:61;以及Sarkar和Sommer,1990,BioTechniques[生物技术]8:404。
还可以通过基因破坏技术,通过将破坏性核酸构建体插入进该基因中而构建突变体丝状真菌细胞,该破坏性核酸构建体包括与该基因同源的核酸片段,该片段将产生具有同源性的区域的重复并且在重复的区域之间掺入构建体DNA。这样的基因破坏可以消除基因表达,如果插入的构建体将该基因的启动子与编码区分离或打断编码序列,这样使得产生无功能性基因产物。破坏构建体可以简单地是伴有与该基因同源的5’和3’区的选择性标记基因。该选择性标记使得可以鉴定含有破坏的基因的转化体。
还可以通过基因转化过程构建突变体丝状真菌细胞(参见例如,Iglesias和Trautner,1983,Molecular General Genetics[分子普通遗传学]189:73-76)。例如,在基因转化方法中,将对应于该基因的核苷酸序列体外诱变,以产生缺陷核苷酸序列,然后将其转化进丝状真菌细胞中以产生缺陷基因。通过同源重组,该缺陷核苷酸序列替换该内源基因。该缺陷核苷酸序列还包含用于选择含有缺陷基因的转化体的标记可以是令人希望的。
还可以使用与该基因的核苷酸序列互补的核苷酸序列,通过已建立的反义技术构建突变体丝状真菌细胞(Parish和Stoker,1997,FEMS Microbiology Letters[FEMS微生物学快报]154:151-157)。更确切而言,可以通过引入与该基因的核苷酸序列互补的核苷酸序列来减少或消除该基因的表达,该核苷酸序列可以在该细胞中转录并且能够与在该细胞中产生的mRNA杂交。由此在允许互补反义核苷酸序列与mRNA杂交的条件下,减少或消除翻译的蛋白的量。
还可以通过已确立的RNA干扰(RNAi)技术来构建突变体丝状真菌细胞(参见,例如WO 2005/056772和WO 2008/080017)。
可以使用本领域熟知的方法(包括但不限于化学诱变),通过随机或特异诱变进一步构建突变体丝状真菌细胞(参见,例如Hopwood,The Isolation of Mutants in Methodsin Microbiology[微生物学方法中的突变体分离](J.R.Norris和D.W.Ribbons,编辑)第363-433页,Academic Press[学术出版社],纽约,1970)。可以通过使亲本细胞经受诱变并筛选其中该基因的表达已经失活的突变体细胞来修饰该基因。诱变可以是特异的或随机的,例如通过使用适合的物理或化学诱变剂、使用适合的寡核苷酸或使DNA序列经受PCR产生的诱变来进行。此外,诱变可以通过使用这些诱变方法的任何组合来进行。
适合本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射,羟胺,N-甲基-N'-硝基-N-亚硝基胍(MNNG),N-甲基-N'-亚硝基胍(NTG)邻甲基羟胺,亚硝酸,乙基甲磺酸(EMS),亚硫酸氢钠,甲酸和核苷酸类似物。当使用此类试剂时,诱变典型地是在适合条件下在所选的诱变剂的存在下通过孵育有待诱变的亲本细胞并选择展现出该基因的减少表达或无表达的突变体来进行的。
编码Rho-GTP酶RacA蛋白的基因的表达减少或消除可由本领域普通技术人员通过熟知的方式,例如,定量实时PCR(qRT-PCR)、RNA印迹杂交、使用cDNA或寡核苷酸阵列杂交(oligo array hybridization)的全局基因表达谱(global gene expressionprofiling)、或深度RNA测序(RNA-seq)分析选择的mRNA或转录水平来测量。可替代地,编码本发明的Rho-GTP酶RacA蛋白的基因的修饰可以通过使用如本文所述的基因座特异性引物的真菌孢子PCR来确定。
在一方面,当在相同条件下培养时,与未经修饰的亲本丝状真菌细胞相比,该突变体在Rho-GTP酶RacA蛋白的产生方面存在部分缺陷。在优选的方面,当在相同条件下培养时,该突变体产生比未经修饰的亲本丝状真菌细胞至少少25%、更优选地至少少50%、甚至更优选地至少少75%、和最优选地至少少95%的Rho-GTP酶RacA蛋白。
在另一方面,当在相同条件下培养时,与未经修饰的亲本丝状真菌细胞相比,该突变体在Rho-GTP酶RacA蛋白的产生方面存在完全缺陷。换句话说,编码Rho-GTP酶RacA蛋白的基因失活(例如基因的缺失、破坏等)。
可以使用如本文所述的本领域标准方法将编码GTP酶Ras2变体的多核苷酸引入具有经修饰的Rho-GTP酶RacA基因的突变体丝状真菌细胞中。
核酸构建体
本发明还涉及包含编码本发明的目的多肽的、可操作地连接至一个或多个控制序列上的多核苷酸的核酸构建体,该一个或多个控制序列在与控制序列相容的条件下指导编码序列在本发明的突变体丝状真菌细胞中表达。
多核苷酸可以按多种方式操纵,以提供目的多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可以是理想的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
控制序列可以是启动子、由本发明的突变体丝状真菌细胞识别的多核苷酸,用于表达编码目的多肽的多核苷酸。启动子包含介导目的多肽的表达的转录控制序列。启动子可以是在突变体细胞中显示转录活性的任何多核苷酸,包括突变型、截短型和杂合型启动子,并且可以获得自编码与突变体细胞同源或异源的细胞外或细胞内多肽的基因。
用于指导核酸构建体在突变体丝状真菌宿主细胞中的转录的合适启动子的实例是从以下的基因中获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、尖孢镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子,以及NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的修饰的启动子,其中已用来自曲霉属磷酸丙糖异构酶基因的未翻译的前导序列替代未翻译的前导序列;非限制性实例包括来自黑曲霉中性α-淀粉酶基因的经修饰的启动子,其中已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替代未翻译的前导序列);及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
控制序列还可以是由突变体丝状真菌宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接至编码目的多肽的多核苷酸的3'末端。在本发明的突变体丝状真菌宿主细胞中起作用的任何终止子都可以使用。
用于丝状真菌宿主细胞的优选终止子从以下的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延伸因子。
控制序列也可以是前导序列,即对突变体丝状真菌宿主细胞翻译很重要的mRNA的非翻译区域。该前导序列可操作地连接至编码目的多肽的多核苷酸的5'末端。在突变体丝状真菌宿主细胞中起作用的任何前导序列都可以使用。
用于丝状真菌宿主细胞的优选前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
控制序列还可以是多腺苷酸化序列,一种可操作地连接至该多核苷酸的3’末端并且当转录时由突变体丝状真菌宿主细胞识别为将多腺苷酸残基添加至所转录的mRNA的信号的序列。在突变体丝状真菌宿主细胞中起作用的任何多腺苷酸化序列都可以使用。
丝状真菌宿主细胞的优选多腺苷酸化序列从以下的基因中获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖孢镰孢胰蛋白酶样蛋白酶。
控制序列还可以是编码与目的多肽的N末端连接的信号肽并指导目的多肽进入细胞的分泌通路的信号肽编码区。多核苷酸的编码序列的5’端本身可以含有在翻译阅读框中天然与编码目的多肽的编码序列区段相连接的信号肽编码序列。可替代地,编码序列的5’末端可以包含对编码序列是外源(异源)的信号肽编码序列。在编码序列天然地不含有信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强目的多肽的分泌。然而,可以使用指导已表达的目的多肽进入宿主细胞的分泌通路的任何信号肽编码序列。
用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶。
控制序列还可以是编码位于目的多肽N末端的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性目的多肽。前肽编码序列可以从以下各项的基因获得:嗜热毁丝霉漆酶(WO 95/33836)、和米黑根毛霉天冬氨酸蛋白酶。
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列位于紧邻目的多肽的N末端且该信号肽序列位于紧邻前肽序列的N末端。
还可希望的是添加调节序列,这些调节序列调节宿主细胞生长相关的目的多肽的表达。调节序列的实例是引起基因表达以响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是允许基因扩增的那些序列。在真核系统中,这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码目的多肽的多核苷酸将与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体,这些重组表达载体包含编码目的多肽的多核苷酸、启动子和转录和翻译终止信号。多个核苷酸和控制序列可连接在一起以产生重组表达载体,该重组表达载体可包括一个或多个便利的限制位点以允许编码目的多肽的多核苷酸在此类位点处的插入或取代。可替代地,可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生表达载体时,编码序列位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。
重组表达载体可以是可以方便地经受重组DNA程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链或闭合环状质粒。
载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总DNA,或可以使用转座子。
载体优选地含有允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。
用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)以及trpC(邻氨基苯甲酸合酶)连同其等同物。优选的用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选的用于木霉属细胞的是adeA、adeB、amdS、hpt、和pyrG基因。
选择性标记可以是如WO 2010/039889中所述的双选择性标记系统。在一方面,双选择性标记是hpt-tk双选择性标记系统。
载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到宿主细胞基因组中,载体可以依靠编码目的多肽的多核苷酸序列或用于通过同源或非同源重组整合到该基因组中的载体的任何其他元件。可替代地,载体可以含有用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,例如100至10,000个碱基对、400至10,000个碱基对和800至10,000个碱基对,这些核酸与相应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,该复制起点使得载体在讨论中的宿主细胞中自主复制成为可能。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175;WO00/24883)。可根据WO 00/24883中披露的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。
可以将本发明的多核苷酸的多于一个的拷贝插入宿主细胞中以增加目的多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包括与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的提高的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝以及由此该多核苷酸的另外的拷贝的细胞。
用于连接本文所述的元件以构建重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,Molecular Cloning,ALaboratory Manual[分子克隆:实验室手册],第2版,冷泉港,纽约)。
载体可以通过例如转化引入该丝状真菌细胞中,这样使得该载体被维持为染色体整合体或被维持为自主复制的染色体外载体。通常认为整合是有利的,因为核苷酸序列更有可能稳定地保持在细胞中。通过同源重组、非同源重组或转座将载体整合入染色体中。
将表达载体引入丝状真菌细胞中可能涉及由原生质体形成、原生质体转化和细胞壁再生组成的以本身已知的方式进行的程序。用于转化曲霉属和木霉属宿主细胞的适合程序描述于以下文献中:EP 238023,Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422。用于转化镰孢属物种的适合方法由Malardier等人,1989,Gene[基因]78:147-156和WO 96/00787描述。
产生目的多肽的方法
本发明还涉及产生目的多肽的方法,该方法包括(a)培养本发明的突变体丝状真菌细胞用于产生该目的多肽,并且任选地(b)回收该目的多肽。
使用本领域已知的方法在适合于产生该多肽的营养培养基中培养突变体丝状真菌细胞。例如,可以通过摇瓶培养、或在实验室或工业发酵器中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养丝状真菌细胞,该培养在适合的培养基中并且在允许表达和/或分离多肽的条件下进行。使用本领域中已知的程序,培养发生在包含碳和氮来源及无机盐的适合的营养培养基中。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果多肽被分泌到该营养培养基中,那么可以直接从该培养基中回收该多肽。如果多肽不进行分泌,那么其可以从细胞裂解液中进行回收。
可以使用特异性针对该多肽的本领域已知的方法来检测该目的多肽。这些检测方法包括但不限于:特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定多肽的活性。
可以使用以上方法测量突变体丝状真菌细胞的目的多肽的生产力的提高。可以通过熟知的方式,例如,定量实时PCR(qRT-PCR)、RNA印迹杂交、使用cDNA或寡核苷酸阵列杂交的全局基因表达谱、或深度RNA测序(RNA-seq)分析选择的mRNA或转录水平来确定编码目的多肽的基因的表达的增加。
可以使用本领域已知的方法来回收多肽。例如,可通过常规方法,包括但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从营养培养基回收多肽。在一方面,回收包含多肽的全发酵液。
可以通过本领域已知的多种程序纯化该多肽,包括但不限于色谱法(例如,离子交换色谱法、亲和色谱法、疏水色谱法、聚焦色谱法和尺寸排阻色谱法)、电泳程序(例如,制备型等电聚焦电泳)、差异性溶解(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见例如,ProteinPurification[蛋白质纯化],Janson和Ryden编辑,VCH Publishers[VCH出版公司],纽约,1989),以便获得基本上纯的多肽。
通过以下实例进一步描述本发明,这些实例不应理解为对本发明的范围进行限制。
实例
菌株
里氏木霉菌株BTR213描述于WO 2013/086633中。
里氏木霉菌株O44N7J是BTR213衍生菌株,其表达异源烟曲霉纤维二糖水解酶I和烟曲霉β-葡糖苷酶基因。
培养基和溶液
COVE2板由以下构成:30g的蔗糖、20ml的COVE盐溶液、10ml的1M乙酰胺、25g的诺布尔琼脂、以及去离子水补足至1升。
COVE盐溶液由以下构成:26g的KCl、26g的MgSO4·7H2O、76g的KH2PO4、50ml的COVE痕量金属溶液、以及去离子水补足至1升。
COVE痕量金属溶液由以下构成:0.04g的Na2B4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g的MnSO4·H2O、0.8g的Na2MoO2·2H2O、10g的ZnSO4·7H2O、以及去离子水补足至1升。
发酵分批培养基由以下构成:15.1g的右旋糖、40g的大豆粉、8g的(NH4)2SO4、3g的K2HPO4、8g的K2SO4、3g的CaCO3、8g的MgSO4·7H2O、1g的柠檬酸H2O、5.2ml的85%磷酸、1ml的消泡剂、14.7ml的痕量金属溶液、以及去离子水补足至1升。痕量金属溶液由以下构成:26.1g的FeSO4·7H2O、5.5g的ZnSO4·7H2O、6.6g的MnSO4·H2O、2.6g的CuSO4·5H2O、2g的柠檬酸H2O、以及去离子水补足至1升。
LB+Amp培养基由以下构成:10g的胰蛋白胨、5g的酵母提取物、5g的氯化钠、50mg的氨苄青霉素(过滤灭菌并且在高压灭菌之后添加)、以及去离子水补足至1升。
PDA板由以下构成:39g的马铃薯右旋糖琼脂(Difco)、以及去离子水补足至1升。
PDA+1M蔗糖板由以下构成:39g马铃薯右旋糖琼脂(Difco)、342.30g蔗糖、和去离子水补足至1升。
PDA+潮霉素B覆盖物由以下构成:175μl潮霉素B(英杰公司(Invitrogen),50mg/ml,在PBS缓冲液中)和250ml无菌PDA板培养基。
PEG缓冲液由以下构成:去离子水中的50%聚乙二醇(PEG)4000、10mM Tris-HCl(pH 7.5)和10mM CaCl2。将溶液过滤灭菌。
摇瓶培养基由以下构成:20g的甘油、10g的大豆粉、10g的(NH4)2SO4、2g的KH2PO4、4g的MgSO4·7H2O、0.5g的CaCO3、0.2ml的痕量金属溶液、以及去离子水补足至1升。痕量金属溶液由以下构成:26.1g的FeSO4·7H2O、5.5g的ZnSO4·7H2O、6.6g的MnSO4·H2O、2.6g的CuSO4·5H2O、2g的柠檬酸H2O、以及去离子水补足至1升。
STC由以下构成:去离子水中的1M山梨醇、10mM Tris(pH 7.5)和10mM CaCl2。
TBE缓冲液由以下构成:10.8g Tris碱、5g硼酸、4ml 0.5M EDTA(pH 8)、以及补足至1升的去离子水。
TE缓冲液由1M Tris(pH 8.0)和0.5M EDTA(pH 8.0)构成。
2xYT+Amp板由以下构成:16g的胰蛋白胨、10g的酵母提取物、5g的NaCl、15g的Bacto琼脂、1ml 100mg/ml的氨苄青霉素(过滤灭菌并且在高压灭菌之后添加)和去离子水补足至1升。
YP培养基是由去离子水中的1%酵母提取物和2%蛋白胨构成的。
YPD培养基由以下构成:于去离子水中的1%酵母提取物、2%蛋白胨、以及2%葡萄糖。
实例1:里氏木霉原生质体产生
使用与Penttila等人,1987,Gene[基因]61:155-164类似的方案进行里氏木霉的原生质体制备与转化。简而言之,将里氏木霉在各自含有25ml YPD培养基的两个摇瓶中在27℃下伴随90rpm的轻轻搅拌培养17小时。将菌丝体通过使用真空驱动一次性过滤系统(密理博公司(Millipore))过滤来收集,并且用去离子水洗涤两次并用1.2M山梨醇洗涤两次。通过在34℃下伴随90rpm的轻轻振荡使洗涤的菌丝体悬浮于30ml含有5mg/ml的YATALASETM(美国宝生物工程株式会社(Takara Bio USA,Inc.))和0.5mg/ml的几丁质酶(西格玛化工有限公司(Sigma Chemical Co.))的1.2M山梨醇中60-75分钟来产生原生质体。将原生质体通过以834x g离心7分钟来收集,并且用冷的1.2M山梨醇洗涤两次。将原生质体使用血球计数器来计数,并且使其重新悬浮至最终浓度为1x108个原生质体/ml的STC。将原生质体溶液的等分试样(1.1ml)置于MR中。将FROSTYTM冷冻容器(赛默飞世尔科技公司(Thermo FisherScientific))置于-80℃下以备以后使用。
实例2:CRISPR/Mad7骨架载体pGMEr263
将质粒pGMEr263用作里氏木霉中基因组编辑的骨架载体,即racA基因的失活(针对DNA序列为SEQ ID NO:1,针对推导的氨基酸序列为SEQ ID NO:2)。
质粒pGMEr263(SEQ ID NO:3,图1)是CRISPR/MAD7表达质粒,用于使用HiFi DNA组装克隆试剂盒(新英格兰生物实验室公司(New EnglandBiolabs Inc.))将原型间隔子克隆到Bgl II消化的pGMEr263中。质粒pGMEr263含有直肠真杆菌(Eubacterium rectale)Mad7蛋白编码序列(pGMEr263中的核苷酸9663-13,478)并经密码子优化以用于在黑曲霉中使用,以及在直肠真杆菌Mad7开放阅读框的3'端处的SV40核定位信号(NLS;核苷酸13,455-13,478)以确保Mad7被定位至细胞核。直肠真杆菌Mad7的表达在来自pFC330-333的构巢曲霉tef1启动子(核苷酸8777-9662)和终止子(核苷酸13,479-13,883)的控制之下(等人,2015,PLoS One[公共科学图书馆·综合]10(7):1-18)。
质粒pGMEr263还具有用于单指导RNA(sgRNA)表达的所有元件,其由以下组成:稻梨孢菌U6-2启动子(核苷酸7949-8448)、结构tRNA下游区域被去除的烟曲霉tRNAgly(GCC)1-6序列(核苷酸8449-8539)、直肠真杆菌单指导RNA序列(核苷酸8540-8560)、Bgl II限制酶识别序列(核苷酸8557-8562)和稻梨孢菌U6-2终止子(核苷酸8562-8776)。
为了在里氏木霉中进行选择,质粒pGMEr263含有来自pHT1的潮霉素磷酸转移酶(hpt)基因(Cummings等人,1999,Curr.Genet.[当代遗传学]36:371)(核苷酸6475-7506)从而赋予对潮霉素B的抗性,以及在曲霉属中的自主维持(AMA1)序列(Gems等人,1991,Gene[基因]98:61-67)(核苷酸332-6056)用于pGMEr263在里氏木霉中进行染色体外复制。潮霉素抗性基因(CDS核苷酸6475-7506)受灰盖鬼伞β-微管蛋白启动子(核苷酸6082-6474)和终止子(核苷酸7503-7929)的转录控制。使用染料-终止子化学法(Giesecke等人,1992,J.Virol.Methods[病毒学方法杂志]38(1):47-60),用377XL型号自动DNA测序仪(应用生物系统公司(Applied Biosystems Inc.))通过DNA测序确认了pGMEr263中的单指导RNA和Mad7-SV40 NLS表达元件。
实例3:pGMEr263-racA-proto3的构建
质粒载体制备。用限制酶Bgl II(ANZATM 19Bgl II,赛默飞世尔科技公司)消化质粒pGMEr263。限制反应物包含15μg的pGMEr263质粒DNA、1X ANZATM缓冲液、100个单位的BglII和无菌Milli-Q水,最终体积达200μl。将反应物在37℃下孵育3小时。在限制酶消化后,在TBE缓冲液中对消化物进行0.8%琼脂糖凝胶电泳,并从凝胶上切除代表消化的pGMEr263的条带并根据制造商的说明使用凝胶和PCR清理试剂盒(马歇雷-纳格尔公司(Macherey-Nagel))进行纯化。
原型间隔子设计。通过在里氏木霉racA基因中找到具有序列TTTV(其中V代表核苷酸A、C或G)的适当的原型间隔子相邻基序(PAM)来选择原型间隔子。一旦鉴定出适当的PAM位点,就选择紧邻PAM位点3'侧的二十一个碱基对作为原型间隔子。拒绝含有多于三个连续T核苷酸的原型间隔子,以避免RNA聚合酶的可能卡壳。将紧邻PAM TTTC的二十一个碱基对的原型间隔子(鉴定为racA-proto3(SEQ ID NO:4))设计用于里氏木霉racA基因的基因座,以将Mad7酶引导至位于racA基因第三外显子的3’端的靶位点,并产生双链断裂。
racA-proto3:
CCCGGAGAGTACATCCCGACC(SEQ ID NO:4)
由赛默飞世尔科技公司将延伸序列如下所示(寡核苷酸1229348,SEQ ID NO:5)的原型间隔子合成为单链寡核苷酸。寡核苷酸中的加下划线序列突出了二十一个核苷酸的原型间隔子。将原型间隔子寡核苷酸稀释至最终工作浓度为1μM。
寡核苷酸1229348:
ATTCACGGATGATGCAGGAATTTCTACTCTTGTAGATCCCGGAGAGTACATCCCGACCTTTTTTTGGCTCTTGGGTTCGAACTGCCCAAGGCCCA(SEQ ID NO:5)
寡核苷酸1229348中紧邻原型间隔子racA-proto3区域的序列分别代表与Bgl II线性化质粒pGMEr263同源的5’和3’区域。需要此类同源区域将原型间隔子racA-proto3克隆到质粒pGMEr263中,从而产生功能性Mad7指导RNA表达盒,靶向racA基因。
原型间隔子的组装。使用总体积为10μl的HiFi DNA组装预混合液试剂盒(新英格兰生物实验室公司)将原型间隔子racA-proto3克隆到Bgl II线性化pGMEr263中,该试剂盒由以下构成:1xHiFi组装预混合液(新英格兰生物实验室公司)、0.05pmol的Bgl II消化的pGMEr263、1.0μl的原型间隔子寡核苷酸1229348(1μM)和无菌Milli-Q水,最终体积达20μl。将反应在50℃下孵育15分钟,然后置于冰上。使用2μl的组装反应物根据制造商的说明来转化50μl的STELLARTM化学感受态大肠杆菌细胞(克罗泰克实验室公司(Clontech laboratories))。将每种转化反应物涂布到两个2xYT+Amp板上,并且在37℃下孵育过夜。将推定的转化体菌落从选择板中分离,并且使用QIAprep SpinMiniprep试剂盒(凯杰公司(QIAGEN Inc.))从每种转化体菌落中制备质粒DNA并通过使用如下所示引物1228659(SEQ ID NO:6)测序来筛选所需原型间隔子的插入。将具有正确原型间隔子序列的质粒命名为pGMEr263-racA-proto3(SEQ ID NO:7,图2)。
引物1228659:
CTTGCTTGTCAAGCAATGGC(SEQ ID NO:6)
实例4:使里氏木霉中racA基因失活所需的双链寡核苷酸供体DNA的设计
为了使用CRISPR/Mad7质粒pGMEr263-racA-proto3通过Mad7基因组编辑使里氏木霉中的racA基因(SEQ ID NO:1)失活,赛默飞世尔科技公司合成了如下所示的反向和互补单链寡核苷酸1229227和1229228。
寡核苷酸1229227:
TTTTGCGCAGACCTGTCTTCTCATCTCGTACACGACCAATTAATGATGTTAGTTTCGCCTCCCGATATGACACAACCAACTCTGGCTCGCGAATA(SEQ ID NO:8)
寡核苷酸1229228:
TATTCGCGAGCCAGAGTTGGTTGTGTCATATCGGGAGGCGAAACTAACATCATTAAT
TGGTCGTGTACGAGATGAGAAGACAGGTCTGCGCAAAA(SEQ ID NO:9)
1229227和1229228寡核苷酸通过在C1000 TOUCHTM型号热循环仪(伯乐实验室有限公司)中在98℃下孵育5分钟进行退火,然后进行在室温下缓慢冷却步骤。所得双链寡核苷酸命名为racA-9227/9228,用于修复由质粒pGMEr263-racA-proto3中编码的gRNA引导至里氏木霉宿主racA基因座的Mad7内切核酸酶产生的双链切口。racA基因座基因组编辑使得PAM TTTC基序(4个核苷酸)缺失,原型间隔子区(21个核苷酸)缺失,位置32处新增第一终止密码子TAA,并产生ORF移码,这使得在基因的下游部分引入了许多另外的终止密码子。
实例5:pGMEr263-ras2G16V-proto的构建
将质粒pGMEr263用作骨架载体,构建用于修饰里氏木霉ras2基因的质粒pGMEr263-ras2G16V-proto(针对DNA序列为SEQ ID NO:10,针对推导的氨基酸序列为SEQID NO:11)。
质粒载体制备。用限制酶Bgl II消化质粒pGMEr263。限制反应物包含15μg的pGMEr263质粒DNA、1X ANZATM缓冲液、100个单位的Bgl II和无菌Milli-Q水,最终体积达200μl。将反应物在37℃下孵育3小时。在限制酶消化后,在TBE缓冲液中对消化物进行0.8%琼脂糖凝胶电泳,并从凝胶上切除代表消化的pGMEr263的条带并根据制造商的说明使用凝胶和PCR清理试剂盒进行纯化。
原型间隔子设计。通过在里氏木霉ras2G基因中找到具有序列TTTV(其中V代表核苷酸A、C或G)的适当的原型间隔子相邻基序(PAM)来选择原型间隔子。一旦鉴定出适当的PAM位点,就选择紧邻PAM位点3'侧的二十一个碱基对作为原型间隔子。拒绝含有多于三个连续T核苷酸的原型间隔子,以避免RNA聚合酶的可能卡壳。将二十一个碱基对的原型间隔子(鉴定为如下所示的ras2G16V-proto(SEQ ID NO:12))设计用于ras2基因,以将Mad7内切核酸酶切口引导至ras2基因第一外显子的5’端。通过寻找具有序列TTTG的合适的原型间隔子相邻基序(PAM)对原型间隔子ras2G16V-proto进行选择,该序列位于ras2基因ATG起始密码子上游的八个核苷酸处。原型间隔子ras2G16V-proto位于SEQ ID NO:11的位置16处靶甘氨酸上游32个核苷酸处。
ras2G16V-proto:
CGCCCATCATGGCGGGCAGAA(SEQ ID NO:12)
由赛默飞世尔科技公司将延伸序列如下所示(寡核苷酸1230370,SEQ ID NO:13)的原型间隔子合成为单链寡核苷酸。寡核苷酸中的加下划线序列突出了二十一个核苷酸的原型间隔子。将原型间隔子寡核苷酸稀释至最终工作浓度为1μM。
寡核苷酸1230370
ATTCACGGATGATGCAGGAATTTCTACTCTTGTAGATCGCCCATCATGGCGGGCAGAATTTTTTTGGCTCTTGGGTTCGAACTGCCCAAGGCCCA(SEQ ID NO:13)
寡核苷酸1230370中紧邻原型间隔子ras2G16V-proto区域的序列分别代表与BglII线性化质粒pGMEr263同源的5’和3’区域。需要此类同源区域将ras2G16V-proto原型间隔子克隆到质粒pGMEr263中,从而产生功能性Mad7指导RNA表达盒,靶向ras2基因。
原型间隔子的组装。使用总体积为10μl的HiFi DNA组装预混合液将ras2G16V-proto原型间隔子克隆到Bgl II线性化pGMEr263中,该预混合液由以下构成:1xHiFi组装预混合液、0.05pmol的Bgl II消化的pGMEr263、1.0μl的原型间隔子寡核苷酸(1μM)和无菌Milli-Q水,最终体积达20μl。将反应在50℃下孵育15分钟,然后置于冰上。使用2μl的组装反应物根据制造商的说明来转化50μl的STELLARTM化学感受态大肠杆菌细胞。将每种转化反应物涂布到两个2xYT+Amp板上,并且在37℃下孵育过夜。将推定的转化体菌落从选择板中分离,并使用QIAprep旋转迷你制备型试剂盒(凯杰公司)从每种中制备质粒DNA。通过使用如下所示的引物1228659(SEQ ID NO:14)测序来针对所需原型间隔子的插入对质粒进行筛选。将具有正确原型间隔子序列的质粒命名为pGMEr263-ras2G16V-proto(SEQ ID NO:15,图3)。
引物1228659:
CTTGCTTGTCAAGCAATGGC(SEQ ID NO:14)
实例6:产生里氏木霉中ras2G16V基因变体所需的双链寡核苷酸供体DNA的设计
为了使用CRISPR/Mad7质粒pGMEr263-ras2G16V-proto通过Mad7基因组编辑将点突变G47T引入到天然里氏木霉ras2基因中,整合DNA技术有限公司(Integrated DNATechnologies)合成了如下所示的反向和互补单链寡核苷酸ras2G16-供体F和ras2G16-供体R。
寡核苷酸ras2G16-供体F:
GGTCGCTCCTCAACCGCTGACTCTTTGCGCCCATCATGGCAGGAAGGATGGTGCTGTACAAGCTGGTGGTGCTGGGAGACGTTGGTGTCGGTAAGACGGCCCTGACCATCCAGCTGTGCCTGCAGCACTTCGTCGAGACG(SEQID NO:16)
寡核苷酸ras2G16-供体R:
CGTCTCGACGAAGTGCTGCAGGCACAGCTGGATGGTCAGGGCCGTCTTACCGACACCAACGTCTCCCAGCACCACCAGCTTGTACAGCACCATCCTTCCTGCCATGATGGGCGCAAAGAGTCAGCGGTTGAGGAGCGACC(SEQID NO:17)
这两个反向和互补单链寡核苷酸ras2G16-供体F和ras2G16-供体R通过在TOUCHTM热循环仪中在98℃下孵育5分钟进行退火,然后进行在室温下缓慢冷却步骤。所得双链寡核苷酸命名为ras2G16V-供体,用于修复由质粒pGMEr263-ras2G16V-proto中编码的gRNA引导至里氏木霉宿主ras2基因座的Mad7内切核酸酶产生的双链切口。ras2基因座基因组编辑使得插入点突变G47T,引起氨基酸变化G16V(位置16处的甘氨酸变为缬氨酸)。此外,在ras2 CDS的5'端还引入了三个沉默突变,特别是核苷酸6由G变为A,核苷酸9由C变为A,且核苷酸12由A变为G。这三个沉默突变都包含在ras2G16V-proto区域中,且一旦在位置47处引入所需的SNV,这三个沉默突变就可以帮助避免Mad7基因组重新切割(针对突变体ras2G16V基因的DNA序列为SEQ ID NO:18,针对ras2G16V变体的推导氨基酸序列为SEQ ID NO:19)。
实例7:pGMEr2630racA-proto3、pGMEr263-ras2G16V-proto和双链供体寡核苷酸的共转化
本实验的目的是以单独和组合的方式通过Mad7基因组编辑将racA基因失活和ras2G16V变体引入到里氏木霉中,以评估对纤维素酶表达的影响。pGMEr263-racA-proto3和pGMEr263-ras2G16V-proto质粒是表达Mad7的自主复制质粒(包含AMA1),Mad7是一种分别靶向里氏木霉中racA基因座和ras2基因座的特定序列的sgRNA构建体和一种hpt选择标记(潮霉素B抗性)。相应的供体DNA片段是racA-9227/9228(实例4)和ras2G16V-供体(实例6),它们被用作双链寡核苷酸。供体DNA racA-9227/9228与Mad7质粒pGMER263-racA-proto3组合使用,用TAA终止密码子替换了racA基因座的PAM和原型间隔子区,产生了导致racA基因失活的有意移码。供体DNA ras2-供体与Mad7质粒pGMER263-ras2G16V-proto组合使用,通过用氨基酸缬氨酸替换位置16处的氨基酸甘氨酸修饰了Ras2蛋白氨基酸序列,使ras2基因在纤维素酶表达诱导条件下具有组成型活性。
将质粒pGMEr263-racA-proto3、pGMEr263-ras2G16V-proto、供体DNA racA-9227/9228、和供体DNA ras2-供体共转化到里氏木霉BTR213宿主菌株O44N7J中,该菌株表达异源烟曲霉纤维二糖水解酶I基因和烟曲霉β-葡糖苷酶基因。将O44N7J原生质体在冰上解冻。对于每次转化,将大约2μg的质粒DNA和6μl的每种双链供体DNA分子(50μM)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在37℃下孵育过夜。第二天,添加PDA+潮霉素B覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得大约15-20个转化体。为了确定编辑频率,从每个转化板中挑取少量潮霉素抗性菌落,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRETM Plant Direct PCR试剂盒,赛默科技公司)中。使用具有引物对1230867(SEQ ID NO:20)+1230870(SEQ ID NO:21)和1230863(SEQ ID NO:22)+1230864(SEQ IDNO:23)的PHIRETM植物直接PCR试剂盒(赛默科技公司)对覆盖racA和ras2靶位点的区域进行扩增,这些引物对分别如下所示。
引物1230867:
ATGGCGCAAGCTGGAGTGCA(SEQ ID NO:20)
引物1230870:
CGAATAGCCTCGTCAAAGAC(SEQ ID NO:21)
引物1230863:
CAGCTTCCCGTCGCCGCCCA(SEQ ID NO:22)
引物1230864:
CTGCTTGCGGTATGAGTCCTC(SEQ ID NO:23)
每个PCR由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRETM植物PCR缓冲液(PHIRETM植物直接PCR试剂盒,赛默科技公司)、0.4μl的PHIRETM热启动II DNA聚合酶(PHIRETM植物直接PCR试剂盒,赛默科技公司)和无菌Milli-Q H2O,至最终体积为20μl。将反应物在编程为如下的TOUCHTM热循环仪中孵育:1个循环,在98℃下持续3分钟;40个循环,每个循环在98℃下持续5秒并在72℃下持续1分20秒;以及一个循环,在72℃下持续5分钟。
为了鉴定经编辑的转化体,在使用ExoSAP-IT试剂(昂飞公司(Affimetrix,Inc.))进行清理过程后对PCR产物进行测序。将五μl PCR后反应物与2μlExoSAP-IT试剂(昂飞公司)混合,组合形成7μl反应物体积。将混合物在37℃下孵育15分钟,然后在80℃下孵育15分钟以使ExoSAP-IT试剂失活。使用如下所示的测序引物1230871(SEQ ID NO:24)(针对racA基因座)和测序引物1230865(SEQ ID NO:25)(针对ras2基因座)对每种经ExoSAP-IT处理的PCR产物进行测序以确认所需的基因组编辑。
引物1230871:
GACCTCCTTGACGTAGTTGA(SEQ ID NO:24)
引物1230865:
GCTTCTGCTTCTGCTTCTGC(SEQ ID NO:25)
测序结果确定了三种不同的经编辑菌株:单突变体里氏木霉O83E59(O44N7J,含racA敲除)、单突变体里氏木霉O83E58(O44N7J,含ras2G16V变体)和双突变体里氏木霉O838XE(O44N7J,两种经编辑基因座均包含,即racA敲除和ras2G16V变体)。
实例8:突变体里氏木霉菌株O83E59、O83E58和O838XE的全基因组测序
三个突变体里氏木霉菌株O83E59、O83E58和O838XE(实例7)中的每一个在30℃下以300rpm振荡在14ml管中的5ml YPD培养基中生长3天。通过离心收集菌丝体,并在KINGFISHErTM Duo Prime(赛默科技公司)中使用MAGMAXTM植物DNA试剂盒(赛默科技公司)纯化基因组DNA。使用Qubit荧光定量装置(赛默科技公司)测量最终的基因组DNA浓度,并且,对于每个突变体菌株,提交20μl(5ng/μl)的DNA溶液用于NGS测序分析。将每种基因组DNA溶液用于创建配对末端测序文库,并且在NEXTSEQTM 500系统(依诺米那公司(IlluminaInc.))上使用2X 150bp化学法进行测序。用CLC Genomics Workbench 11.0.1版本(凯杰公司)进行序列分析。使用修剪读段模块修剪读段。对于每个样品,使用样品读段模块对100,000个修剪的读段采样。使用具有高严格度设置的将读段映射至参考值模块将读段映射至racA和ras2经编辑基因座的模型。总体上,85%-96%的读段被成功地映射,从而产生100%的模型覆盖率。用基本变体检测(Basic Variant Detection)模块分析了突变的编辑和转移,并在所有突变体菌株中都证实了所需的基因组变化。
实例9:rac/ras突变体里氏木霉菌株的表型评估
使单突变体里氏木霉O83E59、单突变体里氏木霉O83E58、双突变体里氏木霉O838XE和亲本里氏木霉菌株O44N7J在COVE2琼脂板上生长,并记录表型变化。亲本菌株里氏木霉O44N7J在COVE2板上表现出特有的里氏木霉表型:大量产孢和菌丝体生长蔓延到整个板表面。单突变体O83E58(ras2G16V变体)出现大量产孢,但菌丝体生长未达到板边缘。单突变体里氏木霉O83E59(racA敲除)产孢减少,且生长仅限于板的中间。双突变体里氏木霉O838XE表现出最极端的表型变化,其大量产孢,但菌丝体生长严重受限,仅限于板的中心。
实例10:补料分批发酵
突变体里氏木霉菌株O83E59、O83E58、和O838XE以及亲本里氏木霉菌株O44N7J在3升补料分批发酵中进行了至少一次测试,以评估菌株性能和蛋白质表达水平。
菌株各自在PDA板上在28℃下生长5-9天。将各自含有100ml针对每种菌株的摇瓶培养基的三个500ml摇瓶用来自各PDA板的两个塞子接种。在26℃,将摇瓶在定轨摇床上在250rpm下孵育48小时。将这些培养物用作种子,以用于更大规模发酵。
使用共160ml的各种子培养物接种含有1.5升发酵分批培养基的欧谱生物技术公司(Applikon Biotechnology)3升玻璃夹套发酵罐。将发酵罐维持在28℃的温度下,并且使用欧谱控制系统将pH控制在3.85+/-0.25的设定值。将空气以2.5L/min的速率添加到容器中,并用以1100rpm旋转的Rushton叶轮搅拌培养液。将由右旋糖和磷酸构成的发酵补料培养基以0至18g/小时的速率,基于溶解氧控制的斜升,给予163小时。从每个发酵罐中每天取1ml样品,离心,并储存于-20℃。
实例11:对发酵样品进行的测定
将来自实例10的样品提交用于总蛋白测定和β-葡糖苷酶测定,以评估引入的突变是否有益于里氏木霉在3升补料分批发酵中的性能。
总蛋白测定。使用10DG脱盐柱(伯乐实验室有限公司)对第7天的发酵样品进行脱盐并将缓冲液交换为50mM乙酸钠-100mM NaCl,pH 5.0。脱盐后,使用Gallery分析仪(赛默科技公司)对酶组合物的蛋白浓度进行确定。将培养物在水中适当稀释。将白蛋白标准品(牛血清白蛋白;BSA)在水中连续稀释至0.66mg/ml至0.087mg/ml的浓度范围。将总共20μl的每种稀释液(包括标准品在内)转移到含有200μl二辛可宁酸(BCA)底物溶液(Pierce BCA蛋白测定试剂盒;赛默科技公司)的比色皿中,然后在37℃下孵育30分钟。孵育完成后,测量每个样品在540nm处的光密度。通过从生成的标准曲线外推来确定样品浓度。
图4以“箱线图”表示示出了每个菌株相对于第7天总蛋白值的比较。黑色箱代表数据样本在第一和第三四分位数之间的分布。中间的白线代表中值。
基于图4所示的比较,里氏木霉菌株O838XE产生的总蛋白显著高于亲本里氏木霉菌株O44N7J,而里氏木霉菌株O83E58和O83E59与亲本菌株没有显著差异。与里氏木霉菌株O838XE与亲本里氏木霉菌株O44N7J的这种比较相关的p值为0.0009。平均而言,总蛋白增加了9.2%。
β-葡糖苷酶测定。在0.1M琥珀酸盐、0.01%X-100缓冲液pH5.0(样品缓冲液)中适当稀释第2天、第3天、第4天、第5天、第6天和第7天样品,随后将稀释样品从0倍系列稀释至1/3倍至1/9倍。通过将β-葡糖苷酶标准品稀释至每毫升0.2至0.01纤维二糖酶生物量单位(生物量)(CBU(B))的范围来制备标准曲线。一个CBU(B)是在下面定义的条件下,以纤维二糖为底物,每分钟释放2μmol葡萄糖的酶量。将总共20μl的每种稀释液转移至96孔平底板中。将在0.1M琥珀酸盐pH 5.0缓冲溶液中的二百微升的1mg/ml对硝基苯基-β-D-吡喃葡萄糖苷底物添加到每个孔中,然后在环境温度下孵育45分钟。孵育期结束后,每孔添加50μl淬灭溶液(1MTRIS缓冲液,pH 9)。针对96孔板在光密度为405nm下测量端点。通过从生成的标准曲线外推来确定样品活性。
图5以“箱线图”表示示出了每个菌株相对于第7天β-葡糖苷酶活性值的比较。黑色箱代表数据样本在第一和第三四分位数之间的分布。中间的白线代表中值。
基于图5所示的比较,里氏木霉菌株O838XE产生的β-葡糖苷酶活性显著高于亲本里氏木霉菌株O44N7J,而里氏木霉菌株O83E58和O83E59与亲本菌株没有显著差异。与里氏木霉菌株O838XE与亲本里氏木霉菌株O44N7J的这种比较相关的p值为0.0187。平均而言,β-葡糖苷酶活性增加了32.5%。
粘度下降和总补料。图6以“箱线图”表示示出了每个菌株相对于总补料(发酵运行中使用的总补料克数)的比较。黑色箱是第7天的发酵数据。黑色箱代表数据样本在第一和第三四分位数之间的分布。中间的白线代表中值。
基于图6所示的比较,里氏木霉菌株O838XE使用的总补料显著高于亲本里氏木霉菌株O44N7J,而里氏木霉菌株O83E58和O83E59与亲本菌株没有显著差异。与里氏木霉菌株O838XE与亲本里氏木霉菌株O44N7J的这种比较相关的p值为0.0005。平均而言,总补料增加了16.1%。由于发酵是使用基于溶解氧斜升的补料曲线运行的,所以总补料实际上是粘度的指标。当粘度下降时,到发酵罐中的氧转移会更好,并且可以向发酵罐中添加更多的补料。当粘度上升时,氧转移会更差,因此总补料会下降。由于里氏木霉菌株O838XE的总补料更高,因此粘度更低。
本文描述和要求保护的本发明不限于本文披露的具体方面的范围,因为这些方面旨在作为本发明若干方面的说明。任何等同方面旨在处于本发明的范围之内。实际上,除了本文所示和描述的那些之外,本发明的各种修改因前述说明而对本领域的技术人员变得清楚。此类修改也旨在落入所附权利要求的范围内。在冲突的情况下,以包括定义的本披露为准。
序列表
<110> 诺维信公司(Novozymes A/S)
<120> 在多肽生产中具有提高的生产力的丝状真菌细胞的突变体
<130> 15108-WO-PCT
<160> 25
<170> PatentIn 3.5版
<210> 1
<211> 1054
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 1
atggcgcaag ctggagtgca atcgctgaag gtaatatcat tcatctgctc ctctcttcca 60
cttggggggt tttttttttc ttcttcttct ctttttcttg ggccacttac tgacgcctcc 120
tgtctccttt agtgtgtcgt gaccggtgac ggtgccgtcg gcaaggtatg tcgcaaccat 180
ttctcccctc cccttcttct agttcttggt cgactaacgc atgattttgc gcagacctgt 240
cttctcatct cgtacacgac caatgctttc cccggagagt acatcccgac cgtgttagtt 300
tcgcctcccg atatgacaca accaactctg gctcgcgaat attgattgtt gactttgggt 360
cctcccgcca caggtttgac aactactctg ctagcgtcat tgttgatggc aagccgatca 420
gcctgggtct ttgggacact gcaggccagg aggattatga tagactccgg cccttgtcct 480
acccccagac cgacgtgttc ctcatctgtt tctccgtcgt gagcccgcct tcttacgata 540
acgttgccgc aaaggtatga tatgccgtcc ctccccgttc tgcttctttg ttgagcgaca 600
agagctgtac atctgacgat accccagtgg ctccccgaga tcacccacca ctcgtctgga 660
actcccatca tcctcgtcgg taccaagatc gatcttcgcg atgacccggc tacccgagcc 720
gccctgacca agcaacacat ggagccggtc aagtacgaga acgtgctcaa ctacgtcaag 780
gaggtcaaca agaccaacaa aatcatctac aaatacattg agtgttccgc cctgactcag 840
cgcaacctca agagtgtctt tgacgaggct attcggtaag caaacgcctc cagcccgcgc 900
tgttgcggct ttcagtctcg attgattcct gcctgctctc tgcctgcctc tgcccccctt 960
tgcacagcta acagttctgt ctttgatcag tgcggttctc aaccccaccc ctcaggcttc 1020
caaggccaaa aagtccaagt gctcgatcct gtaa 1054
<210> 2
<211> 204
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 2
Met Ala Gln Ala Gly Val Gln Ser Leu Lys Cys Val Val Thr Gly Asp
1 5 10 15
Gly Ala Val Gly Lys Thr Cys Leu Leu Ile Ser Tyr Thr Thr Asn Ala
20 25 30
Phe Pro Gly Glu Tyr Ile Pro Thr Val Phe Asp Asn Tyr Ser Ala Ser
35 40 45
Val Ile Val Asp Gly Lys Pro Ile Ser Leu Gly Leu Trp Asp Thr Ala
50 55 60
Gly Gln Glu Asp Tyr Asp Arg Leu Arg Pro Leu Ser Tyr Pro Gln Thr
65 70 75 80
Asp Val Phe Leu Ile Cys Phe Ser Val Val Ser Pro Pro Ser Tyr Asp
85 90 95
Asn Val Ala Ala Lys Trp Leu Pro Glu Ile Thr His His Ser Ser Gly
100 105 110
Thr Pro Ile Ile Leu Val Gly Thr Lys Ile Asp Leu Arg Asp Asp Pro
115 120 125
Ala Thr Arg Ala Ala Leu Thr Lys Gln His Met Glu Pro Val Lys Tyr
130 135 140
Glu Asn Val Leu Asn Tyr Val Lys Glu Val Asn Lys Thr Asn Lys Ile
145 150 155 160
Ile Tyr Lys Tyr Ile Glu Cys Ser Ala Leu Thr Gln Arg Asn Leu Lys
165 170 175
Ser Val Phe Asp Glu Ala Ile Arg Ala Val Leu Asn Pro Thr Pro Gln
180 185 190
Ala Ser Lys Ala Lys Lys Ser Lys Cys Ser Ile Leu
195 200
<210> 3
<211> 16354
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA序列
<400> 3
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180
ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240
ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300
agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360
tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420
ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480
tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540
accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600
gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660
ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720
atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780
cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840
gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900
acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960
aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020
gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080
gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140
gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200
taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260
catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320
gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380
tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440
ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500
gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560
tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620
gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680
gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740
cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800
tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860
ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920
actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980
cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040
agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100
tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160
taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220
tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280
cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340
caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400
gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460
tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520
taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580
tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640
tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360
aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720
aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780
ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840
aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900
gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960
gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020
aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080
ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140
gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200
gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260
tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320
aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380
aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440
aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500
gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560
tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620
ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680
tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740
caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800
gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860
gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920
gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980
gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040
aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100
cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160
aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220
actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280
ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340
tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400
agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460
taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520
tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580
gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640
caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700
gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760
tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820
agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880
gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940
ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000
tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060
cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120
tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180
cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240
ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300
atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360
catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420
gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500
aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560
ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620
cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680
ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740
ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800
cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860
tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920
tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980
tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040
gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100
tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160
actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220
ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280
atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340
gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400
gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460
aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520
tcgattcacg gatgatgcag gaatttctac tcttgtagat ctttttttgg ctcttgggtt 8580
cgaactgccc aaggcccatg ttttggtcat cttttttttt atgccccacc atttgggtca 8640
cccctgccaa tcattccatc tttgttccta cccttcacgt gtgctttccg aagccaaagt 8700
tcccattcaa caactctcct tgcgtttttt ttttcttgaa gcttgtcacc cgtcgatagt 8760
ttctgccatt tgcaatcgag acagcagaat caccgcccaa gttaagcctt tgtgctgatc 8820
atgctctcga acgggccaag ttcgggaaaa gcaaaggagc gtttagtgag gggcaatttg 8880
actcacctcc caggcaacag atgagggggg caaaaagaaa gaaattttcg tgagtcaata 8940
tggattccga gcatcatttt cttgcggtct atcttgctac gtatgttgat cttgacgctg 9000
tggatcaagc aacgccactc gctcgctcca tcgcaggctg gtcgcagaca aattaaaagg 9060
cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt acagagtgat aaaagccgcc 9120
atgcgaccat caacgcgttg atgcccagct ttttcgatcc gagaatccac cgtagaggcg 9180
atagcaagta aagaaaagct aaacaaaaaa aaatttctgc ccctaagcca tgaaaacgag 9240
atggggtgga gcagaaccaa ggaaagagtc gcgctgggct gccgttccgg aaggtgttgt 9300
aaaggctcga cgcccaaggt gggagtctag gagaagaatt tgcatcggga gtggggcggg 9360
ttacccctcc atatccaatg acagatatct accagccaag ggtttgagcc cgcccgctta 9420
gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc tccccctccc acaaaatttt 9480
ctttcccttc ctctccttgt ccgcttcagt acgtatatct tcccttccct cgcttctctc 9540
ctccatcctt ctttcatcca tctcctgcta acttctctgc tcagcacctc tacgcattac 9600
tagccgtagt atctgagcac ttctcccttt tatattccac aaaacataac acaaccttca 9660
ccatgaacaa cggcacaaac aacttccaga acttcattgg aatctcgtcg ttgcagaaga 9720
ctttgcgcaa cgccctcatc cccacagaaa ctacccagca gttcattgtg aagaacggaa 9780
tcatcaagga agatgaactc cgaggcgaga accgccagat tttgaaggac atcatggatg 9840
attactaccg tggtttcatc tcggaaacgc tctcctccat tgacgacatc gattggactt 9900
cgttgttcga aaagatggaa atccagctca aaaacggcga taacaaggat accttgatca 9960
aggagcagac cgagtatcgg aaggcgatcc ataagaagtt cgccaacgat gatcggttca 10020
agaacatgtt ctcggccaag ttgatttccg acattctccc cgaattcgtg atccataaca 10080
acaactactc ggcgtcggag aaggaggaga agacgcaggt catcaagttg ttctcgaggt 10140
tcgccacatc gttcaaagac tattttaaga atcgtgcgaa ctgtttctcg gcagatgata 10200
tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc ggaaatcttc ttctcgaacg 10260
cgttggtgta taggcgcatc gtgaagtccc tctccaacga tgacatcaac aaaatctcgg 10320
gagatatgaa ggattcgctc aaggagatgt cgttggagga aatctactcc tatgagaagt 10380
atggcgagtt cattacgcag gagggcattt ccttctacaa cgacatttgt ggtaaagtca 10440
actcgttcat gaacctctac tgtcagaaaa acaaggagaa caaaaacctc tataagctcc 10500
agaagttgca taagcagatc ctctgtatcg cagacacctc gtacgaggtc ccttacaagt 10560
tcgaatccga tgaggaggtc taccagtccg tcaacggatt cttggacaac atctcctcga 10620
aacacattgt cgagcggctc cgaaagatcg gcgataacta caacggctac aacttggaca 10680
aaatctatat cgtctccaag ttctatgagt ccgtctcgca gaaaacctat cgtgattggg 10740
agactatcaa cactgcgctc gagattcact ataacaacat cttgcctggt aacggcaaat 10800
cgaaagccga caaggtgaag aaggccgtga aaaacgatct ccagaagtcg atcacagaaa 10860
tcaacgaact cgtctcgaac tacaagctct gttcggatga taacatcaag gcggaaacgt 10920
acatccatga aatctcgcat atcttgaaca acttcgaggc ccaggaactc aaatacaacc 10980
ccgagatcca cttggtcgag tcggagctca aagcctcgga gttgaagaac gtcttggatg 11040
tcatcatgaa cgcattccac tggtgttccg tgttcatgac cgaggaactc gtcgataaag 11100
acaacaactt ctacgcggaa ctcgaggaaa tctacgatga aatctatccc gtgatctccc 11160
tctacaacct cgtgcgaaac tacgtcactc agaagcccta ttccaccaag aagatcaagc 11220
tcaacttcgg catccccact ctcgcagacg gttggtcgaa gtcgaaggag tactccaaca 11280
acgccattat cctcatgcga gacaacctct actacttggg tatcttcaac gcaaagaaca 11340
agccggataa gaagatcatt gaaggcaaca cttcggaaaa caagggagac tataagaaga 11400
tgatctacaa cctcctccct ggacccaaca agatgattcc taaagtgttc ctctcgtcga 11460
agactggtgt ggaaacgtat aagccgtcgg cctacatctt ggagggctac aaacagaaca 11520
agcatatcaa gtcctcgaag gacttcgaca tcactttctg tcacgacctc atcgactatt 11580
tcaagaactg tattgcaatc catccggaat ggaagaactt cggcttcgat ttctcggata 11640
cttcgacata cgaagatatc tcgggattct accgagaggt cgaattgcag ggctataaga 11700
ttgattggac ctacatctcg gaaaaggata tcgacttgct ccaggaaaag ggccagctct 11760
acctcttcca gatttacaac aaggacttct ccaagaagtc gacgggtaac gacaacttgc 11820
acacaatgta tctcaaaaac ctcttctcgg aggagaactt gaaggatatc gtgctcaaat 11880
tgaacggaga ggccgaaatc ttcttccgta agtcctccat caagaacccg atcatccata 11940
agaagggatc gatcttggtc aaccggactt acgaagcaga ggaaaaagat cagttcggaa 12000
acatccagat tgtcaggaag aacatccctg aaaacatcta tcaggagttg tataagtact 12060
tcaacgacaa gtcggataag gagctctccg acgaagcagc caaactcaag aacgtcgtcg 12120
gacaccatga agcagcaacc aacattgtga aggactaccg gtacacttac gacaagtact 12180
tcttgcacat gccgatcact atcaacttca aagccaacaa gaccggattc attaacgaca 12240
ggatcctcca gtacattgcc aaagaaaagg acctccatgt catcggtatc gataggggag 12300
aacggaacct catctacgtc tccgtgattg acacttgtgg caacattgtc gaacagaagt 12360
cgttcaacat cgtcaacggt tacgattacc agattaagtt gaaacagcag gaaggtgcga 12420
ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat caaggagatt aaggaaggct 12480
acttgtcgtt ggtcatccac gaaatctcga aaatggtgat caaatacaac gccatcatcg 12540
ccatggaaga cctctcgtac ggcttcaaaa agggacggtt caaagtggag cgtcaggtgt 12600
accagaagtt cgaaacaatg ttgatcaaca agttgaacta cttggtgttc aaggacattt 12660
ccattaccga gaacggagga ttgctcaagg gttatcagct cacgtacatc cccgacaagt 12720
tgaaaaacgt gggacaccag tgtggctgta tcttctacgt gcctgcagcc tacacgtcga 12780
aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt caaggatctc accgtcgacg 12840
cgaagcggga gttcatcaaa aagttcgact ccatccgcta tgattcggag aagaacttgt 12900
tctgtttcac attcgactac aacaacttca ttactcagaa caccgtgatg tccaaatcgt 12960
cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg cttcgtcaac ggtcgcttct 13020
ccaacgaatc ggacacgatc gatatcacga aagacatgga gaaaacattg gaaatgaccg 13080
acatcaactg gcgtgacggc catgacctca ggcaggacat catcgattac gagatcgtcc 13140
agcacatctt cgaaatcttc cgtctcaccg tgcagatgag gaactccctc tccgagctcg 13200
aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa cgagaacaac atcttctacg 13260
actcggcaaa agcgggagat gcattgccga aggacgccga tgcgaacggt gcatattgta 13320
ttgcactcaa gggtctctac gaaatcaagc agatcaccga aaactggaag gaggacggca 13380
aattctcgag ggacaagttg aagatttcga acaaggattg gttcgatttc atccagaaca 13440
agaggtactt gcctccgaag aagaagcgaa aggtgtgagc ggacattcga tttatgccgt 13500
tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg gaattagact tgttatgtag 13560
ttgattctac aatggattat gattcctgaa cttcaaatcc gctgttcatt attaatctca 13620
gctcttcccg taaagccaat gttgaaacta ttcgtaaatg tacctcgttt tgcgtgtacc 13680
ttgcttatca cgtgatatta catgacctgg acagagttct gcgcgaaagt cataacgtaa 13740
atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt ctcgtccacc ccaacgcgtt 13800
tatcaacctc aactttcaac aaccatcatg ccaccaaaag cgcgtaaaac aaagcgagat 13860
ttgattgagc aagagggcag gatggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 13920
tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 13980
ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 14040
tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 14100
ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 14160
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 14220
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 14280
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 14340
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 14400
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 14460
tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 14520
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 14580
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 14640
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 14700
ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct 14760
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 14820
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 14880
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 14940
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 15000
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 15060
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 15120
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt 15180
gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag 15240
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 15300
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 15360
gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 15420
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt 15480
agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg 15540
gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg 15600
actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct 15660
tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc 15720
attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt 15780
tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt 15840
tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg 15900
aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat 15960
tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 16020
cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat catgacatta 16080
acctataaaa ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg tgatgacggt 16140
gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggatgcc 16200
gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg gggctggctt 16260
aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg tgaaataccg 16320
cacagatgcg taaggagaaa ataccgcatc aggc 16354
<210> 4
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 4
cccggagagt acatcccgac c 21
<210> 5
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 5
attcacggat gatgcaggaa tttctactct tgtagatccc ggagagtaca tcccgacctt 60
tttttggctc ttgggttcga actgcccaag gccca 95
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 6
cttgcttgtc aagcaatggc 20
<210> 7
<211> 16374
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA序列
<400> 7
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180
ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240
ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300
agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360
tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420
ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480
tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540
accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600
gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660
ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720
atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780
cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840
gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900
acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960
aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020
gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080
gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140
gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200
taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260
catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320
gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380
tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440
ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500
gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560
tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620
gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680
gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740
cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800
tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860
ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920
actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980
cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040
agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100
tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160
taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220
tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280
cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340
caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400
gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460
tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520
taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580
tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640
tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360
aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720
aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780
ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840
aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900
gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960
gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020
aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080
ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140
gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200
gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260
tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320
aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380
aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440
aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500
gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560
tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620
ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680
tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740
caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800
gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860
gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920
gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980
gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040
aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100
cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160
aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220
actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280
ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340
tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400
agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460
taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520
tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580
gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640
caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700
gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760
tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820
agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880
gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940
ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000
tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060
cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120
tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180
cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240
ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300
atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360
catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420
gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500
aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560
ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620
cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680
ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740
ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800
cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860
tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920
tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980
tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040
gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100
tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160
actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220
ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280
atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340
gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400
gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460
aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520
tcgattcacg gatgatgcag gaatttctac tcttgtagat cccggagagt acatcccgac 8580
ctttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640
atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700
gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760
gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820
gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880
gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940
gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000
gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060
gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120
acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180
gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240
ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300
gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360
tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420
ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480
tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540
tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600
tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660
aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720
aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780
gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840
tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900
tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960
taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020
cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080
cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140
catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200
ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260
ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320
tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380
aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440
cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500
caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560
gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620
cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680
caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740
gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800
cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860
ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920
taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980
ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040
gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100
cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160
aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220
ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280
gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340
tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400
caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460
taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520
ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580
tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640
cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700
cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760
ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820
gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880
gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940
caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000
ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060
tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120
caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180
gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240
gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300
catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360
caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420
gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480
caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540
caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600
caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660
cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720
cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780
gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840
caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900
tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960
caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020
cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080
gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140
catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200
gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260
cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320
tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380
aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440
gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500
ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560
gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620
gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680
tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740
gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800
ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860
cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140
cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200
cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260
gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320
atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374
<210> 8
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 8
ttttgcgcag acctgtcttc tcatctcgta cacgaccaat taatgatgtt agtttcgcct 60
cccgatatga cacaaccaac tctggctcgc gaata 95
<210> 9
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 9
tattcgcgag ccagagttgg ttgtgtcata tcgggaggcg aaactaacat cattaattgg 60
tcgtgtacga gatgagaaga caggtctgcg caaaa 95
<210> 10
<211> 994
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 10
atggcgggca gaatggtgct gtacaagctg gtggtgctgg gagacggtgg tgtcggtaag 60
acggccctga ccatccagct gtgcctgcag cacttcgtcg agacggtaag cattcgctcc 120
ctttggatca gaaccggcat ttttggggga ggacaacaaa gagatcaacg aagaagacaa 180
gaaacaagca gaaaggggac ggagaaccgc gggagacgaa aacagggagg agaaatcacc 240
gactcttctt cccctctcct gaccgacttg ggcggacagc ctcggcggcg gtagcgcatg 300
aggggcaggg caacatggag ctcccgtccg cccagcgctg ggcgatgcat tggacgaatg 360
aatagctaac atccgacgtc tacagtacga cccgacaatt gaggactcat accgcaagca 420
ggtcgtcatc gacggccagc cctgcatgct cgaggtcctc gacacggccg gccaggagga 480
gtacacagcg ctgcgagacc aatggatccg agacggtgag ggcttcgtcc tcgtctacag 540
catcgcatcc cgctcgtcct tcacccgcat taagcgcttc caccaccaga tccagcgcgt 600
caaggagtcg gtagcctcct cgccctcata tccgggctca cctctgtccg ccgccagccc 660
gcagctgccc gtgcccatca tgctggtcgg caacaagagc gacagggtca ccgagcgcga 720
ggtatcgacc caggaggggc acgccctcgc tcgcgagctt ggctgcgagt ttgtcgaggc 780
ctcggccaag aactgcatca atgttgaaaa ggccttctac gacgtcgtca ggatcctgcg 840
ccggcagcgc cagcaggctt cgcgaccccc tgcgggcgcc agcggccgag cccgaaccag 900
caacggcgac gcgggcggag gaagccgaga cacgcaccgg taccggcgcg gcaaggacgg 960
cgagaagggc aagtccaagt gcattgtctt atga 994
<210> 11
<211> 219
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 11
Met Ala Gly Arg Met Val Leu Tyr Lys Leu Val Val Leu Gly Asp Gly
1 5 10 15
Gly Val Gly Lys Thr Ala Leu Thr Ile Gln Leu Cys Leu Gln His Phe
20 25 30
Val Glu Thr Tyr Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val
35 40 45
Val Ile Asp Gly Gln Pro Cys Met Leu Glu Val Leu Asp Thr Ala Gly
50 55 60
Gln Glu Glu Tyr Thr Ala Leu Arg Asp Gln Trp Ile Arg Asp Gly Glu
65 70 75 80
Gly Phe Val Leu Val Tyr Ser Ile Ala Ser Arg Ser Ser Phe Thr Arg
85 90 95
Ile Lys Arg Phe His His Gln Ile Gln Arg Val Lys Glu Ser Leu Pro
100 105 110
Val Pro Ile Met Leu Val Gly Asn Lys Ser Asp Arg Val Thr Glu Arg
115 120 125
Glu Val Ser Thr Gln Glu Gly His Ala Leu Ala Arg Glu Leu Gly Cys
130 135 140
Glu Phe Val Glu Ala Ser Ala Lys Asn Cys Ile Asn Val Glu Lys Ala
145 150 155 160
Phe Tyr Asp Val Val Arg Ile Leu Arg Arg Gln Arg Gln Gln Ala Ser
165 170 175
Arg Pro Pro Ala Gly Ala Ser Gly Arg Ala Arg Thr Ser Asn Gly Asp
180 185 190
Ala Gly Gly Gly Ser Arg Asp Thr His Arg Tyr Arg Arg Gly Lys Asp
195 200 205
Gly Glu Lys Gly Lys Ser Lys Cys Ile Val Leu
210 215
<210> 12
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 12
cgcccatcat ggcgggcaga a 21
<210> 13
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 13
attcacggat gatgcaggaa tttctactct tgtagatcgc ccatcatggc gggcagaatt 60
tttttggctc ttgggttcga actgcccaag gccca 95
<210> 14
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 14
cttcttgtca agcaatggc 19
<210> 15
<211> 16374
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA序列
<400> 15
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180
ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240
ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300
agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360
tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420
ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480
tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540
accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600
gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660
ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720
atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780
cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840
gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900
acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960
aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020
gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080
gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140
gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200
taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260
catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320
gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380
tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440
ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500
gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560
tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620
gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680
gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740
cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800
tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860
ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920
actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980
cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040
agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100
tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160
taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220
tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280
cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340
caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400
gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460
tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520
taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580
tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640
tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360
aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720
aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780
ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840
aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900
gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960
gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020
aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080
ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140
gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200
gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260
tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320
aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380
aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440
aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500
gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560
tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620
ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680
tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740
caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800
gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860
gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920
gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980
gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040
aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100
cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160
aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220
actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280
ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340
tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400
agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460
taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520
tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580
gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640
caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700
gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760
tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820
agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880
gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940
ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000
tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060
cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120
tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180
cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240
ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300
atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360
catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420
gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500
aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560
ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620
cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680
ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740
ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800
cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860
tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920
tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980
tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040
gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100
tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160
actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220
ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280
atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340
gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400
gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460
aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520
tcgattcacg gatgatgcag gaatttctac tcttgtagat cgcccatcat ggcgggcaga 8580
atttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640
atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700
gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760
gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820
gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880
gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940
gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000
gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060
gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120
acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180
gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240
ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300
gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360
tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420
ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480
tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540
tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600
tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660
aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720
aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780
gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840
tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900
tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960
taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020
cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080
cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140
catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200
ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260
ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320
tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380
aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440
cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500
caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560
gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620
cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680
caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740
gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800
cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860
ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920
taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980
ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040
gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100
cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160
aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220
ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280
gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340
tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400
caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460
taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520
ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580
tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640
cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700
cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760
ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820
gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880
gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940
caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000
ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060
tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120
caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180
gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240
gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300
catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360
caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420
gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480
caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540
caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600
caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660
cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720
cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780
gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840
caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900
tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960
caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020
cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080
gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140
catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200
gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260
cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320
tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380
aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440
gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500
ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560
gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620
gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680
tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740
gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800
ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860
cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140
cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200
cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260
gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320
atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374
<210> 16
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 16
ggtcgctcct caaccgctga ctctttgcgc ccatcatggc aggaaggatg gtgctgtaca 60
agctggtggt gctgggagac gttggtgtcg gtaagacggc cctgaccatc cagctgtgcc 120
tgcagcactt cgtcgagacg 140
<210> 17
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 17
cgtctcgacg aagtgctgca ggcacagctg gatggtcagg gccgtcttac cgacaccaac 60
gtctcccagc accaccagct tgtacagcac catccttcct gccatgatgg gcgcaaagag 120
tcagcggttg aggagcgacc 140
<210> 18
<211> 994
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 18
atggcaggaa ggatggtgct gtacaagctg gtggtgctgg gagacgttgg tgtcggtaag 60
acggccctga ccatccagct gtgcctgcag cacttcgtcg agacggtaag cattcgctcc 120
ctttggatca gaaccggcat ttttggggga ggacaacaaa gagatcaacg aagaagacaa 180
gaaacaagca gaaaggggac ggagaaccgc gggagacgaa aacagggagg agaaatcacc 240
gactcttctt cccctctcct gaccgacttg ggcggacagc ctcggcggcg gtagcgcatg 300
aggggcaggg caacatggag ctcccgtccg cccagcgctg ggcgatgcat tggacgaatg 360
aatagctaac atccgacgtc tacagtacga cccgacaatt gaggactcat accgcaagca 420
ggtcgtcatc gacggccagc cctgcatgct cgaggtcctc gacacggccg gccaggagga 480
gtacacagcg ctgcgagacc aatggatccg agacggtgag ggcttcgtcc tcgtctacag 540
catcgcatcc cgctcgtcct tcacccgcat taagcgcttc caccaccaga tccagcgcgt 600
caaggagtcg gtagcctcct cgccctcata tccgggctca cctctgtccg ccgccagccc 660
gcagctgccc gtgcccatca tgctggtcgg caacaagagc gacagggtca ccgagcgcga 720
ggtatcgacc caggaggggc acgccctcgc tcgcgagctt ggctgcgagt ttgtcgaggc 780
ctcggccaag aactgcatca atgttgaaaa ggccttctac gacgtcgtca ggatcctgcg 840
ccggcagcgc cagcaggctt cgcgaccccc tgcgggcgcc agcggccgag cccgaaccag 900
caacggcgac gcgggcggag gaagccgaga cacgcaccgg taccggcgcg gcaaggacgg 960
cgagaagggc aagtccaagt gcattgtctt atga 994
<210> 19
<211> 219
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 19
Met Ala Gly Arg Met Val Leu Tyr Lys Leu Val Val Leu Gly Asp Val
1 5 10 15
Gly Val Gly Lys Thr Ala Leu Thr Ile Gln Leu Cys Leu Gln His Phe
20 25 30
Val Glu Thr Tyr Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val
35 40 45
Val Ile Asp Gly Gln Pro Cys Met Leu Glu Val Leu Asp Thr Ala Gly
50 55 60
Gln Glu Glu Tyr Thr Ala Leu Arg Asp Gln Trp Ile Arg Asp Gly Glu
65 70 75 80
Gly Phe Val Leu Val Tyr Ser Ile Ala Ser Arg Ser Ser Phe Thr Arg
85 90 95
Ile Lys Arg Phe His His Gln Ile Gln Arg Val Lys Glu Ser Leu Pro
100 105 110
Val Pro Ile Met Leu Val Gly Asn Lys Ser Asp Arg Val Thr Glu Arg
115 120 125
Glu Val Ser Thr Gln Glu Gly His Ala Leu Ala Arg Glu Leu Gly Cys
130 135 140
Glu Phe Val Glu Ala Ser Ala Lys Asn Cys Ile Asn Val Glu Lys Ala
145 150 155 160
Phe Tyr Asp Val Val Arg Ile Leu Arg Arg Gln Arg Gln Gln Ala Ser
165 170 175
Arg Pro Pro Ala Gly Ala Ser Gly Arg Ala Arg Thr Ser Asn Gly Asp
180 185 190
Ala Gly Gly Gly Ser Arg Asp Thr His Arg Tyr Arg Arg Gly Lys Asp
195 200 205
Gly Glu Lys Gly Lys Ser Lys Cys Ile Val Leu
210 215
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 20
atggcgcaag ctggagtgca 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 21
cgaatagcct cgtcaaagac 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 22
cagcttcccg tcgccgccca 20
<210> 23
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 23
ctgcttgcgg tatgagtcct c 21
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 24
gacctccttg acgtagttga 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 25
gcttctgctt ctgcttctgc 20
Claims (22)
1.一种亲本丝状真菌细胞的分离的突变体,该突变体包含:
(a)编码目的多肽的多核苷酸;
(b)编码Rho-GTP酶RacA蛋白的racA基因,其中该racA基因在该亲本丝状真菌细胞中经修饰以产生该突变体,使得该突变体在该Rho-GTP酶RacA蛋白的产生方面部分或完全缺陷;以及
(c)编码GTP酶Ras2蛋白的ras2基因,其中该GTP酶Ras2蛋白在该亲本丝状真菌细胞中经修饰以产生GTP酶Ras2变体,该变体在与SEQ ID NO:11的位置16相对应的位置处包含取代;
其中经修饰的racA基因和该Ras2变体的组合协同地增加了该突变体在该目的多肽产生中的生产力。
2.如权利要求1所述的突变体,其中该Rho-GTP酶RacA选自由以下组成的组:
(i)Rho-GTP酶RacA蛋白,其包含与SEQ ID NO:2具有至少70%序列同一性的氨基酸序列;
(ii)Rho-GTP酶RacA蛋白,其由包含与SEQ ID NO:1具有至少70%序列同一性的核苷酸序列的多核苷酸编码;以及
(iii)Rho-GTP酶RacA蛋白,其由包含如下核苷酸序列的多核苷酸编码,该核苷酸序列在高严格条件下与SEQ ID NO:1的全长互补序列杂交。
3.如权利要求1所述的突变体,其中该GTP酶Ras2选自由以下组成的组:
(i)GTP酶Ras2蛋白,其包含与SEQ ID NO:11具有至少70%序列同一性的氨基酸序列;
(ii)GTP酶Ras2蛋白,其由包含与SEQ ID NO:10具有至少70%序列同一性的核苷酸序列的多核苷酸编码;以及
(iii)GTP酶Ras2蛋白,其由包含如下核苷酸序列的多核苷酸编码,该核苷酸序列在高严格条件下与SEQ ID NO:10的全长互补序列杂交。
4.如权利要求1-3中任一项所述的突变体,其中该GTP酶Ras2变体在位置16处有氨基酸残基被缬氨酸(Val)取代。
5.如权利要求4所述的突变体,其中该GTP酶Ras2变体在SEQ ID NO:11的位置16处或对应于SEQ ID NO:11的位置16处包含取代Gly16Val。
6.如权利要求1-5中任一项所述的突变体,其中该GTP酶Ras2变体与SEQ ID NO:11的多肽具有至少70%,例如至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列同一性但小于100%序列同一性。
7.如权利要求1-6中任一项所述的突变体,其中该目的多肽对于该亲本丝状真菌细胞或其突变体是天然的。
8.如权利要求1-6中任一项所述的突变体,其中该目的多肽对于该亲本丝状真菌细胞或其突变体是异源的。
9.如权利要求1-8中任一项所述的突变体,其中该目的多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫调节剂、神经递质、受体、报告蛋白、结构蛋白或转录因子。
10.如权利要求1-8中任一项所述的突变体,其中该目的多肽是纤维素酶。
11.如权利要求10所述的突变体,其中该纤维素酶是内切葡聚糖酶、纤维二糖水解酶或β-葡糖苷酶。
12.如权利要求1-8中任一项所述的突变体,其中该目的多肽是半纤维素酶。
13.如权利要求12所述的突变体,其中该半纤维素酶是木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、或葡糖醛酸糖苷酶。
14.如权利要求1-13中任一项所述的突变体,其中该亲本丝状真菌细胞是枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、脉胞菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、或木霉属细胞。
15.如权利要求14所述的突变体,其中该亲本丝状真菌细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管霉、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、女王杜香金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑根毛霉、嗜热毁丝霉、粗糙脉胞菌、产紫青霉、黄孢平革菌、射脉菌、刺芹侧耳、埃默森篮状菌、土生梭孢霉、长域毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
16.如权利要求1-13中任一项所述的突变体,其中该亲本丝状真菌细胞是木霉属细胞。
17.如权利要求16所述的突变体,其中该木霉属细胞是里氏木霉细胞。
18.如权利要求1-17中任一项所述的突变体,其中与该亲本丝状真菌细胞相比,该突变体在该目的多肽的产生量方面的生产力提高1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、或50%。
19.如权利要求1-17中任一项所述的突变体,其中与该亲本丝状真菌细胞相比,该突变体在该目的多肽的产生量方面的生产力提高至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少11%、至少12%、至少13%、至少14%、至少15%、至少16%、至少17%、至少18%、至少19%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、或至少50%。
20.如权利要求1-19中任一项所述的突变体,其中该突变体在该Rho-GTP酶RacA蛋白的产生方面部分或完全缺陷。
21.一种产生目的多肽的方法,该方法包括在用于产生该目的多肽的培养基中培养如权利要求1-20中任一项所述的突变体丝状真菌细胞。
22.如权利要求21所述的方法,其进一步包括从该培养基回收该目的多肽。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062965752P | 2020-01-24 | 2020-01-24 | |
US62/965,752 | 2020-01-24 | ||
PCT/EP2021/050464 WO2021148278A1 (en) | 2020-01-24 | 2021-01-12 | Mutants of a filamentous fungal cell having increased productivity in the production of a polypeptide |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115052477A true CN115052477A (zh) | 2022-09-13 |
Family
ID=74236140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180007046.4A Pending CN115052477A (zh) | 2020-01-24 | 2021-01-12 | 在多肽生产中具有提高的生产力的丝状真菌细胞的突变体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230242960A1 (zh) |
EP (1) | EP4093188A1 (zh) |
CN (1) | CN115052477A (zh) |
BR (1) | BR112022014573A2 (zh) |
WO (1) | WO2021148278A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110066741B (zh) * | 2019-05-21 | 2023-02-24 | 中国科学院合肥物质科学研究院 | 一种通过形态优化定向提高丝状真菌代谢产量的突变菌株构建方法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
US5989870A (en) | 1986-04-30 | 1999-11-23 | Rohm Enzyme Finland Oy | Method for cloning active promoters |
US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
IL99552A0 (en) | 1990-09-28 | 1992-08-18 | Ixsys Inc | Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof |
DE4343591A1 (de) | 1993-12-21 | 1995-06-22 | Evotec Biosystems Gmbh | Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
CN1192108C (zh) | 1994-06-03 | 2005-03-09 | 诺沃奇梅兹生物技术有限公司 | 纯化的毁丝霉属漆酶及编码该酶的核酸 |
ATE294871T1 (de) | 1994-06-30 | 2005-05-15 | Novozymes Biotech Inc | Nicht-toxisches, nicht-toxigenes, nicht- pathogenes fusarium expressionssystem und darin zu verwendende promotoren und terminatoren |
CN1231588C (zh) | 1996-01-19 | 2005-12-14 | 诺沃奇梅兹生物技术有限公司 | 丝状真菌的形态突变体 |
WO2000024883A1 (en) | 1998-10-26 | 2000-05-04 | Novozymes A/S | Constructing and screening a dna library of interest in filamentous fungal cells |
EP1194572A2 (en) | 1999-03-22 | 2002-04-10 | Novozymes Biotech, Inc. | Promoter sequences derived from fusarium venenatum and uses thereof |
CN1509330A (zh) | 2001-05-18 | 2004-06-30 | ŵ��ø�ɷ�����˾ | 具有纤维二糖酶活性的多肽和编码其的多核苷酸 |
JP2005500841A (ja) | 2001-07-27 | 2005-01-13 | アメリカ合衆国 | オリゴヌクレオチドを用いるインビボ部位指定変異誘発のためのシステム |
EP1702059B1 (en) | 2003-12-09 | 2012-11-14 | Novozymes Inc. | Methods for eliminating or reducing the expression of genes in filamentous fungal strains |
CN105420268A (zh) | 2006-12-21 | 2016-03-23 | 诺维信股份有限公司 | 通过移行rna干扰来降低或消除丝状真菌菌株中的基因表达的方法 |
EP2064323B2 (en) | 2007-05-31 | 2024-06-19 | Novozymes Inc. | Methods of increasing the cellulolytic enhancing activity of a polypeptide |
EP2356242A2 (en) | 2008-09-30 | 2011-08-17 | Novozymes Inc. | Methods for using positively and negatively selectable genes in a filamentous fungal cell |
WO2011075677A2 (en) | 2009-12-18 | 2011-06-23 | Novozymes, Inc. | Methods for producing polypeptides in protease-deficient mutants of trichoderma |
WO2012021395A1 (en) | 2010-08-12 | 2012-02-16 | Novozymes, Inc. | Compositions comprising a polypeptide having cellulolytic enhancing activity and a sulfur-containing compound and uses thereof |
US9150842B2 (en) | 2011-03-09 | 2015-10-06 | Novozymes A/S | Methods of increasing the cellulolytic enhancing activity of a polypeptide |
CN108179139A (zh) | 2011-08-24 | 2018-06-19 | 诺维信股份有限公司 | 纤维素分解酶组合物及其用途 |
US9834804B2 (en) | 2011-12-14 | 2017-12-05 | Iogen Energy Corporation | Fungal cells and fermentation processes |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
-
2021
- 2021-01-12 CN CN202180007046.4A patent/CN115052477A/zh active Pending
- 2021-01-12 BR BR112022014573A patent/BR112022014573A2/pt unknown
- 2021-01-12 US US17/794,408 patent/US20230242960A1/en active Pending
- 2021-01-12 WO PCT/EP2021/050464 patent/WO2021148278A1/en unknown
- 2021-01-12 EP EP21701670.8A patent/EP4093188A1/en active Pending
Non-Patent Citations (9)
Also Published As
Publication number | Publication date |
---|---|
EP4093188A1 (en) | 2022-11-30 |
BR112022014573A2 (pt) | 2022-10-04 |
WO2021148278A1 (en) | 2021-07-29 |
US20230242960A1 (en) | 2023-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2875119T3 (en) | AGSE-DEFICIENT TRIALS | |
CA2834716C (en) | Simultaneous site-specific integrations of multiple gene-copies in filamentous fungi | |
EP2588616B1 (en) | A method for the production of a compound of interest | |
KR20150113170A (ko) | 탄수화물 분해 폴리펩티드 및 이의 용도 | |
JP2011234729A (ja) | 糸状菌の分野における新規発現調節配列および発現産物 | |
WO2014202622A2 (en) | Rasamsonia gene and use thereof | |
EA018840B1 (ru) | Рекомбинантная клетка-хозяин для получения соединения, представляющего интерес | |
US20220064228A1 (en) | Methods For Increasing The Productivity Of A Filamentous Fungal Cell In The Production Of A Polypeptide | |
DK3036324T3 (en) | Regulated PepC expression | |
WO2019046703A1 (en) | METHODS OF ENHANCING GENOME EDITION IN FUNGI | |
CN109661402B (zh) | 真菌的高水平蛋白质生产系统 | |
WO2020112881A1 (en) | Modified filamentous fungal host cells | |
WO2018166943A1 (en) | Zinc binuclear cluster transcriptional regulator-deficient strain | |
EP2714900A1 (en) | Bi-directional cytosine deaminase-encoding selection marker | |
US20230174998A1 (en) | Compositions and methods for enhanced protein production in filamentous fungal cells | |
CN115052477A (zh) | 在多肽生产中具有提高的生产力的丝状真菌细胞的突变体 | |
EP3445776B1 (en) | Rlma-inactivated filamentous fungal host cell | |
WO2014202623A2 (en) | Rasamsonia gene and use thereof | |
WO2022251056A1 (en) | Transcriptional regulators and polynucleotides encoding the same | |
CN110168095A (zh) | 用于使用工程化酵母菌株从含有木糖的纤维素基质生产乙醇的改善方法 | |
WO2014202624A2 (en) | Rasamsonia gene and use thereof | |
RU2771581C1 (ru) | Рекомбинантный штамм дрожжей Komagataella phaffii - продуцент секретируемой эндо-диссоциативной ксилоглюканазы семейства GH74, кодируемой мутированным геном, и способ микробиологического синтеза секретируемой эндо-диссоциативной ксилоглюканазы на основе этого штамма | |
WO2014202621A1 (en) | Carbohydrate degrading polypeptide and uses thereof | |
KR101035731B1 (ko) | 덱스트란수크라제를 생성하지 않는 류코노스톡 균주 및이를 제조하는데 사용한 벡터 | |
WO2003070939A1 (fr) | Fragment d'adn ayant une activite de promoteur |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |