CN117467020A - 一种嵌合型转录激活因子及其应用 - Google Patents
一种嵌合型转录激活因子及其应用 Download PDFInfo
- Publication number
- CN117467020A CN117467020A CN202310940429.8A CN202310940429A CN117467020A CN 117467020 A CN117467020 A CN 117467020A CN 202310940429 A CN202310940429 A CN 202310940429A CN 117467020 A CN117467020 A CN 117467020A
- Authority
- CN
- China
- Prior art keywords
- transcription activator
- amino acids
- activator
- mxr1
- transcription
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000035897 transcription Effects 0.000 title claims abstract description 96
- 238000013518 transcription Methods 0.000 title claims abstract description 96
- 239000012190 activator Substances 0.000 title claims abstract description 69
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 69
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 41
- 230000004568 DNA-binding Effects 0.000 claims abstract description 40
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 claims abstract description 29
- 230000004913 activation Effects 0.000 claims abstract description 19
- 108091006106 transcriptional activators Proteins 0.000 claims description 91
- 150000001413 amino acids Chemical class 0.000 claims description 90
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 claims description 69
- 210000004027 cell Anatomy 0.000 claims description 52
- 101150049281 PRM1 gene Proteins 0.000 claims description 48
- 108010054147 Hemoglobins Proteins 0.000 claims description 38
- 102000001554 Hemoglobins Human genes 0.000 claims description 37
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 35
- 229920001184 polypeptide Polymers 0.000 claims description 33
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 33
- 241000235058 Komagataella pastoris Species 0.000 claims description 31
- 150000007523 nucleic acids Chemical class 0.000 claims description 29
- 102100036826 Aldehyde oxidase Human genes 0.000 claims description 19
- 101000928314 Homo sapiens Aldehyde oxidase Proteins 0.000 claims description 19
- 150000003278 haem Chemical class 0.000 claims description 19
- 102000039446 nucleic acids Human genes 0.000 claims description 19
- 108020004707 nucleic acids Proteins 0.000 claims description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 16
- 230000001939 inductive effect Effects 0.000 claims description 16
- 239000012634 fragment Substances 0.000 claims description 15
- 239000013604 expression vector Substances 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 9
- 101100490563 Caenorhabditis elegans adr-1 gene Proteins 0.000 claims description 8
- 230000006696 biosynthetic metabolic pathway Effects 0.000 claims description 8
- 101000589056 Bos taurus Myoglobin Proteins 0.000 claims description 6
- 102000006395 Globulins Human genes 0.000 claims description 5
- 108010044091 Globulins Proteins 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 5
- 101100494773 Caenorhabditis elegans ctl-2 gene Proteins 0.000 claims description 4
- 101000620266 Candida boidinii Putative peroxiredoxin-A Proteins 0.000 claims description 4
- 101000620273 Candida boidinii Putative peroxiredoxin-B Proteins 0.000 claims description 4
- 101100112369 Fasciola hepatica Cat-1 gene Proteins 0.000 claims description 4
- 101000619805 Homo sapiens Peroxiredoxin-5, mitochondrial Proteins 0.000 claims description 4
- 101100005271 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cat-1 gene Proteins 0.000 claims description 4
- 102100022078 Peroxiredoxin-5, mitochondrial Human genes 0.000 claims description 4
- 101100008874 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DAS2 gene Proteins 0.000 claims description 4
- 210000005253 yeast cell Anatomy 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 3
- 230000014509 gene expression Effects 0.000 abstract description 45
- 230000002708 enhancing effect Effects 0.000 abstract description 3
- 235000001014 amino acid Nutrition 0.000 description 56
- 108091023040 Transcription factor Proteins 0.000 description 40
- 102000040945 Transcription factor Human genes 0.000 description 37
- 235000018102 proteins Nutrition 0.000 description 31
- 235000010469 Glycine max Nutrition 0.000 description 22
- 230000001105 regulatory effect Effects 0.000 description 20
- 238000000855 fermentation Methods 0.000 description 18
- 230000004151 fermentation Effects 0.000 description 18
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 14
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 13
- 244000068988 Glycine max Species 0.000 description 11
- 235000010633 broth Nutrition 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 102000040430 polynucleotide Human genes 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 108020004414 DNA Proteins 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 241000235648 Pichia Species 0.000 description 6
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 230000005026 transcription initiation Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 102000003875 Ferrochelatase Human genes 0.000 description 5
- 108010057394 Ferrochelatase Proteins 0.000 description 5
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 5
- 102100036201 Oxygen-dependent coproporphyrinogen-III oxidase, mitochondrial Human genes 0.000 description 5
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 5
- 108020000963 Uroporphyrinogen-III synthase Proteins 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- ZGXJTSGNIOSYLO-UHFFFAOYSA-N 88755TAZ87 Chemical compound NCC(=O)CCC(O)=O ZGXJTSGNIOSYLO-UHFFFAOYSA-N 0.000 description 4
- -1 CAG Proteins 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 102100028862 Delta-aminolevulinic acid dehydratase Human genes 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000037353 metabolic pathway Effects 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 108010056651 Hydroxymethylbilane synthase Proteins 0.000 description 3
- 101000983164 Mus musculus Proliferation-associated protein 2G4 Proteins 0.000 description 3
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 description 3
- 102100029028 Protoporphyrinogen oxidase Human genes 0.000 description 3
- 102000015437 Uroporphyrinogen decarboxylase Human genes 0.000 description 3
- 108010064762 Uroporphyrinogen decarboxylase Proteins 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 229910052742 iron Inorganic materials 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 108020001580 protein domains Proteins 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 102000003643 uroporphyrinogen-III synthase Human genes 0.000 description 3
- 108010025188 Alcohol oxidase Proteins 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108010094074 Coproporphyrinogen oxidase Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 101001067140 Homo sapiens Porphobilinogen deaminase Proteins 0.000 description 2
- 101000910482 Homo sapiens Uroporphyrinogen decarboxylase Proteins 0.000 description 2
- 108010072970 Porphobilinogen synthase Proteins 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 2
- 102100024118 Uroporphyrinogen decarboxylase Human genes 0.000 description 2
- 102100034397 Uroporphyrinogen-III synthase Human genes 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 101150029559 hph gene Proteins 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N lysine Chemical compound NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 102000018727 5-Aminolevulinate Synthetase Human genes 0.000 description 1
- 108010052384 5-Aminolevulinate Synthetase Proteins 0.000 description 1
- 101710084741 5-aminolevulinate synthase Proteins 0.000 description 1
- 101710188223 5-aminolevulinate synthase, mitochondrial Proteins 0.000 description 1
- 102100030755 5-aminolevulinate synthase, nonspecific, mitochondrial Human genes 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 101710134307 Coproporphyrinogen III oxidase Proteins 0.000 description 1
- 102100030801 Elongation factor 1-alpha 1 Human genes 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000843649 Homo sapiens 5-aminolevulinate synthase, nonspecific, mitochondrial Proteins 0.000 description 1
- 101000920078 Homo sapiens Elongation factor 1-alpha 1 Proteins 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 108010063653 Leghemoglobin Proteins 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102000010750 Metalloproteins Human genes 0.000 description 1
- 108010063312 Metalloproteins Proteins 0.000 description 1
- 108010062374 Myoglobin Proteins 0.000 description 1
- 102100030856 Myoglobin Human genes 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 241001452677 Ogataea methanolica Species 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 101800001701 Saposin-C Proteins 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 241000713880 Spleen focus-forming virus Species 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000499912 Trichoderma reesei Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 108010084455 Zeocin Proteins 0.000 description 1
- 241000222124 [Candida] boidinii Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- FRHBOQMZUOWXQL-UHFFFAOYSA-L ammonium ferric citrate Chemical compound [NH4+].[Fe+3].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O FRHBOQMZUOWXQL-UHFFFAOYSA-L 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000007398 colorimetric assay Methods 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000012502 diagnostic product Substances 0.000 description 1
- 229940124645 emergency medicine Drugs 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 229960004642 ferric ammonium citrate Drugs 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000004313 iron ammonium citrate Substances 0.000 description 1
- 235000000011 iron ammonium citrate Nutrition 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 101150048352 mazF gene Proteins 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 150000004032 porphyrins Chemical group 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000013930 proline Nutrition 0.000 description 1
- 150000003148 prolines Chemical class 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- VNOYUJKHFWYWIR-ITIYDSSPSA-N succinyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 VNOYUJKHFWYWIR-ITIYDSSPSA-N 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
- C07K14/4705—Regulators; Modulating activity stimulating, promoting or activating activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/795—Porphyrin- or corrin-ring-containing peptides
- C07K14/805—Haemoglobins; Myoglobins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/84—Pichia
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Mycology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本文提供了用于甲醇诱导型启动子的嵌合型转录激活因子,其至少包括第一部分和第二部分,其中:1)所述第一部分包括:i)DNA结合结构域;或ii)DNA结合结构域和第一转录激活结构域;以及2)所述第二部分包括至少一个第二转录激活结构域。本文还提供了所述嵌合型转录激活因子在宿主细胞中增强外源蛋白的表达量的应用。
Description
相关申请的交叉引用
本申请要求2022年7月29日提交的中国专利申请CN202210910746.0的优先权,在此通过引用将其全文并入本文。
技术领域
本文涉及嵌合型转录激活因子,尤其是能够促进毕赤酵母AOX1启动子转录的嵌合型转录激活因子。本文还涉及该嵌合型转录激活因子在毕赤酵母中增强目的蛋白(如血红蛋白)表达的应用。
背景技术
血红蛋白是一类存在于原核和真核细胞中的以血红素为辅基的含铁金属蛋白,在生物体内具有运输和储存氧、调节胞内pH值、调控生理代谢等诸多重要功能。近年来,血红蛋白已经被应用于急诊医学(作为无细胞氧载体)、医疗保健(作为铁补给剂)以及食品加工(人造肉的食品级着色和调味剂)等领域。但血红蛋白的获取依然需要依靠从血液或植物组织中提取,提取法不仅费时低效、并且所用化学试剂还易造成环境污染。因此,以微生物细胞工厂为平台来合成不同来源的血红蛋白已经成为近年来的研究热点。
毕赤酵母(Pichia pastoris)是常用的高效蛋白表达系统,具有表达量高、低蛋白糖基化和高密度培养等优势,被广泛应用于食品和制药领域。毕赤酵母能够利用甲醇作为唯一碳源进行生长,其甲醇利用途径中的醇氧化酶AOX1,占毕赤酵母表达总蛋白的30%,因此AOX1启动子是非常强的甲醇诱导型启动子,常被用来实现异源蛋白的高效表达。已有报道毕赤酵母甲醇代谢途径中重要的转录激活因子有3个,分别是Mxr1、Mit1和Prm1。这3个转录因子结合在AOX1启动子的不同基序上,协同调控转录激活。
已有专利US10273492报道在毕赤酵母中通过AOX1启动子与Mxr1编码序列连接以表达Mxr1,能够提高豆血红蛋白表达。但为了降低成本,需要进一步提高表达量。
发明内容
在一方面,本文提供了嵌合型转录激活因子,其至少包括第一部分和第二部分,其中:
1)所述第一部分包括:
i)DNA结合结构域;或
ii)DNA结合结构域和第一转录激活结构域;以及
2)所述第二部分包括至少一个第二转录激活结构域。
在一些实施方案中,所述第一部分的C末端直接或通过连接分子间接与所述第二部分的N末端连接。
在一些实施方案中,所述DNA结合结构域和所述第二转录激活结构域来自不同的转录激活因子。
在一些实施方案中,所述DNA结合结构域和所述第一转录激活结构域来自相同的转录激活因子。
在一些实施方案中,所述DNA结合结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体,优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。
在一些实施方案中,所述第一转录激活结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体,优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。
在一些实施方案中,所述转录激活因子Mxr1包括SEQ ID NO:10所示序列;所述转录激活因子Mit1包括SEQ ID NO:11所示序列;所述转录激活因子Prm1包括SEQ ID NO:12所示序列。
在一些实施方案中,所述DNA结合结构域包括所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1的第1-104位氨基酸或所述转录激活因子Prm1的第1-89位氨基酸。
在一些实施方案中,所述DNA结合结构域与所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1的第1-104位氨基酸或所述转录激活因子Prm1的第1-89位氨基酸具有至少50%、60%、70%、80%、90%、92%、95%、98%、或99%序列一致性。
在一些实施方案中,所述第一转录激活结构域包括所述转录激活因子Mxr1的第92-1155位氨基酸、转录激活因子Mxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。
在一些实施方案中,所述第一转录激活结构域与所述转录激活因子Mxr1的第92-1155位氨基酸、转录激活因子Mxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸具有至少50%、60%、70%、80%、90%、92%、95%、98%、或99%序列一致性。
在一些实施方案中,所述第一部分包括所述转录激活因子Mxr1、所述转录激活因子Mxr1的第1-400位氨基酸、所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1、所述转录激活因子Mit1的第1-104位氨基酸、所述转录激活因子Prm1或所述转录激活因子Prm1的第1-89位氨基酸。
在一些实施方案中,所述第二转录激活结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体,优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。
在一些实施方案中,所述第二转录激活结构域包括转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。
在一些实施方案中,所述第二转录激活结构域与所述转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸具有至少50%、60%、70%、80%、90%、92%、95%、98%、或99%序列一致性。
在一些实施方案中,所述第二部分包括转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。
在一些实施方案中,所述嵌合型转录激活因子包括SEQ ID NO:14-25任一项所示序列。
另一方面,本文提供了分离的核酸分子,其包括上述嵌合型转录激活因子的编码核酸序列。
另一方面,本文提供了表达载体,其包括上述核酸分子。
在一些实施方案中,所述表达载体在所述表达载体中所述编码核酸序列与甲醇诱导型启动子可操作地连接。
在一些实施方案中,所述甲醇诱导型启动子包括AOX1、DAS1、DAS2、CAT1、PMP20启动子或它们的突变体,优选AOX1启动子。
另一方面,本文提供了宿主细胞,其包括上述核酸分子或表达载体。
另一方面,本文提供了宿主细胞,其表达上述嵌合型转录激活因子。
在一些实施方案中,所述宿主细胞还包括编码与甲醇诱导型启动子可操作地连接的异源多肽的核酸序列。
在一些实施方案中,所述异源多肽来自PF00042球蛋白家族。
在一些实施方案中,所述异源多肽为血红蛋白,优选大豆血红蛋白LegH或牛肌红蛋白。
在一些实施方案中,所述异源多肽包括SEQ ID NO:9或SEQ ID NO:26所示序列。
在一些实施方案中,所述宿主细胞还包括编码可与所述甲醇诱导型启动子可操作地连接的参与血红素生物合成途径的至少一种多肽。
在一些实施方案中,所述宿主细胞为酵母细胞,优选毕赤酵母,更优选毕赤酵母X-33菌株。
另一方面,本文提供了制备目的蛋白的方法,包括培养上述宿主细胞并分离所述目的蛋白。
在一些实施方案中,所述宿主细胞为毕赤酵母,在培养所述宿主细胞过程中包括向培养液中添加甲醇。
在一些实施方案中,所述目的蛋白为来自PF00042球蛋白家族的蛋白。
在一些实施方案中,所述目的蛋白为血红蛋白,优选大豆血红蛋白LegH或牛肌红蛋白。
附图说明
图1为血红素生物合成途径示意图。
图2为构建大豆血红蛋白表达菌株的质粒示意图。
图3为各菌株摇瓶发酵的SDS-PAGE凝胶图。M:Marker;1-2:TF624;3-5:TF625;6:TF626;7:TF627;8:TF628;9-10:TF629;11-12:M202;13:TF720;14:TF721;15-16:TF722;17-18:TF723;19-20:TF724;21-22:TF725;23:TF726;24:TF727;25:TF728;26:TF729;27-28:TF730;29:TF731;30-31:L528。
图4为显示各菌株摇瓶发酵后发酵液颜色的照片。
图5为pUC57-pAOX1-Mxr1-hph表达质粒示意图。
具体实施方式
除非另有说明,本文使用的所有技术和科学术语具有本领域普通技术人员所通常理解的含义。
术语“或”是指列举的可选择要素中的单个要素,除非上下文明确地另外指出。术语“和/或”是指所列举的可选择要素中的任意一个、任意两个、任意三个、任意更多个或其全部。
本文所用术语“约”表示给定数值的±10%范围内的值。
本文所用术语“包括”、“含有”、“具有”以及类似的表述表示不排除未列举的要素。这些术语也包括仅由所列举的要素组成的情形。
“启动子(promoter)”是RNA聚合酶识别、结合和开始转录的一段DNA序列,它含有RNA聚合酶特异性结合和转录起始所需的保守序列,多数位于结构基因转录起始点的上游,启动子本身不被转录。常见启动子的实例包括但不限于CMV、EF1A、CAG、CBh、SFFV、T7启动子等。启动子可包括核心启动子和调控序列。核心启动子意指起始转录所需的最低限度序列,例如称为TATA盒的序列,该TATA盒是编码蛋白质的基因中的大多数启动子所共有的;调控序列可包括转录激活因子或阻遏物可识别和结合的DNA片段,在它们与调控序列部分结合后可影响启动子的转录起始速率。
“诱导型启动子”,也称为“调控型启动子”,指细胞或组织响应内源或外源刺激的存在例如通过化合物(化学诱导剂)处理,或响应环境(营养物质或碳源变化)、激素或发育信号等,选择性表达编码序列或功能RNA的启动子。换言之,诱导型启动子在特定条件下才启动(或增强)与其可操作地连接的编码序列的转录。诱导型启动子的一个实例为毕赤酵母的醇氧化酶AOX1,其在培养基中存在甲醇时才激活该启动子。在本文中,将由于甲醇的存在才启动相关基因表达的启动子称为甲醇诱导型启动子。甲醇诱导型启动子的实例包括AOX1、DAS1、DAS2、CAT1或PMP20启动子,尤其是AOX1启动子。与诱导型启动子相对应的是“组成型启动子”,其相对稳定地进行相关基因的表达。
“可操作地连接”指调控序列与其调控对象的连接方式使得调控序列能够对其调控对象发挥作用。例如,启动子与目的基因“可操作地连接”指启动子可驱动目的基因从准确起始位点的开始转录;调控序列与核心启动子“可操作地连接”指调控序列可控制核心启动子的转录起始速率。
“连接分子”是指一段短肽序列,能够将两个或多个蛋白质结构域连接起来,并保持蛋白质结构域之间某种最小距离或其他空间关系,此外一般没有特定的生物活性。常见的连接分子根据结构可以分为三类:柔性连接分子、刚性连接分子和可被切割的连接分子。本发明中不可以使用可被切割的连接分子。本发明中使用的是通常胞内不可被切割的连接分子。柔性连接分子通常包含非极性氨基酸如甘氨酸或极性氨基酸如丝氨酸或苏氨酸。常见的柔性连接分子包括:(GGGGS)n(SEQ ID NO:27)、(G)n、(G)8、GSAGSAAGSGEF(SEQ ID NO:28)、KESGSVSSEQLAQFRSLD(SEQ ID NO:29)或EGKSSGSGSESKST(SEQ ID NO:30),其中n代表前面括号中氨基酸重复的个数。刚性连接分子通常含有α-螺旋结构或者含有多个脯氨酸,以形成相对刚性的结构。常见的刚性连接分子包括:(EAAAK)n(SEQ ID NO:31)或(XP)n,其中n代表前面括号中氨基酸重复的个数,X代表任何氨基酸,优选丙氨酸、赖氨酸或谷氨酸。
“转录激活因子识别结合位点”指DNA分子上的一段核苷酸序列,转录因子可识别并与其结合。转录激活因子与其结合后,有助于与其他蛋白(如RNA聚合酶)一起形成转录起始复合物,启动转录过程。“转录激活因子识别结合位点”可认为是启动子的调控序列的一部分。
“结构域(domain)”指蛋白或多肽中介于二级和三级结构之间的一种结构层次,为可区分开的紧密球状结构区域。对于较小的蛋白或蛋白亚基来说,结构域和它的三级结构往往是一个意思,也就是说这些蛋白或亚基是单结构域。对于较大的蛋白结构域,可能或包括两个或更多个结构域。结构域自身可以是紧密装配的,但结构域与结构域之间关系相对松懈。结构域与结构域之间常常有一段长短不等的肽链相连,形成所谓铰链区。不同蛋白中结构域的数目不同,同一蛋白质分子中的几个结构域彼此相似或很不相同。常见结构域的氨基酸残基数在100-400个之间,最小的结构域只有40-50个氨基酸残基,大的结构域可超过400个氨基酸残基。
“转录激活因子”在本文中指可以与启动子上的部分DNA序列结合并由此激活或增强启动子的转录活性的蛋白(包括融合蛋白)或多肽。转录激活因子可以单独地或者与其他蛋白或多肽结合后激活或增强启动子的转录活性。在一些实例中,转录激活因子可包括至少两个结构域:DNA结合结构域,用于与启动子上的调控序列结合;转录激活结构域,用于激活或增强启动子的转录起始速率。酵母细胞中的转录激活因子例如可包括Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1等。在一些实施例中,转录激活因子可与甲醇诱导型启动子可操作性地连接,甲醇诱导型启动子包括AOX1、DAS1、DAS2、CAT1或PMP20启动子,尤其是AOX1启动子。
“嵌合型转录激活因子”在本文中指这样的转录激活因子,其包括DNA结合结构域和一个或更多个转录激活结构域,其中至少一个结构域与另外的结构域并非天然存在于同一转录激活因子中。例如,转录激活因子X包括DNA结合结构域A1和转录激活B1,转录激活因子Y包括DNA结合结构域A2和转录激活B2,则包括A1结构域和B2结构域的转录激活因子、包括A1结构域、B1结构域和B2结构域的转录激活因子、包括A2结构域和B1结构域的转录激活因子、包括A2结构域、B1结构域和B2结构域的转录激活因子都可以认为是嵌合型转录激活因子。在本文的一些实施方案中,嵌合型转录激活因子所包括的DNA结合结构域和转录激活结构域是来自毕赤酵母的转录激活因子。可以设想,转录因子可以在广泛存在于不同的宿主细胞中。因此,这些DNA结合结构域和转录激活结构域有可能取自或衍生自其它原核生物或真核生物,而不是采用特定种或属的天然序列。优选地,这些转录激活因子序列可以取自或衍生自真菌宿主细胞,更优选地取自或衍生自比如巴斯德毕赤酵母、多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种和粟酒裂殖酵母的酵母宿主细胞等。在一些实施方案中,嵌合型转录激活因子的DNA结合结构域和转录激活结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2或Mpp1。优选地,嵌合型转录激活因子的DNA结合结构域包括转录激活因子Mxr1的第1-91位氨基酸、转录激活因子Mit1的第1-104位氨基酸或转录激活因子Prm1的第1-89位氨基酸,或为它们的功能性变体。优选地,转录激活结构域包括转录激活因子Mxr1的第92-1155位氨基酸、转录激活因子Mxr1的第92-400位氨基酸、转录激活因子Mit1的第105-888位氨基酸、转录激活因子Prm1的第90-989位氨基酸,或为它们的功能性变体。
“功能性变体”和“突变体”在本文中可互换使用,指在原始序列(例如天然序列)或本文提供的序列基础上包括了少许改动(例如氨基酸或核苷酸删除、添加或替换)后获得的蛋白或核苷酸变体,其仍然保留了亲本序列的全部或至少部分功能。例如,功能性变体可以与亲本序列具有至少约50%、60%、70%、80%、90%、92%、95%、98%、或99%序列一致性,并且可保留亲本序列某种活性的约50%、60%、70%、80%、90%、100%或甚至具有高于亲本序列的活性。“功能性变体”或“突变体”可以是人工产生的(如通过基因操作),或者是自然界自然产生的(如群体中的蛋白多态性或不同物种中存在的同源蛋白)。另外,“功能性变体”或“突变体”还可以是原始序列的功能性片段,例如保留了所关注的功能的最小片段,例如具有DNA结合能力的DNA结合结构域。在本文中,当提及特定的氨基酸或核苷酸序列时,应意识到其可涵盖这些氨基酸或核苷酸序列功能性变体或突变体,除非上下文另有说明或暗示。
当提及氨基酸或核苷酸序列时,术语“序列一致性(sequence identity)”(也称为“序列同一性”)指两氨基酸或核苷酸序列(例如查询序列和参照序列)之间一致性程度的量,一般以百分比表示。通常,在计算两氨基酸或核苷酸序列之间的一致性百分比之前,先进行序列比对(alignment)并引入缺口(gap)(如果有的话)。如果在某个比对位置,两序列中的氨基酸残基或碱基相同,则认为两序列在该位置一致或匹配;两序列中的氨基酸残基或碱基不同,则认为在该位置不一致或错配。在一些算法中,用匹配位置数除以比对窗口中的位置总数以获得序列一致性。在另一些算法中,还将缺口数量和/或缺口长度考虑在内。常用的序列对比算法或软件包括DANMAN、CLUSTALW、MAFFT、BLAST、MUSCLE等。出于本发明的目的,可以采用公开的比对软件BLAST(可从https://www.ncbi.nlm.nih.gov/获得),通过使用缺省设置来获得最佳序列比对并计算出两氨基酸或核苷酸序列之间的序列一致性。
“核酸分子”、“核酸”和“多核苷酸”在本文中可互换使用,指核苷酸聚合物。此类核苷酸聚合物可含有天然和/或非天然核苷酸且包括(但不限于)DNA、RNA和PNA。“核酸序列”指包含于核酸分子或多核苷酸中的核苷酸线性序列。对于DNA分子来说,由于双链互补,在本文提及其中一条链的序列时,本领域技术人员应意识到已同时提及其互补链或包括其互补链的双链DNA分子。
在本文中,“分离的核酸分子”指经过提取或纯化的核酸分子,也包括人工合成的核酸分子。例如,其可以是通过以下方法产生或合成的:(i)在体外扩增的,例如通过聚合酶链式反应(PCR)扩增产生的,(ii)通过克隆重组产生的,(iii)纯化的,例如通过酶切和凝胶电泳分级分离,或者(iv)合成的,例如通过化学合成。在某些实施方式中,所述分离的核酸分子是通过重组DNA技术制备的核酸分子。
“载体”指可经工程改造以含有目的多核苷酸(例如目的多肽的编码序列)的核酸分子或可在宿主细胞中复制的核酸分子(例如,核酸、质粒、或病毒等)。载体可包括以下组件中的一个或更多个:复制起点、一或更多个调控目的多核苷酸的表达的调控序列、增强子、启动子和/或一个或更多个可选择标记物基因(诸如抗生素抗性基因和可用于比色分析中的基因,例如β-半乳糖)。术语“表达载体”指用于在宿主细胞中表达目基因的载体。
“宿主细胞”指可为或已为载体或经分离多核苷酸的接受体的细胞。宿主细胞可为原核细胞或真核细胞。示例性真核细胞包括哺乳动物细胞,诸如灵长类动物或非灵长类动物细胞;真菌细胞,诸如酵母;植物细胞;以及昆虫细胞。宿主细胞包括单个宿主细胞的后代,且后代可能由于自然、偶然或故意突变而不一定与原始母细胞完全一致(在形态或基因组DNA互补方面)。宿主细胞也包括在活体内经本文提供的核酸分子或表达载体转染的细胞。
“目的基因”是指编码RNA或蛋白质产物的多核苷酸序列,所述多核苷酸序列可以根据所需目的引入到细胞或个体中,并且能够在适合条件下表达。目的基因可以编码感兴趣的产物,例如感兴趣的治疗性或诊断性产物。目的基因编码的蛋白产物称为目的蛋白。目的蛋白通常是异源多肽或外源多肽,即宿主细胞中通常并不表达该异源多肽或外源多肽,而是经人工工程化该宿主细胞后使得该异源多肽或外源多肽能够在其中表达。
“异源多肽”指相对于基因组或生物基因组不是天然的任何核酸序列编码的多肽。在本发明中,所述异源多肽可以来自PF00042(Pfam数据库蛋白家族ID号)球蛋白家族成员。在本发明的一些实施方案中,宿主细胞可存在编码大豆(Glycine max)豆血红蛋白LegH的多肽或编码牛(Bos taurus)肌红蛋白的多肽序列。所述异源多肽可以在甲基营养型酵母菌株中表达,并可以与甲醇诱导型或组成型的启动子或其元件结合以进一步增强异源核酸的表达。
“外源多肽”或“外源蛋白”是指从外部来源引入到细胞基因组的任何核酸序列编码的多肽,其中所述外部来源可以是相同或不同的生物体或合成产生的多肽。例如外源多肽可以是来自一种微生物(例如甲基营养型酵母的一个属或一种)的多肽,其被引入到不同的属或种的甲基营养型酵母中,然而,外源多肽也可以是来自甲基营养型酵母的多肽,尽管存在相应的天然核酸序列,但其作为额外拷贝被重组导入到甲基营养型酵母中。本发明中参与血红素辅因子生物合成途径的8个酶的编码核酸序列是巴斯德毕赤酵母的内源基因,包括5-氨基酮戊酸合成酶,胆色素原合成酶,胆色素原脱氨酶,尿卟啉原III合成酶,尿卟啉原脱羧酶,粪卟啉原氧化酶,原卟啉原氧化酶,和亚铁螯合酶,通过重组外源表达这8个酶基因并整合到毕赤酵母中进一步增强核酸的表达被认为是外源的。
毕赤酵母嵌合型转录因子报道较少,本发明设计了多种人造嵌合型转录因子,测试不同嵌合型转录因子是否具有活性,并筛选出了最有利于蛋白表达的人造转录因子,对于进一步提高异源蛋白的表达具有重要意义。
本发明设计了多组嵌合型转录激活因子,转化到含有血红素合成途径的血红蛋白表达菌株中,与pAOX1-Mxr1比较,筛选得到的嵌合型转录激活因子Mxr1D-Mit1AD、Mxr1D-Prm1AD等能够进一步提高血红蛋白的表达。
本发明部分地基于这一惊人发现,即发现在宿主细胞(如毕赤酵母)中本文所述的至少一种嵌合型转录因子的表达(或过表达)使重组目标蛋白(外源蛋白,如大豆血红蛋白或牛肌红蛋白)的产量增加。因此,在一方面,本文提供了新的嵌合型转录激活因子;另一方面,本文提供了增加宿主细胞中外源蛋白的产量的方法,包括在该宿主细胞中表达这些嵌合型转录激活因子中的一种或更多种。与不表达编码这些嵌合型转录激活因子的多核苷酸的宿主细胞相比,表达编码这些嵌合型转录激活因子的多核苷酸的宿主细胞使外源蛋白的产量增加。另外,本发明人还发现,在宿主细胞中过表达血红素有助于诸如大豆血红蛋白或牛肌红蛋白的外源蛋白更好地在新生蛋白中结合血红素。
实施例1将血红素途径导入毕赤酵母基因组
血红素由卟啉环和铁离子组成。血红素作为血红蛋白的重要组成部分,与珠蛋白通过共价连接组成完整的血红蛋白。为了得到高产的血红蛋白,细胞内需要有足够的血红素,用于合成血红蛋白。酿酒酵母S.cerevisiae血红素生物合成途径已有报道(如图1),包含8个酶,5-氨基酮戊酸合成酶(ALA synthase,ALAS),胆色素原合成酶(porphobilinogensynthase,PBGS),胆色素原脱氨酶(porphobilinogen deaminase,PBGD),尿卟啉原III合成酶(uroporphyrinogen III synthase,UROS),尿卟啉原脱羧酶(uroporphyrinogen IIIdecarboxylase,UROD),粪卟啉原氧化酶(coproporphyrinogen III oxidase,CPO),原卟啉原氧化酶(protoporphyrinogen oxidase,PPO),和亚铁螯合酶(ferrochelatase,FECH)。ALA synthase将前体物质L-甘氨酸和琥珀酰辅酶A合成关键前体5-氨基酮戊酸(5-aminolevulinate,ALA)之后经过上述多个酶催化作用合成血红素。在NCBI中搜索毕赤酵母基因组中血红素生物合成途径的8个酶基因,序列见SEQ ID NO:1-8。
将血红素生物合成途径的8个酶基因整合到毕赤酵母基因组中。以毕赤酵母X-33基因组为模板分别扩增血红素生物合成途径8个酶相关基因,通过酶切连接将上述基因分别与AOX1启动子和FDHI终止子或者actin终止子连接组成表达盒,将上述8个基因分为4组,ALAS和PBGD、PPO和FECH、UROS和PBGS、UROD和CPO,将每两个表达盒串联后,分别与上下游同源臂、正向筛选标记Zeocin抗性基因和反向筛选标记mazF基因连接,组装到pUC57质粒上,得到血红素合成途径表达质粒。通过酵母同源重组,分4次将血红素合成途径8个基因整合到毕赤酵母X-33菌株基因组上,得到血红素生物合成途径加强的毕赤酵母菌株HEM201。
实施例2构建毕赤酵母大豆血红蛋白表达菌株
大豆血红蛋白基因LegH(SEQ ID NO:9)连接至pPIZa表达载体中(如图2),SacI线性化后转入实施例1中的毕赤酵母菌株HEM201,得到大豆血红蛋白表达菌株L528。
毕赤酵母重组菌株L528摇瓶发酵(50mL/250mL)验证血红蛋白表达情况:
将构建好的菌株进行划线培养,培养2~3天至长出单菌落。挑取单菌落,接种至YPD培养基(50mL/250mL)中,30℃、100~600rpm摇至OD600=2~6;4℃、1500~3000g离心5~10min,生理盐水洗涤细胞两次,去除培养基中的葡萄糖。离心后的全部菌体用50mL BMMY培养基重悬,在30℃、250rpm下发酵(发酵初在培养基中添加终浓度为20mg/L的血红素),每24h添加至发酵液终浓度为1%甲醇+0.1mM柠檬酸铁铵以继续诱导,120h取发酵液进行分析。
摇瓶发酵结果显示大豆血红蛋白有表达,SDS-PAGE胶中有显著条带(如图3),发酵液呈粉红色(如图4)。
实施例3在毕赤酵母大豆血红蛋白表达菌株中导入已知酵母转录因子
构建毕赤酵母甲醇代谢途径转录激活因子Mxr1(SEQ ID NO:10)的表达载体pMxr1。以毕赤酵母X-33基因组为模板扩增Mxr1基因,并通过overlap PCR,将Mxr1基因连接到AOX1启动子和FDH终止子之间,组成Mxr1表达盒。将Mxr1表达盒与HIS基因上游位置的上下游同源臂以及潮霉素hph基因连接到pUC57质粒上,得到Mxr1表达载体pUC57-pAOX1-Mxr1-hph(如图5)。
用限制性内切酶NheI线性化质粒pUC57-pAOX1-Mxr1-hph,转化大豆血红蛋白表达菌株L528,将AOX1启动子调控的Mxr1基因插入到毕赤酵母基因组HIS基因位置的上游,得到Mxr1基因加强的大豆血红蛋白表达菌株M202。
摇瓶发酵结果SDS-PAGE胶图显示M202菌株大豆血红蛋白表达量比L528菌株提高(如图3),发酵液呈红色(如图4)。
除了转录因子Mxr1,其他的甲醇代谢途径转录激活因子也可能有利于提高大豆血红蛋白表达和发酵液变红。分别选取毕赤酵母甲醇代谢途径中另外2个重要转录因子Mit1和Prm1,以及H.polymorpha的转录因子Mpp1进行表达(SEQ ID NO:11-13)。菌株构建方法与菌株M202相同。分别用AOX1启动子和GAP启动子调控转录因子的表达,构建表达盒。将不同转录因子的表达盒与HIS基因上游位置上下游同源臂以及潮霉素hph基因连接到pUC57质粒上,得到不同转录因子表达载体pTF624-pTF629(如表1所示)。
载体用限制性内切酶NheI线性化后转化大豆血红蛋白表达菌株L528,将AOX1启动子调控的不同转录因子基因插入到毕赤酵母基因组HIS基因位置上游,得到转录因子基因加强的大豆血红蛋白表达菌株TF624-TF629。
按照实施例2中摇瓶发酵方法验证血红蛋白表达情况,摇瓶发酵结果SDS-PAGE胶图显示大豆血红蛋白TF624-TF629的菌株表达量没有M202菌株高(如图3),除了TF624和TF625发酵液红色与M202接近,其他菌株发酵液呈浅红色和浅黄色(如图4)。
实施例4在毕赤酵母大豆血红蛋白表达菌株中导入嵌合型酵母转录因子
根据文献报道和NCBI BLAST分析得到毕赤酵母3个重要转录因子Mxr1,Mit1,Prm1的DNA结合结构域DBD和转录激活结构域TAD氨基酸序列,并将其重新组合,其中有报道Mxr1的1-400位氨基酸(mMxr1)能够保留Mxr1的完整功能,Mxr1的DNA结合结构域Mxr1D为第1-91位氨基酸,转录激活结构域mMxr1AD为第92-400位氨基酸;Mit1的DNA结合结构域Mit1D为第1-104位氨基酸,转录激活结构域Mit1AD为第105-888位氨基酸;Prm1的DNA结合结构域Prm1D为第1-89位氨基酸,转录激活结构域Prm1AD为第90-989位氨基酸;
将不同的DNA结合结构域和转录激活结构域重新组合,得到多个新的嵌合型转录因子序列。嵌合型转录因子构建如下:
将截短的mMxr1与截短的Mxr1转录激活结构域mMxr1AD用GGGGS linker连接,进一步提高转录激活效果,得到嵌合型转录因子mMxr1-mMxr1AD(SEQ ID NO:14);
将Mxr1与Prm1转录激活结构域Prm1AD用GGGGS linker连接,进一步提高转录激活效果,得到嵌合型转录因子Mxr1-Prm1AD(SEQ ID NO:15);
将Mxr1的DNA结合结构域Mxr1D与Mit1的转录激活结构域Mit1AD用GGGGS linker连接,得到嵌合型转录因子Mxr1D-Mit1AD(SEQ ID NO:16);
将Mxr1的DNA结合结构域Mxr1D与Prm1的转录激活结构域Prm1AD用GGGGS linker连接,得到嵌合型转录因子Mxr1D-Prm1AD(SEQ ID NO:17);
将Mit1与截短的mMxr1转录激活结构域mMxr1AD用GGGGS linker连接,进一步提高转录激活效果,得到嵌合型转录因子Mit1-mMxr1AD(SEQ ID NO:18);
将Mit1的DNA结合结构域Mit1D与截短的mMxr1转录激活结构域mMxr1AD用GGGGSlinker连接,进一步提高转录激活效果,得到嵌合型转录因子Mit1D-mMxr1AD(SEQ ID NO:19);
将Mit1的DNA结合结构域Mit1D与Mxr1的转录激活结构域Mxr1AD用GGGGS linker连接,得到嵌合型转录因子Mit1D-Mxr1AD(SEQ ID NO:20);
将Mit1的DNA结合结构域Mit1D与Prm1的转录激活结构域Prm1AD用GGGGS linker连接,得到嵌合型转录因子Mit1D-Prm1AD(SEQ ID NO:21);
将Prm1与截短的mMxr1转录激活结构域mMxr1AD用GGGGS linker连接,进一步提高转录激活效果,得到嵌合型转录因子Prm1-mMxr1AD(SEQ ID NO:22);
将Prm1的DNA结合结构域Prm1D与截短的mMxr1转录激活结构域mMxr1AD用GGGGSlinker连接,进一步提高转录激活效果,得到嵌合型转录因子Prm1D-mMxr1AD(SEQ ID NO:23);
将Prm1的DNA结合结构域Prm1D与Mxr1的转录激活结构域Mxr1AD用GGGGS linker连接,得到嵌合型转录因子Prm1D-Mxr1AD(SEQ ID NO:24);
将Prm1的DNA结合结构域Prm1D与Mit1的转录激活结构域Mit1AD用GGGGS linker连接,得到嵌合型转录因子Prm1D-Mit1AD(SEQ ID NO:25);
将上述转录因子替换pUC57-pAOX1-Mxr1-hph中的Mxr1基因,得到含有不同嵌合型转录因子的载体质粒pTF720-pTF731(如表1所示)。上述载体质粒用限制性内切酶NheI线性化后转化大豆血红蛋白表达菌株L528,将AOX1启动子调控的不同嵌合型转录因子基因插入到毕赤酵母基因组HIS基因位置上游,得到对应含有嵌合型转录因子的大豆血红蛋白表达菌株TF720-TF731。
按照实施例2中摇瓶发酵方法验证血红蛋白的表达情况,与M202菌株相比,TF722-TF723菌株的表达量有所提高,而且发酵液的颜色比M202菌株颜色更红。TF730-TF731菌株的表达量与M202菌株表达量相当,但发酵液的颜色不如M202的颜色,而含有其他嵌合型的转录因子的菌株的表达量和发酵液颜色均没有M202的效果好(如图3和图4)。实验结果表明Mxr1D-Mit1AD、Mxr1D-Prm1AD嵌合型转录因子的表达效果优于Mxr1的表达,更优于其他嵌合型转录因子的表达效果。
表1含有不同嵌合型转录因子质粒
/>
各菌株的摇瓶发酵结果蛋白表达量和发酵液颜色的强弱如表2所示,“+”号越多代表蛋白表达量越高,发酵液颜色越红。
表2摇瓶发酵结果
本文中提到的一些氨基酸序列如下:
>1ALAS
MEFVARQSMNACPFVRSTSTHHLKKLAANSSLAATASHCPVVGPALQQQRYYSQPSKPAQAQTSDIATGIKKDVSPIRMDSNETAFDYNGMYESDLANKRKDNSYRYFNNINRLAKEFPKAHRQTEDDKVTVWCSNDYLGMGRHPEIIKTMKATMDKYGSGAGGTRNIAGHNHAAINLESELACLNKKEAALVFSSCFIANDAIISLLGQKIKNLVIFSDQSNHASMILGVRNSKAKKHIFKHNNLKDLESQLAQYPKSTPKLIAFESVYSMCGSVAPIEKICDLAKRYGALTFLDEVHAVGMYGPHGQGVAEHLDFDLHLQSGIASPSVVDKRTILDRVDMITGTCGKSFGTVGGYVAGSANLIDWLRSYAPGFIFTTTLPPAIMAGTATSVRIVRADIEARIKQQLNTRYVKDSFENLGIPVIPNPSHIVPVLVGNAADAKKASDMLMNKHRIYVQAINYPTVPVGEERLRITPTPGHGKEICDQLISAVDDVFTELNLPRINKWQSQGGHCGVGDANYVPEPNLWTQDQLSLTNQDLHSNVHNPVIEQIETSSGVRL*(SEQ ID NO:1)
>2PBGS
MVHKAEYLDDHPTQISSILSGGYNHPLLREWQHERQLNKNMFIFPLFVTDRPDEEELIPSLPNIKRFGVNKLIPYVGGLVSKGLRAVILFGVPLKPGVKDEEGTAADDPEGPVIQAIKHLRKNFPDLYIITDVCLCEYTSHGHCGILYEDGTINRELSVRRIAAVAVKYAQAGANSVAPSDMTDGRIRDIKEGLLSAGLAHKTFVMSYAAKFSGNLYGPFRDAAGSCPSQGDRKCYQLPSGGKGLAHRALIRDMNEGTDGIIVKPSTFYLDIVADAYQLCKDYPICCYQVSGEYAMLHAAAEKNIVDLKSIAFEAHQGFLRAGARLIISYFTPEFLEWLSE*(SEQ ID NO:2)
>3PBGD
MNQIEQSGPIDCSSLKLGSRKSALAIIQAEIVRQLILKEYPELETKLVSVSTLGDQVQNKALFTFGGKSLWTKELEMLLLESVGGFDQIDMIVHSLKDMPTHLPDEFELGCIIEREDPRDALVVQDGLSYKSLADLPEGAVVGTSSVRRSAQLLKNFPHLKFKSVRGNLQTRLRKLDDPDSEYCCLLLAAAGLIRTGLQHRISMYLNDDVMYHSVGQGALGVEIRKGDQFMKNICEKIGHRTTTLRCLAERALLRYLEGGCSVPIGVSTIYSEDTKELTMNSLVVSCNGRDSVTESMTEVVTTEEQAEDFGERLAQKLIDQGAKRILDEINFNKIKEIKEEGLH*(SEQ ID NO:3)
>4UROS
MPKAILLKNKTTPKDPYLENFVSSGYSTDFVPLLDHIHMEKSEIIAFLKTDYFLHKTLAFIITSQRAVEMLNECMQILRRTDPEITQIIYSKPVYTVGPATYRILADAGFVDLRGGDKAGNGSILAQIILNDDIYTGIEDSDKHITFFTGETRRDIIPKCLLSNNFQLYEKIVYKTLPRDDIVTRFKSAVDSIDQSQRSSSWVVFFSPQGTEDIVTYLQHTKDQFNIASIGPTTEKYLLSKNLKPKVVAPKPEPISLLLSIQKVH*(SEQ ID NO:4)
>5UROD
MSRFPELKNDLILRAARGEKVERPPIWIMRQAGRYLPEYHEVKGGRDFFETCRDAEIASEITIQPITHFDGLIDAAIIFSDILVIPQAMGMEVKMVDKVGPQFPNPLRKPSDLDHLKKDVDVLKELDWAFKAISLTRKKLNGRVPLLGFCGAPWTLLVYMTEGGGTKMFRFAKEWIYKFTKESHQLLQQITDVAVEFLAQQVVAGAQMLQVFESWGGELGPDEFDEFSLPYLRQISSKLPLRLKELGITENVPITVFAKGSWYALEQLCDSGYDVVSLDWLFRPSDAVQIANGRIALQGNLDPGTMYGSKETISKKVDKMIKGFGGGKQNYIINFGHGTHPFMDPEQIRWFLQECHRIGSQ*(SEQ ID NO:5)
>6 CPO
MAIDSDINLSSPNDSIRQRMFELIQRKQLEIVAALEAIEGNDTKFRSDSWERGAEGGGGRSMLIQDGRVFEKAGVNISKVHGVLPPQAVSQMRNDHSKLDLPAGTSLKFFACGLSLVIHPHNPHAPTTHLNYRYFETWDETGKPHTWWFGGGADLTPSYLYPEDAKQFHQAHKDALDKHDVSLYPRFKKWCDEYFLIKHRNETRGIGGIFFDDFDEFDAERSLKLVEDCFNAFLESYPAITRKRMDTPSTDAEKNWQQIRRGRYVEFNLVLDRGTQFGLRTPGSRVESILMSLPRTAGWVYDHHPEPGSREEELLQVLQNPIEWV*(SEQ ID NO:6)
>7 PPO
MLKSLAPNSSIAVLGSGISGLTFSFFLNRLRPDVKIHIFEKSKQVGGWIRSEEHETFHFEKGPRTLRGTNTGTLMLLDLLTKIGANDKVLGLHKDSLANKKYLLSPFSDVHGNNAKLLQVPQDFSSFVKFMFDPLSKDLILGLLKEPWQPKLKYSDESVDHFFNRRFATKLSENIVSAIVHGIYAGDVKKLSVKAIFPRLPEMEQESGSIIRYMIAQYRTKKNVKQKVDPFLADYEKLIGTSLSFKNISLFLKNFPMLSFQGGLQKLPISLKNHLSQIENIKFHFDSKIKNIALESGKVALTDHDQVYLVDHVRSTINTNELAKIISPVVPSSTKKKSVFKSKANGPGLVKCLSWLHYTNILMCNIYIPKHVSKSITGFGYLVPRSMSSQASKLLGVIFDSDIETAMTPNFTEANITAINSNSASPKQLQKFSDQFVNNDLPKYTKLTLMLGGHYLKSEADMPGSAESKHAVKAILSNHLNIDLDEFASLPDFKMEITKIPNCIPQYEVGYLDLKRKVQNAASKEFNDQISFGGMAFGDGVGIPDCVQNAFKDSATLSGI*(SEQ ID NO:7)
>8 FECH
MLNRRFQSTVSSSLNKGTGIVFMNMGGPSTVKETYDFLFRLFSDGDLIPFGRFQNILARFIASRRTPKIESYYKAIGGGSPIRKWSEYQSSKLCEKLDIISPQSAPHKPYVAFRYANPLTEDTLQKMKNDGITKAIAFSQYPQFSYSTTGSSINELYRQSKILDPDQSIKWTVIDRWPDHPALVKTFAAHIKDTLNRFKTENGLTDTKDVVLQFSAHSLPMDIVNKGDSYPAEVAASVFAIMKELNFSNPYKLTWQSQVGPKPWLGAQTEKITKQLASSDVPGVVLVPIAFTSDHIETLHELDIELIQELPNPSKVKRVESLNGDQTFIDSLAELVKSHIDSKVVFSNQLPLDSMLGVVSDNSLTDPKEFFRAH*(SEQ ID NO:8)
>9 LegH
MGAFTEKQEALVSSSFEAFKANIPQYSVVFYTSILEKAPAAKDLFSFLSNGVDPSNPKLTGHAEKLFGLVRDSAGQLKANGTVVADAALGSIHAQKAITDPQFVVVKEALLKTIKEAVGDKWSDELSSAWEVAYDELAAAIKKAF*(SEQ ID NO:9)
>10 Mxr1
MSNLPPTFGSTRQSPEDQSPPVPKELSFNGTTPSGKLRLFVCQTCTRAFARQEHLKRHERSHTKEKPFSCGICSRKFSRRDLLLRHAQKLHSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSCTSSNATISPILLDNSINNNSTSDVRPEFRTQSVTSEMSQAPPPPQKNNSKYSTEVLFTSNMRSFIHYALSKYPFIGVPTPTLPENERLNEYADSFTNRFLNHYPFIHVTILKEYSLFKAILDENESTKNWENNQFYLENQRISIVCLPLLVATIGAVLSNNKKDASNLYEASRRCIHVYLDSRKKIPTSLSANNNDSPLWLIQSLTLSVMYGLFADNDISLNVVIRQVNALNSLVKTSGLNRTSIIDLFNINKPLDNELWNQFVKIESTVRTIHTIFQISSNLSALYNIIPSLKIDDLMITLPVPTTLWQADSFVKFKSLSYGNQIPFQYTRVLQNLIDYNQPLSDGKFLYENHVSEFGLICLQNGLHQYSYFQKLTAVNNREDALFTKVVNSLHSWDRMISNSDLFPKKIYQQSCLILDSKLLNNFLIVKSSLKVSTGDVSSLNKLKENVWLKNWNQVCAIYYNSFMNIPAPSIQKKYNDIEFVDDMINLSLIIIKIMKLIFYNNVKDNYEDENDFKLQELNLTFDNFDEKISLNLTILFDIFLMIYKIITNYEKFMKIKHKFNYYNSNSNISFLHHFELSSVINNTQMNQNDYMKTDIDEKLDQLFHIYQTFFRLYLDLEKFMKFKFNYHDFETEFSSLSISNILNTHAASNNDTNAADAMNAKDEKISPTTLNSVLLADEGNENSGRNNDSDRLFMLNELINFEVGLKFLKIGESFFDFLYENNYKFIHFKNLNDGMFHIRIYLENRLDGGV*(SEQ ID NO:10)
>11 Mit1
MSTAAPIKEESQFAHLTLMNKDIPSNAKQAKSKVSAAPAKTGSKSAGGSGNNNAAPVKKRVRTGCLTCRKKHKKCDENRNPKCDFCTLKGLECVWPENNKKNIFVNNSMKDFLGKKTVDGADSLNLAVNLQQQQSSNTIANQSLSSIGLESFGYGSGIKNEFNFQDLIGSNSGSSDPTFSVDADEAQKLDISNKNSRKRQKLGLLPVSNATSHLNGFNGMSNGKSHSFSSPSGTNDDELSGLMFNSPSFNPLTVNDSTNNSNHNIGLSPMSCLFSTVQEASQKKHGNSSRHFSYPSGPEDLWFNEFQKQALTANGENAVQQGDDASKNNTAIPKDQSSNSSIFSSRSSAASSNSGDDIGRMGPFSKGPEIEFNYDSFLESLKAESPSSSKYNLPETLKEYMTLSSSHLNSQHSDTLANGTNGNYSSTVSNNLSLSLNSFSFSDKFSLSPPTITDAEKFSLMRNFIDNISPWFDTFDNTKQFGTKIPVLAKKCSSLYYAILAISSRQRERIKKEHNEKTLQCYQYSLQQLIPTVQSSNNIEYIITCILLSVFHIMSSEPSTQRDIIVSLAKYIQACNINGFTSNDKLEKSIFWNYVNLDLATCAIGEESMVIPFSYWVKETTDYKTIQDVKPFFTKKTSTTTDDDLDDMYAIYMLYISGRIINLLNCRDAKLNFEPKWEFLWNELNEWELNKPLTFQSIVQFKANDESQGGSTFPTVLFSNSRSCYSNQLYHMSYIILVQNKPRLYKIPFTTVSASMSSPSDNKAGMSASSTPASDHHASGDHLSPRSVEPSLSTTLSPPPNANGAGNKFRSTLWHAKQICGISINNNHNSNLAAKVNSLQPLWHAGKLISSKSEHTQLLKLLNNLECATGWPMNWKGKELIDYWNVEE*(SEQ ID NO:11)
>12 Prm1
MPPKHRLEQSIQPMASQQIVPGNKVILPNPKVDAKSTPNISVQKRRRVTRACDECRKKKVKCDGQQPCIHCTVYSYECTYSQPSSKKRQGQSLSLSAPSNINATSSVQKSVKPPEIDFQRMRDALKYYEDLLNQLIYPNSAPTVRVNPIRLASILKQLRADKSSDELISVKALSDNYIEMLHKTMQQPVQQPAPPSLGQGGSFSNHSPNHNNASIDGSIESNLGREIRIILPPRDIALKLIYKTWDNACVLFRFYHRPAFIEDLNELYETDLANYTNKQQRFLPLVYSVMACGALFCKTDGINHGQKSSKPKDSSDESLIDDEGYKYFIAARKLIDITDTRDTYGIQTIVMLIIFLQCSARLSTCYSYIGIALRAALREGLHRQLNYPFNPIELETRKRLFWTIYKMDIYVNTMLGLPRTISEEDFDQEMPIELDDENISETGYRFDLQGTKLSSSGIANAHTRLIFIMKKIVKKLYPVKLQKPTSNSGDTPLENNDLLAHEIVHELEMDLQNWVNSLPAELKPGIEPPTEYFKANRLLHLAYLHVKIILYRPFIHYISEKDKVGNSSIPPSPEEITSIEKAKNCVNVARIVVKLAEDMINRKMLSGSYWFSIYTIFFSVACLVYYVHFAPPKKDNGELDPQYMEIKKDTESGREVLNILKDSSMAARRTYNILNSLFEQLNRRTAKVNLAKAQQPPSGLNNPAATQYQKQGEHRQLQPSNYSGTVKSVDPENIDYSSFGSQFENTNIEDGSSNTKIDQKVNGVNYIDGVFTGINLNMPNLSETSNTQGIDNPAFQSINNSNLNNNFVQTKYIPGMMDQLDMKIFGRFLPPYMLNSNKVEQGQNERNLSGQPSSSNTPDGSQPVTVLDGLYPLQNDNNNNHDPGNSKSVVNNSNSVENLLQNFTMVPSGLSSTVQNPEAAQKFNNHMSNISNMNDPRRASVATSDGSNDMDHHSQGPINKDLKPLSNYEFDDLFFNDWTTAPDTINFDS*(SEQ ID NO:12)
>13 Mpp1
MSISRDDDHPRPKRARSGKPKKETPPAKRRVRTGCLTCRRKHKKCDENRPKCDFCTAKGLECVWPEEVKKNVFVNNSFKDFCFSQSKHRDRFRKPTDFDLSSSLSPLDYHLGPDDPRTRKKAYSLDVADHYLSAFDGYSRKNEYLDAPLTTAYPLLETSESPLSGLFNAPQELPSQLTRTPSFGASSLSYFDTLQSYSMNPSLSSGSNDKISTASSVSSDMSLAKKDADFEHRYSFAEPQKKSKFGLDYYDLPNTLNDLMCLFIATKDSTSGSKLPNNETIFEIFTDKSTMEAPSIDDHEMMLLMETYIDQIAHFLNKSDETQCNIFMTKIPELAHRFPSLKYAILGLASRHLEKVRSDYSGEKTLQYYTYSLQQLSMCLNSDKNTLEVVATCVLLCYFEILSTNPDSWHSRLENCGSMLKVCHINARSETELEKALFWSFAALDIGCCAVGDRKTVVRPEDWFGTDAPSSPTETGTALQSMLYLSCQIFQLVSSNDDQSEFDSCWKSLWKQLGDWERARSSNMRGFCFKRDNSFPETLFSSSTALCANQLFHTCCILMLQTKPRLVKLHEPEKQERTPDTLFQSAIKTEQGESVSTSSLMSRSQIWHAKQIIGINVCNMKSASSRSLGCQILSLQAIWIAGKLISSAHEHSIILQLLQRLESWSSMSMDWREKQLTEFWKREC*(SEQ ID NO:13)
>14 mMxr1-mMxr1AD
MSNLPPTFGSTRQSPEDQSPPVPKELSFNGTTPSGKLRLFVCQTCTRAFARQEHLKRHERSHTKEKPFSCGICSRKFSRRDLLLRHAQKLHSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSCGGGGSTSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSC*(SEQ ID NO:14)
>15 Mxr1-Prm1AD
MSNLPPTFGSTRQSPEDQSPPVPKELSFNGTTPSGKLRLFVCQTCTRAFARQEHLKRHERSHTKEKPFSCGICSRKFSRRDLLLRHAQKLHSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSCTSSNATISPILLDNSINNNSTSDVRPEFRTQSVTSEMSQAPPPPQKNNSKYSTEVLFTSNMRSFIHYALSKYPFIGVPTPTLPENERLNEYADSFTNRFLNHYPFIHVTILKEYSLFKAILDENESTKNWENNQFYLENQRISIVCLPLLVATIGAVLSNNKKDASNLYEASRRCIHVYLDSRKKIPTSLSANNNDSPLWLIQSLTLSVMYGLFADNDISLNVVIRQVNALNSLVKTSGLNRTSIIDLFNINKPLDNELWNQFVKIESTVRTIHTIFQISSNLSALYNIIPSLKIDDLMITLPVPTTLWQADSFVKFKSLSYGNQIPFQYTRVLQNLIDYNQPLSDGKFLYENHVSEFGLICLQNGLHQYSYFQKLTAVNNREDALFTKVVNSLHSWDRMISNSDLFPKKIYQQSCLILDSKLLNNFLIVKSSLKVSTGDVSSLNKLKENVWLKNWNQVCAIYYNSFMNIPAPSIQKKYNDIEFVDDMINLSLIIIKIMKLIFYNNVKDNYEDENDFKLQELNLTFDNFDEKISLNLTILFDIFLMIYKIITNYEKFMKIKHKFNYYNSNSNISFLHHFELSSVINNTQMNQNDYMKTDIDEKLDQLFHIYQTFFRLYLDLEKFMKFKFNYHDFETEFSSLSISNILNTHAASNNDTNAADAMNAKDEKISPTTLNSVLLADEGNENSGRNNDSDRLFMLNELINFEVGLKFLKIGESFFDFLYENNYKFIHFKNLNDGMFHIRIYLENRLDGGVGGGGSGQSLSLSAPSNINATSSVQKSVKPPEIDFQRMRDALKYYEDLLNQLIYPNSAPTVRVNPIRLASILKQLRADKSSDELISVKALSDNYIEMLHKTMQQPVQQPAPPSLGQGGSFSNHSPNHNNASIDGSIESNLGREIRIILPPRDIALKLIYKTWDNACVLFRFYHRPAFIEDLNELYETDLANYTNKQQRFLPLVYSVMACGALFCKTDGINHGQKSSKPKDSSDESLIDDEGYKYFIAARKLIDITDTRDTYGIQTIVMLIIFLQCSARLSTCYSYIGIALRAALREGLHRQLNYPFNPIELETRKRLFWTIYKMDIYVNTMLGLPRTISEEDFDQEMPIELDDENISETGYRFDLQGTKLSSSGIANAHTRLIFIMKKIVKKLYPVKLQKPTSNSGDTPLENNDLLAHEIVHELEMDLQNWVNSLPAELKPGIEPPTEYFKANRLLHLAYLHVKIILYRPFIHYISEKDKVGNSSIPPSPEEITSIEKAKNCVNVARIVVKLAEDMINRKMLSGSYWFSIYTIFFSVACLVYYVHFAPPKKDNGELDPQYMEIKKDTESGREVLNILKDSSMAARRTYNILNSLFEQLNRRTAKVNLAKAQQPPSGLNNPAATQYQKQGEHRQLQPSNYSGTVKSVDPENIDYSSFGSQFENTNIEDGSSNTKIDQKVNGVNYIDGVFTGINLNMPNLSETSNTQGIDNPAFQSINNSNLNNNFVQTKYIPGMMDQLDMKIFGRFLPPYMLNSNKVEQGQNERNLSGQPSSSNTPDGSQPVTVLDGLYPLQNDNNNNHDPGNSKSVVNNSNSVENLLQNFTMVPSGLSSTVQNPEAAQKFNNHMSNISNMNDPRRASVATSDGSNDMDHHSQGPINKDLKPLSNYEFDDLFFNDWTTAPDTINFDS*(SEQ ID NO:15)
>16 Mxr1D-Mit1AD
MSNLPPTFGSTRQSPEDQSPPVPKELSFNGTTPSGKLRLFVCQTCTRAFARQEHLKRHERSHTKEKPFSCGICSRKFSRRDLLLRHAQKLHSNCSGGGGSVNNSMKDFLGKKTVDGADSLNLAVNLQQQQSSNTIANQSLSSIGLESFGYGSGIKNEFNFQDLIGSNSGSSDPTFSVDADEAQKLDISNKNSRKRQKLGLLPVSNATSHLNGFNGMSNGKSHSFSSPSGTNDDELSGLMFNSPSFNPLTVNDSTNNSNHNIGLSPMSCLFSTVQEASQKKHGNSSRHFSYPSGPEDLWFNEFQKQALTANGENAVQQGDDASKNNTAIPKDQSSNSSIFSSRSSAASSNSGDDIGRMGPFSKGPEIEFNYDSFLESLKAESPSSSKYNLPETLKEYMTLSSSHLNSQHSDTLANGTNGNYSSTVSNNLSLSLNSFSFSDKFSLSPPTITDAEKFSLMRNFIDNISPWFDTFDNTKQFGTKIPVLAKKCSSLYYAILAISSRQRERIKKEHNEKTLQCYQYSLQQLIPTVQSSNNIEYIITCILLSVFHIMSSEPSTQRDIIVSLAKYIQACNINGFTSNDKLEKSIFWNYVNLDLATCAIGEESMVIPFSYWVKETTDYKTIQDVKPFFTKKTSTTTDDDLDDMYAIYMLYISGRIINLLNCRDAKLNFEPKWEFLWNELNEWELNKPLTFQSIVQFKANDESQGGSTFPTVLFSNSRSCYSNQLYHMSYIILVQNKPRLYKIPFTTVSASMSSPSDNKAGMSASSTPASDHHASGDHLSPRSVEPSLSTTLSPPPNANGAGNKFRSTLWHAKQICGISINNNHNSNLAAKVNSLQPLWHAGKLISSKSEHTQLLKLLNNLECATGWPMNWKGKELIDYWNVEE*(SEQ ID NO:16)
>17 Mxr1D-Prm1AD
MSNLPPTFGSTRQSPEDQSPPVPKELSFNGTTPSGKLRLFVCQTCTRAFARQEHLKRHERSHTKEKPFSCGICSRKFSRRDLLLRHAQKLHSNCSGGGGSGQSLSLSAPSNINATSSVQKSVKPPEIDFQRMRDALKYYEDLLNQLIYPNSAPTVRVNPIRLASILKQLRADKSSDELISVKALSDNYIEMLHKTMQQPVQQPAPPSLGQGGSFSNHSPNHNNASIDGSIESNLGREIRIILPPRDIALKLIYKTWDNACVLFRFYHRPAFIEDLNELYETDLANYTNKQQRFLPLVYSVMACGALFCKTDGINHGQKSSKPKDSSDESLIDDEGYKYFIAARKLIDITDTRDTYGIQTIVMLIIFLQCSARLSTCYSYIGIALRAALREGLHRQLNYPFNPIELETRKRLFWTIYKMDIYVNTMLGLPRTISEEDFDQEMPIELDDENISETGYRFDLQGTKLSSSGIANAHTRLIFIMKKIVKKLYPVKLQKPTSNSGDTPLENNDLLAHEIVHELEMDLQNWVNSLPAELKPGIEPPTEYFKANRLLHLAYLHVKIILYRPFIHYISEKDKVGNSSIPPSPEEITSIEKAKNCVNVARIVVKLAEDMINRKMLSGSYWFSIYTIFFSVACLVYYVHFAPPKKDNGELDPQYMEIKKDTESGREVLNILKDSSMAARRTYNILNSLFEQLNRRTAKVNLAKAQQPPSGLNNPAATQYQKQGEHRQLQPSNYSGTVKSVDPENIDYSSFGSQFENTNIEDGSSNTKIDQKVNGVNYIDGVFTGINLNMPNLSETSNTQGIDNPAFQSINNSNLNNNFVQTKYIPGMMDQLDMKIFGRFLPPYMLNSNKVEQGQNERNLSGQPSSSNTPDGSQPVTVLDGLYPLQNDNNNNHDPGNSKSVVNNSNSVENLLQNFTMVPSGLSSTVQNPEAAQKFNNHMSNISNMNDPRRASVATSDGSNDMDHHSQGPINKDLKPLSNYEFDDLFFNDWTTAPDTINFDS*(SEQ ID NO:17)
>18 Mit1-mMxr1AD
MSTAAPIKEESQFAHLTLMNKDIPSNAKQAKSKVSAAPAKTGSKSAGGSGNNNAAPVKKRVRTGCLTCRKKHKKCDENRNPKCDFCTLKGLECVWPENNKKNIFVNNSMKDFLGKKTVDGADSLNLAVNLQQQQSSNTIANQSLSSIGLESFGYGSGIKNEFNFQDLIGSNSGSSDPTFSVDADEAQKLDISNKNSRKRQKLGLLPVSNATSHLNGFNGMSNGKSHSFSSPSGTNDDELSGLMFNSPSFNPLTVNDSTNNSNHNIGLSPMSCLFSTVQEASQKKHGNSSRHFSYPSGPEDLWFNEFQKQALTANGENAVQQGDDASKNNTAIPKDQSSNSSIFSSRSSAASSNSGDDIGRMGPFSKGPEIEFNYDSFLESLKAESPSSSKYNLPETLKEYMTLSSSHLNSQHSDTLANGTNGNYSSTVSNNLSLSLNSFSFSDKFSLSPPTITDAEKFSLMRNFIDNISPWFDTFDNTKQFGTKIPVLAKKCSSLYYAILAISSRQRERIKKEHNEKTLQCYQYSLQQLIPTVQSSNNIEYIITCILLSVFHIMSSEPSTQRDIIVSLAKYIQACNINGFTSNDKLEKSIFWNYVNLDLATCAIGEESMVIPFSYWVKETTDYKTIQDVKPFFTKKTSTTTDDDLDDMYAIYMLYISGRIINLLNCRDAKLNFEPKWEFLWNELNEWELNKPLTFQSIVQFKANDESQGGSTFPTVLFSNSRSCYSNQLYHMSYIILVQNKPRLYKIPFTTVSASMSSPSDNKAGMSASSTPASDHHASGDHLSPRSVEPSLSTTLSPPPNANGAGNKFRSTLWHAKQICGISINNNHNSNLAAKVNSLQPLWHAGKLISSKSEHTQLLKLLNNLECATGWPMNWKGKELIDYWNVEEGGGGSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSC*(SEQ IDNO:18)
>19 Mit1D-mMxr1AD
MSTAAPIKEESQFAHLTLMNKDIPSNAKQAKSKVSAAPAKTGSKSAGGSGNNNAAPVKKRVRTGCLTCRKKHKKCDENRNPKCDFCTLKGLECVWPENNKKNIFGGGGSSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSC*(SEQ ID NO:19)
>20 Mit1D-Mxr1AD
MSTAAPIKEESQFAHLTLMNKDIPSNAKQAKSKVSAAPAKTGSKSAGGSGNNNAAPVKKRVRTGCLTCRKKHKKCDENRNPKCDFCTLKGLECVWPENNKKNIFGGGGSSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSCTSSNATISPILLDNSINNNSTSDVRPEFRTQSVTSEMSQAPPPPQKNNSKYSTEVLFTSNMRSFIHYALSKYPFIGVPTPTLPENERLNEYADSFTNRFLNHYPFIHVTILKEYSLFKAILDENESTKNWENNQFYLENQRISIVCLPLLVATIGAVLSNNKKDASNLYEASRRCIHVYLDSRKKIPTSLSANNNDSPLWLIQSLTLSVMYGLFADNDISLNVVIRQVNALNSLVKTSGLNRTSIIDLFNINKPLDNELWNQFVKIESTVRTIHTIFQISSNLSALYNIIPSLKIDDLMITLPVPTTLWQADSFVKFKSLSYGNQIPFQYTRVLQNLIDYNQPLSDGKFLYENHVSEFGLICLQNGLHQYSYFQKLTAVNNREDALFTKVVNSLHSWDRMISNSDLFPKKIYQQSCLILDSKLLNNFLIVKSSLKVSTGDVSSLNKLKENVWLKNWNQVCAIYYNSFMNIPAPSIQKKYNDIEFVDDMINLSLIIIKIMKLIFYNNVKDNYEDENDFKLQELNLTFDNFDEKISLNLTILFDIFLMIYKIITNYEKFMKIKHKFNYYNSNSNISFLHHFELSSVINNTQMNQNDYMKTDIDEKLDQLFHIYQTFFRLYLDLEKFMKFKFNYHDFETEFSSLSISNILNTHAASNNDTNAADAMNAKDEKISPTTLNSVLLADEGNENSGRNNDSDRLFMLNELINFEVGLKFLKIGESFFDFLYENNYKFIHFKNLNDGMFHIRIYLENRLDGGV*(SEQ ID NO:20)
>21 Mit1D-Prm1AD
MSTAAPIKEESQFAHLTLMNKDIPSNAKQAKSKVSAAPAKTGSKSAGGSGNNNAAPVKKRVRTGCLTCRKKHKKCDENRNPKCDFCTLKGLECVWPENNKKNIFGGGGSGQSLSLSAPSNINATSSVQKSVKPPEIDFQRMRDALKYYEDLLNQLIYPNSAPTVRVNPIRLASILKQLRADKSSDELISVKALSDNYIEMLHKTMQQPVQQPAPPSLGQGGSFSNHSPNHNNASIDGSIESNLGREIRIILPPRDIALKLIYKTWDNACVLFRFYHRPAFIEDLNELYETDLANYTNKQQRFLPLVYSVMACGALFCKTDGINHGQKSSKPKDSSDESLIDDEGYKYFIAARKLIDITDTRDTYGIQTIVMLIIFLQCSARLSTCYSYIGIALRAALREGLHRQLNYPFNPIELETRKRLFWTIYKMDIYVNTMLGLPRTISEEDFDQEMPIELDDENISETGYRFDLQGTKLSSSGIANAHTRLIFIMKKIVKKLYPVKLQKPTSNSGDTPLENNDLLAHEIVHELEMDLQNWVNSLPAELKPGIEPPTEYFKANRLLHLAYLHVKIILYRPFIHYISEKDKVGNSSIPPSPEEITSIEKAKNCVNVARIVVKLAEDMINRKMLSGSYWFSIYTIFFSVACLVYYVHFAPPKKDNGELDPQYMEIKKDTESGREVLNILKDSSMAARRTYNILNSLFEQLNRRTAKVNLAKAQQPPSGLNNPAATQYQKQGEHRQLQPSNYSGTVKSVDPENIDYSSFGSQFENTNIEDGSSNTKIDQKVNGVNYIDGVFTGINLNMPNLSETSNTQGIDNPAFQSINNSNLNNNFVQTKYIPGMMDQLDMKIFGRFLPPYMLNSNKVEQGQNERNLSGQPSSSNTPDGSQPVTVLDGLYPLQNDNNNNHDPGNSKSVVNNSNSVENLLQNFTMVPSGLSSTVQNPEAAQKFNNHMSNISNMNDPRRASVATSDGSNDMDHHSQGPINKDLKPLSNYEFDDLFFNDWTTAPDTINFDS*(SEQ ID NO:21)
>22 Prm1-mMxr1AD
MPPKHRLEQSIQPMASQQIVPGNKVILPNPKVDAKSTPNISVQKRRRVTRACDECRKKKVKCDGQQPCIHCTVYSYECTYSQPSSKKRQGQSLSLSAPSNINATSSVQKSVKPPEIDFQRMRDALKYYEDLLNQLIYPNSAPTVRVNPIRLASILKQLRADKSSDELISVKALSDNYIEMLHKTMQQPVQQPAPPSLGQGGSFSNHSPNHNNASIDGSIESNLGREIRIILPPRDIALKLIYKTWDNACVLFRFYHRPAFIEDLNELYETDLANYTNKQQRFLPLVYSVMACGALFCKTDGINHGQKSSKPKDSSDESLIDDEGYKYFIAARKLIDITDTRDTYGIQTIVMLIIFLQCSARLSTCYSYIGIALRAALREGLHRQLNYPFNPIELETRKRLFWTIYKMDIYVNTMLGLPRTISEEDFDQEMPIELDDENISETGYRFDLQGTKLSSSGIANAHTRLIFIMKKIVKKLYPVKLQKPTSNSGDTPLENNDLLAHEIVHELEMDLQNWVNSLPAELKPGIEPPTEYFKANRLLHLAYLHVKIILYRPFIHYISEKDKVGNSSIPPSPEEITSIEKAKNCVNVARIVVKLAEDMINRKMLSGSYWFSIYTIFFSVACLVYYVHFAPPKKDNGELDPQYMEIKKDTESGREVLNILKDSSMAARRTYNILNSLFEQLNRRTAKVNLAKAQQPPSGLNNPAATQYQKQGEHRQLQPSNYSGTVKSVDPENIDYSSFGSQFENTNIEDGSSNTKIDQKVNGVNYIDGVFTGINLNMPNLSETSNTQGIDNPAFQSINNSNLNNNFVQTKYIPGMMDQLDMKIFGRFLPPYMLNSNKVEQGQNERNLSGQPSSSNTPDGSQPVTVLDGLYPLQNDNNNNHDPGNSKSVVNNSNSVENLLQNFTMVPSGLSSTVQNPEAAQKFNNHMSNISNMNDPRRASVATSDGSNDMDHHSQGPINKDLKPLSNYEFDDLFFNDWTTAPDTINFDSGGGGSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSC*(SEQ ID NO:22)
>23 Prm1D-mMxr1AD
MPPKHRLEQSIQPMASQQIVPGNKVILPNPKVDAKSTPNISVQKRRRVTRACDECRKKKVKCDGQQPCIHCTVYSYECTYSQPSSKKRQGGGGSSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSC*(SEQ ID NO:23)
>24 Prm1D-Mxr1AD
MPPKHRLEQSIQPMASQQIVPGNKVILPNPKVDAKSTPNISVQKRRRVTRACDECRKKK
VKCDGQQPCIHCTVYSYECTYSQPSSKKRQGGGGSSNCSDAAITRLRRKATRRSSNAAG
SISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSL
KQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNF
QQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSF
TDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPD
TVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSCTSSNATISPILL
DNSINNNSTSDVRPEFRTQSVTSEMSQAPPPPQKNNSKYSTEVLFTSNMRSFIHYALSKY
PFIGVPTPTLPENERLNEYADSFTNRFLNHYPFIHVTILKEYSLFKAILDENESTKNWENN
QFYLENQRISIVCLPLLVATIGAVLSNNKKDASNLYEASRRCIHVYLDSRKKIPTSLSANN
NDSPLWLIQSLTLSVMYGLFADNDISLNVVIRQVNALNSLVKTSGLNRTSIIDLFNINKPL
DNELWNQFVKIESTVRTIHTIFQISSNLSALYNIIPSLKIDDLMITLPVPTTLWQADSFVKF
KSLSYGNQIPFQYTRVLQNLIDYNQPLSDGKFLYENHVSEFGLICLQNGLHQYSYFQKLT
AVNNREDALFTKVVNSLHSWDRMISNSDLFPKKIYQQSCLILDSKLLNNFLIVKSSLKVS
TGDVSSLNKLKENVWLKNWNQVCAIYYNSFMNIPAPSIQKKYNDIEFVDDMINLSLIIIKI
MKLIFYNNVKDNYEDENDFKLQELNLTFDNFDEKISLNLTILFDIFLMIYKIITNYEKFMK
IKHKFNYYNSNSNISFLHHFELSSVINNTQMNQNDYMKTDIDEKLDQLFHIYQTFFRLYL
DLEKFMKFKFNYHDFETEFSSLSISNILNTHAASNNDTNAADAMNAKDEKISPTTLNSVL
LADEGNENSGRNNDSDRLFMLNELINFEVGLKFLKIGESFFDFLYENNYKFIHFKNLNDGMFHIRIYLENRLDGGV*(SEQ ID NO:24)
>25 Prm1D-Mit1AD
MPPKHRLEQSIQPMASQQIVPGNKVILPNPKVDAKSTPNISVQKRRRVTRACDECRKKK
VKCDGQQPCIHCTVYSYECTYSQPSSKKRQGGGGSVNNSMKDFLGKKTVDGADSLNLA
VNLQQQQSSNTIANQSLSSIGLESFGYGSGIKNEFNFQDLIGSNSGSSDPTFSVDADEAQK
LDISNKNSRKRQKLGLLPVSNATSHLNGFNGMSNGKSHSFSSPSGTNDDELSGLMFNSPS
FNPLTVNDSTNNSNHNIGLSPMSCLFSTVQEASQKKHGNSSRHFSYPSGPEDLWFNEFQK
QALTANGENAVQQGDDASKNNTAIPKDQSSNSSIFSSRSSAASSNSGDDIGRMGPFSKGP
EIEFNYDSFLESLKAESPSSSKYNLPETLKEYMTLSSSHLNSQHSDTLANGTNGNYSSTVS
NNLSLSLNSFSFSDKFSLSPPTITDAEKFSLMRNFIDNISPWFDTFDNTKQFGTKIPVLAKK
CSSLYYAILAISSRQRERIKKEHNEKTLQCYQYSLQQLIPTVQSSNNIEYIITCILLSVFHIM
SSEPSTQRDIIVSLAKYIQACNINGFTSNDKLEKSIFWNYVNLDLATCAIGEESMVIPFSY
WVKETTDYKTIQDVKPFFTKKTSTTTDDDLDDMYAIYMLYISGRIINLLNCRDAKLNFEP
KWEFLWNELNEWELNKPLTFQSIVQFKANDESQGGSTFPTVLFSNSRSCYSNQLYHMSY
IILVQNKPRLYKIPFTTVSASMSSPSDNKAGMSASSTPASDHHASGDHLSPRSVEPSLSTT
LSPPPNANGAGNKFRSTLWHAKQICGISINNNHNSNLAAKVNSLQPLWHAGKLISSKSEHTQLLKLLNNLECATGWPMNWKGKELIDYWNVEE*(SEQ ID NO:25)
>26 BtMb
MGLSDGEWQLVLNAWGKVEADVAGHGQEVLIRLFTGHPETLEKFDKFKHLKTEAEMK
ASEDLKKHGNTVLTALGGILKKKGHHEAEVKHLAESHANKHKIPVKYLEFISDAIIHVLHAKHPSDFGADAQAAMSKALELFRNDMAAQYKVLGFHG*(SEQ ID NO:26)
>27
(GGGGS)n(SEQ ID NO:27)
>28
GSAGSAAGSGEF(SEQ ID NO:28)
>29
KESGSVSSEQLAQFRSLD(SEQ ID NO:29)
>30
EGKSSGSGSESKST(SEQ ID NO:30)
>31
(EAAAK)n(SEQ ID NO:31)
Claims (33)
1.嵌合型转录激活因子,其至少包括第一部分和第二部分,其中:
1)所述第一部分包括:
i)DNA结合结构域;或
ii)DNA结合结构域和第一转录激活结构域;以及
2)所述第二部分包括至少一个第二转录激活结构域。
2.如权利要求1所述的嵌合型转录激活因子,其中所述第一部分的C末端直接或通过连接分子间接与所述第二部分的N末端连接。
3.如权利要求1或2所述的嵌合型转录激活因子,其中所述DNA结合结构域和所述第二转录激活结构域来自不同的转录激活因子。
4.如权利要求1-3任一项所述的嵌合型转录激活因子,其中所述DNA结合结构域和所述第一转录激活结构域来自相同的转录激活因子。
5.如权利要求1-4任一项所述的嵌合型转录激活因子,其中所述DNA结合结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体,优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。
6.如权利要求1-5任一项所述的嵌合型转录激活因子,其中所述第一转录激活结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体,优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。
7.如权利要求1-6任一项所述的嵌合型转录激活因子,其中所述转录激活因子Mxr1包括SEQ ID NO:10所示序列;所述转录激活因子Mit1包括SEQ ID NO:11所示序列;所述转录激活因子Prm1包括SEQ ID NO:12所示序列。
8.如权利要求1-7任一项所述的嵌合型转录激活因子,其中所述DNA结合结构域包括所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1的第1-104位氨基酸或所述转录激活因子Prm1的第1-89位氨基酸。
9.如权利要求1-8任一项所述的嵌合型转录激活因子,其中所述DNA结合结构域与所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1的第1-104位氨基酸或所述转录激活因子Prm1的第1-89位氨基酸具有至少50%、60%、70%、80%、90%、92%、95%、98%、或99%序列一致性。
10.如权利要求1-9任一项所述的嵌合型转录激活因子,其中所述第一转录激活结构域包括所述转录激活因子Mxr1的第92-1155位氨基酸、转录激活因子Mxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。
11.如权利要求1-10任一项所述的嵌合型转录激活因子,其中所述第一转录激活结构域与所述转录激活因子Mxr1的第92-1155位氨基酸、转录激活因子Mxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸具有至少50%、60%、70%、80%、90%、92%、95%、98%、或99%序列一致性。
12.如权利要求1-11任一项所述的嵌合型转录激活因子,其中所述第一部分包括所述转录激活因子Mxr1、所述转录激活因子Mxr1的第1-400位氨基酸、所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1、所述转录激活因子Mit1的第1-104位氨基酸、所述转录激活因子Prm1或所述转录激活因子Prm1的第1-89位氨基酸。
13.如权利要求1-12任一项所述的嵌合型转录激活因子,其中所述第二转录激活结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体,优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。
14.如权利要求1-13任一项所述的嵌合型转录激活因子,其中所述第二转录激活结构域包括转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。
15.如权利要求1-14任一项所述的嵌合型转录激活因子,其中所述第二转录激活结构域与所述转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸具有至少50%、60%、70%、80%、90%、92%、95%、98%、或99%序列一致性。
16.如权利要求1-15任一项所述的嵌合型转录激活因子,其中所述第二部分包括转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。
17.如权利要求1-16任一项所述的嵌合型转录激活因子,其包括SEQ ID NO:14-25任一项所示序列。
18.分离的核酸分子,其包括权利要求1-17任一项所述的嵌合型转录激活因子的编码核酸序列。
19.表达载体,其包括权利要求18所述的核酸分子。
20.如权利要求19所述的表达载体,其中在所述表达载体中所述编码核酸序列与甲醇诱导型启动子可操作地连接。
21.如权利要求20所述的表达载体,其中所述甲醇诱导型启动子包括AOX1、DAS1、DAS2、CAT1、PMP20启动子或它们的突变体,优选AOX1启动子。
22.宿主细胞,其包括权利要求18所述的核酸分子或权利要求19-21任一项所述的表达载体。
23.宿主细胞,其表达权利要求1-17任一项所述的嵌合型转录激活因子。
24.如权利要求22或23所述的宿主细胞,其还包括编码与甲醇诱导型启动子可操作地连接的异源多肽的核酸序列。
25.如权利要求24所述的宿主细胞,其中所述异源多肽来自PF00042球蛋白家族。
26.如权利要求25所述的宿主细胞,其中所述异源多肽为血红蛋白,优选大豆血红蛋白LegH或牛肌红蛋白。
27.如权利要求所述22-26任一项的宿主细胞,其中所述异源多肽包括SEQ ID NO:9或SEQ ID NO:26所示序列。
28.如权利要求22-27任一项所述的宿主细胞,其还包括编码可与所述甲醇诱导型启动子可操作地连接的参与血红素生物合成途径的至少一种多肽。
29.如权利要求22-28任一项所述的宿主细胞,其为酵母细胞,优选毕赤酵母,更优选毕赤酵母X-33菌株。
30.制备目的蛋白的方法,包括培养权利要求24-29任一项所述的宿主细胞并分离所述目的蛋白。
31.如权利要求30所述的方法,其中所述宿主细胞为毕赤酵母,在培养所述宿主细胞过程中包括向培养液中添加甲醇。
32.如权利要求30或31所述的方法,其中所述目的蛋白为来自PF00042球蛋白家族的蛋白。
33.如权利要求30-32任一项所述的方法,其中所述目的蛋白为血红蛋白,优选大豆血红蛋白LegH或牛肌红蛋白。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210910746 | 2022-07-29 | ||
CN2022109107460 | 2022-07-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117467020A true CN117467020A (zh) | 2024-01-30 |
Family
ID=89633756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310940429.8A Pending CN117467020A (zh) | 2022-07-29 | 2023-07-28 | 一种嵌合型转录激活因子及其应用 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117467020A (zh) |
WO (1) | WO2024022474A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6015709A (en) * | 1997-08-26 | 2000-01-18 | Ariad Pharmaceuticals, Inc. | Transcriptional activators, and compositions and uses related thereto |
CA2303482A1 (en) * | 1997-08-27 | 1999-03-04 | Ariad Gene Therapeutics, Inc. | Chimeric transcriptional activators and compositions and uses related thereto |
CA2417135C (en) * | 1997-11-19 | 2005-04-12 | Microbia, Inc. | Chimeric pre-activated transcription factors |
CN101182352B (zh) * | 2007-11-21 | 2010-06-09 | 中国科学院微生物研究所 | 一种转录激活因子及其编码基因与应用 |
-
2023
- 2023-07-28 WO PCT/CN2023/109788 patent/WO2024022474A1/zh unknown
- 2023-07-28 CN CN202310940429.8A patent/CN117467020A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2024022474A1 (zh) | 2024-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022201465A1 (en) | Expression constructs and methods of genetically engineering methylotrophic yeast | |
CN103003438B (zh) | 减少蛋白质糖基化的方法和过程及其蛋白质 | |
CN113481226B (zh) | 信号肽相关序列及其在蛋白质合成中的应用 | |
GB2241703A (en) | Preparation of IGF-1 and plasmids for use therein | |
JP2022537010A (ja) | イソオイゲノールからのバニリンの生合成 | |
JP2019516401A (ja) | 組換えヒト血清アルブミンの高発現のための遺伝子工学操作された細菌の構築 | |
CN1526021A (zh) | N端部分为蛭素衍生物的融合蛋白在生产酵母分泌的重组蛋白中的应用 | |
CN113136349B (zh) | 一种高效表达不同来源肌红蛋白/血红蛋白毕赤酵母重组菌株的构建 | |
CN113549561A (zh) | 高效合成不同来源的血红或肌红蛋白的酿酒酵母菌株的构建及其应用 | |
CN116554309A (zh) | 一种重组人源ⅲ型胶原蛋白及其制备方法和应用 | |
CA2467142C (en) | Improved method for the recombinant production of polypeptides | |
CN117467020A (zh) | 一种嵌合型转录激活因子及其应用 | |
CN114181288B (zh) | 制备l-缬氨酸的方法及其所用的基因与该基因编码的蛋白质 | |
AU2019218315A1 (en) | Codon optimized precursor gene and signal peptide gene of human insulin analogue | |
KR20030022274A (ko) | 히드록실화 콜라겐 유사 화합물의 제조 방법 | |
JP2003502021A (ja) | アスペルギルス起源のエポキシドヒドロラーゼ | |
CN108753810B (zh) | 一种转录调节蛋白基因orf2的用途 | |
US11866714B2 (en) | Promoter for yeast | |
JP3496640B2 (ja) | 酸化還元酵素、同酵素をコードする遺伝子、同酵素遺伝子含有形質転換体および同酵素の製造方法 | |
CN113980922A (zh) | 一种重组脂肪氧合酶及其诱导表达方法和用途 | |
CN116949086A (zh) | 利用马克斯克鲁维酵母重组表达血红蛋白的方法 | |
CN117568379A (zh) | 一种重组表达猫血清白蛋白的方法 | |
JP2004519239A (ja) | タンパク質発現のための調節領域を含むdna配列 | |
JP3864303B2 (ja) | 麹菌のフェリクローム又はそのデフェリ体生合成に関与するオルニチンn5−オキシゲナーゼ遺伝子 | |
CN115261363A (zh) | Apobec3a的rna脱氨酶活性测定方法及rna高活性的apobec3a变体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |