CN116970046A - 一种适用于圆红冬孢酵母的2a肽突变体及其筛选方法与应用 - Google Patents
一种适用于圆红冬孢酵母的2a肽突变体及其筛选方法与应用 Download PDFInfo
- Publication number
- CN116970046A CN116970046A CN202210421108.2A CN202210421108A CN116970046A CN 116970046 A CN116970046 A CN 116970046A CN 202210421108 A CN202210421108 A CN 202210421108A CN 116970046 A CN116970046 A CN 116970046A
- Authority
- CN
- China
- Prior art keywords
- peptide
- sequence
- mutant
- interest
- strain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012216 screening Methods 0.000 title claims abstract description 29
- 241000221523 Rhodotorula toruloides Species 0.000 title abstract description 48
- 239000013612 plasmid Substances 0.000 claims abstract description 53
- 230000014509 gene expression Effects 0.000 claims abstract description 31
- 108020004414 DNA Proteins 0.000 claims abstract description 28
- 239000001963 growth medium Substances 0.000 claims abstract description 18
- 108091026890 Coding region Proteins 0.000 claims abstract description 16
- 241000235342 Saccharomycetes Species 0.000 claims abstract description 6
- 238000012163 sequencing technique Methods 0.000 claims abstract description 6
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 2
- 108090000623 proteins and genes Proteins 0.000 claims description 51
- 102000004169 proteins and genes Human genes 0.000 claims description 26
- 229920001184 polypeptide Polymers 0.000 claims description 24
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 24
- 150000007523 nucleic acids Chemical class 0.000 claims description 21
- 108020004707 nucleic acids Proteins 0.000 claims description 19
- 102000039446 nucleic acids Human genes 0.000 claims description 19
- 239000012620 biological material Substances 0.000 claims description 11
- 102000053602 DNA Human genes 0.000 claims description 9
- 230000004186 co-expression Effects 0.000 claims description 5
- 238000002360 preparation method Methods 0.000 claims description 4
- 244000005700 microbiome Species 0.000 claims description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 abstract description 14
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 abstract description 6
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 abstract description 6
- 239000000243 solution Substances 0.000 description 24
- 239000000047 product Substances 0.000 description 21
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 18
- 239000002904 solvent Substances 0.000 description 18
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 16
- 238000003776 cleavage reaction Methods 0.000 description 14
- 239000002609 medium Substances 0.000 description 14
- 235000018102 proteins Nutrition 0.000 description 14
- 230000007017 scission Effects 0.000 description 14
- 239000000203 mixture Substances 0.000 description 13
- 102100036669 Glycerol-3-phosphate dehydrogenase [NAD(+)], cytoplasmic Human genes 0.000 description 12
- 101001072574 Homo sapiens Glycerol-3-phosphate dehydrogenase [NAD(+)], cytoplasmic Proteins 0.000 description 12
- 230000035772 mutation Effects 0.000 description 12
- 238000012546 transfer Methods 0.000 description 10
- 239000000499 gel Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 239000002033 PVDF binder Substances 0.000 description 8
- 239000007788 liquid Substances 0.000 description 8
- 239000002773 nucleotide Substances 0.000 description 8
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 7
- 239000012528 membrane Substances 0.000 description 7
- 238000001262 western blot Methods 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- 101150007280 LEU2 gene Proteins 0.000 description 6
- 150000001413 amino acids Chemical group 0.000 description 6
- 238000001962 electrophoresis Methods 0.000 description 6
- 239000008103 glucose Substances 0.000 description 6
- 238000010008 shearing Methods 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 241000589158 Agrobacterium Species 0.000 description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 5
- 239000008188 pellet Substances 0.000 description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 4
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 4
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 239000007853 buffer solution Substances 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 230000030648 nucleus localization Effects 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 238000009630 liquid culture Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 230000001954 sterilising effect Effects 0.000 description 3
- 238000004659 sterilization and disinfection Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 229960004295 valine Drugs 0.000 description 3
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 2
- 101150073246 AGL1 gene Proteins 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- GUKYYUFHWYRMEU-WHFBIAKZSA-N Cys-Gly-Asp Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O GUKYYUFHWYRMEU-WHFBIAKZSA-N 0.000 description 2
- CKLJMWTZIZZHCS-UHFFFAOYSA-N D-OH-Asp Natural products OC(=O)C(N)CC(O)=O CKLJMWTZIZZHCS-UHFFFAOYSA-N 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-UWTATZPHSA-N L-Aspartic acid Natural products OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 2
- 235000019766 L-Lysine Nutrition 0.000 description 2
- FFEARJCKVFRZRR-UHFFFAOYSA-N L-Methionine Natural products CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 2
- 229930064664 L-arginine Natural products 0.000 description 2
- 235000014852 L-arginine Nutrition 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 239000004201 L-cysteine Substances 0.000 description 2
- 235000013878 L-cysteine Nutrition 0.000 description 2
- 229930182844 L-isoleucine Natural products 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 229930195722 L-methionine Natural products 0.000 description 2
- 229930182821 L-proline Natural products 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 2
- 235000019270 ammonium chloride Nutrition 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 229960005261 aspartic acid Drugs 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007865 diluting Methods 0.000 description 2
- 239000011790 ferrous sulphate Substances 0.000 description 2
- 235000003891 ferrous sulphate Nutrition 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 229960002885 histidine Drugs 0.000 description 2
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 2
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 2
- 239000012160 loading buffer Substances 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 229960004452 methionine Drugs 0.000 description 2
- 239000011259 mixed solution Substances 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 229960005190 phenylalanine Drugs 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 230000001376 precipitating effect Effects 0.000 description 2
- 229960002429 proline Drugs 0.000 description 2
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 238000007789 sealing Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 229960001153 serine Drugs 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 229960002898 threonine Drugs 0.000 description 2
- 229960004799 tryptophan Drugs 0.000 description 2
- 229960004441 tyrosine Drugs 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 101800004419 Cleaved form Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 108010009736 Protein Hydrolysates Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009697 arginine Nutrition 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000004327 boric acid Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 235000021466 carotenoid Nutrition 0.000 description 1
- 150000001747 carotenoids Chemical class 0.000 description 1
- 229960005229 ceftiofur Drugs 0.000 description 1
- ZBHXIWJRIFEVQY-IHMPYVIRSA-N ceftiofur Chemical compound S([C@@H]1[C@@H](C(N1C=1C(O)=O)=O)NC(=O)\C(=N/OC)C=2N=C(N)SC=2)CC=1CSC(=O)C1=CC=CO1 ZBHXIWJRIFEVQY-IHMPYVIRSA-N 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- JZCCFEFSEZPSOG-UHFFFAOYSA-L copper(II) sulfate pentahydrate Chemical compound O.O.O.O.O.[Cu+2].[O-]S([O-])(=O)=O JZCCFEFSEZPSOG-UHFFFAOYSA-L 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 108010005155 delta-12 fatty acid desaturase Proteins 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- DBLXOVFQHHSKRC-UHFFFAOYSA-N ethanesulfonic acid;2-piperazin-1-ylethanol Chemical compound CCS(O)(=O)=O.OCCN1CCNCC1 DBLXOVFQHHSKRC-UHFFFAOYSA-N 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 239000004519 grease Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 1
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 1
- ISPYRSDWRDQNSW-UHFFFAOYSA-L manganese(II) sulfate monohydrate Chemical compound O.[Mn+2].[O-]S([O-])(=O)=O ISPYRSDWRDQNSW-UHFFFAOYSA-L 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 239000005332 obsidian Substances 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- PJNZPQUBCPKICU-UHFFFAOYSA-N phosphoric acid;potassium Chemical compound [K].OP(O)(O)=O PJNZPQUBCPKICU-UHFFFAOYSA-N 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 230000003234 polygenic effect Effects 0.000 description 1
- 239000001294 propane Substances 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 description 1
- 229960001225 rifampicin Drugs 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- RZLVQBNCHSJZPX-UHFFFAOYSA-L zinc sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Zn+2].[O-]S([O-])(=O)=O RZLVQBNCHSJZPX-UHFFFAOYSA-L 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/02—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
- C12Q1/04—Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Mycology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Toxicology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明公开了一种适用于圆红冬孢酵母的2A肽突变体及其筛选方法与应用。所述2A肽突变体的氨基酸序列如序列表中序列6所示。所述2A肽突变体的筛选方法包括如下步骤:1)通过易错PCR将适用于酵母菌的2A肽编码序列进行突变,得到易错PCR产物,并构建到质粒中,得到带有2A肽突变体的质粒文库;2)将所述带有2A肽突变体的质粒文库转染酵母菌,然后用营养缺陷型培养基进行筛选,选择比对照菌株生长好的菌株作为目标菌株;3)提取所述目标菌株的基因组DNA并进行测序,获得2A肽突变体编码序列。本发明对利用酵母表达系统制备重组蛋白或提高重组蛋白表达水平具有重要意义。
Description
技术领域
本发明属于生物技术领域,具体涉及一种适用于圆红冬孢酵母的2A肽突变体及其筛选方法与应用。
背景技术
2A肽是一类长度为18-22个氨基酸残基的肽片段,存在2个蛋白之间,能诱导细胞内含有2A肽的重组蛋白自我剪切,理论上可以实现两个基因的等量表达,因此2A肽非常适合用于构建双顺反子载体,但目前报道的2A肽介导的双顺反子载体的目的基因表达水平较低。
圆红冬孢酵母作为一种产油微生物,可天然累积类胡萝卜素,其具有生长周期短、利用碳源广泛、油脂积累量多等优点,且其对纤维素水解液中的诸如乙酸等毒性物质具有天然抗性,被认为是一株具有广泛工业应用前景的菌株。然而,受限于遗传操作的便利性和可操控性,使得对圆红冬孢酵母遗传改造研究进展缓慢、效率较低。
发明内容
本发明的一个目的是提供一种多肽。
本发明提供的多肽的氨基酸序列如序列表中序列2或序列6所示。
本发明的另一个目的是提供编码上述多肽的核酸分子。
本发明提供的编码上述多肽的核酸分子为如下A1)或A2):
A1)其编码序列是序列表中序列1或序列5所示的DNA分子;
A2)与A1)限定的DNA分子具有75%以上的同一性且编码上述多肽的DNA分子。
上述A1)所述核酸分子可以是DNA,如重组DNA;所述核酸分子也可以是RNA,如mRNA或hnRNA等。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码上述多肽的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明分离得到的多肽核苷酸序列75%或者更高同一性的核苷酸,只要编码上述多肽且具有相同功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
上述A2)所述核酸分子中,所述同一性是指与天然核酸序列的序列相似性。同一性包括与本发明的编码序列2或序列6所示的氨基酸序列组成的多肽的核苷酸序列具有75%或更高,或80%或更高,或85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
本发明还有一个目的是提供与上述多肽相关的生物材料。
本发明提供的与上述多肽相关的生物材料为含有上述核酸分子的表达盒、重组载体或重组微生物。
进一步的,所述重组载体可为双顺反子载体或多顺反子载体。
本发明还有一个目的是提供上述多肽或上述核酸分子或上述生物材料的新用途。
本发明提供了上述多肽在作为2A肽中的应用。
本发明还提供了上述多肽或上述核酸分子或上述生物材料在多个目的基因共表达或同时表达多个目的基因中的应用。
本发明还提供了上述多肽或上述核酸分子或上述生物材料在制备目的蛋白中的应用。
本发明还提供了上述多肽或上述核酸分子或上述生物材料在提高目的蛋白表达水平中的应用。
本发明还有一个目的是提供一种多个目的基因共表达或同时表达多个目的基因的方法。
本发明提供的多个目的基因共表达或同时表达多个目的基因的方法包括用上述核酸分子连接多个目的基因进行表达的步骤。
进一步的,所述方法包括用上述核酸分子连接两个目的基因进行表达的步骤。
更进一步的,所述方法包括用上述核酸分子连接LEU2基因序列(带有flag标签)和EGFP基因序列(带有SV40核定位序列)进行表达的步骤。
本发明最后一个目的是提供一种2A肽突变体的筛选方法。
本发明提供的2A肽突变体的筛选方法包括如下步骤:
1)通过易错PCR将适用于酵母菌的2A肽编码序列进行突变,得到易错PCR产物,并构建到质粒中,得到带有2A肽突变体的质粒文库;
2)将所述带有2A肽突变体的质粒文库转染酵母菌,然后用营养缺陷型培养基进行筛选,选择比对照菌株生长好的菌株作为目标菌株;
3)提取所述目标菌株的基因组DNA并进行测序,获得2A肽突变体编码序列。
所述步骤1)中,所述质粒可为质粒P0,所述质粒P0具体为在质粒pKOCAR2的NcoI酶切位点处插入序列表中序列4所示的DNA分子后得到的质粒;所述质粒pKOCAR2的核苷酸序列如序列表中序列3所示。
所述步骤1)可包括如下步骤:
1-1)以P1质粒为模板采用序列7和序列8组成的引物对进行随机突变,得到易错PCR产物;所述P1质粒具体为在所述质粒P0的SmaI酶切位点处插入序列表中序列1所示的DNA分子后得到的质粒;
1-2)利用限制内切酶SmaI酶切所述质粒P0,得到酶切产物;
1-3)将所述易错PCR产物和所述酶切产物进行组装,得到带有所述2A肽突变体的质粒文库。
进一步的,所述随机突变可采用GeneMorph II Random Mutagenesis试剂盒构建突变体系。
所述组装可采用Gibson assembly试剂盒构建组装体系。
更进一步的,所述突变体系(50μl)具体如下:41.5μL水,5μL 10×Mutazyme IIreaction buffer,1μL 40mM dNTP混合物,0.25μL上游引物(引物浓度为250ng/μL,序列7),0.25μL下游引物(引物浓度为250ng/μL,序列8),1μL Mutazyme II DNA polymerase(2.5U/μL),500ng模板(P1质粒)。
所述组装体系中,所述酶切产物与所述易错PCR产物的摩尔比可为2:1。
所述组装的条件可为50℃反应20分钟。
所述步骤2)中,所述营养缺陷型培养基由溶剂和溶质组成,溶剂为水,溶质及其浓度分别为:酵母基础氮源1.7g/L、硫酸铵5g/L、L-精氨酸0.1g/L、L-半胱氨酸0.1g/L、L-赖氨酸0.1g/L、L-苏氨酸0.1g/L、L-天冬氨酸0.05g/L、L-异亮氨酸0.05g/L、L-苯丙氨酸0.05g/L、L-脯氨酸0.05g/L、L-丝氨酸0.05g/L、L-酪氨酸0.05g/L、L-缬氨酸0.05g/L、L-甲硫氨酸0.05g/L、L-色氨酸0.1g/L、L-组氨酸0.05g/L、L-尿嘧啶0.1g/L、L-腺嘌呤0.1g/L,葡萄糖20g/L。
所述选择比对照菌株生长好的菌株为选择比对照菌株生长快且比对照菌株OD600nm数值大的菌株。所述对照菌株具体可为下文中的重组圆红冬孢酵母Strain 1。
所述步骤3)可包括如下步骤:提取所述目标菌株的基因组DNA,采用序列9和序列10组成的引物对进行扩增,并对扩增产物进行测序,获得2A肽突变体编码序列。
上述方法中,所述2A肽可为序列表中序列2所示的多肽;
所述2A肽突变体可为序列表中序列6所示的多肽。
所述2A肽突变体的剪切效率(切割效率)大于所述2A肽。
按照上述方法筛选获得的2A肽突变体也属于本发明的保护范围。
如下a1)-a4)任一所述应用也属于本发明保护范围:
a1)按照上述2A肽突变体筛选方法筛选获得的2A肽突变体在作为2A肽中的应用;
a2)上述2A肽突变体的筛选方法或按照上述2A肽突变体筛选方法筛选获得的2A肽突变体在多个目的基因共表达或同时表达多个目的基因中的应用;
a3)上述2A肽突变体的筛选方法或按照上述2A肽突变体筛选方法筛选获得的2A肽突变体在制备目的蛋白中的应用;
a4)上述2A肽突变体的筛选方法或按照上述2A肽突变体筛选方法筛选获得的2A肽突变体在提高目的蛋白表达水平中的应用。
上述任一所述方法或应用中,所述制备目的蛋白为利用酵母菌制备目的蛋白。
所述提高目的蛋白表达水平为提高目的蛋白在酵母菌中的表达水平。
上述任一所述方法或应用中,所述提高目的蛋白表达水平体现为提高2A肽剪切效率。
上述任一所述方法或应用中,所述目的蛋白可为重组蛋白。
上述任一所述方法或应用中,所述多个目的基因可为两个目的基因。所述多个目的基因共表达或同时表达多个目的基因为在单个启动子驱动下多个目的基因共表达或在单个启动子驱动下同时表达多个目的基因。
上述任一所述方法或应用中,所述酵母菌可为圆红冬孢酵母(Rhodosporidiumtoruloides)。所述圆红冬孢酵母(Rhodosporidium toruloides)具体可为圆红冬孢酵母(Rhodosporidium toruloides)菌株NCYC 1585。
本发明首先鉴定了一个适用于圆红冬孢酵母的2A肽BmCPV1,然后通过易错PCR对该序列进行突变建库,并转化圆红冬孢酵母NCYC 1585菌株,再根据生长状态用营养缺陷型培养基SC-LEU进行筛选,最后获得比2A肽BmCPV1剪切效率更高的2A肽突变体序列,并将其命名为BmCPV1-1。本发明提供了一种适用于圆红冬孢酵母的2A突变体筛选方法,并成功筛选到一个剪切效率提高的2A突变体,对利用酵母表达系统制备重组蛋白或提高重组蛋白表达水平具有重要意义。
附图说明
图1为双顺反子载体的构建。用PGPD1启动子驱动2A肽BmCPV1连接的上游LEU2基因和下游EGFP基因。其中,PGPD1为启动子,T35S为终止子,flag为圆红冬孢酵母密码子优化的flag标签,SV40为核定位序列。
图2为荧光显微镜下观察到的圆红冬孢酵母的绿色荧光。
图3为提取的圆红冬孢酵母Strain 0-3蛋白用flag抗体做的蛋白印迹图像。其中,71KDa的蛋白条带代表flag-LEU2-2A-EGFP这一未切割形式,40KDa的蛋白条带表示flag-LEU2这一切割形式。泳道1:Marker;泳道2:阴性对照(Strain 0);泳道3:阳性对照(Strain2);泳道4:阳性对照(Strain 3);泳道5和6:Strain 1。
图4为BmCPV1序列和BmCPV1-1序列的比较。
图5为提取的突变后菌株1-1蛋白用flag抗体做的蛋白印迹图像。其中,泳道1泳道2为突变后菌株1-1的两个平行样品;泳道3:阴性对照(Strain0);泳道8:marker。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下述实施例中的荧光显微镜型号为Olympus IX73(Olympus,Tokyo,Japan)。
下述实施例中的根癌农杆菌菌株AGL1记载于文献“WANG Y,ZHANG S,POTTER M,etal.Overexpression of Delta12-Fatty Acid Desaturase in the Oleaginous YeastRhodosporidium toruloides for Production of Linoleic Acid-Rich Lipids[J].Applied biochemistry and biotechnology,2016,180(8):1497-507.”中。
下述实施例中的圆红冬孢酵母NCYC 1585记载于文献“JOHNS AM,LOVE J,AVES SJ.Four Inducible Promoters for Controlled Gene Expression in the OleaginousYeast Rhodotorula toruloides[J].Frontiers in microbiology,2016,7(1666).”中。
下述实施例中涉及的培养基配方如下:
2YT培养基由溶剂和溶质组成,溶剂为水,溶质及其浓度分别为:酵母粉10g/L、胰蛋白胨16g/L、氯化钠5g/L。
1mM HEPES溶液由溶剂和溶质组成,溶剂为水,溶质及其浓度为:HEPES 0.2383g/L,调pH=7.0,过滤除菌。
1mM HEPES甘油混合溶液:4.5mL 1mM HEPES溶液与0.5mL甘油等比例混合,过滤除菌。
MinAB培养基由溶剂和溶质组成,溶剂为水,溶质及其浓度分别为:K-salts 10mL/L、M-salts 20mL/L、20%氯化铵2.5mL/L、Z-salts 5mL/L、0.01%硫酸亚铁10mL/L、1%氯化钙1mL/L,过滤除菌后在使用前每100mL加1mL 20%葡萄糖溶液。
K-salts由溶剂和溶质组成,溶剂为水,溶质及其浓度分别为:磷酸氢二钾20.5%、磷酸二氢钾14.5%。
M-salts由溶剂和溶质组成,溶剂为水,溶质及其浓度分别为:七水硫酸镁3%、氯化钠1.5%、硫酸铵2.5%。
Z-salts由溶剂和溶质组成,溶剂为水,溶质及其浓度分别为:七水硫酸锌0.01%、五水硫酸铜0.01%、硼酸0.01%、一水硫酸锰0.01%、NaMbO4·2H2O 0.01%。
MinAB培养基由溶剂和溶质组成,溶剂为水,溶质及其浓度分别为:K-salts 10mL/L、M-salts 20mL/L、20%氯化铵2.5mL/L、Z-salts 5mL/L、0.01%硫酸亚铁10mL/L、1%氯化钙1mL/L,过滤除菌后在使用前每100mL加1mL 20%葡萄糖溶液。
IMB培养基:向500mL的MinAB培养基中加入1M 2-(N-吗啉代)乙磺酸(MES)溶液20mL、50%甘油5mL,高压灭菌。在使用前每100mL补充1mL 20%葡萄糖溶液和0.2mL 0.1MAS溶液。
IMA培养基:向500mL的MinAB培养基中加入1M MES溶液20mL、50%甘油5mL、琼脂粉7.5g,高压灭菌后在使用前每100mL补充1mL 20%葡萄糖溶液和0.2mL 0.1M AS溶液。
营养缺陷型培养基SC-LEU(pH为6)由溶剂和溶质组成,溶剂为水,溶质及其浓度分别为:酵母基础氮源1.7g/L、硫酸铵5g/L、L-精氨酸0.1g/L、L-半胱氨酸0.1g/L、L-赖氨酸0.1g/L、L-苏氨酸0.1g/L、L-天冬氨酸0.05g/L、L-异亮氨酸0.05g/L、L-苯丙氨酸0.05g/L、L-脯氨酸0.05g/L、L-丝氨酸0.05g/L、L-酪氨酸0.05g/L、L-缬氨酸0.05g/L、L-甲硫氨酸0.05g/L、L-色氨酸0.1g/L、L-组氨酸0.05g/L、L-尿嘧啶0.1g/L、L-腺嘌呤0.1g/L,葡萄糖20g/L。
实施例1、一种适用于圆红冬孢酵母的2A突变体及其筛选方法
一、在圆红冬孢酵母中验证2A肽BmCPV1的效果
2A肽BmCPV1的氨基酸序列如序列表中序列2所示,编码序列如序列表中序列1所示。
在圆红冬孢酵母中验证2A肽BmCPV1是否可以实现单个启动子驱动下的多基因共表达。具体步骤如下:
1、质粒P1-P3的获得
1)质粒P0的获得
在质粒pKOCAR2(PGPD1-NcoI-T35S)的NcoI酶切位点处插入序列表中序列4所示的DNA分子(flag-LEU2-SmaI-SV40-EGFP整个片段的核苷酸序列),得到质粒P0(PGPD1-flag-LEU2-SmaI-SV40-EGFP-T35S)。质粒pKOCAR2(PGPD1-NcoI-T35S)的核苷酸序列如序列表中序列3所示。
2)质粒P1的获得
在质粒P0的SmaI酶切位点处插入序列表中序列1所示的DNA分子(2A肽BmCPV1编码序列),得到质粒P1(PGPD1-flag-LEU2-BmCPV1-SV40-EGFP-T35S)。质粒P1中含有片段PGPD1-flag-LEU2-BmCPV1-SV40-EGFP-T35S,其结构如图1所示,依次包括启动子PGPD1序列、flag序列、LEU2基因序列、2A肽BmCPV1编码序列、SV40核定位序列、绿色荧光蛋白基因EGFP序列和终止子T35S序列。在单个启动子PGPD1的驱动下,用2A肽BmCPV1编码序列连接LEU2基因和绿色荧光蛋白基因EGFP。为了便于后续Western blot检测,在LEU2基因序列上游连接了flag序列。为了使荧光定位到细胞核中,在绿色荧光蛋白基因EGFP上游连接了SV40核定位序列。
3)质粒P2的获得
在质粒pKOCAR2(PGPD1-NcoI-T35S)核苷酸序列的NcoI酶切位点处插入序列表中序列4第1-1594位所示的DNA分子,得到质粒P2(PGPD1-flag-LEU2-T35S)。
4)质粒P3的获得
质粒P3(PGPD1-flag-LEU2-SV40-EGFP-T35S)的核苷酸序列为将质粒P0核苷酸序列中的SmaI酶切位点识别序列删除后,且保持质粒P0其它核酸序列不变后得到的序列。
2、酵母转化
通过农杆菌介导转化(ATMT)方法将步骤1中构建的质粒P1-P3分别转入圆红冬孢酵母NCYC 1585中,得到重组圆红冬孢酵母。具体步骤如下:
1)制备农杆菌感受态
(1)将冻存的根癌农杆菌(A.tumefaciens)菌株AGL1于2YT固体培养基上培养活化2天,然后将单克隆接种到5mL 2YT液体培养基中,28℃,250rpm培养至饱和,得到种子液。
(2)将上述种子液在2YT液体培养基中稀释至OD600nm=0.04-0.08,28℃,250rpm培养至OD600nm=0.5。
(3)10000rpm,4℃离心10min收集菌体,用40mL预冷的1mM 4-羟乙基哌嗪乙磺酸(HEPES)溶液温和地悬浮沉淀,重复清洗两次。
(4)用5mL预冷的1mM HEPES甘油混合溶液重悬菌体沉淀,5000rpm离心5min收集菌体。
(5)用1~2mL预冷的1mM HEPES甘油混合溶液重悬菌体沉淀,在冰上分装感受态,每管50μL。
2)农杆菌转化
(1)在冰上将1μL待转化质粒加入分装好的农杆菌感受态细胞中,静置2min后转移到预冷的2mm电转杯中,转移过程中避免气泡产生。
(2)电转仪参数设置为2500V,400Ω,25μF,进行电击,然后立即加入0.5mL2YT液体培养基,28℃,250rpm复苏2小时。
(3)取200μL菌液涂布在含有壮观霉素(终浓度100mg/L)和利福平抗生素(终浓度25mg/L)的2YT固体培养基上,28℃培养2天;同时,将保存的圆红冬孢酵母NCYC 1585菌株划到YPD固体培养基上,于30℃培养。
(4)从2YT固体培养基上挑取单克隆到5~10mL MinAB液体培养基中,28℃,250rpm培养两天至饱和。
(5)隔天下午从YPD固体培养基上挑取酵母单克隆到5mL YPD液体培养基中,30℃,250rpm培养至第二天上午(约20h)。
(6)将培养至饱和的农杆菌菌液稀释到25mL IMB培养基至OD600nm=0.15,以28℃,250rpm培养至OD600nm=0.3~0.4;同时将酵母菌液稀释到10mL YPD培养基中至OD600nm=0.12,以30℃,250rpm培养至OD600nm=0.7~0.8。
(7)将各0.4mL的农杆菌菌液与酵母菌液混合均匀,涂布在IMA培养基上,24℃培养2~3天。
(8)待IMA平板表面菌落层略呈红色后,用涂布棒将菌体涂布到带有潮霉素抗生素(150mg/L)和头孢噻呋抗生素(300mg/L)的YPD固体培养基上,于30℃培养2~4天。
将质粒P1转入圆红冬孢酵母NCYC 1585得到的重组圆红冬孢酵母记作Strain 1。
将质粒P2转入圆红冬孢酵母NCYC 1585得到的重组圆红冬孢酵母记作Strain 2。
将质粒P3转入圆红冬孢酵母NCYC 1585得到的重组圆红冬孢酵母记作Strain 3。
将圆红冬孢酵母NCYC 1585记作Strain 0作为阴性对照株系。
3、荧光检测
通过荧光显微镜观察各重组圆红冬孢酵母是否有荧光。
结果如图2所示,荧光显微镜下观察到重组圆红冬孢酵母Strain 1细胞核内有荧光(图2),EGFP准确定位在细胞核中。
4、剪切效率检测
提取重组圆红冬孢酵母中的蛋白进行Western Blot检测,并计算2A肽BmCPV1的剪切效率。剪切效率=剪切开的强度/(剪切开的强度+未剪切的强度)。剪切开的强度和未剪切的强度通过Image J软件对条带进行灰度分析来确定。
蛋白提取及Western Blot检测步骤如下:
将4mL培养菌液在2mL无菌离心管中以12000rpm、1min离心收集菌体,用1mL无菌水重悬沉淀后离心弃上清,再用2mL 1×PBS缓冲液重悬沉淀后加入预装有不同规格玻璃珠的MP管中与玻璃珠混匀,使用蛋白提取仪以6m/s震荡20s,重复5次,单次完成后将MP管置于冰上静置5min,5次后用预冷到4℃的离心机低温离心20min,取蛋白溶液(即上清)20μL与等体积2×SDS-loading上样缓冲液混匀后在100℃加热5min使蛋白质变性,剩余蛋白样品于-80℃超低温冰箱冻存。
配制SDS-PAGE凝胶电泳蛋白胶(分离胶和浓缩胶配方分别如表1和表2所示),制备完成后将20μL制备的蛋白上样缓冲液垂直加入上样孔内,在电泳槽内以1×电泳缓冲液进行电泳,分离胶电泳条件为80V、约30min,浓缩胶电泳条件为110V、90min。
表1、SDS-PAGE分离胶配方
表2、SDS-PAGE浓缩胶配方
电泳结束后,在转膜仪上用1×转印缓冲液浸透下层转印滤纸和0.45μm PVDF膜,将凝胶切至合适大小后转移到PVDF膜上铺平后放置上层转印滤纸并用1×转印缓冲浸湿,然后调整转膜仪和转印条件(20mA、约120min)进行转印。
转膜结束后将PVDF膜蛋白面朝下没入5%的脱脂奶粉1×TBST溶液中进行封闭,封闭时间为用脱色摇床60rpm、室温2h,封闭完成后将PVDF膜同样蛋白面朝下没入稀释了4μL一抗的20mL 5%脱脂奶粉1×TBST溶液进行一抗孵育(4℃过夜),一抗孵育完成后用1×TBST溶液每10min洗一次共三次,然后将PVDF膜蛋白面朝下没入稀释了4μL二抗的20mL 5%脱脂奶粉1×TBST溶液进行二抗孵育(脱色摇床60rpm、室温2h),二抗孵育完成后用1×TBST溶液每10min洗一次共三次,洗完后将PVDF膜蛋白面朝上用Super ECL Plus超敏发光液(加强型)A/B混合液进行显色,超敏发光液的A液B液等体积混合后均匀滴加在PVDF膜上后,将PVDF膜置于无光处10min即可进行照胶显色。
Western Blot检测所用一抗为Flag-Tag rabbit polyclonal antibody(Huaxingbio,Beijing,China),二抗为HRP Anti-Rabbit IgG(H+L)Antibody(Huaxingbio,Beijing,China)。
结果如图3所示,Western blot检测结果表明:重组圆红冬孢酵母Strain 1有两条带(图3),即剪切开的形式(flag-LEU2)和未剪切的形式(flag-LEU2-BmCPV1-EGFP)。说明2A肽BmCPV1在圆红冬孢酵母中适用,能够实现圆红冬孢酵母中在单个启动子驱动下两个基因的共表达,剪切效率为53%。
二、突变菌株的筛选
1、质粒文库的构建
结合Error prone PCR,对2A肽BmCPV1进行突变建库,回收易错PCR产物,并构建到质粒P0中,获得带有2A肽BmCPV1突变体的质粒文库。具体步骤如下:
1)利用安捷伦科技公司的GeneMorph II Random Mutagenesis试剂盒对2A肽BmCPV1进行随机突变,获得易错PCR产物。按试剂盒方法建立突变体系,其中进行随机突变的突变率为0-4.5mutations/kb。
50μL突变体系包含:41.5μL水,5μL 10×Mutazyme II reaction buffer,1μL40mM dNTP混合物,0.25μL上游引物(引物浓度为250ng/μL),0.25μL下游引物(引物浓度为250ng/μL),1μL Mutazyme II DNA polymerase(2.5U/μL),500ng模板(采用P1质粒为模板)。引物序列如下:
上游引物:CTTACGGGATTGCTTAC(序列7);
下游引物:CCGGATCCGCGACCTTT(序列8)。
2)利用限制内切酶SmaI酶切质粒P0,得到酶切产物,然后将获得的酶切产物以及步骤1获得的易错PCR产物,利用下述方法进行纯化,得到纯化后产物。
a、易错PCR产物加入1.5mL离心管中,加1/10体积的NaAc(3M,pH5.7)和等体积的异丙醇,-20℃放置20min。12000rpm、4℃离心10min。
b、结束离心后,轻柔丢弃上清,缓慢加入新鲜配置1mL 70%冰乙醇清洗,12000rpm、4℃离心10min,重复该步骤并清洗DNA沉淀两次。
c、轻柔丢弃上清,用小型离心机短暂离心残留在管壁的乙醇溶液并用200μL枪头轻柔吸走,将离心管放置于65℃金属浴上烘干。
d、加入20μL ddH2O再次溶解,取1μL模板DNA溶液于Nanodrop分光光度计上测量模板DNA浓度。
e、-20℃保存。
3)将纯化后的酶切产物以及易错PCR产物,利用NEB公司的Gibson assembly试剂盒进行组装。按试剂盒方法建立组装体系,组装体系中酶切产物与易错PCR产物的摩尔比为2:1,并通过补水使体积达到10μL,同时加入10μL Gibson Assembly Master Mix(2X),得到组装体系。将组装体系50℃反应20分钟,获得带有2A肽BmCPV1突变体的质粒文库。
2、突变菌株的筛选
按照步骤一中的ATMT法将步骤1构建的质粒文库转化圆红冬孢酵母NCYC 1585菌株,由于该菌株为LEU基因缺失菌株,可以用营养缺陷型培养基SC-LEU进行筛选。只有成功表达了LEU基因的菌株才能在该培养基中生长,而且LEU基因表达量越高,生长状况越好。
通过在SC-LEU培养基中传代培养,最终获得一株比重组圆红冬孢酵母Strain 1生长好(在SC-LEU培养基中比重组圆红冬孢酵母Strain 1生长快,且OD600nm数值大于重组圆红冬孢酵母Strain 1)的突变菌株,并将其命名为圆红冬孢酵母突变菌株Strain 1-1。
三、BmCPV1-1突变体的获得
提取圆红冬孢酵母突变菌株Strain 1-1的基因组DNA,以基因组DNA为模板,在LEU2基因C端和EGFP基因N端设计引物对(LEU2-F3和EGFP-R3)进行扩增,并对扩增产物进行测序。引物序列如下:
LEU2-F3:GACTACGACCCAGGTTGGAG(序列9);
EGFP-R3:CGAGCTCGACGAGGATCGGG(序列10)。
结果如图4所示,测序结果发现:圆红冬孢酵母突变菌株Strain 1-1中的2A肽BmCPV1编码序列有两个碱基发生突变,分别为:序列1第2位由碱基G突变为碱基A、第37位由碱基A突变为碱基G。突变后的2A肽BmCPV1编码序列如序列表中序列5所示,其编码的氨基酸序列如序列表中序列6所示,并将其命名为BmCPV1-1。2A肽突变体BmCPV1-1为将2A肽BmCPV1氨基酸序列第1位的精氨酸突变为赖氨酸,且将第13位的异亮氨酸突变为缬氨酸后得到的2A肽。
四、BmCPV1-1突变体的剪切效率检测
选取两个BmCPV1-1突变菌株按照步骤一的4中的方法检测BmCPV1-1突变体的剪切效率。
结果表明:BmCPV1-1突变体的剪切效率为63%,比2A肽BmCPV1的剪切效率提升了19%,证明了本发明筛选方法的有效性。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 合曜生物科技(南京)有限公司
<120> 一种适用于圆红冬孢酵母的2A肽突变体及其筛选方法与应用
<160> 10
<170> PatentIn version 3.5
<210> 1
<211> 57
<212> DNA
<213> Artificial Sequence
<400> 1
aggtcgaact acgacctcct caagctctgc ggcgacatcg agtcgaaccc gggcccg 57
<210> 2
<211> 19
<212> PRT
<213> Artificial Sequence
<400> 2
Arg Ser Asn Tyr Asp Leu Leu Lys Leu Cys Gly Asp Ile Glu Ser Asn
1 5 10 15
Pro Gly Pro
<210> 3
<211> 11742
<212> DNA
<213> Artificial Sequence
<400> 3
agtactttga tccaacccct ccgctgctat agtgcagtcg gcttctgacg ttcagtgcag 60
ccgtcttctg aaaacgacat gtcgcacaag tcctaagtta cgcgacaggc tgccgccctg 120
cccttttcct ggcgttttct tgtcgcgtgt tttagtcgca taaagtagaa tacttgcgac 180
tagaaccgga gacattacgc catgaacaag agcgccgccg ctggcctgct gggctatgcc 240
cgcgtcagca ccgacgacca ggacttgacc aaccaacggg ccgaactgca cgcggccggc 300
tgcaccaagc tgttttccga gaagatcacc ggcaccaggc gcgaccgccc ggagctggcc 360
aggatgcttg accacctacg ccctggcgac gttgtgacag tgaccaggct agaccgcctg 420
gcccgcagca cccgcgacct actggacatt gccgagcgca tccaggaggc cggcgcgggc 480
ctgcgtagcc tggcagagcc gtgggccgac accaccacgc cggccggccg catggtgttg 540
accgtgttcg ccggcattgc cgagttcgag cgttccctaa tcatcgaccg cacccggagc 600
gggcgcgagg ccgccaaggc ccgaggcgtg aagtttggcc cccgccctac cctcaccccg 660
gcacagatcg cgcacgcccg cgagctgatc gaccaggaag gccgcaccgt gaaagaggcg 720
gctgcactgc ttggcgtgca tcgctcgacc ctgtaccgcg cacttgagcg cagcgaggaa 780
gtgacgccca ccgaggccag gcggcgcggt gccttccgtg aggacgcatt gaccgaggcc 840
gacgccctgg cggccgccga gaatgaacgc caagaggaac aagcatgaaa ccgcaccagg 900
acggccagga cgaaccgttt ttcattaccg aagagatcga ggcggagatg atcgcggccg 960
ggtacgtgtt cgagccgccc gcgcacgtct caaccgtgcg gctgcatgaa atcctggccg 1020
gtttgtctga tgccaagctg gcggcctggc cggccagctt ggccgctgaa gaaaccgagc 1080
gccgccgtct aaaaaggtga tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg 1140
cgtatatgat gcgatgagta aataaacaaa tacgcaaggg gaacgcatga aggttatcgc 1200
tgtacttaac cagaaaggcg ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc 1260
cctgcaactc gccggggccg atgttctgtt agtcgattcc gatccccagg gcagtgcccg 1320
cgattgggcg gccgtgcggg aagatcaacc gctaaccgtt gtcggcatcg accgcccgac 1380
gattgaccgc gacgtgaagg ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc 1440
ccaggcggcg gacttggctg tgtccgcgat caaggcagcc gacttcgtgc tgattccggt 1500
gcagccaagc ccttacgaca tatgggccac cgccgacctg gtggagctgg ttaagcagcg 1560
cattgaggtc acggatggaa ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg 1620
cacgcgcatc ggcggtgagg ttgccgaggc gctggccggg tacgagctgc ccattcttga 1680
gtcccgtatc acgcagcgcg tgagctaccc aggcactgcc gccgccggca caaccgttct 1740
tgaatcagaa cccgagggcg acgctgcccg cgaggtccag gcgctggccg ctgaaattaa 1800
atcaaaactc atttgagtta atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta 1860
agtgccggcc gtccgagcgc acgcagcagc aaggctgcaa cgttggccag cctggcagac 1920
acgccagcca tgaagcgggt caactttcag ttgccggcgg aggatcacac caagctgaag 1980
atgtacgcgg tacgccaagg caagaccatt accgagctgc tatctgaata catcgcgcag 2040
ctaccagagt aaatgagcaa atgaataaat gagtagatga attttagcgg ctaaaggagg 2100
cggcatggaa aatcaagaac aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg 2160
aacgggcggt tggccaggcg taagcggctg ggttgtctgc cggccctgca atggcactgg 2220
aacccccaag cccgaggaat cggcgtgagc ggtcgcaaac catccggccc ggtacaaatc 2280
ggcgcggcgc tgggtgatga cctggtggag aagttgaagg ccgcgcaggc cgcccagcgg 2340
caacgcatcg aggcagaagc acgccccggt gaatcgtggc aagcggccgc tgatcgaatc 2400
cgcaaagaat cccggcaacc gccggcagcc ggtgcgccgt cgattaggaa gccgcccaag 2460
ggcgacgagc aaccagattt tttcgttccg atgctctatg acgtgggcac ccgcgatagt 2520
cgcagcatca tggacgtggc cgttttccgt ctgtcgaagc gtgaccgacg agctggcgag 2580
gtgatccgct acgagcttcc agacgggcac gtagaggttt ccgcagggcc ggccggcatg 2640
gccagtgtgt gggattacga cctggtactg atggcggttt cccatctaac cgaatccatg 2700
aaccgatacc gggaagggaa gggagacaag cccggccgcg tgttccgtcc acacgttgcg 2760
gacgtactca agttctgccg gcgagccgat ggcggaaagc agaaagacga cctggtagaa 2820
acctgcattc ggttaaacac cacgcacgtt gccatgcagc gtacgaagaa ggccaagaac 2880
ggccgcctgg tgacggtatc cgagggtgaa gccttgatta gccgctacaa gatcgtaaag 2940
agcgaaaccg ggcggccgga gtacatcgag atcgagctag ctgattggat gtaccgcgag 3000
atcacagaag gcaagaaccc ggacgtgctg acggttcacc ccgattactt tttgatcgat 3060
cccggcatcg gccgttttct ctaccgcctg gcacgccgcg ccgcaggcaa ggcagaagcc 3120
agatggttgt tcaagacgat ctacgaacgc agtggcagcg ccggagagtt caagaagttc 3180
tgtttcaccg tgcgcaagct gatcgggtca aatgacctgc cggagtacga tttgaaggag 3240
gaggcggggc aggctggccc gatcctagtc atgcgctacc gcaacctgat cgagggcgaa 3300
gcatccgccg gttcctaatg tacggagcag atgctagggc aaattgccct agcaggggaa 3360
aaaggtcgaa aaggtctctt tcctgtggat agcacgtaca ttgggaaccc aaagccgtac 3420
attgggaacc ggaacccgta cattgggaac ccaaagccgt acattgggaa ccggtcacac 3480
atgtaagtga ctgatataaa agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa 3540
cttattaaaa ctcttaaaac ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc 3600
gaagagctgc aaaaagcgcc tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg 3660
cgtcggccta tcgcggccgc tggccgctca aaaatggctg gcctacggcc aggcaatcta 3720
ccagggcgcg gacaagccgc gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc 3780
ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 3840
ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 3900
gggtgttggc gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta 3960
tactggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt 4020
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg 4080
ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 4140
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 4200
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 4260
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 4320
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 4380
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 4440
catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 4500
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 4560
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 4620
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 4680
actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 4740
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 4800
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 4860
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gcatgatata 4920
tctcccaatt tgtgtagggc ttattatgca cgcttaaaaa taataaaagc agacttgacc 4980
tgatagtttg gctgtgagca attatgtgct tagtgcatct aatcgcttga gttaacgccg 5040
gcgaagcggc gtcggcttga acgaatttct agctagacat tatttgccga ctaccttggt 5100
gatctcgcct ttcacgtagt ggacaaattc ttccaactga tctgcgcgcg aggccaagcg 5160
atcttcttct tgtccaagat aagcctgtct agcttcaagt atgacgggct gatactgggc 5220
cggcaggcgc tccattgccc agtcggcagc gacatccttc ggcgcgattt tgccggttac 5280
tgcgctgtac caaatgcggg acaacgtaag cactacattt cgctcatcgc cagcccagtc 5340
gggcggcgag ttccatagcg ttaaggtttc atttagcgcc tcaaatagat cctgttcagg 5400
aaccggatca aagagttcct ccgccgctgg acctaccaag gcaacgctat gttctcttgc 5460
ttttgtcagc aagatagcca gatcaatgtc gatcgtggct ggctcgaaga tacctgcaag 5520
aatgtcattg cgctgccatt ctccaaattg cagttcgcgc ttagctggat aacgccacgg 5580
aatgatgtcg tcgtgcacaa caatggtgac ttctacagcg cggagaatct cgctctctcc 5640
aggggaagcc gaagtttcca aaaggtcgtt gatcaaagct cgccgcgttg tttcatcaag 5700
ccttacggtc accgtaacca gcaaatcaat atcactgtgt ggcttcaggc cgccatccac 5760
tgcggagccg tacaaatgta cggccagcaa cgtcggttcg agatggcgct cgatgacgcc 5820
aactacctct gatagttgag tcgatacttc ggcgatcacc gcttccccca tgatgtttaa 5880
ctttgtttta gggcgactgc cctgctgcgt aacatcgttg ctgctccata acatcaaaca 5940
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtaccccaaa 6000
aaaacatgtc ataacaagaa gccatgaaaa ccgccactgc gccgttacca ccgctgcgtt 6060
cggtcaaggt tctggaccag ttgcgtgacg gcagttacgc tacttgcatt acagcttacg 6120
aaccgaacga ggcttatgtc cactgggttc gtgcccgaat tgatcacagg cagcaacgct 6180
ctgtcatcgt tacaatcaac atgctaccct ccgcgagatc atccgtgttt caaacccggc 6240
agcttagttg ccgttcttcc gaatagcatc ggtaacatga gcaaagtctg ccgccttaca 6300
acggctctcc cgctgacgcc gtcccggact gatgggctgc ctgtatcgag tggtgatttt 6360
gtgccgagct gccggtcggg gagctgttgg ctggctggtg gcaggatata ttgtggtgta 6420
aacaaattga cgcttagaca acttaataac acattgcgga cgtttttaat gtactgaatt 6480
aacgccgaat tgaattcggt tgagaaacca gcgagaccat ctattccagc caatatgcac 6540
aacttgtagg gattctgctt ttgccccgtc acaacgcctg ccacgctttg cgcgccctcg 6600
cccccttgga caccctcgcg cgctccatga ccctcccctc gtccaaggcc ctcccgaccg 6660
cgtccccaat gctgagataa accaaacacg ccgccctgat ccctcctctc gcctcttgcg 6720
gcaacttctc tatcgcatcc ttactctgtg cagccatctc gttcgcacga gcaagtaggg 6780
cccgcctatc cgccgtcaac tcgggcacag gcgtgtcgag cccgcgacca gggaggtaga 6840
tccgcccaat cttcagatcc gccggtacgt cccgcgcgat attgacgagc tgaagagcct 6900
gtcccatctc cctcgccgca gcgagaacat gtgcgttctc cgcttctgag agggtcgggt 6960
cgcgcgggac tgattgagcg ggtgtgcgcg agtaaggcgt gcagtgtgcc cagacgagtt 7020
ggacgcagag atcggcgacg gacgaggcga cgttattggc gtagacgagg agatccgagt 7080
cggtcttgat gggcaactcg gcggagatac tcgatatgcc gttcccgtta ccgtttgcgc 7140
tgccgttcgt cttgacaccc ttcgagtcgg agagagcgag gaaggagagg tcggtgcgga 7200
agccgtcgag gagttcgtta agcggcgggc gggcaatagg gagaaggctg aggaggcgga 7260
atgcgcctcg ttcgggctcg ctcaagccgg gcaaggccgc ctcgatctgc ttgttcgaaa 7320
cgcggacggg gagagaggtg ggcgtggagg aggagggagg gtagaggagg tcgaggcagc 7380
ccgaaatcat gtcgatgttg gattcggctg ctgcgactgt cgaggcgttg tcgatcaggt 7440
cgtcgcagac tcggcaccag gcgtagctgc gatactctca aggtcagctc gaattcggat 7500
cctaccgttc gtatagcata cattatacga agttatacta gcatgaccat ctccaagggc 7560
gagtcgttca tccagggctc caagctctga ctcgccggcg catcgacggg cgcgagccac 7620
aaggcgagga tgtgagagga ggcgtttcct ccaccttgga ccccatctgc cgcctccctt 7680
tctctctctt tctttccctt cctctctctc tctctctctc tcgttctcct ccttctgggc 7740
ctctcggacc tcttcctcgc cgtcgactcg tgaaaatgca gtgcgcgttt ctgtaccttg 7800
tcctgcgaga gagatctggt tctgcgaggg tgagtcgttg ccttggccgt ggcacgcctc 7860
gccgcagcga gagagaagag gccacggtcc aggacgacga cgacgaggag gaagcgcaaa 7920
aggcgagaca ccgagtgcca tcgattcccc gctcgaacct gctcacggct gtcgaaggcg 7980
gtgcgccacg gtgcttgcgg gagcgaaagc aagctggcgt cgtcctcttg aactggttcg 8040
agtccgtgag ggcggcgacg agaactcagg cgaggtgctc gcgtcggaac aagccgggct 8100
tgtggtcgag ggagcgagag cgaggcagcg ccgtcgtcgc cgaggcaaga gcggcatcga 8160
caagttggcc cgtcgcctct cgctccctct tctcctcctc ccaccaccac ctttctccag 8220
ctcgaaccat gaagaagccg gagctcaccg ccacctcggt cgagaagttc ctcatcgaga 8280
agttcgactc ggtctcggac ctcatgcagc tctcggaggg cgaggagtcg cgcgccttct 8340
cgttcgacgt cggcggccgc ggctacgtcc tccgcgtcaa ctcgtgcgcc gacggcttct 8400
acaaggaccg ctacgtctac cgccacttcg cctcggccgc cctcccgatc ccggaggtcc 8460
tcgacatcgg cgagttctcg gagtcgctca cctactgcat ctcgcgccgc gcccagggcg 8520
tcaccctcca ggacctcccg gagaccgagc tcccggccgt cctccagccg gtcgccgagg 8580
cgatggacgc catcgccgcc gccgacctct cgcagacctc gggcttcggc ccgttcggcc 8640
cgcagggcat cggccagtac accacctggc gcgacttcat ctgcgccatc gccgacccgc 8700
acgtctacca ctggcagacc gtcatggacg acaccgtctc ggcctcggtc gcccaggccc 8760
tcgacgagct catgctctgg gccgaggact gcccggaggt ccgccacctc gtccacgccg 8820
acttcggctc gaacaacgtc ctcaccgaca acggccgcat caccgccgtc atcgactggt 8880
cggaggccat gttcggcgac tcgcagtacg aggtcgccaa catcttcttc tggcgcccgt 8940
ggctcgcctg catggagcag cagacccgct acttcgagcg ccgccacccg gagctcgccg 9000
gctcgccgcg cctccgcgcc tacatgctcc gcatcggcct cgaccagctc taccagtcgc 9060
tcgtcgacgg caacttcgac gacgccgcct gggcgcaggg ccgctgcgac gccatcgtcc 9120
gctcgggcgc cggcaccgtc ggccgcaccc agatcgcccg ccgctcggcc gccgtctgga 9180
ccgacggctg cgtcgaggtc ctcgccgact cgggcaaccg ccgcccgtcg acccgcccgc 9240
gcgccaagga gtagcccatc taagatacat tgatgagttt ggacaaacca caactagaat 9300
gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 9360
tataagctgc aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca 9420
gggggagatg tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtaaataact 9480
tcgtatagca tacattatac gaacggtacc ggcgcgccca cctgcaatca tggccttaat 9540
taatctagaa agcttagctt gagcttggat cagattgtcg tttcccgcct tcagtttttt 9600
actagtggac ggcttgttct ctcctgctct ggtgggctgg cctgacatgt aatgtgctcc 9660
gccgcaagtc cgtcgtcggt ctcaattcga cgttgaaagg gcatagcgca aggaagaacc 9720
ctctgcggac atgcagaatt actggctcgc ctgctccttc gtctactgga ataagtcctg 9780
tctcgttaaa gccccaacgt cgtttttcga cgtttgtaag gcgcaagagg tgctatgggc 9840
tacgcaggaa gctgagagga catagaagtc gggggaggaa cggcgcagag cggcagttgc 9900
ggaagcatga ggaaagcgag acggtccagc atctgcagcg ccaatccgca atctcctggt 9960
tgagcctgca ccggaagcgt cggaacagta tgcgcagagt cgaacgcaag taagaaagac 10020
gcaccctcac actcgcttac ttcgagccat acaacggatc aaagctgcgc gtatctcggc 10080
ttgtaagggc cggaaagcaa cctcggagat ggacacgtca catcaccaac ttatcgatct 10140
cggccgtcga cgtcgcagag agggcgagag aagcggtgaa ggagggaaac aacccctcga 10200
gagcatgatc cgaccgaatc tgcagcgcag gaagccgtta caagcccgcc tcgagcgcag 10260
gtcgggtcca gccgggggac gaaacgcgcg aggctgattc gtgagcgaag gaagccgcat 10320
cgacaagttc gctccccttt gccctctttc ccatcacccg ttctcgcctt acccgctcag 10380
aacaacacca gatcactcac catgggtaga tgccgaccgg gatctgtcga tcgacaagct 10440
cgagtttctc cataataatg tgtgagtagt tcccagataa gggaattagg gttcctatag 10500
ggtttcgctc atgtgttgag catataagaa acccttagta tgtatttgta tttgtaaaat 10560
acttctatca ataaaatttc taattcctaa aaccaaaatc cagtactaaa atccagatcc 10620
cccgaattag catgtttaaa caatcgagac cgcggaaagc caagcccagc ttcgtgccct 10680
tctcgatgac ccaagtcccg cgttgcagag ctcgcgcgtc gcactcccac aggtagagcg 10740
tcggtaggag gatggggaga ccgacagccc agcggggcat ggcgaggatg tgggttgagg 10800
caatgaacct gcgcgacaca agtcagtcat cctcctcgtc cggaaactcg ctgaacgcac 10860
caaagcagcg caaggaacgg cgccacccat ccaacaatca acgcgaggta cgtcccctct 10920
cctccctcct ccaactttgc ccacgcgagc gcaaagatgc ccaagaacgc cgccgttcca 10980
atccacctcg ctgctcgtcc gtcgctaggt ttccgaggga ggaggacggc gtggacgact 11040
gggcggctga agagggcgta gacggtcgcg gtgatgtagg tttggacgaa gaagaagaag 11100
atctcttcgt agggtatcgc gaagagggtc ggcccgacga cggatgactc ggggtatgac 11160
cagatctgtc cggcgcgagc gttagacggc ggttttgggg atacagagca agacttggcg 11220
caccctgtgc cggatgaggt acgagtccca gggaatcgtc gcctgcgcgt ctttcggtca 11280
gcctctctcg tcttccggtt tacatgagct gcacgaaccg ttactgcgat ctgcgggacg 11340
agcagaggtc agttggcgat tggagcatcg agccgacgga ggaagcggtg aggacgcacg 11400
gtgatgagga agagcgtctt gtagacatcg cgccgtgtcc taagctttct gaaggtgctc 11460
cagaggacta gcgctggcgg gatagtccag cggaggtggc tgtcgcgcgt tacgagcaac 11520
acgagggtga gtccggagga tgcgagtgaa cgggagcgag gtggacgcac acgagccagt 11580
agtccagtcc aaactatcag tgtttgacag gatatattgg cgggtaaacc taagagaaaa 11640
gagcgtttat tagaataacg gatatttaaa agggcgtgaa aaggtttatc cgttcgtcca 11700
tttgtatgtg catgccaacc acagggttcc cctcgggatc aa 11742
<210> 4
<211> 2350
<212> DNA
<213> Artificial Sequence
<400> 5
atggattata aagatgacga tgacaaaccc tactctatca cctgcttggc cggcgacggg 60
atcggtgcgc tacagaccgt tccactccac cccaccttga ctcgctcgca cggcatcacg 120
acaccacggg ggacgatgga gggaacacgg ggcgtgtagc tgcaggatgg atatgcggct 180
gggcactcga gcgaagcgca cccgtgctgc cgccgcgccg ccatctcgct cgcacacctc 240
gggacgatat cgccgacaac cctcccaccc ctcccgcggc ttcgcgctga ccgctatcac 300
gtcgcacgta cacaggcccc gaagtctccg ctcaggccat ccgcgtcctc gaaaccctct 360
cagcccacac ggacctcaag ttcgaggtcg cctcgcacga ctttggagga atcgccatcg 420
acaaccacca gaacccgttg cccgagtcga cgctcaaggc gtgccaggag gctgatgcaa 480
tcttgctcgg tgcgcgcaaa cttccccgcg ccgtcgagag agggagaaga ctcgggcgga 540
gttaggtcgt tcgctaaccc cgccgcacgt ccttctgttc ctcgtcgcct gttccgtctg 600
caggcgccgt gggtggaccc aagtggggca cgcaccctac cctccgcccc gaaatcggcc 660
tcctcgcact ccgcaaagcc ctcggcctct acgccaacat ccgccccgcc tcgttccccg 720
ctccctctct cgtcgcgcac tccccgctca aggaacacat cgcccaagga accgacatcg 780
tcgtcgtgcg cgaattgatc ggcggaatct actttggtga acgccgcgag gcggttgcgg 840
gcgcgacgga gggaaaggac gcagaggcgt atgatgcgtg cacctactct gtccccgagg 900
tgcagcgtat tacacgcctc gcagcgtacc tcgccaagtg ctcgaacccg cctctggcga 960
ttcactcggt cgacaaggcg aatgtcctcg cgacatcgcg cttgtggagg cgcgtcgtgc 1020
aggagacgct cgacaaggag gcgcctgaac tcaagctcga ccaccagctt gtcgactcgg 1080
ctgccatgct catctgcgcc aacccgcgca agctgaacgg catcgtcctc agtgcgtcgc 1140
gcttcgctcc ctcccacatt gctctcgagt ccacctcgct gacgctcgtg actcgcccgc 1200
agccgagaac ctctttggcg acatcctctc ggacgagacc tccgtcatcc ccggttctct 1260
cggcctcctc ccctccgcct cactcggcgg catccccgac ggcacctctc gcatccccgg 1320
cctctacgag ccaatccacg gttcagcgcc cgacatcgcc ggccaaaaca tcgccaaccc 1380
aatcgggacc atcctctccg tcgccttgat gctgcggtac tcgtttggaa aggaacaaga 1440
ggcacggttg gtcgaggagg cggtcaggat cgtgttggat gatgagagtg cgggtgggtg 1500
tgcgtacagg acgaaggatt tgggtggaga caagactacg acccaggttg gagacaaggt 1560
tgtcgaggtc cttacgggat tgcttaccaa gaagcccggg cctccaaaaa agaagagaaa 1620
ggtcgcggat ccggtctcga agggcgagga gctcttcacc ggcgtcgtcc cgatcctcgt 1680
cgagctcgac ggcgacgtca acggccacaa gttctcggtc tcgggcgagg gcgagggcga 1740
cgccacctac ggcaagctca ccctcaagtt catctgcacc accggcaagc tcccggtccc 1800
gtggccgacc ctcgtcacca ccctcaccta cggcgtccag tgcttctcgc gctacccgga 1860
ccacatgaag cagcacgact tcttcaagtc ggccatgccg gagggctacg tccaggagcg 1920
caccatcttc ttcaaggacg acggcaacta caagacccgc gccgaggtca agttcgaggg 1980
cgacaccctc gtcaaccgca tcgagctcaa gggcatcgac ttcaaggagg acggcaacat 2040
cctcggccac aagctcgagt acaactacaa ctcgcacaac gtctacatca tggccgacaa 2100
gcagaagaac ggcatcaagg tcaacttcaa gatccgccac aacatcgagg acggctcggt 2160
ccagctcgcc gaccactacc agcagaacac cccgatcggc gacggcccgg tcctcctccc 2220
ggacaaccac tacctctcga cccagtcggc cctctcgaag gacccgaacg agaagcgcga 2280
ccacatggtc ctcctcgagt tcgtcaccgc cgccggcatc accctcggca tggacgagct 2340
ctacaagtag 2350
<210> 5
<211> 57
<212> DNA
<213> Artificial Sequence
<400> 5
aagtcgaact acgacctcct caagctctgc ggcgacgtcg agtcgaaccc gggcccg 57
<210> 6
<211> 19
<212> PRT
<213> Artificial Sequence
<400> 6
Lys Ser Asn Tyr Asp Leu Leu Lys Leu Cys Gly Asp Val Glu Ser Asn
1 5 10 15
Pro Gly Pro
<210> 7
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 7
cttacgggat tgcttac 17
<210> 8
<211> 17
<212> DNA
<213> Artificial Sequence
<400> 8
ccggatccgc gaccttt 17
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 9
gactacgacc caggttggag 20
<210> 10
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 10
cgagctcgac gaggatcggg 20
Claims (10)
1.一种多肽,所述多肽的氨基酸序列如序列表中序列2或序列6所示。
2.编码权利要求1所述多肽的核酸分子,为如下A1)或A2):
A1)其编码序列是序列表中序列1或序列5所示的DNA分子;
A2)与A1)限定的DNA分子具有75%以上的同一性且编码权利要求1所述多肽的DNA分子。
3.与权利要求1所述多肽相关的生物材料,所述生物材料为含有权利要求2所述核酸分子的表达盒、重组载体或重组微生物。
4.权利要求1所述的多肽在作为2A肽中的应用。
5.权利要求1所述的多肽或权利要求2所述的核酸分子或权利要求3所述的生物材料在多个目的基因共表达或同时表达多个目的基因中的应用。
6.权利要求1所述的2A肽或权利要求2所述的核酸分子或权利要求3所述的生物材料在制备目的蛋白中的应用;
或,权利要求1所述的2A肽或权利要求2所述的核酸分子或权利要求3所述的生物材料在提高目的蛋白表达水平中的应用。
7.一种多个目的基因共表达或同时表达多个目的基因的方法,包括用权利要求2所述核酸分子连接多个目的基因进行表达的步骤。
8.一种2A肽突变体的筛选方法,包括如下步骤:
1)通过易错PCR将适用于酵母菌的2A肽编码序列进行突变,得到易错PCR产物,并构建到质粒中,得到带有2A肽突变体的质粒文库;
2)将所述带有2A肽突变体的质粒文库转染酵母菌,然后用营养缺陷型培养基进行筛选,选择比对照菌株生长好的菌株作为目标菌株;
3)提取所述目标菌株的基因组DNA并进行测序,获得2A肽突变体编码序列。
9.按照权利要求8所述方法筛选获得的2A肽突变体。
10.如下a1)-a4)任一应用:
a1)权利要求9所述的2A肽突变体在作为2A肽中的应用;
a2)权利要求8所述的方法或权利要求9所述的2A肽突变体在多个目的基因共表达或同时表达多个目的基因中的应用;
a3)权利要求8所述的方法或权利要求9所述的2A肽突变体在制备目的蛋白中的应用;
a4)权利要求8所述的方法或权利要求9所述的2A肽突变体在提高目的蛋白表达水平中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210421108.2A CN116970046A (zh) | 2022-04-21 | 2022-04-21 | 一种适用于圆红冬孢酵母的2a肽突变体及其筛选方法与应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210421108.2A CN116970046A (zh) | 2022-04-21 | 2022-04-21 | 一种适用于圆红冬孢酵母的2a肽突变体及其筛选方法与应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116970046A true CN116970046A (zh) | 2023-10-31 |
Family
ID=88481875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210421108.2A Pending CN116970046A (zh) | 2022-04-21 | 2022-04-21 | 一种适用于圆红冬孢酵母的2a肽突变体及其筛选方法与应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116970046A (zh) |
-
2022
- 2022-04-21 CN CN202210421108.2A patent/CN116970046A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102061438B1 (ko) | 표적화 dna 서열 중의 핵산 염기가 특이적으로 전환되어 있는 단자엽식물 게놈 서열을 전환시키는 방법, 및 그것에 사용되는 분자 복합체 | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
CN108138121B (zh) | 用微生物高水平生产长链二羧酸 | |
BRPI0806354A2 (pt) | plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados | |
KR20180084135A (ko) | 감소된 clr2 활성을 갖는 사상 진균에서 단백질을 생산하는 방법 | |
CA3004001A1 (en) | Expression cassettes derived from maize | |
CN106929532A (zh) | 人工创制玉米雄性不育系与高效的转育方法 | |
CN108473968A (zh) | 生产植物鞘氨醇或二氢神经鞘氨醇的方法 | |
KR20160134760A (ko) | 발효를 위한 탄수화물의 제한적 공급을 사용하는 글리세롤의 용도 | |
CN108913718A (zh) | 一种靶向EGFR vⅢ的CAR-T细胞的制备方法及应用 | |
CN106701810A (zh) | 一种谷氨酸棒状杆菌的基因编辑系统及其应用 | |
CN109652381A (zh) | 基于碱基编辑靶向cd133的car-t细胞制备方法及应用 | |
KR20180081817A (ko) | 감소된 clr1 활성을 갖는 사상 진균에서 단백질을 생산하는 방법 | |
CN103732751A (zh) | 在幽门螺杆菌中的基因表达和根除系统 | |
KR102304834B1 (ko) | 숙신산 생산을 위한 개선된 미생물 | |
CN110564752B (zh) | 差异代理技术在c·t碱基替换细胞富集中的应用 | |
CN116970046A (zh) | 一种适用于圆红冬孢酵母的2a肽突变体及其筛选方法与应用 | |
KR20140043890A (ko) | 조절된 유전자 발현 시스템 및 그의 작제물 | |
CN115087734B (zh) | 新型膦酰基乙酸酯水解酶变体及使用其生产xmp或gmp的方法 | |
KR102266231B1 (ko) | 신규한 mfs 트랜스포터 변이체 및 이를 이용한 l-글루탐산 생산 방법 | |
CN113293173B (zh) | 一种农杆菌双元表达载体 | |
KR20230156365A (ko) | 메타게놈 유래의 새로운 CRISPR-Cas 뉴클레아제 | |
CN115916982A (zh) | 表达血管活性肠肽的微生物及其用途 | |
CN111961651A (zh) | 基因重组PD-1抗体自分泌型人γδT细胞及其构建方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |