CN113667685A - 信号肽相关序列及其在蛋白质合成中的应用 - Google Patents
信号肽相关序列及其在蛋白质合成中的应用 Download PDFInfo
- Publication number
- CN113667685A CN113667685A CN202110876455.XA CN202110876455A CN113667685A CN 113667685 A CN113667685 A CN 113667685A CN 202110876455 A CN202110876455 A CN 202110876455A CN 113667685 A CN113667685 A CN 113667685A
- Authority
- CN
- China
- Prior art keywords
- vitro
- sequence
- protein
- signal peptide
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000014616 translation Effects 0.000 title claims abstract description 103
- 108010076504 Protein Sorting Signals Proteins 0.000 title claims abstract description 85
- 238000001243 protein synthesis Methods 0.000 title claims abstract description 81
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 127
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 115
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 41
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 41
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 41
- 239000013598 vector Substances 0.000 claims abstract description 30
- 238000000338 in vitro Methods 0.000 claims description 103
- 210000004027 cell Anatomy 0.000 claims description 64
- 239000002773 nucleotide Substances 0.000 claims description 51
- 125000003729 nucleotide group Chemical group 0.000 claims description 51
- 230000015572 biosynthetic process Effects 0.000 claims description 28
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 23
- 210000005253 yeast cell Anatomy 0.000 claims description 19
- 241000235649 Kluyveromyces Species 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 12
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 12
- 229920001184 polypeptide Polymers 0.000 claims description 10
- 241000238631 Hexapoda Species 0.000 claims description 9
- 230000001851 biosynthetic effect Effects 0.000 claims description 8
- 210000004978 chinese hamster ovary cell Anatomy 0.000 claims description 7
- 241000283973 Oryctolagus cuniculus Species 0.000 claims description 6
- 210000001995 reticulocyte Anatomy 0.000 claims description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 5
- 230000035484 reaction time Effects 0.000 claims description 5
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 4
- 239000003153 chemical reaction reagent Substances 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 2
- 108091026890 Coding region Proteins 0.000 abstract description 39
- 230000014509 gene expression Effects 0.000 abstract description 21
- 230000000694 effects Effects 0.000 abstract description 9
- 238000010353 genetic engineering Methods 0.000 abstract description 4
- 238000000746 purification Methods 0.000 abstract description 4
- 235000018102 proteins Nutrition 0.000 description 83
- 102000040430 polynucleotide Human genes 0.000 description 64
- 108091033319 polynucleotide Proteins 0.000 description 64
- 239000002157 polynucleotide Substances 0.000 description 64
- 108020004414 DNA Proteins 0.000 description 42
- 102000053602 DNA Human genes 0.000 description 42
- 150000001413 amino acids Chemical class 0.000 description 26
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 23
- 239000013612 plasmid Substances 0.000 description 18
- 241001138401 Kluyveromyces lactis Species 0.000 description 15
- 108060001084 Luciferase Proteins 0.000 description 13
- 239000005089 Luciferase Substances 0.000 description 13
- 238000013519 translation Methods 0.000 description 13
- 235000001014 amino acid Nutrition 0.000 description 12
- 229940024606 amino acid Drugs 0.000 description 12
- 230000000295 complement effect Effects 0.000 description 10
- 239000000284 extract Substances 0.000 description 10
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 10
- 210000003527 eukaryotic cell Anatomy 0.000 description 9
- 102000016938 Catalase Human genes 0.000 description 8
- 108010053835 Catalase Proteins 0.000 description 8
- DRBBFCLWYRJSJZ-UHFFFAOYSA-N N-phosphocreatine Chemical compound OC(=O)CN(C)C(=N)NP(O)(O)=O DRBBFCLWYRJSJZ-UHFFFAOYSA-N 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 8
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 8
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 8
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 description 7
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 description 7
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 7
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 7
- 108090000331 Firefly luciferases Proteins 0.000 description 7
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 7
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 7
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 7
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 7
- 238000005119 centrifugation Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 239000005090 green fluorescent protein Substances 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 229920001223 polyethylene glycol Polymers 0.000 description 7
- 239000013641 positive control Substances 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- 238000005406 washing Methods 0.000 description 7
- 102000007469 Actins Human genes 0.000 description 6
- 108010085238 Actins Proteins 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 6
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 239000002202 Polyethylene glycol Substances 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 6
- LOGFVTREOLYCPF-KXNHARMFSA-N (2s,3r)-2-[[(2r)-1-[(2s)-2,6-diaminohexanoyl]pyrrolidine-2-carbonyl]amino]-3-hydroxybutanoic acid Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-KXNHARMFSA-N 0.000 description 5
- UBAVPHLFRVPRCI-CRBCFSCISA-N 2-[[(e)-2-carboxyethenyl]amino]-n-methoxy-2-oxoethanimine oxide Chemical compound CO\[N+]([O-])=C\C(=O)N\C=C\C(O)=O UBAVPHLFRVPRCI-CRBCFSCISA-N 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 5
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 5
- 108010073141 Hepatitis C virus glycoprotein E2 Proteins 0.000 description 5
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 5
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 5
- 102000004877 Insulin Human genes 0.000 description 5
- 108090001061 Insulin Proteins 0.000 description 5
- 108010078049 Interferon alpha-2 Proteins 0.000 description 5
- 102100040018 Interferon alpha-2 Human genes 0.000 description 5
- 102000003777 Interleukin-1 beta Human genes 0.000 description 5
- 108090000193 Interleukin-1 beta Proteins 0.000 description 5
- 102000016943 Muramidase Human genes 0.000 description 5
- 108010014251 Muramidase Proteins 0.000 description 5
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 5
- 108010071690 Prealbumin Proteins 0.000 description 5
- 102000007562 Serum Albumin Human genes 0.000 description 5
- 108010071390 Serum Albumin Proteins 0.000 description 5
- 102000009190 Transthyretin Human genes 0.000 description 5
- 241000209140 Triticum Species 0.000 description 5
- 235000021307 Triticum Nutrition 0.000 description 5
- 102000003425 Tyrosinase Human genes 0.000 description 5
- 108060008724 Tyrosinase Proteins 0.000 description 5
- 102000004139 alpha-Amylases Human genes 0.000 description 5
- 108090000637 alpha-Amylases Proteins 0.000 description 5
- 229940024171 alpha-amylase Drugs 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 229940125396 insulin Drugs 0.000 description 5
- 239000004325 lysozyme Substances 0.000 description 5
- 229960000274 lysozyme Drugs 0.000 description 5
- 235000010335 lysozyme Nutrition 0.000 description 5
- 239000013642 negative control Substances 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 239000002777 nucleoside Substances 0.000 description 5
- 239000002243 precursor Substances 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 239000001226 triphosphate Substances 0.000 description 5
- 235000011178 triphosphate Nutrition 0.000 description 5
- -1 D-amino acids) Chemical class 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 241000206602 Eukaryota Species 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- 210000004102 animal cell Anatomy 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 3
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 3
- 108010020764 Transposases Proteins 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- UEGPKNKPLBYCNK-UHFFFAOYSA-L magnesium acetate Chemical compound [Mg+2].CC([O-])=O.CC([O-])=O UEGPKNKPLBYCNK-UHFFFAOYSA-L 0.000 description 3
- 239000011654 magnesium acetate Substances 0.000 description 3
- 229940069446 magnesium acetate Drugs 0.000 description 3
- 235000011285 magnesium acetate Nutrition 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 229950007002 phosphocreatine Drugs 0.000 description 3
- 235000011056 potassium acetate Nutrition 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- 241000589158 Agrobacterium Species 0.000 description 2
- ANGAOPNEPIDLPO-XVYDVKMFSA-N Ala-His-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N ANGAOPNEPIDLPO-XVYDVKMFSA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- SPIPSJXLZVTXJL-ZLUOBGJFSA-N Asn-Cys-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O SPIPSJXLZVTXJL-ZLUOBGJFSA-N 0.000 description 2
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 2
- 102000043856 Leucine-tRNA ligase Human genes 0.000 description 2
- 108010071170 Leucine-tRNA ligase Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- DBLXOVFQHHSKRC-UHFFFAOYSA-N ethanesulfonic acid;2-piperazin-1-ylethanol Chemical compound CCS(O)(=O)=O.OCCN1CCNCC1 DBLXOVFQHHSKRC-UHFFFAOYSA-N 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 210000003370 receptor cell Anatomy 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical group C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- PWYFCPCBOYMOGB-LKTVYLICSA-N Ala-Gln-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PWYFCPCBOYMOGB-LKTVYLICSA-N 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- OSASDIVHOSJVII-WDSKDSINSA-N Arg-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N OSASDIVHOSJVII-WDSKDSINSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000726103 Atta Species 0.000 description 1
- YHZQPWIAFHYDJG-UHFFFAOYSA-M C(C)S(=O)(=O)[O-].OCCN1CCNCC1.[K+] Chemical compound C(C)S(=O)(=O)[O-].OCCN1CCNCC1.[K+] YHZQPWIAFHYDJG-UHFFFAOYSA-M 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 101900264058 Escherichia coli Beta-galactosidase Proteins 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108091081406 G-quadruplex Proteins 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 1
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 241000235650 Kluyveromyces marxianus Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 239000012880 LB liquid culture medium Substances 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000008118 PEG 6000 Substances 0.000 description 1
- 229920000604 Polyethylene Glycol 200 Polymers 0.000 description 1
- 229920002560 Polyethylene Glycol 3000 Polymers 0.000 description 1
- 229920002562 Polyethylene Glycol 3350 Polymers 0.000 description 1
- 229920002584 Polyethylene Glycol 6000 Polymers 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- HEYZPTCCEIWHRO-IHRRRGAJSA-N Ser-Met-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HEYZPTCCEIWHRO-IHRRRGAJSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 1
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 1
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000003125 aqueous solvent Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical group [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- MTHSVFCYNBDYFN-UHFFFAOYSA-N diethylene glycol Chemical compound OCCOCCO MTHSVFCYNBDYFN-UHFFFAOYSA-N 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 230000001516 effect on protein Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 229960004109 potassium acetate Drugs 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000003161 proteinsynthetic effect Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 230000009614 wildtype growth Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/08—Linear peptides containing only normal peptide links having 12 to 20 amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
- C12N15/625—DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明提供了信号肽相关序列及其在蛋白质合成中的应用,具体地,本发明提供了具有提高蛋白表达效果的信号肽及其编码序列,将信号肽编码序列与外源蛋白的编码序列可操作的相连形成的核酸构建物,可显著提高外源蛋白合成的效率,并简化目标外源蛋白的表达与纯化过程。同时,本发明提供与其相应的载体或载体组合、基因工程细胞、试剂盒,从而能够应用于蛋白质合成中。
Description
技术领域
本发明涉及生物技术领域,具体地,涉及信号肽相关序列及其在蛋白质合成中的应用。
背景技术
蛋白质是细胞中的重要分子,几乎参与了细胞所有功能的执行。蛋白的序列和结构不同,决定了其功能的不同(1,2)。在细胞内,蛋白可以作为酶类催化各种生化反应,可以作为信号分子协调生物体的各种活动,可以支持生物形态,储存能量,运输分子,并使生物体运动(2)。在生物医学领域,蛋白质抗体作为靶向药物,是治疗癌症等疾病的重要手段(2)。
信号肽是位于蛋白质N端携带蛋白质分泌信息的短肽,它们广泛分布于所有原核生物和真核生物中(3,4)。对于信号肽的研究,着重表现在很多科学和工业领域,包括重组蛋白质的生产,疾病诊断,免疫和很多生物学实验技术(4,5)。很多研究表明信号肽在重组蛋白质生产中有非常重要的作用(6,7)。但是,信号肽在蛋白表达以及跨膜结构形成方面的某些功能仍然很模糊(4,8,9)。
除了人们对于细胞内蛋白质合成的了解之外,蛋白质合成也可以在细胞外进行。蛋白质体外合成系统一般是指在细菌、真菌、植物细胞或动物细胞的裂解体系中,加入mRNA或者DNA模板、RNA聚合酶及氨基酸和ATP等组分,完成外源蛋白的快速高效翻译(10,11)。目前,经常实验的商业化体外蛋白表达系统包括大肠杆菌系统(E.coli extract,ECE)、兔网织红细胞(Rabbit reticulocyte lysate,RRL)、麦胚(Wheat germ extract,WGE)、昆虫(Insect cell extract,ICE)和人源系统(11,12)。与传统的体内重组表达系统相比,蛋白质的体外无细胞合成系统具有多种优点,如可表达对细胞有毒害作用或含有非天然氨基酸(如D-氨基酸)的特殊蛋白质,能够直接以PCR产物作为模板同时平行合成多种蛋白质,开展高通量药物筛选和蛋白质组学的研究(10-12)。
研究表明部分信号肽序列对蛋白表达有一定的促进作用,而在体外合成所使用的DNA模板通常不具有信号肽相关序列(13)。因此在体外蛋白质合成体系中一般采用在目标蛋白的N端插入长度在30个氨基酸以下的短多肽序列来提升目标蛋白质翻译效率,但有些短肽的插入会显著影响目标蛋白的结构与功能(4,14)。
因此,本领域迫切需要提供一种能够应用于体外蛋白质表达系统中,可以显著提高目标蛋白产量,降低蛋白表达的成本,并且提高蛋白质翻译效率的信号肽相关序列。
发明内容
本发明的目的在于提供一种能够应用于体外蛋白质表达系统中,可以显著提高目标蛋白产量,降低蛋白表达的成本,并且提高蛋白质翻译效率的信号肽相关序列。
本发明第一方面,提供一种核酸构建物,该核酸构建物包含编码信号肽的第一核苷酸序列,其与编码外源蛋白的第二核苷酸序列可操作地连接,第一核苷酸序列的3′端在第二核苷酸序列的上游,且第一核苷酸序列选自下组:
(a)编码以下任一信号肽的核苷酸序列:氨基酸序列为SEQ ID NO:14-24的信号肽;
(b)SEQ ID NO:1-13所示的任一核苷酸序列。
在另一优选例中,所述核酸构建物具有从5'至3'的式I结构:
Z1-Z2-Z3 (I)
式中,
Z1-Z3分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为信号肽的编码序列;
Z2为无或连接序列;
Z3为无或外源蛋白的编码序列;
其中,所述信号肽的编码序列选自下组:
(a)编码如SEQ ID NO.:14-24所示多肽的多核苷酸;
(b)序列如SEQ ID NO.:1-13任一所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:1-13任一所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:1-13任一所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述核酸构建物具有从5'至3'的式II结构:
Z1-Z2-Z3 (II)
式中,
Z1-Z3分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为信号肽的编码序列;
Z2为连接序列;
Z3为无或外源蛋白的编码序列;
其中,所述信号肽的编码序列选自下组:
(a)编码如SEQ ID NO.:14-24所示多肽的多核苷酸;
(b)序列如SEQ ID NO.:1-13任一所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:1-13任一所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:1-13任一所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述核酸构建物具有从5'至3'的式III结构:
Z1-Z2-Z3 (III)
式中,
Z1-Z3分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为信号肽的编码序列;
Z2为连接序列;
Z3为外源蛋白的编码序列;
其中,所述信号肽的编码序列选自下组:
(a)编码如SEQ ID NO.:14-24所示多肽的多核苷酸;
(b)序列如SEQ ID NO.:1-13任一所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:1-13任一所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:1-13任一所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述的可操作地连接为直接连接或通过连接序列连接。
在另一优选例中,所述的连接序列为SEQ ID NO:25所示的核苷酸序列。
在另一优选例中,所述连接序列的氨基酸序列如SEQ ID NO.:26所示。
在另一优选例中,所述信号肽的编码序列为密码子优化的编码序列。
在另一优选例中,所述信号肽的编码序列如SEQ ID NO.:1-13所示。
在另一优选例中,所述信号肽的氨基酸序列具有SEQ ID NO.:14-24所示的序列或其活性片段,或者具有与SEQ ID NO:14-24所示氨基酸序列≥85%的同源性,优选地≥90%的同源性;更优选地≥95%的同源性;最优选地,≥97%的同源性,如98%以上,99%以上)且具有与SEQ ID NO.:14-24所示序列相同活性的多肽。
在另一优选例中,所述信号肽的编码序列如SEQ ID NO.:11-13所示。
在另一优选例中,所述信号肽的编码序列如SEQ ID NO.:2-7所示。
在另一优选例中,所述信号肽的编码序列如SEQ ID NO.:1所示。
在另一优选例中,所述信号肽的编码序列如SEQ ID NO.:8-10所示。
在另一优选例中,所述信号肽的氨基酸序列如SEQ ID NO.:22-24所示。
在另一优选例中,所述信号肽的氨基酸序列如SEQ ID NO.:15-20所示。
在另一优选例中,所述信号肽的氨基酸序列如SEQ ID NO.:14所示。
在另一优选例中,所述信号肽的氨基酸序列如SEQ ID NO.:21所示。
在另一优选例中,所述连接序列为密码子优化的连接序列。
在另一优选例中,所述连接序列具有不易形成二级结构的序列(如AT-rich序列,无发卡结构,无G-四链体(G-quadruplex)等),不富含稀有密码子。
在另一优选例中,所述连接序列选自下组;
(i)序列如SEQ ID NO.:25所示的多核苷酸;
(ii)核苷酸序列与SEQ ID NO.:25所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(iii)在SEQ ID NO.:25所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(iv)与(i)-(iii)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述外源蛋白来自原核生物、真核生物。
在另一优选例中,所述外源蛋白来自动物、植物、病原体。
在另一优选例中,所述外源蛋白来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述的外源蛋白的编码序列编码选自下组的蛋白:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体或其可变区域、萤光素酶突变体、或其组合。
在另一优选例中,所述核酸构建物的5'端上游还包括启动子。
在另一优选例中,所述启动子包括组成型或诱导型启动子。
在另一优选例中,所述启动子选自下组:T7启动子、T3启动子、SP6启动子、或其组合。
在另一优选例中,所述核酸构建物还包括增强子元件、RBS核糖体结合序列、间隔序列(Spacer)、其他供RNA转录、翻译的相关序列、或其组合。
在另一优选例中,所述增强子元件包括内部核糖体进入位点元件(IRES)、核糖体结合位点元件、非编码序列、或其组合。
在另一优选例中,所述IRES元件来源选自下组的一种或多种细胞:原核细胞、真核细胞。
在另一优选例中,所述真核细胞包括高等真核细胞。
在另一优选例中,所述IRES元件包括内源性IRES元件和外源性IRES元件。
在另一优选例中,所述IRES元件来源选自下组的一种或多种细胞:人(human)、中国仓鼠卵巢细胞(Chinese hamster ovary cell,CHO)、昆虫细胞(insect)、麦胚(Wheatgerm cells)、兔网织红细胞(Rabbit reticulocyte)。
在另一优选例中,所述IRES元件选自下组:ScGPR1、ScFLO8、ScNCE102、ScMSN1、KlFLO8、KlNCE102、KlMSN1、GAA、Omega、Omega10A、或其组合。
本发明第二方面,提供一种信号肽,其氨基酸序列由第一方面中的第一核苷酸序列编码产生。
在另一优选例中,所述的信号肽的氨基酸序列如SEQ ID No.:14-24中任一所示。
本发明第三方面,提供一种载体或载体组合,所述的载体或载体组合含有本发明第一方面的核酸构建物。
本发明第四方面,提供一种基因工程细胞,所述基因工程细胞的基因组的一个或多个位点整合有本发明第一方面中的核酸构建物,或者所述基因工程细胞中含有本发明第三方面中的载体或载体组合。
在另一优选例中,所述基因工程细胞包括原核细胞、真核细胞。
在另一优选例中,所述真核细胞包括高等真核细胞。
在另一优选例中,所述基因工程细胞选自下组:人源细胞(如Hela细胞)、中国仓鼠卵巢细胞、昆虫细胞、麦胚细胞、兔网织红细胞、酵母细胞、或其组合。
在另一优选例中,所述基因工程细胞为酵母细胞。
在另一优选例中,所述酵母细胞选自下组:酿酒酵母、克鲁维酵母属酵母、或其组合。
在另一优选例中,所述克鲁维酵母属酵母选自下组:乳酸克鲁维酵母、马克斯克鲁维酵母、多布克鲁维酵母、或其组合。
本发明第五方面,提供一种试剂盒,所述试剂盒中包含的试剂选自下组中的一种或多种:
(a)本发明第一方面所述的核酸构建物;
(b)本发明第三方面所述的载体或载体组合;和
(c)本发明第四方面所述的基因工程细胞。
在另一优选例中,所述试剂盒还包括(d)真核体外生物合成体系(如真核体外蛋白合成体系)。
在另一优选例中,所述真核体外生物合成体系选自下组:酵母体外生物合成体系、中国仓鼠卵巢细胞体外生物合成体系、昆虫细胞体外生物合成体系、Hela细胞体外生物合成体系、或其组合。
在另一优选例中,所述真核体外生物合成体系包括真核体外蛋白合成体系。
在另一优选例中,所述真核体外蛋白合成体系选自下组:酵母体外蛋白合成体系、中国仓鼠卵巢细胞体外蛋白合成体系、昆虫细胞体外蛋白合成体系、Hela细胞体外蛋白合成体系、或其组合。
在另一优选例中,所述酵母体外生物合成体系(如酵母体外蛋白合成体系)为克鲁维酵母体外生物合成体系(如克鲁维酵母体外蛋白合成体系),优选为乳酸克鲁维酵母体外生物合成体系(如乳酸克鲁维酵母体外蛋白合成体系)。
在另一优选例中,所述的酵母体外生物合成体系为克鲁维酵母体外生物合成体系。
本发明第六方面提供第一方面所述的核酸构建物、第二方面所述的信号肽、第三方面所述的载体或载体组合、第四方面所述的基因工程细胞或第五方面所述的试剂盒在体外蛋白合成体系中的应用。
本发明第七方面,提供一种体外蛋白合成方法,其包括以下步骤:
(i)提供一体外生物合成体系,所述体外生物合成体系含有本发明第一方面所述的核酸构建物;
(ii)在合适条件孵育步骤(i)的体外生物合成体系,经过一定反应时间,合成所述外源蛋白。
在另一优选例中,该体外蛋白合成方法还包括(iii)任选地从所述真核体外生物合成体系中,分离或检测所述外源蛋白。
在另一优选例中,所述步骤(ii)中,反应温度为20-37℃,较佳地,22-35℃。
在另一优选例中,所述步骤(ii)中,反应时间为1-72h,较佳地,2-24h。
在另一优选例中,所述体外生物合成体系可选择酵母体外生物合成体系(如酵母体外蛋白合成体系)。
在另一优选例中,所述酵母体外生物合成体系(如酵母体外蛋白合成体系)为克鲁维酵母体外生物合成体系(如克鲁维酵母体外蛋白合成体系)(优选乳酸克鲁维酵母体外生物合成体系,如乳酸克鲁维酵母体外蛋白合成体系)。
在另一优选例中,所述外源蛋白来自原核生物、真核生物。
在另一优选例中,所述外源蛋白来自动物、植物、病原体。
在另一优选例中,所述外源蛋白来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述的外源蛋白的编码序列编码选自下组的外源蛋白:荧光素蛋白、荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变体、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
本发明第八方面提供了一种分离的多核苷酸,所述多核苷酸选自下组:
(a)编码如SEQ ID NO.:14-24所示多肽的多核苷酸;
(b)序列如SEQ ID NO.:1-13任一所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:1-13任一所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:1-13任一所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述多核苷酸为编码信号肽的核苷酸序列。
在另一优选例中,所述多核苷酸包括DNA序列。
本发明第九方面提供了一种连接序列,所述连接序列选自下组:
(i)序列如SEQ ID NO.:25所示的多核苷酸;
(ii)核苷酸序列与SEQ ID NO.:25所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(iii)在SEQ ID NO.:25所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(iv)与(i)-(iii)任一所述的多核苷酸互补的多核苷酸。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了从DNA到蛋白质的基本生物过程。
图2显示了13种本发明信号肽相关序列在体外蛋白质合成体系中起始合成的增强型绿色荧光蛋白(Enhanced green fluorescent protein,eGFP)的相对荧光单位值(Relative Fluorescence Units,RFUs)。
具体实施方式
本发明人经过广泛而深入的研究,通过大量筛选和摸索,首次发现了用于提高体外蛋白合成体系的蛋白翻译效率的新型信号肽及包括该信号肽编码序列的核酸构建物,本发明的核酸构建物包括与编码外源蛋白的第二核苷酸序列可操作地相连的编码信号肽的第一核苷酸序列(包括密码子优化的或未优化的信号肽编码序列)。实验表明,在体外蛋白质合成体系(如酵母体外蛋白质合成体系)中应用本发明的核酸构建物或信号肽序列,所合成的外源蛋白的信号强度比对照组显著性的提高(p<0.05)。本发明还简化了外源蛋白的表达和纯化方式。
蛋白质合成体系
蛋白质合成是指生物按照从脱氧核糖核酸(DNA)转录得到的信使核糖核酸(mRNA)上的遗传信息合成蛋白质的过程,如图1所示。蛋白质生物合成亦称为翻译(Translation),即把mRNA分子中碱基排列顺序转变为蛋白质或多肽链中的氨基酸排列顺序过程。这是基因表达的第二步,产生基因产物蛋白质的最后阶段。不同的组织细胞具有不同的生理功能,是因为它们表达不同的基因,产生具有特殊功能的蛋白质,参与蛋白质生物合成的成份至少有200种,其主要体是由mRNA、tRNA、核糖核蛋白体以及有关的酶和蛋白质因子共同组成。
蛋白质体外合成系统一般是指在细菌、真菌、植物细胞或动物细胞的裂解体系中,加入mRNA或者DNA模板、RNA聚合酶及氨基酸和ATP等组分,完成外源蛋白的快速高效翻译。目前,经常实验的商业化体外蛋白表达系统包括大肠杆菌系统(E.coli extract,ECE)、兔网织红细胞(Rabbit reticulocyte lysate,RRL)、麦胚(Wheat germ extract,WGE)、昆虫(Insect cell extract,ICE)和人源系统。
酵母(yeast)兼具培养简单、高效蛋白质折叠、和翻译后修饰的优势。其中,酿酒酵母(Saccharomyces cerevisiae)和毕氏酵母(Pichia pastoris)是表达复杂真核蛋白质和膜蛋白的模式生物,酵母也可作为制备体外翻译系统的原料。
克鲁维酵母(Kluyveromyces)是一种子囊孢子酵母,其中的马克斯克鲁维酵母(Kluyveromyces marxianus)和乳酸克鲁维酵母(Kluyveromyces lactis)是工业上广泛使用的酵母。与其他酵母相比,乳酸克鲁维酵母具有许多优点,如超强的分泌能力,更好的大规模发酵特性、食品安全的级别、以及同时具有蛋白翻译后修饰的能力等。
在本发明中,一种优选的蛋白合成体系为体外蛋白合成体系。本发明的体外蛋白质合成体系不受特别限制,一种优选的体外蛋白质合成体系为克鲁维酵母表达系统(更佳地,乳酸克鲁维酵母表达系统)。
在本发明中,所述体外蛋白质合成体系包括:酵母细胞提取物和任选的溶剂,所述溶剂为水或水性溶剂。
在一特别优选的实施方式中,本发明提供的体外蛋白合成体系还包括:4-羟乙基哌嗪乙磺酸,醋酸钾,醋酸镁,核苷三磷酸混合物,氨基酸混合物,磷酸肌酸,二硫苏糖醇(DTT),磷酸肌酸激酶,RNA酶抑制剂,荧光素,萤光素酶DNA,RNA聚合酶。
在本发明中,RNA聚合酶没有特别限制,可以选自一种或多种RNA聚合酶,典型的RNA聚合酶为T7 RNA聚合酶。
在本发明中,所述酵母细胞提取物在体外蛋白合成体系中的比例不受特别限制,通常所述酵母细胞提取物在体外蛋白质合成蛋白合成体系中所占体系为20-70%,较佳地,30-60%,更佳地,40-50%。
在本发明中,所述的酵母细胞提取物不含完整的细胞,典型的酵母细胞提取物包括用于蛋白翻译的核糖体、转运RNA、氨酰tRNA合成酶、蛋白质合成需要的起始因子和延伸因子以及终止释放因子。此外,酵母提取物中还含有一些源自酵母细胞的细胞质中的其他蛋白,尤其是可溶性蛋白。
在本发明中,所述的酵母细胞提取物所含蛋白含量为10-100mg/mL,较佳地为20-80mg/mL。所述的测定蛋白含量方法为考马斯亮蓝测定方法。
在本发明中,所述的酵母细胞提取物的制备方法不受限制,一种优选的制备方法包括以下步骤:
(i)提供酵母细胞;
(ii)对酵母细胞进行洗涤处理,获得经洗涤的酵母细胞;
(iii)对经洗涤的酵母细胞进行细胞破碎处理,从而获得酵母粗提物;
(iv)对所述酵母粗提物进行固液分离,获得液体部分,即为酵母细胞提取物。
在本发明中,所述的固液分离方式不受特别限制,优选为离心。
在本发明中,所述离心条件不受特别限制,离心条件为5000-100000g,较佳地,8000-30000g。
在本发明中,所述离心时间不受特别限制,离心时间为0.5min-2h,较佳地,20min-50min。
在本发明中,所述离心的温度不受特别限制,优选的,离心在1-10℃下进行,较佳地,在2-6℃下进行。
在本发明中,所述的洗涤处理方式不受特别限制,优选的洗涤处理方式为采用洗涤液在pH为7-8(较佳地,7.4)下进行处理,所述洗涤液没有特别限制,典型的所述洗涤液选自下组:4-羟乙基哌嗪乙磺酸钾、醋酸钾、醋酸镁、或其组合。
在本发明中,所述细胞破碎处理的方式不受特别限制,优选的细胞破碎处理包括高压破碎、冻融(如液氮低温)破碎。
所述体外蛋白质合成体系中的核苷三磷酸混合物为腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸和尿嘧啶核苷三磷酸。在本发明中,各种单核苷酸的浓度没有特别限制,通常每种单核苷酸的浓度为0.5-5mM,较佳地为1.0-2.0mM。
所述体外蛋白质合成体系中的氨基酸混合物可包括天然或非天然氨基酸,可包括D型或L型氨基酸。代表性的氨基酸包括(但并不限于)20种天然氨基酸:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸。每种氨基酸的浓度通常为0.01-0.5mM,较佳地0.02-0.2mM,如0.05、0.06、0.07、0.08mM。
在优选例中,所述体外蛋白质合成体系还含有聚乙二醇(PEG)或其类似物。聚乙二醇或其类似物的浓度没有特别限制,通常,聚乙二醇或其类似物的浓度(w/v)为0.1-8%,较佳地,0.5-4%,更佳地,1-2%,以所述蛋白合成体系的总重量计。代表性的PEG例子包括(但并不限于):PEG3000,PEG8000,PEG6000和PEG3350。应理解,本发明的体系还可包括其他各种分子量的聚乙二醇(如PEG200、400、1500、2000、4000、6000、8000、10000等)。
在优选例中,所述体外蛋白质合成体系还含有蔗糖。蔗糖的浓度没有特别限制,通常,蔗糖的浓度为0.03-40wt%,较佳地,0.08-10wt%,更佳地,0.1-5wt%,以所述蛋白合成体系的总重量计。
一种特别优选的体外蛋白质合成体系,除了酵母提取物之外,还含有以下组分:22mM,pH为7.4的4-羟乙基哌嗪乙磺酸,30-150mM醋酸钾,1.0-5.0mM醋酸镁,1.5-4mM核苷三磷酸混合物,0.08-0.24mM的氨基酸混合物,25mM磷酸肌酸,1.7mM二硫苏糖醇,0.27mg/mL磷酸肌酸激酶,1%-4%聚乙二醇,0.5%-2%蔗糖,8-20ng/μL萤火虫荧光素酶的DNA,0.027-0.054mg/mL T7 RNA聚合酶。
外源蛋白的编码序列(外源DNA)
如本文所用,术语“外源蛋白的编码序列”与“外源DNA”可互换使用,均指外源的用于指导蛋白质合成的DNA分子。通常,所述的DNA分子为线性的或环状的。所述的DNA分子含有编码外源蛋白的序列。
在本发明中,所述的编码外源蛋白的序列的例子包括(但并不限于):基因组序列、cDNA序列。所述的编码外源蛋白的序列还含有启动子序列、5′非翻译序列、3′非翻译序列。
在本发明中,所述外源DNA的选择没有特别限制,通常,外源DNA编码选自下组的蛋白:荧光素蛋白、荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体或其可变区、萤光素酶突变体、或其组合。
外源DNA还可以编码选自下组的蛋白:α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在一优选实施方式中,所述外源DNA编码选自下组的蛋白:绿色荧光蛋白(enhanced GFP,eGFP)、黄色荧光蛋白(YFP)、大肠杆菌β-半乳糖苷酶(β-galactosidase,LacZ)、人赖氨酸-tRNA合成酶(Lysine-tRNA synthetase)、人亮氨酸-tRNA合成酶(Leucine-tRNA synthetase)、拟南芥甘油醛3-磷酸脱氢酶(Glyceraldehyde-3-phosphatedehydrogenase)、鼠过氧化氢酶(Catalase)、或其组合。
核酸构建物
本发明第一方面提供了一种核酸构建物,所述的核酸构建物包含编码信号肽的第一核苷酸序列,其与编码外源蛋白的第二核苷酸序列可操作地连接,第一核苷酸序列的3′端在第二核苷酸序列的上游,且第一核苷酸序列选自下组:
(a)编码以下任一信号肽的核苷酸序列:氨基酸序列为SEQ ID NO:14-24的信号肽;
(b)SEQ ID NO:1-13所示的任一核苷酸序列。
术语“可操作地连接”是指两个或多个核苷酸区域或核苷酸序列的功能性的空间排列。例如:编码信号肽核苷酸序列被置于相对于外源蛋白核苷酸序列的特定位置,使得获得提高外源蛋白表达的效果。所述的可操作地连接为直接连接或通过连接序列连接。
在一优选实施方式中,本发明的所述核酸构建物具有从5'至3'的式I结构:
Z1-Z2-Z3 (I)
式中,
Z1-Z3分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为信号肽的编码序列;
Z2为无或连接序列;
Z3为无或外源蛋白的编码序列;
其中,所述信号肽的编码序列选自下组:
(a)编码如SEQ ID NO.:14-24所示多肽的多核苷酸;
(b)序列如SEQ ID NO.:1-13任一所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:1-13任一所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:1-13任一所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在一优选实施方式中,本发明的所述核酸构建物具有从5'至3'的式II结构:
Z1-Z2-Z3 (II)
式中,
Z1-Z3分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为信号肽的编码序列;
Z2为连接序列;
Z3为无或外源蛋白的编码序列;
其中,所述信号肽的编码序列选自下组:
(a)编码如SEQ ID NO.:14-24所示多肽的多核苷酸;
(b)序列如SEQ ID NO.:1-13任一所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:1-13任一所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:1-13任一所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在一优选实施方式中,本发明的所述所述核酸构建物具有从5'至3'的式III结构:
Z1-Z2-Z3 (III)
式中,
Z1-Z3分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为信号肽的编码序列;
Z2为连接序列;
Z3为外源蛋白的编码序列;
其中,所述信号肽的编码序列选自下组:
(a)编码如SEQ ID NO.:14-24所示多肽的多核苷酸;
(b)序列如SEQ ID NO.:1-13任一所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:1-13任一所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:1-13任一所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在一优选实施方式中,本发明所述信号肽的氨基酸序列具有SEQ ID NO.:14-24所示的序列或其活性片段,或者具有与SEQ ID NO:14-24所示氨基酸序列≥85%的同源性,优选地≥90%的同源性;更优选地≥95%的同源性;最优选地,≥97%的同源性,如98%以上,99%以上)且具有与SEQ ID NO.:14-24所示序列相同活性的多肽。
在本发明中,所述外源蛋白的编码序列的选择没有特别限制,通常,外源蛋白的编码序列编码选自下组的蛋白:荧光素蛋白、荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体或其可变区、萤光素酶突变体、或其组合。
外源蛋白的编码序列还可以编码选自下组的蛋白:α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
此外,本发明的所述核酸构建物可以是线性的,也可以是环状的。本发明的所述核酸构建物可以是单链的,也可以是双链的。本发明的所述核酸构建物可以是DNA,也可以是RNA,或DNA/RNA杂合。
本发明的优选的信号肽序列及其编码信号肽的核苷酸序列如表1所示。
在另一优选例中,所述的构建物还包括选自下组的元件或其组合:启动子、终止子、poly(A)元件、转运元件、基因靶向元件、筛选标记基因、增强子、抗性基因、转座酶编码基因。
多种选择性标志基因均可应用于本发明,包括但不限于:营养缺陷型标记,抗性标记,报告基因标记。选择性标志的应用对于重组细胞(重组子)的筛选起到作用,使得受体细胞能够与未转化的细胞进行显著区分。营养缺陷型标记是通过转入的标记基因与受体细胞突变基因互补,从而使受体细胞表现野生型生长。抗性标记是指将抗性基因转入受体细胞中,转入的基因使受体细胞在一定的药物浓度下表现抗药性。作为本发明的优选方式,应用抗性标记来实现重组细胞的便捷筛选。
在本发明中,在体外蛋白质合成体系中应用本发明的核酸构建物,可以显著提高外源蛋白的翻译效率。在一优选实施方式中,在本发明的酵母体外蛋白质合成体系中应用本发明的核酸构建物,可显著提高蛋白翻译的效率。
载体
本发明还提供了一种载体或载体组合,所述载体含有本发明的核酸构建物。优选地,所述载体选自:细菌质粒、噬菌体、酵母质粒、或动物细胞载体、穿梭载体。此外,载体可以为转座子载体。用于制备重组载体的方法是本领域普通技术人员所熟知的。只要其能够在宿主体内复制和稳定,任何质粒和载体都是可以被采用的。
本领域普通技术人员可以使用熟知的方法构建含有本发明所述的启动子和/或目的基因序列的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。
基因工程细胞
本发明还提供了一种基因工程细胞,所述的基因工程细胞含有所述的构建物或载体或载体组合,或所述的基因工程细胞染色体整合有所述的构建物或载体。在另一优选例中,所述的基因工程细胞还包括含有编码转座酶基因的载体或其染色体上整合有转座酶基因。
优选地,所述的基因工程细胞为真核细胞。
在另一优选例中,所述真核细胞,包括但不限于:酵母细胞(优选,克鲁维酵母细胞,更优选乳酸克鲁维酵母细胞)。
本发明的构建物或载体,可以用于转化适当的基因工程细胞。基因工程细胞可以是原核细胞,如大肠杆菌,链霉菌属、农杆菌:或是低等真核细胞,如酵母细胞;或是高等动物细胞,如昆虫细胞。本领域一般技术人员都清楚如何选择适当的载体和基因工程细胞。用重组DNA转化基因工程细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物(如大肠杆菌)时,可以用CaCl2法处理,也可用电穿孔法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法(如显微注射、电穿孔、脂质体包装等)。转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、幼胚转化法、花芽浸泡法等。
此外,本发明的基因工程细胞可用于生产或提供本发明的核酸构建物。
体外高通量的蛋白合成方法
本发明的信号肽、含信号肽编码序列的构建物,特别适合在体外生物合成体系中显著提高外源蛋白的合成效率或产量。
相应地,本发明还提供了一种体外高通量的蛋白合成方法,包括步骤:
(i)在体外蛋白合成体系存在下,提供本发明第一方面所述的核酸构建物;
(i i)在适合的条件下,孵育步骤(i)的所述体外蛋白合成体系一段时间T1,从而合成所述外源蛋白。
在另一优选例中,所述方法还包括:(iii)任选地从所述体外蛋白合成体系中,分离或检测所述外源蛋白。
本发明的主要优点包括:
(1)本发明首次发现,将信号肽相关序列和外源蛋白的编码序列作为核酸构建物,应用于本发明的体外蛋白质合成体系中,可用于提高目标蛋白翻译效率并可表达纯化。
(2)本发明的信号肽相关序列在翻译起始密码子之后,可以影响mRNA的折叠,从而改变目标蛋白的翻译效率。
(3)与其他细胞相比,乳酸克鲁维酵母因其安全性和高效性可以被应用于食品和药品领域蛋白质的生产,加上体外蛋白质合成体系的优点,如适应于高通量的蛋白质合成筛选,合成毒性蛋白质和时间短、成本低等,所以乳酸克鲁维酵母细胞来源的体外蛋白质合成体系在相关领域也能够得到广泛的应用。
(4)本发明提供的信号肽相关序列不仅能够提升目标外源蛋白翻译效率,更主要的是能够增加酵母体外蛋白合成体系(如乳酸克鲁维酵母体外蛋白质合成体系)的针对不同蛋白质合成的可能性。
(5)本发明首次开发一种用于提高体外蛋白合成体系的蛋白翻译效率的新型信号肽及包括该信号肽编码序列的核酸构建物,本发明的核酸构建物包括与编码外源蛋白的第二核苷酸序列可操作地相连的编码信号肽的第一核苷酸序列(如密码子优化的信号肽的编码序列),本发明的核酸构建物可显著提高所合成的外源蛋白的表达。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
材料
如无特别说明,则本发明实施例中所用的材料和试剂均为市售产品。
实施例中的外源蛋白以eGFP为例。
实施例1真核细胞信号肽相关序列的确定
1.1信号肽相关序列的来源及确定:随机截取已构建外源蛋白N端相对应的DNA序列,通过实验筛选对于外源蛋白表达有显著提高的序列或元件。
具体地,选取并合成碱基长度选择为36,54或者其他长度的30个核苷酸片段,同时采用同义密码子交错替换的方式修改了部分碱基,以提高质粒构建的成功率,其中包括(但并不限于):为了降低信号肽相关序列中的GC含量从而降低了序列的退火温度;或采用优选密码子。构建得到几十个质粒,经分析和筛选,对其中的30个质粒并测试其对外源蛋白表达的作用结果表明,与对照相比,13个信号肽相关序列经过实验验证具有提高蛋白表达的作用,其相应的信号肽的氨基酸序列及编码信号肽的核苷酸序列信息列于表1。其他对于提高蛋白表达没有效果或效果不显著的序列信息未予列出。
表1质粒及相关核酸序列
实施例2含有信号肽相关序列的体外蛋白质合成体系质粒的构建
质粒的构建:对于选出的30个信号肽相关序列和连接序列(连接序列上含有TEV酶切位点)使用1对引物扩增,原始含有目标蛋白(以eGFP为例)的质粒骨架使用其对应的反向引物进行扩增。扩增完成后将30个信号肽相关序列+连接序列片段分别插入在目标蛋白的N端。在最终构建的质粒中,30个信号肽相关序列+连接序列核酸序列插入到pD2P-eGFP质粒的ATG起始密码子和eGFP之间。其中13个质粒的名称分别为:pD2P-1.0SP-(001-013)(见表1)。
具体构建过程如下:
使用2对引物分别进行PCR扩增,并取10μL经鉴定正确的扩增产物进行混合;向10μL扩增产物中加入0.5μL DpnI,37℃孵育6h;将DpnI处理后产物4μL加入50μL DH5α感受态细胞中,冰上放置30min,42℃热激45s后,冰上放置3min,加入200μL LB液体培养基37℃振荡培养4h,涂布于含有Amp抗生素的LB固体培养基上过夜培养;挑取6个单克隆进行扩大培养后,进行测序确认正确后,提取质粒保存。
实施例3信号肽相关序列在体外蛋白质合成体系中的应用
3.1利用PCR,并使用引物pD2P_F:CGCGAAATTAATACGACTCACTATAGG(SEQ ID No.:27)和pD2P_R:TCCGGATATAGTTCCTCCTTTCAG(SEQ ID NO.:28),将所有质粒中位于T7转录起始序列和终止序列之间包含信号肽相关序列的片段和pD2P-eGFP片段进行扩增。
并将扩增得到的经测序鉴定正确的DNA片段用乙醇沉淀的方法进行纯化和富集:向PCR产物中加入1/10体积的3M醋酸钠(pH5.2),然后再加入2.5-3倍体积(该体积为加入醋酸钠之后的体积)的95%的乙醇,置于冰上孵育15min;室温条件下以高于14000g的速度离心30min,弃掉上清;使用70%乙醇进行清洗,然后再离心15min,弃掉上清,并用超纯水将沉淀溶解,测定DNA浓度。
3.2按照使用说明,将纯化的DNA片段加入到自制的体外蛋白质合成体系中。并将上述反应体系置于22-30℃的环境中,静置孵育约2-6h。反应结束后,立即放置于Envision2120多功能酶标仪(Perkin Elmer),读数,检测eGFP信号强弱,相对荧光单位值(RelativeFluorescence Unit,RFU)作为活性单位。
PC(Positive Control)是在增强型绿色荧光蛋白N端仅添加连接序列的实验组,NC(Negative Control)是不加入任何核酸构建物的实验组。1μl、2μl、3μl分别为向体外蛋白合成体系中加入的DNA模板量,所有反应的总反应体系体积为30μl。
实验结果
1.体外蛋白质合成体系质粒的构建
经过多次尝试,最终构建成功30个含有信号肽相关序列的体外蛋白质合成体系质粒。
2.信号肽相关序列在体外蛋白质合成体系中的应用
如图2所示,13个包含信号肽相关序列在体外蛋白质合成体系中引起eGFP发出的RFU值均显著提高(反应3小时后RFU值达到1500以上),最高可达2900。尤其pD2P-1.0SP-012(添加1μlDNA模板量,反应3小时后RFU值达到2900),与未插入信号肽相关序列的对照PC(RFU值为800)相比相对荧光单位值提高了2.6倍。
而对于其他17个未列出的信号肽序列而言,其相对荧光单位值与PC相比无变化或者是变化不明显,大多为800-830,如pD2P-1.0SP-019为823,pD2P-1.0SP-027为816。
本发明结果表明,目标蛋白N端的信号肽相关序列可以显著提高目标蛋白的产量,大大提升了目标蛋白质表达纯化效果。提高了目标蛋白的翻译效率并增加了体外合成体系进行蛋白质表达纯化方式的选择性,极大增强了体外蛋白质合成体系的可用性。
并且,本发明的研究还发现,将5'-UTR、强启动子(如T7启动子、T3启动子、SP6启动子)、不同的IRES元件(如KLNCE102)与不同的信号肽相关序列,3'-UTR等组合,也可进一步提高目标蛋白的翻译效率。
对比例(PC和NC)
PC(Positive Control)是在增强型绿色荧光蛋白N端仅添加连接序列的实验组,添加1μlDNA模板量的情况下外源蛋白的RFU值为800,反应体系总体积为30μl。
NC(Negative Control)是不加入任何核酸构建物的实验组,外源蛋白的RFU值为20,反应体系总体积为30μl。
其中,图2中的1μl、2μl、3μl表示分别为向体外蛋白合成体系中加入的DNA模板量,所有反应的总反应体系体积为30μl,反应时间3小时。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
参考文献:
1.Fromm HJ,Hargrove M.Essentials of Biochemistry.2012.
2.Garcia RA,Riley MR.Applied biochemistry and biotechnology.HumanaPress,;1981.263-264p.
3.Martoglio B.Intramembrane proteolysis and post-targeting functionsof signal peptides.Biochem Soc Trans.2003;31(6):1243–7.
4.Owj i H,Nezafat N,Negahdaripour M,Haj iebrahimi A,Ghasemi Y.AComprehensive Review of Signal Peptides:Structure,Roles,and Applications.EurJ Cell Biol.2018.
5.Liu H,Wu R,Yuan L,Tian G,Huang X,Wen Y,et al.Introducing acleavable signal peptide enhances the packaging efficiency of lentiviralvectors pseudotyped with Japanese encephalitis virus envelope proteins.VirusRes.2017;229:9–16.
6.Cui Y,Meng Y,Zhang J,Cheng B,Yin H,Gao C,et al.Efficient secretoryexpression of recombinant proteins in Escherichia coli with a novelactinomycete signal peptide.Protein Expr Purif.2017;129:69–74.
7.Ling HL,Rahmat Z,Murad AMA,Mahadi NM,Illias RM.Proteome-basedidentification of signal peptides for improved secretion of recombinantcyclomaltodextrin glucanotransferase in Escherichia coli.ProcessBiochem.2017;61:47–55.
8.Zhang S,Corin K.18-Peptide surfactants in membrane proteinpurification and stabilization A2-Koutsopoulos,Sotirios BT-PeptideApplications in Biomedicine,Biotechnology and Bioengineering.In WoodheadPublishing;2018.p.485–512.
9.Stone TA,Deber CM.Therapeutic design of peptide modulators ofprotein-protein interactions in membranes.Biochim Biophys Acta-Biomembr.2017;1859(4):577–85.
10.Katzen F,Chang G,Kudlicki W.The past,present and future of cell-free protein synthesis.Trends Biotechnol.2005;23(3):150–6.
11.Gan R,Jewett MC.A combined cell-free transcription-translationsystem from Saccharomyces cerevisiae for rapid and robust proteinsynthesis.Biotechnol J.2014;9(5):641–51.
12.Lu Y.Cell-free synthetic biology:Engineering in an openworld.Synth Syst Biotechnol.2017;2(1):23–7.
13.Kralicek A V.,Radjainia M,Mohamad Ali NAB,Carraher C,Newcomb RD,Mitra AK.A PCR-directed cell-free approach to optimize protein expressionusing diverse fusion tags.Protein Expr Purif.2011;80(1):117–24.
14.Hansted JG,L,F,Sperling-Petersen HU,MortensenKK.Expressivity tag:A novel tool for increased expression in Escherichiacoli.J Biotechnol.2011;155(3):275–83.
15.Kasi D,Nah HJ,Catherine C,Kim ES,Han K,Ha JC,et al.EnhancedProduction of Soluble Recombinant Proteins With an In Situ-Removable FusionPartner in a Cell-Free Synthesis System.Biotechnol J.2017;12(11):1–6.
16.S,Nordlund P,Weigelt J,Hallberg BM,Bray J,Gileadi O,etal.Protein production and purification.Nat Methods.2008;5(2):135–46.
序列表
<110> 康码(上海)生物科技有限公司
<120> 信号肽相关序列及其在蛋白质合成中的应用
<130> P2018-1332
<141> 2018-08-07
<160> 28
<170> SIPOSequenceListing 1.0
<210> 1
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
agtgagcaaa gccaattaga tgattcgact atagac 36
<210> 2
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 2
ctgacaactg ttctccctaa cgtagctaca ttaaac 36
<210> 3
<211> 54
<212> DNA
<213> 人工序列(artificial sequence)
<400> 3
atgctgacaa ctgttctccc taacgtagct acattaaaca gtatgtttgc cctg 54
<210> 4
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
aattgctccg cacattgtat caaaaaggct ttacct 36
<210> 5
<211> 54
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
aattgctccg cacattgtat caaaaaggct ttacctgcac agtggatccg ttgc 54
<210> 6
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
aaaacacata tagtcagctc agtaacaaca acacta 36
<210> 7
<211> 54
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
aaaacacata tagtcagctc agtaacaaca acactattgc taggttccat atta 54
<210> 8
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
tctggtggtc aaattttcgt aaagacgctg accggt 36
<210> 9
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
tctggtggtc aaattttcgt caaaactcta acaggt 36
<210> 10
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
tctggtggtc aaattttcgt taaaactctt actggt 36
<210> 11
<211> 27
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
aagcctccag tatacccatc gatttgc 27
<210> 12
<211> 36
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
atgattacag aaacatcatc accgttcaga tctata 36
<210> 13
<211> 54
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
atggtcgcta gaggtagaac agacgagata tctacagatg tttcagaggc taat 54
<210> 14
<211> 12
<212> PRT
<213> 人工序列(artificial sequence)
<400> 14
Ser Glu Gln Ser Gln Leu Asp Asp Ser Thr Ile Asp
1 5 10
<210> 15
<211> 12
<212> PRT
<213> 人工序列(artificial sequence)
<400> 15
Leu Thr Thr Val Leu Pro Asn Val Ala Thr Leu Asn
1 5 10
<210> 16
<211> 17
<212> PRT
<213> 人工序列(artificial sequence)
<400> 16
Leu Thr Thr Val Leu Pro Asn Val Ala Thr Leu Asn Ser Met Phe Ala
1 5 10 15
Leu
<210> 17
<211> 12
<212> PRT
<213> 人工序列(artificial sequence)
<400> 17
Asn Cys Ser Ala His Cys Ile Lys Lys Ala Leu Pro
1 5 10
<210> 18
<211> 18
<212> PRT
<213> 人工序列(artificial sequence)
<400> 18
Asn Cys Ser Ala His Cys Ile Lys Lys Ala Leu Pro Ala Gln Trp Ile
1 5 10 15
Arg Cys
<210> 19
<211> 12
<212> PRT
<213> 人工序列(artificial sequence)
<400> 19
Lys Thr His Ile Val Ser Ser Val Thr Thr Thr Leu
1 5 10
<210> 20
<211> 18
<212> PRT
<213> 人工序列(artificial sequence)
<400> 20
Lys Thr His Ile Val Ser Ser Val Thr Thr Thr Leu Leu Leu Gly Ser
1 5 10 15
Ile Leu
<210> 21
<211> 12
<212> PRT
<213> 人工序列(artificial sequence)
<400> 21
Ser Gly Gly Gln Ile Phe Val Lys Thr Leu Thr Gly
1 5 10
<210> 22
<211> 9
<212> PRT
<213> 人工序列(artificial sequence)
<400> 22
Lys Pro Pro Val Tyr Pro Ser Ile Cys
1 5
<210> 23
<211> 11
<212> PRT
<213> 人工序列(artificial sequence)
<400> 23
Ile Thr Glu Thr Ser Ser Pro Phe Arg Ser Ile
1 5 10
<210> 24
<211> 17
<212> PRT
<213> 人工序列(artificial sequence)
<400> 24
Val Ala Arg Gly Arg Thr Asp Glu Ile Ser Thr Asp Val Ser Glu Ala
1 5 10 15
Asn
<210> 25
<211> 48
<212> DNA
<213> 人工序列(artificial sequence)
<400> 25
gaaaacctgt atttccaagg aggtagtgga ggaagtggtg gaagtgga 48
<210> 26
<211> 16
<212> PRT
<213> 人工序列(artificial sequence)
<400> 26
Glu Asn Leu Tyr Phe Gln Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
<210> 27
<211> 27
<212> DNA
<213> 人工序列(artificial sequence)
<400> 27
cgcgaaatta atacgactca ctatagg 27
<210> 28
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 28
tccggatata gttcctcctt tcag 24
Claims (14)
1.一种核酸构建物,该核酸构建物包含编码信号肽的第一核苷酸序列,其与编码外源蛋白的第二核苷酸序列可操作地连接,第一核苷酸序列的3′端在第二核苷酸序列的上游,且第一核苷酸序列选自编码以下信号肽的核苷酸序列:氨基酸序列为KTHIVSSVTTTL或KTHIVSSVTTTLLLGSIL的信号肽。
2.根据权利要求1所述的核酸构建物,其特征在于:所述的可操作地连接为直接连接或通过连接序列连接。
3.根据权利要求2所述的核酸构建物,其特征在于:所述的连接序列为SEQ ID NO.:25所示的核苷酸序列。
4.一种信号肽,其特征在于:其氨基酸序列由权利要求1中的第一核苷酸序列编码产生。
5.一种载体或载体组合,其特征在于,所述的载体或载体组合含有权利要求1-3任一所述的核酸构建物。
6.一种基因工程细胞,其特征在于,所述基因工程细胞的基因组的一个或多个位点整合有权利要求1-3任一所述的核酸构建物,或者所述基因工程细胞中含有权利要求5所述的载体或载体组合;
所述基因工程细胞选自原核细胞、中国仓鼠卵巢细胞、昆虫细胞、兔网织红细胞、酵母细胞、或其组合。
7.一种试剂盒,其特征在于,所述试剂盒中包含的试剂选自下组中的一种或多种:
(a)权利要求1-3任一所述的核酸构建物;
(b)权利要求5所述的载体或载体组合;和
(c)权利要求6所述的基因工程细胞。
8.根据权利要求7所述的试剂盒,其特征在于,其还包括(d)体外生物合成体系。
9.根据权利要求8所述的试剂盒,其特征在于:所述体外生物合成体系选自下组:酵母体外生物合成体系、中国仓鼠卵巢细胞体外生物合成体系、昆虫细胞体外生物合成体系、Hela细胞体外生物合成体系、或其组合。
10.根据权利要求9所述的试剂盒,其特征在于:所述的酵母体外生物合成体系为克鲁维酵母体外生物合成体系。
11.一种如权利要求1-3任一所述的核酸构建物、权利要求4所述的信号肽、权利要求5所述的载体或载体组合、权利要求6所述的基因工程细胞或权利要求7-9任一所述试剂盒在体外蛋白合成体系中的应用。
12.一种体外蛋白合成方法,其特征在于,其包括以下步骤:
(i)提供一体外生物合成体系,所述体外生物合成体系含有权利要求1-3任一所述的核酸构建物;
(ii)在适合的条件下,孵育步骤(i)的体外生物合成体系一段反应时间,从而合成所述外源蛋白。
13.根据权利要求12所述的体外蛋白合成方法,其特征在于,合适的条件为反应温度为20-37℃,反应时间为1-72h。
14.根据权利要求12所述的体外蛋白合成方法,其特征在于,所述方法还包括:(iii)分离或检测所述外源蛋白。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110876455.XA CN113667685B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810888184.8A CN110819647A (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110876455.XA CN113667685B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810888184.8A Division CN110819647A (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113667685A true CN113667685A (zh) | 2021-11-19 |
CN113667685B CN113667685B (zh) | 2023-02-28 |
Family
ID=69533681
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110866634.5A Active CN113584060B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110864773.4A Active CN113528574B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110866625.6A Active CN113481226B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110866617.1A Active CN113584059B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110866626.0A Active CN113528575B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN201810888184.8A Pending CN110819647A (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110876455.XA Active CN113667685B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110866616.7A Active CN113584058B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
Family Applications Before (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110866634.5A Active CN113584060B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110864773.4A Active CN113528574B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110866625.6A Active CN113481226B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110866617.1A Active CN113584059B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN202110866626.0A Active CN113528575B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
CN201810888184.8A Pending CN110819647A (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110866616.7A Active CN113584058B (zh) | 2018-08-07 | 2018-08-07 | 信号肽相关序列及其在蛋白质合成中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (8) | CN113584060B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111484998B (zh) | 2019-05-30 | 2023-04-21 | 康码(上海)生物科技有限公司 | 体外定量共表达多种蛋白的方法及其应用 |
KR20220101738A (ko) | 2019-11-30 | 2022-07-19 | 강마-헬스코드 (상하이) 바이오테크 컴퍼니 리미티드 | 생체자기 마이크로스피어 및 이의 제조 방법과 용도 |
CN113402589A (zh) * | 2021-06-18 | 2021-09-17 | 苏州工业园区唯可达生物科技有限公司 | 一种提高抗体产量的信号肽 |
CN117683804A (zh) * | 2022-09-09 | 2024-03-12 | 康码(上海)生物科技有限公司 | 一种核酸构建物以及在ivtt体系中的应用 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005089093A2 (en) * | 2003-11-21 | 2005-09-29 | Dow Global Technologies Inc. | Improved expression systems with sec-system secretion |
CN101250551A (zh) * | 2008-04-08 | 2008-08-27 | 上海师范大学 | 提高大豆蛋白质含量和质量的表达载体及其制法和用途 |
JP2014223064A (ja) * | 2013-04-24 | 2014-12-04 | 東ソー株式会社 | シグナルペプチドおよびそれを用いたタンパク質製造方法 |
CN107474142A (zh) * | 2017-09-04 | 2017-12-15 | 中国动物疫病预防控制中心 | 促进目的蛋白分泌的多肽及其相关生物材料与应用 |
WO2017223528A1 (en) * | 2016-06-24 | 2017-12-28 | The Scripps Research Institute | Novel nucleoside triphosphate transporter and uses thereof |
CN107936096A (zh) * | 2017-10-23 | 2018-04-20 | 华南理工大学 | 一种能有效提高蛋白分泌效率的信号肽及其应用 |
WO2018081350A1 (en) * | 2016-10-27 | 2018-05-03 | Medimmune, Llc | Signal polypeptide for improved secretion of protein |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7863020B2 (en) * | 2000-06-28 | 2011-01-04 | Glycofi, Inc. | Production of sialylated N-glycans in lower eukaryotes |
CN101386868A (zh) * | 2008-09-23 | 2009-03-18 | 复旦大学 | 一种提高重组蛋白在克鲁维酵母中表达量的方法 |
CN100562576C (zh) * | 2008-09-28 | 2009-11-25 | 李校堃 | 一种分泌表达重组人成纤维细胞生长因子-21的生产方法 |
KR101026526B1 (ko) * | 2009-01-23 | 2011-04-01 | 한국과학기술연구원 | 대장균에서 외래단백질을 분비 생산하는 방법 |
CN104059128B (zh) * | 2010-09-17 | 2016-08-03 | 上海凯茂生物医药有限公司 | 一种人工合成的信号肽及其应用 |
CN102993292A (zh) * | 2012-12-14 | 2013-03-27 | 上海柯莱逊生物技术有限公司 | 一种afp重组蛋白和体外重组表达的方法 |
CN103173367A (zh) * | 2013-03-11 | 2013-06-26 | 江南大学 | 一种产热稳定性重组胰蛋白酶的酵母工程菌及其应用 |
CN109415423A (zh) * | 2016-10-11 | 2019-03-01 | 威尔斯达眼科制剂公司 | 短型视杆源性视锥活力因子与亲水性肽的融合蛋白 |
-
2018
- 2018-08-07 CN CN202110866634.5A patent/CN113584060B/zh active Active
- 2018-08-07 CN CN202110864773.4A patent/CN113528574B/zh active Active
- 2018-08-07 CN CN202110866625.6A patent/CN113481226B/zh active Active
- 2018-08-07 CN CN202110866617.1A patent/CN113584059B/zh active Active
- 2018-08-07 CN CN202110866626.0A patent/CN113528575B/zh active Active
- 2018-08-07 CN CN201810888184.8A patent/CN110819647A/zh active Pending
- 2018-08-07 CN CN202110876455.XA patent/CN113667685B/zh active Active
- 2018-08-07 CN CN202110866616.7A patent/CN113584058B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005089093A2 (en) * | 2003-11-21 | 2005-09-29 | Dow Global Technologies Inc. | Improved expression systems with sec-system secretion |
CN101250551A (zh) * | 2008-04-08 | 2008-08-27 | 上海师范大学 | 提高大豆蛋白质含量和质量的表达载体及其制法和用途 |
JP2014223064A (ja) * | 2013-04-24 | 2014-12-04 | 東ソー株式会社 | シグナルペプチドおよびそれを用いたタンパク質製造方法 |
WO2017223528A1 (en) * | 2016-06-24 | 2017-12-28 | The Scripps Research Institute | Novel nucleoside triphosphate transporter and uses thereof |
WO2018081350A1 (en) * | 2016-10-27 | 2018-05-03 | Medimmune, Llc | Signal polypeptide for improved secretion of protein |
CN107474142A (zh) * | 2017-09-04 | 2017-12-15 | 中国动物疫病预防控制中心 | 促进目的蛋白分泌的多肽及其相关生物材料与应用 |
CN107936096A (zh) * | 2017-10-23 | 2018-04-20 | 华南理工大学 | 一种能有效提高蛋白分泌效率的信号肽及其应用 |
Non-Patent Citations (3)
Title |
---|
GENPEPT: ""beta-channel forming cytolysin [Staphylococcus aureus],GenPept:WP_064221861.1"", 《GENPEPT》 * |
HOHREH KHORSHIDI ET AL.: ""Functional expression of the human coagulation factor IX using heterologous signal peptide and propeptide sequences in mammalian cell line"", 《BIOTECHNOL LETT》 * |
李家冬等: ""重组蛋白正确折叠与修饰的提高策略"", 《生物工程学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113528574A (zh) | 2021-10-22 |
CN113584059B (zh) | 2023-02-10 |
CN113584058B (zh) | 2023-02-10 |
CN113528575B (zh) | 2022-06-21 |
CN113481226B (zh) | 2022-06-21 |
CN113584060B (zh) | 2023-02-07 |
CN113528574B (zh) | 2022-06-21 |
CN113584059A (zh) | 2021-11-02 |
CN113528575A (zh) | 2021-10-22 |
CN113584058A (zh) | 2021-11-02 |
CN113667685B (zh) | 2023-02-28 |
CN110819647A (zh) | 2020-02-21 |
CN113481226A (zh) | 2021-10-08 |
CN113584060A (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113481226B (zh) | 信号肽相关序列及其在蛋白质合成中的应用 | |
CN110408635B (zh) | 一种含有链霉亲和素元件的核酸构建物在蛋白质表达、纯化中的应用 | |
CN110408636B (zh) | 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用 | |
JP7292442B2 (ja) | 改変アミノアシルtRNA合成酵素およびその用途 | |
CN111778169B (zh) | 一种提高体外蛋白合成效率的方法 | |
AU2020242724B2 (en) | Aminoacyl-tRNA synthetase for efficiently introducing lysine derivative in protein | |
CN111850020B (zh) | 利用质粒系统在蛋白中引入非天然氨基酸 | |
CN110551745A (zh) | 一种多重组氨酸序列标签及其在蛋白质表达、纯化中的应用 | |
CN111378047B (zh) | 一种提高蛋白表达的融合标签蛋白及其应用 | |
CN110938649A (zh) | 一种提高外源蛋白表达量的蛋白合成体系及其应用方法 | |
KR101373297B1 (ko) | 대장균 포스포글리세르산 인산화효소 유전자를 융합 파트너로서 포함하는 발현벡터 | |
CN114057861B (zh) | 一种靶向UBE2C的bio-PROTAC人工蛋白 | |
JP7028986B2 (ja) | タンパク質合成効率を高めることができるタンデムdnaエレメント | |
EP4067492A1 (en) | Polypeptide tag and application thereof in in vitro protein synthesis | |
KR102223576B1 (ko) | N 말단 또는 c 말단의 알부민 접합을 이용한 세포외 분비 슈퍼옥사이드 디스뮤테이즈(ec-sod) 단백질의 안정화 방법 | |
US20090035815A1 (en) | Synthetic Gene for Enhanced Expression in E. Coli | |
WO2024051855A1 (zh) | 一种核酸构建物以及在ivtt体系中的应用 | |
RU2803949C1 (ru) | Способ экспрессии белка crm197 | |
CA3233224A1 (en) | Chimeric protein and expression system | |
CN116987683A (zh) | 一种催化欧芹酚生成蛇床子素的o-甲基转移酶及其编码基因与应用 | |
KR101325411B1 (ko) | 두날리엘라 살리나 유래의 신규한 포스포에놀피루브산 카르복실화효소 2 | |
KR100755727B1 (ko) | β-갈락토시다제 유래의 융합 단편 펩타이드 및 이를 융합파트너로 이용하는 재조합 단백질의 제조방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231109 Address after: No. 2 Nanya Road, Minhang District, Shanghai, 201321 Patentee after: KANGMA-HEATHCODE (SHANGHAI) BIOTECH Co.,Ltd. Patentee after: Yanshimei Society (Hainan) Medical Beauty Health Technology Co.,Ltd. Address before: 201321 4th floor, building 15, Lane 118, Furonghua Road, Pudong New Area, Shanghai Patentee before: KANGMA-HEATHCODE (SHANGHAI) BIOTECH Co.,Ltd. |
|
TR01 | Transfer of patent right |