KR20230106236A - 목적 단백질의 수용성 및 발현량 증가를 위한 개량된 next 융합 태그 및 이의 용도 - Google Patents
목적 단백질의 수용성 및 발현량 증가를 위한 개량된 next 융합 태그 및 이의 용도 Download PDFInfo
- Publication number
- KR20230106236A KR20230106236A KR1020220001889A KR20220001889A KR20230106236A KR 20230106236 A KR20230106236 A KR 20230106236A KR 1020220001889 A KR1020220001889 A KR 1020220001889A KR 20220001889 A KR20220001889 A KR 20220001889A KR 20230106236 A KR20230106236 A KR 20230106236A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- target protein
- sequence
- tag
- var
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 128
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 100
- 230000004927 fusion Effects 0.000 title claims abstract description 46
- 230000001965 increasing effect Effects 0.000 title claims abstract description 30
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 38
- 150000001413 amino acids Chemical class 0.000 claims description 49
- 230000000844 anti-bacterial effect Effects 0.000 claims description 39
- 238000000034 method Methods 0.000 claims description 30
- 108091033319 polynucleotide Proteins 0.000 claims description 22
- 102000040430 polynucleotide Human genes 0.000 claims description 22
- 239000002157 polynucleotide Substances 0.000 claims description 22
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 17
- 238000004519 manufacturing process Methods 0.000 claims description 12
- 239000000203 mixture Substances 0.000 claims description 12
- 230000000845 anti-microbial effect Effects 0.000 claims description 11
- 238000000338 in vitro Methods 0.000 claims description 7
- 108090000790 Enzymes Proteins 0.000 claims description 6
- 102000004190 Enzymes Human genes 0.000 claims description 6
- 231100000135 cytotoxicity Toxicity 0.000 claims description 6
- 230000003013 cytotoxicity Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 6
- 239000004480 active ingredient Substances 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 3
- 102000004506 Blood Proteins Human genes 0.000 claims description 2
- 101710172711 Structural protein Proteins 0.000 claims description 2
- 239000000427 antigen Substances 0.000 claims description 2
- 102000036639 antigens Human genes 0.000 claims description 2
- 108091007433 antigens Proteins 0.000 claims description 2
- 230000004071 biological effect Effects 0.000 claims description 2
- 230000001413 cellular effect Effects 0.000 claims description 2
- 239000002773 nucleotide Substances 0.000 claims description 2
- 125000003729 nucleotide group Chemical group 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 4
- 210000004027 cell Anatomy 0.000 description 50
- 235000018102 proteins Nutrition 0.000 description 28
- 235000001014 amino acid Nutrition 0.000 description 24
- 229940024606 amino acid Drugs 0.000 description 24
- 102000037865 fusion proteins Human genes 0.000 description 22
- 108020001507 fusion proteins Proteins 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 14
- 239000005090 green fluorescent protein Substances 0.000 description 14
- 241000588724 Escherichia coli Species 0.000 description 13
- 108090000765 processed proteins & peptides Proteins 0.000 description 13
- 239000013604 expression vector Substances 0.000 description 9
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 8
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 8
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 8
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 8
- 238000010186 staining Methods 0.000 description 8
- 230000010261 cell growth Effects 0.000 description 7
- 108091008146 restriction endonucleases Proteins 0.000 description 7
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 238000011537 Coomassie blue staining Methods 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 5
- 241001137857 Hydrogenovibrio marinus Species 0.000 description 5
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 4
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 4
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 4
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 4
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 102000003846 Carbonic anhydrases Human genes 0.000 description 3
- 108090000209 Carbonic anhydrases Proteins 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 101500025419 Homo sapiens Epidermal growth factor Proteins 0.000 description 3
- 241001575835 Ideonella sakaiensis Species 0.000 description 3
- 101000693878 Ideonella sakaiensis (strain NBRC 110686 / TISTR 2288 / 201-F6) Poly(ethylene terephthalate) hydrolase Proteins 0.000 description 3
- 108010029660 Intrinsically Disordered Proteins Proteins 0.000 description 3
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 3
- 101000693873 Unknown prokaryotic organism Leaf-branch compost cutinase Proteins 0.000 description 3
- 239000001569 carbon dioxide Substances 0.000 description 3
- 229910002092 carbon dioxide Inorganic materials 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 229940116978 human epidermal growth factor Drugs 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- GVUGOAYIVIDWIO-UFWWTJHBSA-N nepidermin Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CS)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C(C)C)C(C)C)C1=CC=C(O)C=C1 GVUGOAYIVIDWIO-UFWWTJHBSA-N 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000331307 Thermovibrio ammonificans Species 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 231100000433 cytotoxic Toxicity 0.000 description 2
- 230000001472 cytotoxic effect Effects 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 108091005896 globular proteins Proteins 0.000 description 2
- 102000034238 globular proteins Human genes 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 1
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- DQPOBSRQNWOBNA-GUBZILKMSA-N Gln-His-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O DQPOBSRQNWOBNA-GUBZILKMSA-N 0.000 description 1
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 1
- GFLNKSQHOBOMNM-AVGNSLFASA-N Gln-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GFLNKSQHOBOMNM-AVGNSLFASA-N 0.000 description 1
- ICDIMQAMJGDHSE-GUBZILKMSA-N Gln-His-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O ICDIMQAMJGDHSE-GUBZILKMSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- CJWANNXUTOATSJ-DCAQKATOSA-N Glu-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N CJWANNXUTOATSJ-DCAQKATOSA-N 0.000 description 1
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- UMBKDWGQESDCTO-KKUMJFAQSA-N His-Lys-Lys Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O UMBKDWGQESDCTO-KKUMJFAQSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 241001509283 Ideonella Species 0.000 description 1
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 244000253911 Saccharomyces fragilis Species 0.000 description 1
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 230000003712 anti-aging effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000011942 biocatalyst Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229940014144 folate Drugs 0.000 description 1
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 230000017095 negative regulation of cell growth Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000036560 skin regeneration Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001694 spray drying Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000002525 ultrasonication Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 목적 단백질의 수용성 및 발현량 증가를 위해 개량된 NEXT 융합 태그 및 이의 용도에 관한 것으로, 본 발명의 융합 태그 및 이를 포함하는 재조합 벡터는 숙주세포 내에서 목적 단백질의 수용성 및 발현량을 증가시킴으로써, 산업적으로 유용하게 이용될 수 있을 것이다.
Description
본 발명은 목적 단백질의 수용성 및 발현량 증가를 위한 개량된 NEXT 융합 태그 및 이의 용도에 관한 것이다.
유전자 재조합 기술이 발달되면서 동물세포, 효모와 같은 진핵생물(eukaryote) 및 대장균과 같은 원핵생물(prokaryote) 등을 이용하여 유용한 목적 단백질이 많이 생산되고 있으며, 생산된 재조합 단백질은 의약품 등의 생물공학 산업에 널리 이용되고 있다.
특히 대장균은 세포의 성장 속도가 빠르고 그의 유전자에 대한 규명이 다른 생물체에 비해 잘 연구되고 있기 때문에 유전자 재조합 기술에서 목적 단백질을 생산하기 위한 숙주세포로 많이 이용되고 있다. 그러나 숙주세포로 대장균을 사용할 경우 제조하고자 하는 단백질이 대장균 내의 단백질 분해효소에 의해 분해되어 수율이 낮아지는 경우가 많았으며, 특히 분자량이 10 kDa 이하인 작은 크기의 폴리펩타이드 발현에서 이러한 경향이 심한 것으로 알려져 있다. 재조합 단백질이 대장균에서 과다 발현되면 불용성 응집체(insoluble aggregate)의 형태로 세포질 내에 축적될 수 있으며, 이러한 단백질을 활성형으로 만들기 위해서는 고농도의 우레아(urea) 또는 구아니딘-하이드로클로라이드(guanidine hydrochloride)와 같은 변성제(denaturant)를 사용하여 응집체를 녹여 1차 구조로 풀어주어야 하고, 상기에서 사용한 시약을 제거하여 풀어진 단백질을 정확하게 재접힘(refolding)시켜야만 한다. 그러나 단백질마다 재접힘 조건이 다르고, 효율적인 재접힘 조건을 알아내는데 많은 시간과 비용이 요구되며, 재접힘 자체가 불가능한 경우도 많다.
가장 효율적인 재조합 단백질의 생산법은 감지할 수 있는 이상의 양으로 과발현되면서 가용성(solubility)이 높은 형태를 갖도록 하는 것이다. 재조합 단백질의 발현 효율을 높이기 위해 벡터, 숙주, ORF(open reading frame) 수준에서 다양한 엔지니어링을 시도하였다. 벡터는 전사, 번역인자와 복제인자 등으로 구성되어 있으며 각 인자들은 여러 변이체가 만들어져 있다. 최근에는 전형적인 이들 요소 외에 새로운 조절인자들이 발굴되어 발현 효율의 증가를 위한 다양한 조합 조절이 시도되고 있다. 이러한 과정에서 단백질 접힘이나 회수(recovery)를 돕는 기능성 태그(tag)를 장착한 벡터를 이용해 단백질의 가용성을 높여주거나 정제과정의 용이성을 높일 수 있다. 태그의 사용은 가장 보편적이고 간단한 방식일 뿐만 아니라, 재조합 단백질 기능에 미치는 영향이 적은 비-간섭성도 담보되기 때문에 많이 시도되는 방법이다.
이에 본 발명자들은 재조합 단백질의 수용성과 발현량 증가를 위한 NEXT 태그를 개발하였다. 다만, 한국등록특허 제2106773호에 하이드로게노비브리오 마리누스(Hydrogenovibrio marinus) 유래 α-탄산무수화효소의 N-말단에 존재하는 NEXT 태그가 개시되어 있으나, 본 발명의 NEXT 태그는 기존 NEXT 태그의 아미노산 셔플링(shuffling)을 통해 재정렬된 태그로, 기존 NEXT 태그에 비해 세포 독성이 적어 목적 단백질의 수용성과 발현량 증진 효과가 더 우수한 특징이 있다.
한편, 한국등록특허 제1591786호에는 '해양 박테리아 유래의 재조합 생물촉매를 포함하는 이산화탄소 포집용 조성물, 이의 제조방법 및 이를 이용한 이산화탄소의 포집방법'이 개시되어 있고, 한국공개특허 제2012-0006002호에는 '이수소 엽산 환원효소를 융합발현파트너로 이용한 가용성 재조합 단백질의 제조방법'이 개시되어 있으나, 본 발명의 목적 단백질의 수용성 및 발현량 증가를 위한 개량된 NEXT 융합 태그 및 이의 용도에 대해서는 기재된 바가 없다.
본 발명은 상기와 같은 요구에 의해 도출된 것으로서, 본 발명자들은 기존 NEXT 태그(한국등록특허 제2106773호)가 항균 활성(antimicrobial activity)을 가지고 있어 숙주세포에 대한 세포 독성이 있음을 확인한 후, 기존 NEXT 태그의 아미노산 구성을 유지하면서 아미노산 서열 셔플링(shuffling)을 수행하여 총 743개의 서열을 제작하였고, in silico screening을 통해 항균 활성이 없을 것으로 예측되는 4개의 개량된 NEXT 태그 변이체를 선별하였다. 상기 선별된 4개의 NEXT 태그 변이체를 각각 코딩하는 폴리뉴클레오티드와 목적 단백질(PETase, taCA, hEGF, GFP)을 코딩하는 유전자가 연결된 재조합 벡터를 제작한 후 상기 재조합 벡터로 대장균 세포를 형질전환하여 NEXT 태그 변이체와 목적 단백질이 결합된 융합 단백질을 발현시킨 결과, 본 발명의 NEXT 태그 변이체가 기존 NEXT 태그에 비해 융합 단백질의 수용성 발현량을 현저히 증가시키는 것을 확인함으로써, 본 발명을 완성하였다.
상기 과제를 해결하기 위해, 본 발명은 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그 및 상기 융합 태그를 코딩하는 폴리뉴클레오티드에 관한 것이다.
또한, 본 발명은 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그(fusion tag)를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 것을 특징으로 하는 재조합 벡터를 제공한다.
또한, 본 발명은 상기 재조합 벡터로 형질전환된 숙주세포를 제공한다.
또한, 본 발명은 상기 재조합 벡터로 숙주세포를 형질전환하여 목적 단백질 코딩 유전자를 발현하는 단계를 포함하는, 시험관 내 또는 생체 외에서 목적 단백질의 수용성 및 발현량을 증가시키는 방법을 제공한다.
또한, 본 발명은 상기 재조합 벡터를 숙주세포에 형질전환하는 단계; 및 상기 형질전환된 숙주세포를 배양하여 목적 단백질을 발현시키는 단계;를 포함하는, 시험관 내 또는 생체 외의 숙주세포 내에서 수용성 및 발현량이 증가된 목적 단백질의 생산 방법을 제공한다.
또한, 본 발명은 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 재조합 벡터를 유효성분으로 포함하는, 수용성 및 발현량이 증가된 목적 단백질의 생산용 조성물을 제공한다.
또한, 본 발명은 (1) 서열번호 9의 아미노산으로 이루어진 융합 태그의 아미노산 서열 중 N-말단에 존재하는 4개의 아미노산을 제외한 나머지 아미노산에 대해 서열 셔플링(sequence shuffling)을 수행하여 서열 라이브러리를 확보하는 단계; 및 (2) 상기 (1) 단계에서 확보된 서열 라이브러리에서 각 서열의 항균 활성(antimicrobial activity)을 예측하는 단계;를 포함하는, 숙주 세포에 대한 세포독성이 낮고 목적 단백질의 수용성 및 발현량을 증가시키기 위한 융합 태그의 스크리닝 방법을 제공한다.
본 발명에 따른 NEXT 태그 변이체는 숙주세포에 대한 세포 독성이 낮아 융합 태그의 C-말단에 융합되는 목적 단백질의 수용성 및 발현량을 증가시킬 수 있으므로, 본 발명의 NEXT 태그 변이체는 의약용, 산업용 및 연구용 등의 재조합 단백질 발현을 위한 벡터 시스템의 기본 구성요소로 활용될 수 있을 것이다.
도 1은 기존 NEXTWT 태그에 N-pair reversal 규칙(A)을 적용하여 항균 활성이 없을 것으로 예측되는 NEXT 태그 변이체 서열을 스크리닝하는 과정(B)을 나타낸 그림이다.
도 2는 기존 NEXTWT 태그(대조군)와 본 발명의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4)의 발현 수준을 확인한 쿠마씨 블루 염색 겔 사진(A)과 In-gel staining(B) 결과이다.
도 3은 기존 NEXTWT 태그(대조군) 또는 본 발명의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4)와 목적 단백질(hEGF, taCA, isPETase)이 결합된 융합 단백질의 발현 수준을 확인한 쿠마씨 블루 염색 겔 사진(왼쪽)과 In-gel staining(오른쪽) 결과이다. hEGF: 인간 상피성장인자(human epidermal growth factor), taCA: 써모비브리오 암모니피칸스 유래의 탄산무수화효소(Thermovibrio ammonificans carbonic anhydrase), isPETase: 이데오넬라 사카이엔시스 유래의 PET 분해 효소(Ideonella sakaiensis PETase), S: 수용성(soluble) 분획, IS: 불용성(insoluble) 분획.
도 4는 기존 NEXTWT 태그(대조군) 또는 본 발명의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4)와 목적 단백질인 GFP(green fluorescent protein)가 결합된 융합 단백질의 발현 수준을 확인한 쿠마씨 블루 염색 겔 사진이다. S: 수용성(soluble) 분획, IS: 불용성(insoluble) 분획.
도 5는 기존 NEXTWT 태그(대조군) 또는 본 발명의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4)와 목적 단백질(hEGF, taCA, isPETase)이 결합된 융합 단백질의 발현 균주의 세포 성장을 확인한 결과이다.
도 2는 기존 NEXTWT 태그(대조군)와 본 발명의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4)의 발현 수준을 확인한 쿠마씨 블루 염색 겔 사진(A)과 In-gel staining(B) 결과이다.
도 3은 기존 NEXTWT 태그(대조군) 또는 본 발명의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4)와 목적 단백질(hEGF, taCA, isPETase)이 결합된 융합 단백질의 발현 수준을 확인한 쿠마씨 블루 염색 겔 사진(왼쪽)과 In-gel staining(오른쪽) 결과이다. hEGF: 인간 상피성장인자(human epidermal growth factor), taCA: 써모비브리오 암모니피칸스 유래의 탄산무수화효소(Thermovibrio ammonificans carbonic anhydrase), isPETase: 이데오넬라 사카이엔시스 유래의 PET 분해 효소(Ideonella sakaiensis PETase), S: 수용성(soluble) 분획, IS: 불용성(insoluble) 분획.
도 4는 기존 NEXTWT 태그(대조군) 또는 본 발명의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4)와 목적 단백질인 GFP(green fluorescent protein)가 결합된 융합 단백질의 발현 수준을 확인한 쿠마씨 블루 염색 겔 사진이다. S: 수용성(soluble) 분획, IS: 불용성(insoluble) 분획.
도 5는 기존 NEXTWT 태그(대조군) 또는 본 발명의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4)와 목적 단백질(hEGF, taCA, isPETase)이 결합된 융합 단백질의 발현 균주의 세포 성장을 확인한 결과이다.
본 발명의 목적을 달성하기 위하여, 본 발명은 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그를 제공한다.
본 발명의 융합 태그에 있어서, 상기 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 펩티드를 포함하는 융합 태그는 하이드로게노비브리오 마리누스(Hydrogenovibrio marinus) 유래 α-탄산무수화효소(carbonic anhydrase)의 N-말단에 존재하는 보존된 서열(conserved sequence)일 수 있으나, 이에 제한되지 않는다.
본 발명의 상기 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그는 한국등록특허 제2106773호에 기재된 NEXT 태그의 아미노산 구성을 유지하면서 아미노산 서열 셔플링(shuffling)을 통해 재정렬된 NEXT 태그이다.
구체적으로, 기존 NEXT 태그(서열번호 9)가 잠재적으로 항균 활성을 가지고 있어 숙주세포에 대한 세포 독성이 있음을 확인한 후, 기존 NEXT 태그의 아미노산 서열 셔플링을 수행하여 총 624개의 서열을 제작하였고, in silico screening을 통해 숙주세포에 대한 항균 활성을 지니지 않는 것으로 예측되는 4개의 융합 태그(NEXTvar1, 서열번호 1; NEXTvar2, 서열번호 2; NEXTvar3, 서열번호 3; 및 NEXTvar4, 서열번호 4)를 선별하였다. 상기 선별된 4개의 융합 태그를 각각 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 연결된 재조합 벡터는 기존 NEXT 태그에 비해 목적 단백질의 수용성과 발현량을 증가시키는 효과가 더 우수하였다. 따라서, 본 발명의 융합 태그는 기존 NEXT 태그에 비해 목적 단백질의 수용성과 발현량을 증가시킬 수 있는 개량된 NEXT 태그이다.
본 발명에서 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그는 NEXT 태그 변이체와 동일한 의미로 사용되었다.
본 명세서에서, 용어 "목적 단백질(target protein)"은 당업자가 대량으로 생산하고자 하는 단백질로서, 재조합 발현 벡터에 상기 목적 단백질을 코딩하는 폴리뉴클레오티드를 삽입하여 형질전환체에서 발현이 가능한 모든 단백질을 의미한다.
본 발명은 또한, 상기 융합 태그를 코딩하는 폴리뉴클레오티드를 제공한다.
본 발명의 폴리뉴클레오티드는 상기 융합 태그를 코딩하는 DNA 또는 RNA일 수 있다. DNA는 cDNA, 게놈 DNA 또는 인위적인 합성 DNA를 포함하며, DNA는 단일 가닥 또는 이중 가닥일 수 있다.
바람직하게는, 본 발명의 폴리뉴클레오티드는 서열번호 5, 서열번호 6, 서열번호 7 또는 서열번호 8로 표시되는 염기서열을 포함할 수 있다. 본 발명의 서열번호 5, 서열번호 6, 서열번호 7 또는 서열번호 8의 염기서열은 각각 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그를 코딩하는 폴리뉴클레오티드이다.
본 발명은 또한, 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그(fusion tag)를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 것을 특징으로 하는 재조합 벡터를 제공한다.
본 발명의 재조합 벡터에 있어서, 상기 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그 및 이를 코딩하는 폴리뉴클레오티드는 전술한 것과 같다.
본 발명에 따른 상기 재조합 벡터는 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 펩티드를 포함하는 융합 태그를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 작동가능하게 연결된 것일 수 있다. 본 발명에서, "작동가능하게 연결된"은 이종(exogenous) 단백질을 발현하기 위한 단위로서 기능하는 발현 카세트의 성분을 말한다. 예를들면, 단백질을 코딩하는 이종 DNA에 작동가능하게 연결된 프로모터는 이종 DNA에 해당하는 기능적 mRNA의 생산을 촉진한다. 상기 프로모터와 목적 단백질을 코딩하는 유전자의 연결 방법은 PCR, 제한효소 절단 및 라이게이션법 등 당업자에 의해 용이하게 실시될 수 있는 통상의 기술을 사용할 수 있다.
본 발명의 재조합 벡터에 있어서, 상기 목적 단백질은 의료, 연구용 및 산업용 단백질, 예들 들어, 효소, 항원, 항체, 세포수용체, 구조 단백질, 혈청 및 세포 단백질로 이루어진 군으로부터 선택되는 생물학적 활성을 갖는 다양한 종류의 단백질일 수 있고, 바람직하게는 효소 단백질일 수 있으나, 이에 제한되지 않는다.
본 명세서에서, 용어 "재조합"은 세포가 이종의 핵산을 복제하거나, 상기 핵산을 발현하거나 또는 펩티드, 이종의 펩티드 또는 이종의 핵산에 의해 암호된 단백질을 발현하는 세포를 지칭하는 것이다. 재조합 세포는 상기 세포의 천연 형태에서는 발견되지 않는 유전자 또는 유전자 절편을, 센스 또는 안티센스 형태 중 하나로 발현할 수 있다. 또한 재조합 세포는 천연 상태의 세포에서 발견되는 유전자를 발현할 수 있으며, 그러나 상기 유전자는 변형된 것으로서 인위적인 수단에 의해 세포 내 재도입된 것이다.
본 발명에서, 상기 융합 태그를 코딩하는 폴리뉴클레오티드 및 목적 단백질을 코딩하는 유전자 서열은 재조합 발현 벡터 내로 삽입될 수 있다. 용어 "재조합 발현 벡터"는 세균 플라스미드, 파아지, 효모 플라스미드, 식물 세포 바이러스, 포유동물 세포 바이러스, 또는 다른 벡터를 의미한다. 대체로, 임의의 플라스미드 및 벡터는 숙주 내에서 복제 및 안정화할 수 있다면 사용될 수 있다. 상기 발현 벡터의 중요한 특성은 복제 원점, 프로모터, 마커 유전자 및 번역 조절 요소(translation control element)를 가지는 것이다.
본 발명의 융합 태그를 코딩하는 폴리뉴클레오티드 및 목적 단백질을 코딩하는 유전자 서열 및 적당한 전사/번역 조절 신호를 포함하는 발현 벡터는 당업자에 주지된 방법에 의해 구축될 수 있다. 상기 방법은 시험관 내 재조합 DNA 기술, DNA 합성 기술 및 생체 내 재조합 기술 등을 포함한다. 상기 DNA 서열은 mRNA 합성을 이끌기 위해 발현 벡터 내의 적당한 프로모터에 효과적으로 연결될 수 있다. 또한 발현 벡터는 번역 개시 부위로서 리보좀 결합 부위 및 전사 터미네이터를 포함할 수 있다.
본 발명은 또한, 상기 재조합 벡터로 형질전환된 숙주세포를 제공한다.
본 발명의 벡터를 원핵세포에 안정되면서 연속적으로 클로닝 및 발현시킬 수 있는 숙주세포는 당업계에 공지된 어떠한 숙주세포도 이용할 수 있으며, 예컨대, E. coli BL21, E. coli JM109, E. coli RR1, E. coli LE392, E. coli B, E. coli X 1776, E. coli W3110, 바실러스 서브틸리스, 바실러스 츄린겐시스와 같은 바실러스 속 균주, 그리고 살모넬라 티피무리움, 세라티아 마르세슨스 및 다양한 슈도모나스 종과 같은 장내균과 균주 등이 있다.
또한, 본 발명의 벡터를 진핵 세포에 형질전환시키는 경우에는 숙주세포로서, 효모(예컨대, Saccharomyce cerevisiae; Pichia pastoris; Kluyveromyces lactis; Kluyveromyces marxianus; Yarrowia lipolytica; Hansenula polymorpha 등), 곤충세포(예컨대, Spodoptera frugiperda Sf9, Sf21, High FiveTM), 동물세포 (예컨대, CHO 세포주(Chinese hamster ovary), W138, BHK, COS-7, 293, HepG2, 3T3, RIN 및 MDCK 세포주) 및 식물세포 등이 이용될 수 있다.
본 발명의 일 구현 예에 따른 재조합 벡터로 형질전환된 숙주세포는 E. coli BL21(DE3)일 수 있으나, 이에 제한되지 않는다.
본 발명의 벡터를 숙주세포 내로 운반하는 방법은, 숙주세포가 원핵 세포인 경우, CaCl2 방법, 하나한 방법(Hanahan, D., 1983 J. Mol. Biol. 166, 557-580) 및 전기천공 방법 등에 의해 실시될 수 있다. 또한, 숙주세포가 진핵세포인 경우에는, 미세주입법, 칼슘포스페이트 침전법, 전기천공법, 리포좀-매개 형질감염법, DEAE-덱스트란 처리법, 및 유전자 밤바드먼트 등에 의해 벡터를 숙주세포 내로 주입할 수 있다.
본 발명은 또한, 상기 재조합 벡터로 숙주세포를 형질전환하여 목적 단백질 코딩 유전자를 발현하는 단계를 포함하는, 시험관 내 또는 생체 외에서 목적 단백질의 수용성 및 발현량을 증가시키는 방법을 제공한다.
본 발명의 일 구현 예에 따른 방법에서, 상기 숙주세포는 E. coli BL21(DE3)일 수 있으나, 이에 제한되지 않는다.
본 발명은 또한,
상기 재조합 벡터를 숙주세포에 형질전환하는 단계; 및
상기 형질전환된 숙주세포를 배양하여 목적 단백질을 발현시키는 단계;를 포함하는, 시험관 내 또는 생체 외의 숙주세포 내에서 수용성 및 발현량이 증가된 목적 단백질의 생산 방법을 제공한다.
본 발명의 목적 단백질의 생산 방법에 있어서, 상기 형질전환된 숙주세포의 배양은 공지된 기술을 이용하여 목적 단백질의 생산에 적합한 배지에서 이루어질 수 있다. 적합한 배양 배지는 상업적으로 입수하시거나 예를 들면, American Type Culture Collection의 카탈로그와 같은 간행물에 기재된 성분 및 조성비에 따라 제조할 수 있으나, 이에 제한되지 않는다.
본 발명의 목적 단백질의 생산 방법은, 목적 단백질이 발현된 숙주세포로부터 목적 단백질을 분리 및 정제하는 단계를 추가로 포함할 수 있다. 상기 분리 방법은 예를 들어 원심분리, 여과, 추출, 분무 건조, 증발 또는 침전을 포함하는 통상적인 방법에 의해서 배지로부터 분리될 수 있지만, 이에 제한되는 것은 아니다. 더 아나가 분리된 단백질은 크로마토그래피(예를 들면 이온 교환, 친화성, 소수성 및 크기별 배제), 투석, 전기영동, 분별 용해(예를 들면 암모늄 설페이트 침전), SDS-PAGE 또는 추출을 포함하는 공지된 다양한 방법을 통해서 정제될 수 있다.
본 발명은 또한, 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그(fusion tag)를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 재조합 벡터를 유효성분으로 포함하는, 수용성 및 발현량이 증가된 목적 단백질의 생산용 조성물을 제공한다.
본 발명의 조성물은, 융합되는 목적 단백질의 수용성과 발현량을 증가시킬 수 있는 융합 태그를 코딩하는 폴리뉴클레오티드를 유효성분으로 포함하고 있어, 수용성 및 발현량이 증가된 목적 단백질의 생산이 가능하다.
본 발명은 또한,
(1) 서열번호 9의 아미노산으로 이루어진 융합 태그의 아미노산 서열 중 N-말단에 존재하는 4개의 아미노산을 제외한 나머지 아미노산에 대해 서열 셔플링(sequence shuffling)을 수행하여 서열 라이브러리를 확보하는 단계; 및
(2) 상기 (1) 단계에서 확보된 서열 라이브러리에서 각 서열의 항균 활성(antimicrobial activity)을 예측하는 단계;를 포함하는, 숙주 세포에 대한 세포독성이 낮고 목적 단백질의 수용성 및 발현량을 증가시키기 위한 융합 태그의 스크리닝 방법을 제공한다.
본 발명의 방법에 있어서, 상기 (2) 단계의 항균 활성 예측은 AntiBP Server(http://crdd.osdd.net/raghava/antibp/)를 이용하여 수행될 수 있으나, 이에 특별히 제한되는 것은 아니다.
본 발명의 일 구현 예에 따른 방법에 있어서, 상기 (2) 단계의 항균 활성 예측은 AntiBP Server를 통해 항균 활성을 나타내는 펩타이드 부위로 예측될 수 있는데, 이렇게 예측되는 개수가 가장 적은 것을 기준으로 항균 활성 정도를 판단할 수 있다. 개수가 동일할 경우에는 항균 활성을 나타내는 펩타이드 부위를 서열 상에 오버랩하여 표시하였을 때 가장 짧은 부위(즉, 가장 적은 아미노산 개수)를 커버하면 항균 활성이 더 낮다고 판단할 수 있다. 그리고, 항균 활성을 나타낼 것으로 예측되는 펩타이드 부위가 하나도 없을 경우 항균 활성이 없다고 판단할 수 있다.
또한, 상기 (2) 단계의 예측 결과 항균 활성을 나타내지 않는 융합 태그 서열이 확인되지 않으면, 서열 셔플링을 재수행하여 서열 라이브러리를 재확보한 후 항균 활성 예측을 반복적으로 수행할 수 있다. 구체적으로, 상기 (2) 단계의 항균 활성 예측을 통해 항균 활성을 나타내지 않는 태그 변이체 서열이 확인되지 않으면, 서열 라이브러리 중에서 가장 낮은 항균 활성을 보일 것으로 예측되는 후보 융합 태그 서열을 선발한 후 상기 선발된 후보 융합 태그 서열 내에서 항균 활성을 나타낼 것이라고 예측되는 펩타이드 부위를 타겟으로 서열 셔플링을 재수행하여 서열 라이브러리를 재확보한 후 항균 활성 예측을 반복적으로 수행할 수 있다. 이 과정은 항균 활성을 나타내지 않는 융합 태그 서열을 한 개 이상 확보할 때까지 반복 수행할 수 있다. 그리고 상기 (2) 단계의 예측한 각 서열의 항균 활성을 확인하는 단계를 추가로 포함할 수 있다.
이하, 본 발명의 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.
재료 및 방법
1. NEXT 태그의 항균 활성(antimicrobial activity) 측정
항균 활성은 AntiBP server를 이용하여 측정하였다(http://crdd.osdd.net/raghava/antibp/). 설정은 디폴트(default) 값을 이용하였으며(Terminus: N-terminus; Method: Support Vector Machine (SVM)), 주어진 서열 상에서 예측되는 항균 활성 관련 펩타이드의 개수를 카운트하였다. 항균 활성이 가장 낮을 것으로 예상되는 서열은 항균 활성 관련 펩타이드의 수가 가장 적고, 항균 활성 관련 펩타이드로 예측되는 부위의 잔기의 총 개수가 가장 짧은 서열을 의미한다.
2. NEXT 태그 변이체 후보 서열 선정
Wild-type NEXT 태그(NEXTWT; 서열번호 9)의 아미노산 서열 중 N-말단의 4개 아미노산(MAVQ)을 제외한 나머지 49개 아미노산에 대해 N-pair reversal 규칙(도 1A)을 적용하여 서열 셔플링(sequence shuffling)을 수행하였다. N-pair reversal 셔플링은 직접 C언어 코드로 짜서 수행하였다.
그 결과, 총 624개의 서열로 구성된 1st 라이브러리를 확보하였고, 상기 624개의 서열 중에서 항균 활성(antimicrobial activity)이 가장 낮을 것으로 예상되는 서열 1개를 확보하였다. 상기 확보된 서열 상에서 항균 활성을 나타내는 것으로 예상되는 부위만을 타겟으로 하여 다시 N-pair reversal 규칙을 적용하여 서열 셔플링하였으며, 상기 확보된 1개 서열을 포함한 총 120개의 서열로 구성된 2nd 라이브러리를 새로 확보하였다. 이후 상기 120개의 서열 중에서 항균 활성이 없을 것으로 예측되는 서열 4개를 확보하였으며, 이들은 각각 NEXTvar1(서열번호 1), NEXTvar2(서열번호 2), NEXTvar3(서열번호 3) 및 NEXTvar4(서열번호 4)로 명명하였다(도 1B).
3. 대장균 균주의 배양 조건
유전자 재조합 벡터 제작을 위해 Escherichia coli TOP10 균주, 단백질 발현을 위해 E. coli BL21(DE3) 균주를 사용하였다. 대장균은 LB(Luria-Bertani) 배지에서 37℃, 180 rpm 조건하에 배양되었으며 필요에 따라 50 ㎍/㎖ 암피실린(ampicillin)이 첨가되었다.
4. NEXT 태그 변이체 발현 벡터의 제작
최종 선정된 4개의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3, NEXTVAR4)의 아미노산 서열에 대한 코돈 최적화(codon optimization) 및 유전자 합성을 수행하였으며(표 1 및 표 2), 양 말단에는 NdeI과 XhoI 제한효소 서열을 추가하였다(Genscript, 미국).
명칭 | 서열정보 (서열번호) |
NEXTWT | MAVQHSNAPLIDLGAEMKKQHKEAAPEGAAPAQGKAPAAEAKKEEAPKPKPVV (9) |
NEXTVAR1 | MAVQHNSQHKKEMGADLLIAPEKAAEPAGPAQAKGPAAAAEKKEEPAPKPKVV (1) |
NEXTVAR2 | MAVQHHKKEMGADLLIAPSNQEKAAEPAGPAQAKGPAAAAEKKEEPAPKPKVV (2) |
NEXTVAR3 | MAVQHQHKKEMGADLLIAPSNEKAAEPAGPAQAKGPAAAAEKKEEPAPKPKVV (3) |
NEXTVAR4 | MAVQHKEQHKKEMGADLLIAPSNAAEPAGPAQAKGPAAAAEKKEEPAPKPKVV (4) |
명칭 | 서열정보 (서열번호) |
NEXTWT | CATATGGCTGTTCAACATAGCAATGCCCCATTGATTGACTTGGGCGCGGAAATGAAAAAACAGCACAAGGAGGCAGCTCCCGAAGGCGCTGCGCCGGCTCAAGGTAAGGCACCTGCCGCGGAAGCCAAAAAAGAAGAAGCACCTAAACCAAAACCCGTTGTGCTCGAG (10) |
NEXTVAR1 | CATATGGCTGTACAGCATAATTCACAACACAAAAAGGAGATGGGTGCGGACTTGCTGATCGCCCCGGAAAAAGCAGCCGAGCCGGCGGGTCCGGCGCAGGCAAAAGGCCCAGCGGCGGCTGCGGAAAAGAAAGAGGAACCGGCTCCGAAGCCGAAGGTGGTTCTCGAG (5) |
NEXTVAR2 | CATATGGCTGTACAGCATCACAAGAAAGAAATGGGCGCAGACTTGCTGATCGCCCCAAGCAACCAAGAAAAGGCGGCGGAGCCGGCGGGTCCGGCGCAGGCAAAAGGTCCGGCGGCGGCTGCCGAGAAGAAAGAGGAACCGGCTCCGAAGCCGAAGGTGGTTCTCGAG (6) |
NEXTVAR3 | CATATGGCTGTACAGCATCAACATAAGAAAGAAATGGGCGCAGACTTGCTGATCGCCCCGAGCAACGAAAAAGCAGCCGAGCCGGCGGGTCCGGCGCAGGCGAAAGGTCCGGCTGCTGCGGCGGAGAAGAAAGAGGAACCGGCTCCGAAGCCGAAGGTGGTTCTCGAG (7) |
NEXTVAR4 | CATATGGCTGTACAGCATAAAGAACAACACAAGAAGGAGATGGGTGCGGACTTGCTGATCGCCCCGAGCAACGCAGCCGAGCCGGCGGGTCCGGCGCAGGCAAAAGGCCCAGCGGCTGCGGCGGAAAAAAAAGAGGAACCGGCTCCGAAGCCGAAGGTGGTTCTCGAG (8) |
밑줄: 제한효소 위치
NEXT 태그 변이체의 단독 발현을 위해, 각 변이체의 코딩 유전자를 NdeI과 XhoI 제한효소를 이용하여 절단하여 이를 동일한 제한효소로 처리된 pET-22b(+) 벡터(Novagen, 미국)에 삽입하였다. 또한, NEXT 태그 변이체와 목적 단백질이 결합된 융합 단백질의 발현을 위해, 각 NEXT 태그 변이체 코딩 유전자를 표 3의 프라이머를 이용하여 증폭하였다. 증폭된 유전자는 pGEM-T Easy 벡터에 클로닝되었고, 시퀀싱을 통해 서열 오류가 없음을 확인하였다. 이후 NdeI과 NcoI 제한효소를 이용하여 NEXT 태그 변이체 코딩 유전자를 잘라냈으며, 이를 동일한 제한효소로 처리된 기존 융합 단백질 발현 벡터들(pET-NEXTWT-hEGF, pET-NEXTWT-taCA, pET-NEXTWT-PETase, pET-NEXTWT-GFP)에 삽입하여 wild-type NEXT 태그 서열을 NEXT 태그 변이체의 서열로 치환하였다. 연구에 사용된 모든 단백질은 C-말단에 His6-tag를 지니고 있다.
명칭 | Sequence (5'→3') (서열정보) |
NEXTVAR-Forward | CATATGGCTGTACAGCAT (11) |
NEXTVAR-Reverse | CCATGGAGCCTCCACCGCCGCTGCCACCTCCGCCAACCACCTTCGGCTTCGG (12) |
밑줄: 제한효소 위치
5. 재조합 단백질의 발현
구축한 재조합 벡터를 E. coli BL21(DE3) 균주에 도입하였고, 이들을 37℃, 180 rpm에서 배양하였다. 세포 농도가 OD600=0.6~0.7에 도달했을 때 1 mM IPTG(isopropyl-b-D-thiogalactopyranoside)를 첨가하여 단백질 발현을 유도시켰다. 이후 37℃, 180 rpm에서 12시간 추가 배양하였다. 배양 완료 후 세포 성장 정도는 OD600 측정을 통해 분석하였으며, 이후 4℃, 4,000 ×g에서 10분간 원심분리하여 세포를 회수하였다.
6. 세포 분획 및 단백질 발현 분석
회수된 세포는 용해버퍼(lysis buffer; 50 mM sodium phosphate, 300 mM NaCl, 10 mM imidazole, pH 8.0)에 재현탁하였다. 세포 현탁액은 차가운 상태에서 초음파처리(ultrasonication)를 통해 파쇄하였고, 파쇄액을 4℃, 4000 ×g에서 10분간 원심분리한 후 상등액은 수용성 분획물(soluble fraction, S)로 명명하였고, 펠렛(pellet)은 동일한 부피의 용해버퍼로 재현탁하여 불용성 분획물(insoluble fraction, IS)로 명명하였다. 이후 각각의 세포 분획물은 SDS-PAGE(sodium dodecyl sulfate-polyacrylamide gel electrophoresis), 쿠마씨 블루(Coomassie blue) 염색 및 In gel staining을 통해 분석하였다.
7. SDS-PAGE 분석
샘플과 4× 샘플 버퍼(Bio-Rad, 미국)를 3:1의 부피비로 혼합하여 100℃에서 10분간 가열하였다. 15% Tris-glycine 겔에서 전기영동을 실시한 후 0.1% Coomassie brilliant blue R-250(Bio-Rad)으로 겔을 염색하였다.
8. In-gel staining 분석
His6-tag 단백질의 정확한 정량 분석을 위해 in-gel staining을 수행하였다. InVision™ His-Tag In-Gel Stain (ThermoFisher Scientific, 미국)을 사용하여 염색 후 이미지 분석 시스템(GelDoc Go Imaging system; Bio-Rad)을 이용하여 형광 강도(fluorescence intensity)를 분석하였다.
실시예 1. NEXT 태그 변이체 후보 선정
기존 Wild-type NEXT 태그(NEXTWT)는 무정형 단백질(intrinsically disordered protein, IDP)로서, 무정형 단백질은 높은 유연성(flexibility)에 의해 융합된 목적 단백질에 다른 단백질이 접근하여 응집되는 것을 막아주어 단백질 수용성(solubility)를 증가시킬 수 있는 것으로 알려져 있다. 단백질의 무정형 성질을 결정하는 요인 중 주요한 것은 아미노산 조성이며, 주로 트립토판(Trp), 티로신(Tyr), 페닐알라닌(Phe), 이소류신(Ile), 류신(Leu), 발린(Val), 시스테인(Cys), 아스파라긴(Asn) 등은 질서를 촉진하는 아미노산(order-promoting amino acid)으로 분류되며 알라닌(Ala), 아르기닌(Arg), 글리신(Gly), 글루타민(Gln), 세린(Ser), 글루탐산(Glu), 라이신(Lys), 프롤린(Pro) 등은 무질서를 촉진하는 아미노산(disorder-promoting amino acid)으로 분류된다. NEXT 태그는 이러한 disorder-promoting 아미노산의 비율이 77.4%이다.
NEXT 태그에 결합된 융합 단백질의 발현량 및 용해도 증진 효과는 이미 검증되었으나, 단백질 발현 세포의 성장이 느리거나 최종 세포 농도가 낮아지는 등의 문제점이 발견되었다. 이는 NEXT 태그 자체가 항균 활성으로 인해 세포에 독성을 나타내기 때문인 것으로 예상되었다. 실제로 AntiBP tool (http://crdd.osdd.net/raghava/antibp/)을 이용한 결과, NEXT 태그 서열은 항균 활성을 지니는 것으로 예측되었다.
수용성 태그로서의 기능을 위해서는 아미노산 조성이 중요하며, 항균 활성을 나타내기 위해서는 아미노산 조성뿐만 아니라 구조도 중요하다. 단백질 구조는 아미노산 순서를 조절함으로써 변경될 수 있다. 본 발명에서는 NEXT 태그 서열의 아미노산 조성과 무정형 단백질(IDP)로서의 기능은 그대로 유지하는 동시에 아미노산 순서를 재배열하여 항균 활성을 지니지 않는 새로운 NEXT 태그 변이체를 개발하였다.
53개의 아미노산으로 이루어진 NEXT 태그의 서열에서 개시 아미노산인 첫 메티오닌(Met)을 제외한 나머지 52개의 아미노산을 이용하여 랜덤 셔플링(random shuffling)을 수행할 경우 이론상 1,025×1044개의 서로 다른 서열의 라이브러리를 얻을 수 있는데, 이 서열들로부터 항균 활성을 지니지 않을 것으로 예측되는 서열을 탐색하는 것은 사실상 많은 시간이 소요된다.
본 발명에서는 이러한 문제점을 극복하여 기능성이 향상된 NEXT 태그 변이체를 개발하기 위해 라이브러리의 크기를 한정하기로 하였으며, 이를 위해 특정한 규칙(N-pair reversal)을 적용하여 서열을 재배열하였다
구체적으로, NEXT 태그의 N-말단 서열인 MAVQ는 N-pair reversal을 통해 셔플링하지 않고 그대로 두었는데, 이것은 N-말단 서열이 단백질의 발현량을 결정하는 주요한 서열이기 때문에 최소한의 발현량을 보장하기 위한 것이다. 결과적으로, 총 624개의 서열로 구성된 서열 라이브러리(2+3+4+5+…+23+24+25+24+23+22+…+2+1=624) 1을 확보하였고, 이들 중 항균 활성이 가장 낮을 것으로 예상되는 서열 1개를 확보하였다. 또한 상기 확보된 서열 상에서 항균 활성을 나타내는 것으로 예상되는 부위만을 타겟으로 다시 N-pair reversal 규칙을 적용하여 서열을 재배열하여, 본래 서열을 포함한 총 120개의 서열로 구성된 서열 라이브러리 2를 새로 확보하였다. 다시 이들 중 항균 활성이 없을 것으로 예측되는 서열 4개를 확보하였으며, 상기 4개 서열을 각각 NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4로 명명하였다.
기존에 널리 사용되어온 MBP(maltose-binding protein) 태그 등은 큰 사이즈(> 40 kDa)를 지닌 구형 단백질(globular protein)로, 큰 사이즈(bulky size)의 특성에 기반하여 융합된 목적 단백질이 응집되는 것을 막아주어 폴딩에 도움을 주는 것으로 알려져 있다. 이러한 큰 사이즈의 구형 단백질의 경우 본 발명에서처럼 서열 셔플링을 통해 그 성질을 개선하는 것은 불가능하다. 따라서, 본 발명의 NEXT 태그 변이체 개발에 사용된 서열 셔플링(sequence shuffling) 방법은 무정형 단백질에만 사용될 수 있다.
실시예 2. NEXT 태그 변이체 펩타이드의 발현 수준 확인
NEXTWT(대조군)와 본 발명의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4)의 발현 수준을 확인하기 위해 SDS-PAGE 수행 후 쿠마씨 블루 염색 및 In-gel staining하였다.
그 결과, 본 발명의 NEXT 태그 변이체가 기존 NEXTWT 태그에 보다 발현 수준이 현저히 증가된 것을 확인하였다(도 2).
실시예 3. NEXT 태그 변이체와 목적 단백질이 결합된 융합 단백질의 발현 수준 확인
개량된 NEXT 태그 변이체를 목적 단백질에 결합시킬 경우에도 발현 수준이 향상되는지 확인하기 위해 다양한 목적 단백질과 NEXT 태그 변이체를 결합시켜 발현하였다.
구체적으로 NEXTWT(대조군)와 본 발명의 NEXT 태그 변이체(NEXTVAR1, NEXTVAR2, NEXTVAR3 및 NEXTVAR4)와 피부 재생/치료 및 노화 방지 등에 사용될 수 있는 인간 상피성장인자(human epidermal growth factor, hEGF; 도 3A), 이산화탄소 저감에 활용할 수 있는 써모비브리오 암모니피칸스 유래의 고온 안정성 탄산무수화효소(Thermovibrio ammonificans carbonic anhydrase, taCA; 도 3B), 또는 플라스틱 분해에 활용할 수 있는 이데오넬라 사카이엔시스 유래의 PET 분해 효소(Ideonella sakaiensis PETase, isPETase; 도 3C)가 결합된 융합 단백질을 발현시켰다.
그 결과, 기존 NEXTWT 태그와 결합된 융합 단백질 보다 본 발명의 NEXT 태그 변이체와 결합된 융합 단백질의 수용성 발현 수준이 증가한 것을 확인하였다(도 3 및 표 4). 표 4는 도3의 SDS-PAGE 및 In-gel staining 상에 나타난 밴드 강도(band intensity)를 기반으로 NEXTWT 태그와 결합된 융합 단백질 대비 NEXT 태그 변이체와 결합된 융합 단백질의 상대적 발현 수준을 비교하여 나타낸 결과이다.
NEXT VAR 1 | NEXT VAR 2 | NEXT VAR 3 | NEXT VAR 4 | |
hEGF | 145% (20%) | 155% (60%) | 136% (38%) | 148% (54%) |
taCA | 153% (41%) | 170% (54%) | 168% (42%) | 170% (15%) |
isPETase | 135% (12%) | 177% (14%) | 158% (21%) | 149% (11%) |
괄호 안 숫자: 표준편차
실시예 4. NEXT 태그 변이체와 목적 단백질이 결합된 융합 단백질의 용해도 향상 확인
기존 NEXTWT 태그만으로도 hEGF, taCA 및 isPETase 단백질이 대부분 수용성으로 발현 가능하므로, 본 발명의 NEXT 태그 변이체의 용해도 향상 능력을 확인하기 위해 수용성 발현이 매우 어려운 GFP(green fluorescent protein)를 목적 단백질로 하여 용해도 향상 정도를 분석하였다.
그 결과, 기존 NEXTWT 태그와 결합된 융합 단백질(NEXTWT-GFP) 보다 본 발명의 NEXT 태그 변이체와 결합된 융합 단백질(NEXTVAR1-GFP, NEXTVAR2-GFP, NEXTVAR3-GFP, NEXTVAR4-GFP)의 수용성 발현 수준이 증가한 것을 확인하였다(도 4). 특히, NEXTVAR2와 NEXTVAR4 태그 변이체를 사용한 경우 융합 단백질의 수용성 발현 수준이 가장 우수하였으며, 이는 NEXT 태그 변이체의 무정형성과 일치하는 것을 확인하였다(표 5). 항균 활성을 감소시키기 위해서는 특정 구조(e.g. Alpha helix)가 형성되지 않아야 하고, 항균 활성의 감소는 무정형도의 증가로 이어질 수 있으므로, 무정형성이 NEXT 태그의 단백질 용해도 향상 기능에 있어서 핵심적인 성질임을 알 수 있었다.
NEXTWT | NEXTVAR1 | NEXTVAR2 | NEXTVAR3 | NEXTVAR4 | |
Overall percent disordered | 49.06% | 86.79% | 96.23% | 94.34% | 98.11% |
Average prediction score | 0.5644 | 0.7045 | 0.7632 | 0.7432 | 0.7693 |
실시예 5. 융합 단백질 발현 균주의 세포 성장 저해 완화
기존 NEXTWT 태그가 항균 활성을 보일 것이라는 가설을 토대로 개량된 NEXT 태그 변이체를 개발하였으며, NEXT 태그 변이체가 실제로 세포 성장의 저해를 완화시킬 수 있는지 확인하였다.
NEXT 태그 변이체와 목적 단백질(hEGF, taCA, isPETase)이 결합된 융합 단백질의 발현 균주의 세포 성장을 측정한 결과, 기존 NEXT 태그와 결합된 융합 단백질이 발현된 균주에 비해 본 발명의 NEXT 태그 변이체와 결합된 융합 단백질이 발현된 균주의 세포 성장이 더 증가한 것을 확인하였다(도 5). 이를 통해, 본 발명의 NEXT 태그 변이체는 기존 NEXTWT 태그에 비해 항균 활성이 감소됨에 따라 세포 성장 억제가 완화될 수 있음을 알 수 있었다.
종합하면, 본 발명의 NEXT 태그 변이체는 기존 NEXTWT 태그와 비교하여 아미노산 서열 상동성은 매우 낮지만 동일한 아미노산 조성을 가지고 있기 때문에 단백질 수용성 및 발현량 향상에 매우 효과적이고, 특히 기존 NEXTWT 태그에 비해 태그 자체의 항균 활성이 감소되어 숙주 세포에 대한 세포 독성이 낮으며, 본 발명의 NEXT 태그 변이체를 목적 단백질에 융합함으로써 수용성 단백질의 발현량을 증가시킬 수 있음을 알 수 있었다.
<110> INDUSTRY-ACADEMIC COOPERATION FOUNDATION GYEONGSANG NATIONAL UNIVERSITY
<120> Improved NEXT fusion tag for increasing water solubility and
expression level of target protein and uses thereof
<130> PN21266
<160> 12
<170> KoPatentIn 3.0
<210> 1
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> NEXT VAR 1
<400> 1
Met Ala Val Gln His Asn Ser Gln His Lys Lys Glu Met Gly Ala Asp
1 5 10 15
Leu Leu Ile Ala Pro Glu Lys Ala Ala Glu Pro Ala Gly Pro Ala Gln
20 25 30
Ala Lys Gly Pro Ala Ala Ala Ala Glu Lys Lys Glu Glu Pro Ala Pro
35 40 45
Lys Pro Lys Val Val
50
<210> 2
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> NEXT VAR 2
<400> 2
Met Ala Val Gln His His Lys Lys Glu Met Gly Ala Asp Leu Leu Ile
1 5 10 15
Ala Pro Ser Asn Gln Glu Lys Ala Ala Glu Pro Ala Gly Pro Ala Gln
20 25 30
Ala Lys Gly Pro Ala Ala Ala Ala Glu Lys Lys Glu Glu Pro Ala Pro
35 40 45
Lys Pro Lys Val Val
50
<210> 3
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> NEXT VAR 3
<400> 3
Met Ala Val Gln His Gln His Lys Lys Glu Met Gly Ala Asp Leu Leu
1 5 10 15
Ile Ala Pro Ser Asn Glu Lys Ala Ala Glu Pro Ala Gly Pro Ala Gln
20 25 30
Ala Lys Gly Pro Ala Ala Ala Ala Glu Lys Lys Glu Glu Pro Ala Pro
35 40 45
Lys Pro Lys Val Val
50
<210> 4
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> NEXT VAR 4
<400> 4
Met Ala Val Gln His Lys Glu Gln His Lys Lys Glu Met Gly Ala Asp
1 5 10 15
Leu Leu Ile Ala Pro Ser Asn Ala Ala Glu Pro Ala Gly Pro Ala Gln
20 25 30
Ala Lys Gly Pro Ala Ala Ala Ala Glu Lys Lys Glu Glu Pro Ala Pro
35 40 45
Lys Pro Lys Val Val
50
<210> 5
<211> 168
<212> DNA
<213> Artificial Sequence
<220>
<223> NEXT VAR 1
<400> 5
catatggctg tacagcataa ttcacaacac aaaaaggaga tgggtgcgga cttgctgatc 60
gccccggaaa aagcagccga gccggcgggt ccggcgcagg caaaaggccc agcggcggct 120
gcggaaaaga aagaggaacc ggctccgaag ccgaaggtgg ttctcgag 168
<210> 6
<211> 168
<212> DNA
<213> Artificial Sequence
<220>
<223> NEXT VAR 2
<400> 6
catatggctg tacagcatca caagaaagaa atgggcgcag acttgctgat cgccccaagc 60
aaccaagaaa aggcggcgga gccggcgggt ccggcgcagg caaaaggtcc ggcggcggct 120
gccgagaaga aagaggaacc ggctccgaag ccgaaggtgg ttctcgag 168
<210> 7
<211> 168
<212> DNA
<213> Artificial Sequence
<220>
<223> NEXT VAR 3
<400> 7
catatggctg tacagcatca acataagaaa gaaatgggcg cagacttgct gatcgccccg 60
agcaacgaaa aagcagccga gccggcgggt ccggcgcagg cgaaaggtcc ggctgctgcg 120
gcggagaaga aagaggaacc ggctccgaag ccgaaggtgg ttctcgag 168
<210> 8
<211> 168
<212> DNA
<213> Artificial Sequence
<220>
<223> NEXT VAR 4
<400> 8
catatggctg tacagcataa agaacaacac aagaaggaga tgggtgcgga cttgctgatc 60
gccccgagca acgcagccga gccggcgggt ccggcgcagg caaaaggccc agcggctgcg 120
gcggaaaaaa aagaggaacc ggctccgaag ccgaaggtgg ttctcgag 168
<210> 9
<211> 53
<212> PRT
<213> Hydrogenovibrio marinus
<400> 9
Met Ala Val Gln His Ser Asn Ala Pro Leu Ile Asp Leu Gly Ala Glu
1 5 10 15
Met Lys Lys Gln His Lys Glu Ala Ala Pro Glu Gly Ala Ala Pro Ala
20 25 30
Gln Gly Lys Ala Pro Ala Ala Glu Ala Lys Lys Glu Glu Ala Pro Lys
35 40 45
Pro Lys Pro Val Val
50
<210> 10
<211> 168
<212> DNA
<213> Hydrogenovibrio marinus
<400> 10
catatggctg ttcaacatag caatgcccca ttgattgact tgggcgcgga aatgaaaaaa 60
cagcacaagg aggcagctcc cgaaggcgct gcgccggctc aaggtaaggc acctgccgcg 120
gaagccaaaa aagaagaagc acctaaacca aaacccgttg tgctcgag 168
<210> 11
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 11
catatggctg tacagcat 18
<210> 12
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> primer
<400> 12
ccatggagcc tccaccgccg ctgccacctc cgccaaccac cttcggcttc gg 52
Claims (13)
- 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그.
- 제1항의 융합 태그를 코딩하는 폴리뉴클레오티드.
- 제2항에 있어서, 상기 폴리뉴클레오티드는 서열번호 5, 서열번호 6, 서열번호 7 또는 서열번호 8의 염기서열로 이루어진 것을 특징으로 하는 폴리뉴클레오티드.
- 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그(fusion tag)를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 것을 특징으로 하는 재조합 벡터.
- 제4항에 있어서, 상기 목적 단백질은 효소, 항원, 항체, 세포수용체, 구조 단백질, 혈청 및 세포 단백질로 이루어진 군으로부터 선택되는 생물학적 활성을 갖는 것을 특징으로 하는 재조합 벡터.
- 제4항 또는 제5항의 재조합 벡터로 형질전환된 숙주세포.
- 제4항 또는 제5항의 재조합 벡터로 숙주세포를 형질전환하여 목적 단백질 코딩 유전자를 발현하는 단계를 포함하는, 시험관 내 또는 생체 외에서 목적 단백질의 수용성 및 발현량을 증가시키는 방법.
- 제4항 또는 제5항의 재조합 벡터를 숙주세포에 형질전환하는 단계; 및
상기 형질전환된 숙주세포를 배양하여 목적 단백질을 발현시키는 단계;를 포함하는, 시험관 내 또는 생체 외의 숙주세포 내에서 수용성 및 발현량이 증가된 목적 단백질의 생산 방법. - 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그(fusion tag)를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 재조합 벡터를 유효성분으로 포함하는, 수용성 및 발현량이 증가된 목적 단백질의 생산용 조성물.
- (1) 서열번호 9의 아미노산으로 이루어진 융합 태그의 아미노산 서열 중 N-말단에 존재하는 4개의 아미노산을 제외한 나머지 아미노산에 대해 서열 셔플링(sequence shuffling)을 수행하여 서열 라이브러리를 확보하는 단계; 및
(2) 상기 (1) 단계에서 확보된 서열 라이브러리에서 각 서열의 항균 활성(antimicrobial activity)을 예측하는 단계;를 포함하는, 숙주 세포에 대한 세포독성이 낮고 목적 단백질의 수용성 및 발현량을 증가시키기 위한 융합 태그의 스크리닝 방법. - 제10항에 있어서, 상기 (2) 단계의 항균 활성 예측은 AntiBP Server를 이용하는 것을 특징으로 하는 방법.
- 제11항에 있어서, 상기 (2) 단계의 예측 결과 항균 활성을 나타내지 않는 융합 태그 서열이 확인되지 않으면, 서열 셔플링을 재수행하여 서열 라이브러리를 재확보한 후 항균 활성 예측을 반복적으로 수행하는 것을 특징으로 하는 방법.
- 제10항에 있어서, 상기 (2) 단계의 예측한 각 서열의 항균 활성을 확인하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220001889A KR20230106236A (ko) | 2022-01-06 | 2022-01-06 | 목적 단백질의 수용성 및 발현량 증가를 위한 개량된 next 융합 태그 및 이의 용도 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220001889A KR20230106236A (ko) | 2022-01-06 | 2022-01-06 | 목적 단백질의 수용성 및 발현량 증가를 위한 개량된 next 융합 태그 및 이의 용도 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230106236A true KR20230106236A (ko) | 2023-07-13 |
Family
ID=87160083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220001889A KR20230106236A (ko) | 2022-01-06 | 2022-01-06 | 목적 단백질의 수용성 및 발현량 증가를 위한 개량된 next 융합 태그 및 이의 용도 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20230106236A (ko) |
-
2022
- 2022-01-06 KR KR1020220001889A patent/KR20230106236A/ko not_active Application Discontinuation
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230167421A1 (en) | Variants of a DNA Polymerase of the Polx Family | |
KR102106773B1 (ko) | 목적 단백질의 수용성 및 발현량 증가를 위한 융합 태그 및 이의 용도 | |
Haught et al. | Recombinant production and purification of novel antisense antimicrobial peptide in Escherichia coli | |
US20220290202A1 (en) | Aminoacyl-trna synthetase efficiently introducing lysine derivatives | |
AU2020242724B2 (en) | Aminoacyl-tRNA synthetase for efficiently introducing lysine derivative in protein | |
US20220411764A1 (en) | Thioredoxin mutant, preparation method thereof, and application thereof in production of recombinant fusion protein | |
JP2024038140A (ja) | ブタトリプシンの変異体 | |
KR102345011B1 (ko) | GroES 융합을 이용한 글루카곤 유사 펩타이드-1 또는 이의 유사체의 생산방법 | |
Zhong et al. | Tandem repeat mhBD2 gene enhance the soluble fusion expression of hBD2 in Escherichia coli | |
JP7266325B2 (ja) | 蛍光タンパク質フラグメントを含む融合タンパク質およびその用途 | |
KR20230106236A (ko) | 목적 단백질의 수용성 및 발현량 증가를 위한 개량된 next 융합 태그 및 이의 용도 | |
US20210230659A1 (en) | Leader Sequence for Higher Expression of Recombinant Proteins | |
KR102388401B1 (ko) | 발현량이 증가된 써모설퍼리모나스 디스뮤탄스 유래 탄산무수화효소 단백질 변이체 및 이의 용도 | |
KR102064810B1 (ko) | 재조합 폴리펩타이드 생산용 n-말단 융합 파트너 및 이를 이용하여 재조합 폴리펩타이드를 생산하는 방법 | |
KR20210010365A (ko) | 단백질 또는 폴리펩타이드 생산용 융합태그 | |
KR102345013B1 (ko) | GroES 융합을 이용한 글루카곤 유사 펩타이드-2 또는 이의 유사체의 생산방법 | |
KR20200080749A (ko) | N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 n-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법 | |
KR102345012B1 (ko) | GroES 융합을 이용한 인간부갑상선호르몬 1-34의 생산방법 | |
KR101622373B1 (ko) | 지지체로서 불용성 녹색형광단백질을 이용한 항균 펩타이드의 제조방법 | |
KR102017540B1 (ko) | 융합 폴리펩타이드를 이용하여 글루카곤 유사 펩타이드-1 또는 이의 유사체를 생산하는 방법 | |
WO2020158947A1 (ja) | ポリペプチド | |
KR101776013B1 (ko) | 항산화 활성 및 피부 세포 증식 효과가 증가한 열 충격 단백질 10과 브라제인 단백질의 융합단백질 및 이를 유효성분으로 함유하는 피부 주름 개선용 화장료 조성물 | |
RU2263147C1 (ru) | РЕКОМБИНАНТНАЯ ПЛАЗМИДНАЯ ДНК pHINS05, КОДИРУЮЩАЯ ГИБРИДНЫЙ ПОЛИПЕПТИД, СОДЕРЖАЩИЙ ПРОИНСУЛИН ЧЕЛОВЕКА, КЛЕТКА ESCHERICHIA COLI, ТРАНСФОРМИРОВАННАЯ РЕКОМБИНАНТНОЙ ПЛАЗМИДНОЙ ДНК pHINS05, И ШТАММ БАКТЕРИЙ ESCHERICHIA COLI JM109/pHINS05 - ПРОДУЦЕНТ ГИБРИДНОГО ПОЛИПЕПТИДА, СОДЕРЖАЩЕГО ПРОИНСУЛИН ЧЕЛОВЕКА | |
US20200002743A1 (en) | Control self-cleaving protein activity and application thereof | |
KR20190098690A (ko) | 융합 폴리펩타이드를 이용하여 글루카곤 유사 펩타이드-2 또는 이의 유사체를 생산하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |