KR20200080749A - N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 n-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법 - Google Patents
N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 n-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법 Download PDFInfo
- Publication number
- KR20200080749A KR20200080749A KR1020180170531A KR20180170531A KR20200080749A KR 20200080749 A KR20200080749 A KR 20200080749A KR 1020180170531 A KR1020180170531 A KR 1020180170531A KR 20180170531 A KR20180170531 A KR 20180170531A KR 20200080749 A KR20200080749 A KR 20200080749A
- Authority
- KR
- South Korea
- Prior art keywords
- gene expression
- expression cassette
- target protein
- protein
- tag
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 156
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 140
- 230000014509 gene expression Effects 0.000 title claims abstract description 98
- 229930182817 methionine Natural products 0.000 title claims abstract description 56
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 title abstract description 47
- 238000004519 manufacturing process Methods 0.000 title abstract description 15
- 150000001413 amino acids Chemical class 0.000 claims abstract description 43
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 33
- 102000005927 Cysteine Proteases Human genes 0.000 claims abstract description 24
- 108010005843 Cysteine Proteases Proteins 0.000 claims abstract description 24
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 22
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 22
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims abstract description 19
- 235000001014 amino acid Nutrition 0.000 claims abstract description 19
- 235000018102 proteins Nutrition 0.000 claims description 69
- 239000013598 vector Substances 0.000 claims description 53
- 108090000397 Caspase 3 Proteins 0.000 claims description 30
- 102100029855 Caspase-3 Human genes 0.000 claims description 30
- 102000002265 Human Growth Hormone Human genes 0.000 claims description 30
- 108010000521 Human Growth Hormone Proteins 0.000 claims description 30
- 239000000854 Human Growth Hormone Substances 0.000 claims description 29
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 26
- 235000018417 cysteine Nutrition 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 13
- 244000005700 microbiome Species 0.000 claims description 13
- AOUOVFRSCMDPFA-QSDJMHMYSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]-3-methylbutanoyl]amino]butanedioic acid Chemical group OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O AOUOVFRSCMDPFA-QSDJMHMYSA-N 0.000 claims description 11
- 241000588724 Escherichia coli Species 0.000 claims description 10
- 241000282414 Homo sapiens Species 0.000 claims description 10
- 239000003623 enhancer Substances 0.000 claims description 7
- 230000001105 regulatory effect Effects 0.000 claims description 6
- 102000001554 Hemoglobins Human genes 0.000 claims description 4
- 108010054147 Hemoglobins Proteins 0.000 claims description 4
- 108010002350 Interleukin-2 Proteins 0.000 claims description 4
- 102000000588 Interleukin-2 Human genes 0.000 claims description 4
- 101100189356 Mus musculus Papolb gene Proteins 0.000 claims description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- HULKIXRFKRCRHD-UHFFFAOYSA-N 4-[(2-acetamido-4-methylpentanoyl)amino]-5-[[1-[[3-carboxy-1-oxo-1-[[2-oxo-4-(trifluoromethyl)chromen-7-yl]amino]propan-2-yl]amino]-3-(1h-imidazol-5-yl)-1-oxopropan-2-yl]amino]-5-oxopentanoic acid Chemical compound C=1C=C2C(C(F)(F)F)=CC(=O)OC2=CC=1NC(=O)C(CC(O)=O)NC(=O)C(NC(=O)C(CCC(O)=O)NC(=O)C(NC(C)=O)CC(C)C)CC1=CN=CN1 HULKIXRFKRCRHD-UHFFFAOYSA-N 0.000 claims description 3
- 102000004018 Caspase 6 Human genes 0.000 claims description 3
- 108090000425 Caspase 6 Proteins 0.000 claims description 3
- 108090000566 Caspase-9 Proteins 0.000 claims description 3
- 108091081024 Start codon Proteins 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 244000063299 Bacillus subtilis Species 0.000 claims description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 claims description 2
- 102000003996 Interferon-beta Human genes 0.000 claims description 2
- 108090000467 Interferon-beta Proteins 0.000 claims description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 claims description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims description 2
- 229960001388 interferon-beta Drugs 0.000 claims description 2
- 102100026550 Caspase-9 Human genes 0.000 claims 1
- 241000186226 Corynebacterium glutamicum Species 0.000 claims 1
- 108020004414 DNA Proteins 0.000 description 29
- 108091028043 Nucleic acid sequence Proteins 0.000 description 22
- 102000018997 Growth Hormone Human genes 0.000 description 18
- 108010051696 Growth Hormone Proteins 0.000 description 18
- 239000000122 growth hormone Substances 0.000 description 18
- 210000004027 cell Anatomy 0.000 description 16
- 239000013612 plasmid Substances 0.000 description 14
- 238000003776 cleavage reaction Methods 0.000 description 12
- 230000007017 scission Effects 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 12
- 238000010367 cloning Methods 0.000 description 10
- 230000002068 genetic effect Effects 0.000 description 10
- 230000002018 overexpression Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 6
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 108091008146 restriction endonucleases Proteins 0.000 description 6
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 6
- 230000014616 translation Effects 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 235000014304 histidine Nutrition 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 239000013600 plasmid vector Substances 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 238000001262 western blot Methods 0.000 description 4
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004451 qualitative analysis Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 2
- 102000004039 Caspase-9 Human genes 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 239000002033 PVDF binder Substances 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000003013 cytotoxicity Effects 0.000 description 2
- 231100000135 cytotoxicity Toxicity 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 150000002411 histidines Chemical class 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 235000018977 lysine Nutrition 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 1
- HWPXGQCMZITGFN-XVYDVKMFSA-N Ala-Cys-His Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HWPXGQCMZITGFN-XVYDVKMFSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- ICAYWNTWHRRAQP-FXQIFTODSA-N Asp-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N ICAYWNTWHRRAQP-FXQIFTODSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 1
- ICZWAZVKLACMKR-CIUDSAMLSA-N Asp-His-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 ICZWAZVKLACMKR-CIUDSAMLSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 1
- 102000040350 B family Human genes 0.000 description 1
- 108091072128 B family Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 102000011727 Caspases Human genes 0.000 description 1
- 108010076667 Caspases Proteins 0.000 description 1
- 102000003902 Cathepsin C Human genes 0.000 description 1
- 108090000267 Cathepsin C Proteins 0.000 description 1
- 238000011537 Coomassie blue staining Methods 0.000 description 1
- 101000972324 Cynodon dactylon Leaf protein Proteins 0.000 description 1
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 1
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108010092408 Eosinophil Peroxidase Proteins 0.000 description 1
- 102100028471 Eosinophil peroxidase Human genes 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 1
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 1
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- IMRNSEPSPFQNHF-STQMWFEESA-N Gly-Ser-Trp Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O IMRNSEPSPFQNHF-STQMWFEESA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 1
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 1
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- FGNQZXKVAZIMCI-CIUDSAMLSA-N Leu-Asp-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N FGNQZXKVAZIMCI-CIUDSAMLSA-N 0.000 description 1
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 1
- PPTAQBNUFKTJKA-BJDJZHNGSA-N Leu-Cys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PPTAQBNUFKTJKA-BJDJZHNGSA-N 0.000 description 1
- YORLGJINWYYIMX-KKUMJFAQSA-N Leu-Cys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YORLGJINWYYIMX-KKUMJFAQSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- YVMQJGWLHRWMDF-MNXVOIDGSA-N Lys-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N YVMQJGWLHRWMDF-MNXVOIDGSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 1
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- PYUSHNKNPOHWEZ-YFKPBYRVSA-N N-formyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC=O PYUSHNKNPOHWEZ-YFKPBYRVSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- WMQNLUZXCRZETF-WCCKRBBISA-N N[C@@H](CCSC)C(=O)O.[P] Chemical compound N[C@@H](CCSC)C(=O)O.[P] WMQNLUZXCRZETF-WCCKRBBISA-N 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 1
- MIICYIIBVYQNKE-QEWYBTABSA-N Phe-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N MIICYIIBVYQNKE-QEWYBTABSA-N 0.000 description 1
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 1
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 1
- DXWNFNOPBYAFRM-IHRRRGAJSA-N Phe-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N DXWNFNOPBYAFRM-IHRRRGAJSA-N 0.000 description 1
- GQLOZEMWEBDEAY-NAKRPEOUSA-N Pro-Cys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GQLOZEMWEBDEAY-NAKRPEOUSA-N 0.000 description 1
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 108010001938 Rana catesbeiana pyrimidine-guanine sequence-specific ribonuclease Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 101710141795 Ribonuclease inhibitor Proteins 0.000 description 1
- 229940122208 Ribonuclease inhibitor Drugs 0.000 description 1
- 102100037968 Ribonuclease inhibitor Human genes 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- PNKDNKGMEHJTJQ-BPUTZDHNSA-N Trp-Arg-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N PNKDNKGMEHJTJQ-BPUTZDHNSA-N 0.000 description 1
- BVDHHLMIZFCAAU-BZSNNMDCSA-N Tyr-Cys-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BVDHHLMIZFCAAU-BZSNNMDCSA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 1
- GZOCMHSZGGJBCX-ULQDDVLXSA-N Tyr-Lys-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O GZOCMHSZGGJBCX-ULQDDVLXSA-N 0.000 description 1
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 1
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- LMSBRIVOCYOKMU-NRPADANISA-N Val-Gln-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N LMSBRIVOCYOKMU-NRPADANISA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- 241000607269 Vibrio proteolyticus Species 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000008004 cell lysis buffer Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- -1 for example Proteins 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000012405 in silico analysis Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000003331 infrared imaging Methods 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 108700001686 methionyl-(-1)- angiogenin Proteins 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000004725 rapid separation liquid chromatography Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/64—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
- C12N9/6402—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from non-mammals
- C12N9/6405—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from non-mammals not being snakes
- C12N9/641—Cysteine endopeptidases (3.4.22)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/64—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
- C12N9/6421—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
- C12N9/6472—Cysteine endopeptidases (3.4.22)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/54—Interleukins [IL]
- C07K14/55—IL-2
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/555—Interferons [IFN]
- C07K14/565—IFN-beta
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/61—Growth hormone [GH], i.e. somatotropin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/795—Porphyrin- or corrin-ring-containing peptides
- C07K14/805—Haemoglobins; Myoglobins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/22—Cysteine endopeptidases (3.4.22)
- C12Y304/22056—Caspase-3 (3.4.22.56)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/22—Cysteine endopeptidases (3.4.22)
- C12Y304/22059—Caspase-6 (3.4.22.59)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/22—Cysteine endopeptidases (3.4.22)
- C12Y304/22062—Caspase-9 (3.4.22.62)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/22—Cysteine endopeptidases (3.4.22)
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Endocrinology (AREA)
- Toxicology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 목적 단백질을 코딩하는 핵산 및 시스테인 프로테이즈를 코딩하는 핵산을 포함하는 유전자 발현 카세트에 있어서, 상기 목적 단백질 N-말단의 첫번째 아미노산인 메티오닌(Met)과 두번째 아미노산 사이에 시스테인 프로테이즈 인식서열이 삽입되어 시스테인 프로테이즈에 의해 N-말단의 메티오닌이 절단되는 것을 특징으로 하는 N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 N-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법에 관한 것이다.
Description
본 발명은 N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 N-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법에 관한 것으로, 더 상세하게는 목적 단백질을 코딩하는 핵산; 및 시스테인 프로테이즈 (cysteine protease)를 코딩하는 핵산을 포함하는 유전자 발현 카세트에 있어서, 상기 목적 단백질 N-말단의 첫번째 아미노산인 메티오닌(Met)과 두번째 아미노산 사이에 시스테인 프로테이즈 인식서열이 삽입되어 시스테인 프로테이즈에 의해 N-말단의 메티오닌이 절단되는 것을 특징으로 하는 N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 N-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법에 관한 것이다.
생물학적 활성을 갖는 폴리펩티드 및 단백질의 생산은 인간 및 동물용 약학 제제, 효소 및 기타 특정 화학물질의 제조를 위해 활용될 수 있다. 발현 숙주로서 박테리아 세포, 진균류 세포, 포유류 세포를 사용하는 재조합 DNA 기법은 다량의 폴리펩티드 생산을 위해 특히 유용한 수단으로 이용되고 있다.
일반적으로, 목적 단백질의 재조합 생산은 단백질을 코딩하는 유전자에 작동가능하게 연결된 경우 유전자의 발현을 조절하는 신호를 포함하는 발현벡터를 숙주 세포로 트랜스펙션 (transfection) 시키는 과정을 포함한다. 트랜스펙션 된 세포는 재조합 단백질의 발현에 적합한 조건하에서 성장하고, 발현된 목적 단백질을 회수하는 공정을 통해 목적 단백질을 생산하게 된다.
이와 같이 생산된 단백질은 전통적 방식인 화학적 합성 의약품에 비해 부작용이 적고, 인체 내에서 질병에 대항하는 효과가 뛰어나 임상 시험 성공률이 높은 장점을 가지고 있다. 그러나 산업적으로는 DNA 조작 기술, 대량 발효기술, 고도의 단백질 정제기술 등 첨단기술을 요구한다. 1982년에서 1991년 사이에 5대 단백질 의약품(인슐린, 인간성장호르몬, 인터페론, EPO, G-CSF)가 출시된 이래, 재조합 단백질 치료제에 대한 지속적인 연구가 진행되고 있다.
한편, 인간 헤모글로빈, 인터루킨-2, 성장 호르몬 등과 같은 재조합 단백질에서 번역 개시자인 N-포밀-메티오닌 또는 메티오닌(Met)을 제거하는 것은 재조합 단백질의 기능과 안정성에 중요한 역할을 한다. 따라서, 천연 단백질의 N-말단에서 Met을 제거한 단백질을 제조하기 위한 여러 시도가 있어 왔다. 첫째, 시아노겐 브로마이드는 극한 산성 조건에서 Met을 절단하는데 사용되지만, 이는 내부에 Met 잔기가 없는 단백질에만 적용될 수 있다(Boix et al., 1996). 둘째, 프로테이즈 특이적 올리고펩티드를 표적 단백질 앞에 도입한 후, 각각의 프로테이즈, 예를 들어 인자 Xa, 엔테로카이네이즈 및 카텝신 C에 의해 제거하는 방법이 있다(Belagaje et al. 1997). 셋째, 단백질의 N-말단 Met은 에어로모나스 프로테오리티카(Aeromonas proteolytica)의 아미노펩티데이즈에 의해 in vitro에서 제거될 수 있다(Shapiro et al., 1988; Notomista et al., 1999). 넷째, 목적 단백질 앞에 신호 펩티드를 도입하여 분비하는 동안 생체 내에서 처리하는 방법이 있으나, 이는 수율이 매우 낮다는 문제점이 있다(배양액 1리터 당 1~5mg, Huang et al. 1998).
이러한 기술적 배경하에서, 본 발명자들은 N-말단 메티오닌이 절단된 목적 단백질을 고수율로 생산하기 위한 신규한 방법을 개발하기 위해 예의 노력한 결과, 시스테인 프로테이즈 인식서열을 목적 단백질 N-말단의 첫번째 아미노산인 메티오닌(Met)과 두번째 아미노산 사이에 삽입하고, 시스테인 프로테이즈와 함께 발현시키는 경우, 높은 효율로 N-말단의 메티오닌이 절단된 목적 단백질이 생산되는 것을 확인함으로써 본 발명을 완성하였다.
Boix, E. et al., 1996. Role of the N terminus in RNase A homologues: Differences in catalytic activity, ribonuclease inhibitor interaction and cytotoxicity. J. Mol. Biol. 257 992~1007.
Belagaje, R.M. et al., 1997. Increased production of low molecular weight recombinant proteins in Escherichia coli. Protein Sci. 6 1953~1962.
Shapiro, R. et al., 1988. Expression of Met-(-1) angiogenin in Escherichia coli: Conversion to the authentic less than Glu-1 protein. Anal. Biochem. 175 450-461.
Notomista, E. et al., 1999. Effective expression and purification of recombinant on-conase, an antitumor protein. FEBS Lett. 463 211-215.
Huang, H.C. Wet al., 1998. The Rana catesbeiana rcr gene encoding a cytotoxic ribonuclease. Tissue distribution, cloning, purification, cytotoxicity, and active residues for RNase activity. J. Biol. Chem. 273 6395-6401.
본 발명의 목적은 N-말단의 메티오닌이 절단된 목적 단백질을 생산할 수 있는 유전자 발현 카세트 및 이를 이용하여 목적 단백질을 고수율로 생산하는 방법을 제공하는 데 있다.
상기 목적을 달성하기 위하여, 본 발명은 목적 단백질을 코딩하는 핵산; 및 시스테인 프로테이즈를 코딩하는 핵산을 포함하는 유전자 발현 카세트로, 상기 목적 단백질 N-말단의 첫번째 아미노산인 메티오닌(Met)과 두번째 아미노산 사이에 시스테인 프로테이즈 인식서열이 삽입되어 있는 것을 특징으로 하는 유전자 발현 카세트를 제공한다.
본 발명은 또한, 상기 유전자 발현 카세트가 도입된 재조합 벡터를 제공한다.
본 발명은 또한, 상기 유전자 발현 카세트가 도입된 재조합 미생물을 제공한다.
본 발명은 또한, 다음 단계를 포함하는 목적 단백질의 생산방법을 제공한다:
(a) 상기 재조합 미생물을 배양하여 N-말단의 첫번째 아미노산인 메티오닌이 절단된 목적 단백질을 생성하는 단계; 및
(b) 상기 생성된 목적 단백질을 회수하는 단계.
본 발명에 따른 유전자 발현 카세트를 이용하면, 목적 단백질과 함께 도입된 시스테인 프로테이즈에 의해 목적 단백질 N-말단의 메티오닌이 절단되어, 별도의 메티오닌 제거 과정을 거치지 않고 메티오닌이 제거되기 때문에, 목적 단백질 생산 공정을 단순화하면서도 높은 수율로 활성을 갖는 목적 단백질을 생산할 수 있는 장점이 있다.
도 1은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pETDuet-H6-DEVD-hGH-T7-rev-CASP3 벡터 제작에 대한 모식도이다.
도 2는 본 발명의 일 실시예에서 사용한 pAPT-Y 벡터 제작에 대한 모식도이다.
도 3은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pAPT-Y-tag-DEVD-hGH-Lacuv5-rev-CASP3 벡터 제작에 대한 모식도이다.
도 4는 본 발명의 다양한 실시예에 따른 유전자 발현 카세트의 구성도이다.
도 5는 본 발명의 다양한 실시예에 따른 발현 벡터의 개열지도이다.
도 6은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pETDuet-H6-DEVD-hGH-T7-rev-CASP 벡터에 의한 성숙 성장 호르몬 단백질 발현을 SDS-PAGE를 이용하여 정성적으로 분석한 결과이다.
도 7은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pAPT-Y-tag-DEVD-hGH-Lacuv5-rev-CASP3 벡터에 의한 성숙 성장 호르몬 단백질 발현을 SDS-PAGE를 이용하여 정성적으로 분석한 결과이다.
도 8은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pETDuet-H6-DEVD-hGH-T7-rev-CASP3 벡터에 의한 성숙 성장 호르몬 단백질의 발현을 웨스턴 블롯을 이용하여 정성적으로 분석한 결과이다.
도 9는 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pAPT-Y-tag-DEVD-hGH-Lacuv5-rev-CASP3 벡터에 의한 성숙 성장 호르몬 단백질의 발현을 웨스턴 블롯을 이용하여 정성적으로 분석한 결과이다.
도 10은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pETDuet-H6-DEVD-hGH-T7-rev-CASP3 벡터에 의해 발현된 성숙 성장 호르몬 단백질의 N-말단 시퀀싱을 이용하여 펩티드를 분석한 결과이다.
도 11은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 H6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 12는 본 발명의 일 실시예에 따른 유전자 발현 카세트인 역방향 캐스페이즈-3를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 13은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 H6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 14는 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 DH6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 15는 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 AH6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 16은 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 NH6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 17은 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 KH6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 18은 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 HAK-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 19는 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 Lacuv5 프로모터 하위의 역방향 캐스페이즈-3를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 2는 본 발명의 일 실시예에서 사용한 pAPT-Y 벡터 제작에 대한 모식도이다.
도 3은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pAPT-Y-tag-DEVD-hGH-Lacuv5-rev-CASP3 벡터 제작에 대한 모식도이다.
도 4는 본 발명의 다양한 실시예에 따른 유전자 발현 카세트의 구성도이다.
도 5는 본 발명의 다양한 실시예에 따른 발현 벡터의 개열지도이다.
도 6은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pETDuet-H6-DEVD-hGH-T7-rev-CASP 벡터에 의한 성숙 성장 호르몬 단백질 발현을 SDS-PAGE를 이용하여 정성적으로 분석한 결과이다.
도 7은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pAPT-Y-tag-DEVD-hGH-Lacuv5-rev-CASP3 벡터에 의한 성숙 성장 호르몬 단백질 발현을 SDS-PAGE를 이용하여 정성적으로 분석한 결과이다.
도 8은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pETDuet-H6-DEVD-hGH-T7-rev-CASP3 벡터에 의한 성숙 성장 호르몬 단백질의 발현을 웨스턴 블롯을 이용하여 정성적으로 분석한 결과이다.
도 9는 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pAPT-Y-tag-DEVD-hGH-Lacuv5-rev-CASP3 벡터에 의한 성숙 성장 호르몬 단백질의 발현을 웨스턴 블롯을 이용하여 정성적으로 분석한 결과이다.
도 10은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 pETDuet-H6-DEVD-hGH-T7-rev-CASP3 벡터에 의해 발현된 성숙 성장 호르몬 단백질의 N-말단 시퀀싱을 이용하여 펩티드를 분석한 결과이다.
도 11은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 H6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 12는 본 발명의 일 실시예에 따른 유전자 발현 카세트인 역방향 캐스페이즈-3를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 13은 본 발명의 일 실시예에 따른 유전자 발현 카세트인 H6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 14는 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 DH6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 15는 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 AH6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 16은 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 NH6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 17은 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 KH6-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 18은 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 HAK-DEVD-hGH를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
도 19는 본 발명의 일 실시예에 따른 유전자 발현 카세트 중 하나인 Lacuv5 프로모터 하위의 역방향 캐스페이즈-3를 클로닝한 DNA에 대해 시퀀싱을 이용하여 DNA 서열 및 단백질 서열 일치를 확인한 결과이다.
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로 본 명세서에서 사용된 명명법은 본 기술 분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
본 발명에서는 N-말단 메티오닌이 절단된 목적 단백질을 재조합 미생물에서 생산하기 위하여, 시스테인 프로테이즈 인식서열을 목적 단백질 N-말단 메티오닌 하위에 도입하고 시스테인 프로테이즈를 추가로 선별하여, 이를 미생물 내에서 함께 발현시킬 수 있는 유전자 발현 카세트를 개발하고, N-말단 메티오닌 절단에 의해 단백질 활성을 보이는 대표적인 목적 단백질로 인간 성장 호르몬을 이용하여 상기 유전자 발현 카세트의 효과를 검증한 결과, 별도의 메티오닌 절단 공정 없이 효과적으로 N-말단 메티오닌이 절단된 성숙 인간 성장 호르몬이 높은 수율로 발현되는 것을 확인할 수 있었다.
따라서, 본 발명은 일 관점에서 목적 단백질을 코딩하는 핵산; 및 시스테인 프로테이즈를 코딩하는 핵산을 포함하는 유전자 발현 카세트로, 상기 목적 단백질 N-말단의 첫번째 아미노산인 메티오닌(Met)과 두번째 아미노산 사이에 시스테인 프로테이즈 인식서열이 삽입되어 있는 것을 특징으로 하는 유전자 발현 카세트에 관한 것이다.
본 발명에서 상기 목적 단백질을 코딩하는 핵산 및 시스테인 프로테이즈를 코딩하는 핵산은 별도의 프로모터에 의해 발현이 조절될 수 있으며, 상기 프로모터는 T3 프로모터, T5 프로모터, T7 프로모터, tac 프로모터, trc 프로모터, trp 프로모터, 아라비노스 프로모터, Lacuv5 프로모터 및 LacI 프로모터로 구성된 군에서 선택되는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명에서 상기 시스테인 프로테이즈는 역방향 캐스페이즈-3(reverse caspase-3), 역방향 캐스페이즈-6 (reverse caspase-6, NCBI Accession No. P55212.2) 또는 역방향 캐스페이즈-9 (reverse caspase-9, NCBI Accession No. BAA82697.1)일 수 있으며, 바람직하게는 역방향 캐스페이즈-3(reverse caspase-3)일 수 있으나, 이에 한정되지는 않는다.
본 발명에서 상기 시스테인 프로테이즈 인식서열은 DEVD, VEID, VEHD 또는 LEHD 인 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
구체적으로, 본 발명에서 상기 시스테인 프로테이즈가 역방향 캐스페이즈-3(reverse caspase-3)인 경우 상기 시스테인 프로테이즈 인식서열은 DEVD인 것을 특징으로 할 수 있고, 상기 시스테인 프로테이즈가 역방향 캐스페이즈-6 (reverse caspase-6)인 경우 상기 시스테인 프로테이즈 인식서열은 VEID 또는 VEHD인 것을 특징으로 할 수 있으며, 상기 시스테인 프로테이즈가 역방향 캐스페이즈-9 (reverse caspase-9)인 경우 상기 시스테인 프로테이즈 인식서열은 LEHD인 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명에서 목적 단백질의 발현 효율을 향상시키기 위하여, 상기 목적 단백질을 코딩하는 핵산의 번역 개시 코돈 상위에 인핸서가 삽입될 수 있으며, 상기 인핸서는 A/U-rich 서열인 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명에서 상기 목적 단백질은 인간 헤모글로빈, 인터루킨-2, 인터페론-베타 또는 인간 성장 호르몬 단백질일 수 있으나, 이에 한정되지 않으며, N-말단 메티오닌 절단 또는 N-말단의 특정 서열이 절단되어 활용되는 모든 재조합 단백질에 적용될 수 있을 것이다.
본 발명에서, 상기 시스테인 프로테이즈 인식서열의 N-말단에는 태그가 추가로 결합될 수 있으며, 상기 태그는 His tag, DH6 tag, AH6 tag, NH6 tag, KH6 tag, HAK tag, T7 tag, S-tag, Flag-tag, HA-tag, V5 epitope, PelB 및 Xpress epitope로 구성된 군에서 선택되는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다. 본 발명에서 상기 태그는 그 종류에 따라 목적 단백질의 발현량이나 시스테인 프로테이즈에 의한 절단 효율에 영향을 미칠 수 있으며, 인간 성장 호르몬을 목적 단백질로 발현하는 경우, DH6 또는 KH6를 결합하였을 때 가장 높은 수율로 N-메티오닌 절단된 인간 성장 호르몬이 제조되는 것을 확인할 수 있었다. 이와 같은 특성은 태그 종류에 따라 단백질 번역 안정성에 대한 기여도가 다르고, 캐스페이즈의 접근성 및 목적 단백질-캐스페이즈간의 구조적 안정성에 대한 기여도가 다르기 때문인 것으로 판단되며, in silico 분석 결과에 따르면 mRNA의 5'부분 헤어핀 구조의 차이에 의해 mRNA수명에 차이가 있으며, 그에 따라 발현량의 차이가 발생하는 것으로 예상된다.
본 발명에서 사용할 수 있는 태그와 시스테인 프로테아제 인식서열을 포함하는 핵산 서열은 하기 표 1과 같으나, 이는 본 발명에 따른 일부 실시예를 나열한 것으로, 상기 핵산 서열에 한하여 본 발명의 범위가 한정되는 것은 아니다. 한편, 하기 서열에서 5'의 3개의 핵산 서열은 목적단백질의 첫번째 아미노산인 메티오닌을 코딩하는 핵산 서열을 의미한다.
서열(5'->3') | |
MRGS-H6-DEVD | ATGAGAGGATCGCATCACCATCACCATCACGACGAGGTGGAT |
M-H6-DEVD | ATGCATCACCATCACCATCACGACGAGGTGGAT |
M-DH6-DEVD | ATGGACCATCACCATCACCATCACGACGAGGTGGAT |
M-AH6-DEVD | ATGGCCCATCACCATCACCATCACGACGAGGTGGAT |
M-NH6-DEVD | ATGAACCATCACCATCACCATCACGACGAGGTGGAT |
M-KH6-DEVD | ATGAAACATCACCATCACCATCACGACGAGGTGGAT |
M-HAK-DEVD | ATGCACGCAAAAGCGCACGCCCACGCACACGCGCATGGCCACGCTCATGACGAGGTGGAT |
본 발명의 일 양태로서 상기 유전자 발현 카세트는 제1 프로모터인 T7 프로모터 하에 인간 성장 호르몬의 N-말단 첫번째 아미노산 서열인 메티오닌과 태그 서열 H6, 시스테인 프로테이즈 인식서열인 DEVD, 인간 성장 호르몬의 두번째 아미노산 페닐알라닌 서열부터 마지막 아미노산 서열까지 작동 가능하도록 연결되어 있는 제1 유전자 구조와 제2 프로모터인 T7 프로모터 하에 시스테인 프로테이즈인 역방향 캐스페이즈-3가 작동 가능하도록 연결되어 있는 제2 유전자 구조를 포함하는 형태로 제작될 수 있다.
본 발명의 또 다른 양태로서 상기 유전자 발현 카세트는 제1 프로모터인 tac 프로모터 하에 인간 성장 호르몬의 N-말단 첫번째 아미노산 서열인 메티오닌이 태그인 H6, 시스테인 프로테이즈 인식서열인 DEVD, 인간 성장 호르몬의 두번째 아미노산 서열부터 마지막 아미노산 서열까지 작동 가능하도록 연결되어 있는 제1 유전자 구조와 제2 프로모터인 Lacuv5 프로모터 하에 시스테인 프로테이즈인 역방향 캐스페이즈-3가 작동 가능하도록 연결되어 있는 제2 유전자 구조를 포함하는 형태로 제작될 수 있다.
본 발명의 또 다른 양태로서 상기 유전자 발현 카세트는 제1 프로모터인 tac 프로모터 하에 인간 성장 호르몬의 N-말단 첫번째 아미노산 서열인 메티오닌이 태그인 DH6, 시스테인 프로테이즈 인식서열인 DEVD, 인간 성장 호르몬의 두번째 아미노산 서열부터 마지막 아미노산 서열까지 작동 가능하도록 연결되어 있는 제1 유전자 구조와 제2 프로모터인 Lacuv5 프로모터 하에 시스테인 프로테이즈인 역방향 캐스페이즈-3가 작동 가능하도록 연결되어 있는 제2 유전자 구조를 포함하는 형태로 제작될 수 있다.
본 발명의 또 다른 양태로서 상기 유전자 발현 카세트는 제1 프로모터인 tac 프로모터 하에 인간 성장 호르몬의 N-말단 첫번째 아미노산 서열인 메티오닌이 태그인 AH6, 시스테인 프로테이즈 인식서열인 DEVD, 인간 성장 호르몬의 두번째 아미노산 서열부터 마지막 아미노산 서열까지 작동 가능하도록 연결되어 있는 제1 유전자 구조와 제2 프로모터인 Lacuv5 프로모터 하에 시스테인 프로테이즈인 역방향 캐스페이즈-3가 작동 가능하도록 연결되어 있는 제2 유전자 구조를 포함하는 형태로 제작될 수 있다.
본 발명의 또 다른 양태로서 상기 유전자 발현 카세트는 제1 프로모터인 tac 프로모터 하에 인간 성장 호르몬의 N-말단 첫번째 아미노산 서열인 메티오닌이 태그인 NH6, 시스테인 프로테이즈 인식서열인 DEVD, 인간 성장 호르몬의 두번째 아미노산 서열부터 마지막 아미노산 서열까지 작동 가능하도록 연결되어 있는 제1 유전자 구조와 제2 프로모터인 Lacuv5 프로모터 하에 시스테인 프로테이즈인 역방향 캐스페이즈-3가 작동 가능하도록 연결되어 있는 제2 유전자 구조를 포함하는 형태로 제작될 수 있다.
본 발명의 또 다른 양태로서 상기 유전자 발현 카세트는 제1 프로모터인 tac 프로모터 하에 인간 성장 호르몬의 N-말단 첫번째 아미노산 서열인 메티오닌이 태그인 KH6, 시스테인 프로테이즈 인식서열인 DEVD, 인간 성장 호르몬의 두번째 아미노산 서열부터 마지막 아미노산 서열까지 작동 가능하도록 연결되어 있는 제1 유전자 구조와 제2 프로모터인 Lacuv5 프로모터 하에 시스테인 프로테이즈인 역방향 캐스페이즈-3가 작동 가능하도록 연결되어 있는 제2 유전자 구조를 포함하는 형태로 제작될 수 있다.
본 발명의 또 다른 양태로서 상기 유전자 발현 카세트는 제1 프로모터인 tac 프로모터 하에 인간 성장 호르몬의 N-말단 첫번째 아미노산 서열인 메티오닌이 태그인 HAK, 시스테인 프로테아제 인식서열인 DEVD, 인간 성장 호르몬의 두번째 아미노산 서열부터 마지막 아미노산 서열까지 작동 가능하도록 연결되어 있는 제1 유전자 구조와 제2 프로모터인 Lacuv5 프로모터 하에 시스테인 프로테이즈인 역방향 캐스페이즈-3가 작동 가능하도록 연결되어 있는 제2 유전자 구조를 포함하는 형태로 제작될 수 있다.
본 발명은 다른 관점에서, 상기 유전자 발현 카세트가 도입된 재조합 벡터에 관한 것이다.
본 발명에서, 상기 유전자 발현 카세트는 pAPT 벡터, pETDuet(pETDuet-1) 벡터, pET24a(+) 벡터, pQE30 벡터, pMAL-c2x 벡터, pTrc99a 벡터, pBAD 벡터, pUC18 벡터 및 pUC1벡터로 구성된 군에서 선택되는 벡터에 도입되는 것을 특징으로 할 수 있으나, 이에 한정되지는 않는다.
본 발명은 또 다른 관점에서, 상기 유전자 발현 카세트가 도입된 재조합 미생물에 관한 것이다.
본 발명에서, 상기 재조합 벡터는 대장균, 코리레박테리움 글루타미쿰(Corynebacterium glutamicum), 바실러스 섭틸러스(Bacillus subtilis) 또는 효모에 도입되는 것을 특징으로 할 수 있으나, 이에 한정되는 것은 아니다. 본 발명에서 사용가능한 대장균으로는 K-12 W3110, B strain C41(DE3), B strain Rosetta2(DE3)를 포함하여 목적 단백질의 과발현 유도가 가능한 K-12 계열과 B 계열의 모든 대장균 중에서 선택 가능하고, 상기 효모로는 피치아 파스토리스(Pichia pastoris) 또는 사카로마이세스 세레비지에(Saccharomyces cerevisiae)를 이용할 수 있으나, 본 발명에 따른 유전자 발현 카세트가 도입 가능한 재조합 미생물의 범위는 재조합 단백질의 생산을 위해 당업계에서 활용가능한 미생물의 범위를 모두 포함하는 것으로, 상기 예시적 기재에 한정되는 것은 아니다.
본 발명은 또 다른 관점에서, 다음 단계를 포함하는 목적 단백질의 생산방법에 관한 것이다:
(a) 상기 재조합 미생물을 배양하여 N-말단의 첫번째 아미노산인 메티오닌이 절단된 목적 단백질을 생성하는 단계; 및
(b) 상기 생성된 목적 단백질을 회수하는 단계.
본 발명에서, 상기 생성된 목적 단백질은 바람직하게는 성숙 인간 성장 호르몬인 것을 특징으로 할 수 있으나, 그 밖에 N-말단 메티오닌이 절단된 인간 헤모글로빈 또는 인터루킨-2를 생산하고자 하는 목적 단백질로 할 수 있으며, 이외에도 N-말단 메티오닌 또는 N-말단 폴리펩티드의 절단이 요구되는 단백질은 무엇이든지 목적 단백질로 활용할 수 있을 것이다.
본 발명에서 사용되는 용어 "유전자 발현 카세트" 또는 단순히 "발현 카세트"라 함은 서열과 상용성인 숙주에서 구조 유전자의 발현에 영향을 줄 수 있는 핵산 요소가 있는, 재조합적으로 또는 합성적으로 만들어진 핵산 구축물이다. 발현 카세트는 적어도 프로모터 및 선택적으로 전사 종결 신호를 포함한다. 전형적으로, 유전자 발현 카세트는 전사될 핵산(예컨대, 목적 단백질(폴리펩티드)을 코딩하는 이종 핵산) 및 프로모터를 포함한다. 발현을 수행하는데 요구되거나 이에 도움을 주는 추가의 인자 또한 같이 사용될 수 있다.
본 발명에서 용어 "프로모터(또는 프로모터 영역)"은 이것이 작동가능하게 연결된 DNA의 전사를 제어하는 유전자의 DNA의 일부분을 의미한다. 프로모터 영역은 RNA 중합효소가 인식, 결합 및 전사를 개시하기 위해 충분한 DNA의 특정 서열을 포함한다. 또한, 이러한 프로모터 영역은 RNA 폴리머레이즈 (RNA polymerase)의 인식, 결합 및 전사 개시 활성을 조절하는 서열을 포함한다. 프로모터는 조절의 성질에 따라서 구성성(constitutive)이거나 시스(cis) 작용 또는 트랜스(trans) 작용 인자에 의해 조절될 수 있다.
본 발명에서 용어 "작동가능하도록 연결된"이란 핵산 발현 조절 서열(예컨대, 프로모터, 신호 서열 또는 일련의 전사 인자 결합 부위)과 이종 핵산 서열 사이의 기능적 연결을 지칭하고, 이때 발현 조절 서열은 이종 핵산 서열에 상응하는 핵산의 전사 및/또는 번역에 영향을 준다.
본 발명에서 용어 "재조합"은 유전자 조작의 결과로서 형성될 수 있는 임의의 물질(예를 들어, 벡터 또는 미생물)을 의미한다.
본 발명에서 용어 "벡터(vector)"는 적합한 숙주 내에서 DNA를 발현시킬 수 있는 적합한 조절 서열에 작동가능하게 연결된 DNA 서열을 함유하는 DNA 제조물을 의미한다. 벡터는 플라스미드, 파지 입자 또는 간단하게 잠재적 게놈 삽입물일 수 있다. 적당한 숙주로 형질전환되면, 벡터는 숙주 게놈과 무관하게 복제하고 기능할 수 있거나, 또는 일부 경우에 게놈 그 자체에 통합될 수 있다. 플라스미드가 현재 벡터의 가장 통상적으로 사용되는 형태이므로, 본 발명의 명세서에서 "플라스미드(plasmid)" 및 "벡터(vector)"는 때로 상호 교환적으로 사용된다. 본 발명의 목적상, 플라스미드 벡터를 이용하는 게 바람직하다. 이러한 목적에 사용될 수 있는 전형적인 플라스미드 벡터는 (a) 숙주세포당 수 개에서 수백 개의 플라스미드 벡터를 포함하도록 복제가 효율적으로 이루어지도록 하는 복제 개시점, (b) 플라스미드 벡터로 형질전환된 숙주세포가 선발될 수 있도록 하는 항생제 내성 유전자 및 (c) 외래 DNA 절편이 삽입될 수 있는 제한효소 절단부위를 포함하는 구조를 지니고 있다. 적절한 제한효소 절단 부위가 존재하지 않을지라도, 통상의 방법에 따른 합성 올리고뉴클레오티드 어댑터(oligonucleotide adaptor) 또는 링커(linker)를 사용하면 벡터와 외래 DNA를 용이하게 라이게이션(ligation)할 수 있다. 라이게이션 후에, 벡터는 적절한 숙주세포로 형질전환되어야 한다. 형질전환은 칼슘 클로라이드 (CaCl2) 방법 또는 전기천공법(electroporation) (Neumann, et al., EMBO J., 1:841, 1982) 등을 사용해서 용이하게 달성될 수 있다.
본 발명에 따른 유전자의 과발현을 위하여 사용되는 벡터는 당업계에 공지된 발현 벡터가 사용될 수 있다. 염기서열은 다른 핵산 서열과 기능적 관계로 배치될 때 "작동가능하게 연결(operably linked)"된다. 이것은 적절한 분자(예를 들면, 전사 활성화 단백질)가 조절 서열(들)에 결합될 때 유전자 발현을 가능하게 하는 방식으로 연결된 유전자 및 조절 서열(들)일 수 있다. 예를 들면, 전서열(pre-sequence) 또는 분비 리더 (leader)에 대한 DNA는 폴리펩티드의 분비에 참여하는 전단백질로서 발현되는 경우 폴리펩티드에 대한 DNA에 작동가능하게 연결되고; 프로모터 또는 인핸서는 서열의 전사에 영향을 끼치는 경우 코딩 서열에 작동가능하게 연결되거나; 또는 리보좀 결합 부위는 서열의 전사에 영향을 끼치는 경우 코딩 서열에 작동가능하게 연결되거나; 또는 리보좀 결합 부위는 번역을 용이하게 하도록 배치되는 경우 코딩 서열에 작동가능하게 연결된다. 일반적으로, "작동가능하게 연결된"은 연결된 DNA 서열이 접촉하고, 또한 분비 리더의 경우 접촉하고 리딩 프레임 내에 존재하는 것을 의미한다. 그러나, 인핸서(enhancer)는 접촉할 필요가 없다. 이들 서열의 연결은 편리한 제한 효소 부위에서 라이게이션(연결)에 의해 수행된다. 그러한 부위가 존재하지 않는 경우, 통상의 방법에 따른 합성 올리고뉴클레오티드 어댑터(oligonucleotide adaptor) 또는 링커(linker)를 사용한다.
당업계에 주지된 바와 같이, 숙주세포에서 형질전환 유전자의 발현 수준을 높이기 위해서는, 해당 유전자가 선택된 발현 숙주 내에서 기능을 발휘하는 전사 및 해독 발현 조절 서열에 작동가능하도록 연결되어야만 한다. 바람직하게는 발현 조절서열 및 해당 유전자는 세균 선택 마커 및 복제 개시점(replication origin)을 같이 포함하고 있는 하나의 재조합벡터 내에 포함되게 된다.
상술한 재조합 벡터에 의해 형질전환된 재조합 미생물은 본 발명의 또 다른 측면을 구성한다. 본 발명에 사용된 용어 "형질전환"은 DNA를 숙주로 도입하여 DNA가 염색체 외 인자로서 또는 염색체 통합완성에 의해 복제 가능하게 되는 것을 의미한다.
물론 모든 벡터가 본 발명의 DNA 서열을 발현하는데 모두 동등하게 기능을 발휘하지는 않는다는 것을 이해하여야만 한다. 마찬가지로 모든 숙주가 동일한 발현 시스템에 대해 동일하게 기능을 발휘하지는 않는다. 그러나, 당업자라면 과도한 실험적 부담없이 본 발명의 범위를 벗어나지 않는 채로 여러 벡터, 발현 조절 서열 및 숙주 중에서 적절한 선택을 할 수 있다. 예를 들어, 벡터를 선택함에 있어서는 숙주를 고려하여야 하는데, 이는 벡터가 그 안에서 복제되어야만 하기 때문이다. 벡터의 복제 수, 복제 수를 조절할 수 있는 능력 및 당해 벡터에 의해 코딩되는 다른 단백질, 예를 들어 항생제 마커의 발현도 또한 고려되어야만 한다.
아울러, 본 발명에서 도입된 유전자 발현 카세트는 숙주세포의 게놈에 도입되어 염색체 상 인자로서 존재하는 것을 특징으로 할 수 있다. 본 발명이 속하는 기술분야의 당업자에게 있어 상기 유전자 발현 카세트를 숙주세포의 게놈 염색체에 삽입하여서도 상기와 같이 재조합 벡터를 숙주세포에 도입한 경우와 동일한 효과를 가질 것은 자명하다 할 것이다.
이하, 하기 실시예에 의하여 본 발명을 보다 상세하게 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐 본 발명의 범위가 이들로 한정되는 것은 아니다.
실시예
1. N-말단 메티오닌이 절단된 목적 단백질의 과발현 시스템 구축
1-1. 목적 단백질의 과발현 유도를 위한 유전자 프로모터 선별
시스템 구축을 위해 분자생물학 연구에서 일반적으로 사용하는 이소프로필 베타-D-1-시오갈락토피라노시드 (Isopropyl-βIPTG) 반응성 유전자 프로모터를 선별하였다. 강력한 유전자 발현 유도 및 조절이 가능하다고 알려진 프로모터 3종 (tac, T7, Lacuv5)을 선정하였다.
1-2. 목적 단백질의 과발현 유도 및 N-말단 메티오닌 절단을 위한 합성 태그 선별
목적 단백질 N-말단 메티오닌 하위에 히스티딘 5개 (5x-histidine, H5) 및 특정 아미노산 1개 그리고 시스테인 프로테이즈 인식서열 (DEVD)이 결합된 태그를 기본 합성 태그 구조 (MHHHHHXaa)로서 선별하였다. Xaa에는 라이신 (lysine), 아르기닌 (arginine), 히스티딘이 해당될 수 있으며 또한 삭제될 수도 있다. 또한, 기본 합성 태그 N-말단에 특정 아미노산을 추가하여 MXaaXaaXaaXaaHHHHHXaa 형태의 태그를 사용하였으며 구체적으로는 4종류 태그 (aspartate-6x-histidine, DH6; alanine-6x-histidine, AH6; asparagine-6x-histidine, NH5; lysine-6x-histidine, KH6)를 제작하였으며, 히스티딘(histidine)과 알라닌 (alanine), 라이신 (lysine)을 조합한 복합 히스티딘 합성 태그 (histidine-alanine-lysine-(4x-alanine-histidine)-glycine-histidine-alanine-histidine, HAK)도 제작하였다.
1-3. N-말단 메티오닌 절단을 위한 시스테인
프로테이즈
선별
시스테인 프로테이즈의 소단위 (subunit)를 재정립하여 대장균에서도 단백질 활성을 갖도록 연구한 논문(Srinivasa M. Srinivasula et al., J Biol Chem., 1998 Apr 24;273(17):10107-11)을 참조하여 역방향 캐스페이즈-3 (reverse caspase-3, rev-CASP3) 유전자를 선정하였다. 본 발명에서 사용한 역방향 캐스페이즈-3의 아미노산 서열과 핵산 서열은 다음과 같다.
서열번호 1: 역방향 캐스페이즈-3의 아미노산 서열
MIETDSGVDD DMACHKIPVE ADFLYAYSTA PGYYSWRNSK DGSWFIQSLC AMLKQYADKL 60
EFMHILTRVN RKVATEFESF SFDATFHAKK QIPCIVSMLT KELYFYHDEV DGENTENSVD 120
SKSIKNLEPK IIHGSESMDS GISLDNSYKM DYPEMGLCII INNKNFHKST GMTSRSGTDV 180
DAANLRETFR NLKYEVRNKN DLTREEIVEL MRDVSKEDHS KRSSFVCVLL SHGEEGIIFG 240
TNGPVDLKKI TNFFRGDRCR SLTGKPKLFI IQACRGTELD CGIETD
서열번호 2: 역방향 캐스페이즈-3의 핵산 서열
atgatcgaaa ccgatagcgg tgttgatgat gatatggcct gtcataaaat tccggttgaa 60
gccgattttc tgtatgcata tagcaccgca ccgggttatt atagctggcg taatagcaaa 120
gatggcagct ggtttattca gagcctgtgt gcaatgctga aacagtatgc agataaactg 180
gaattcatgc acattctgac ccgtgttaat cgtaaagttg caaccgaatt tgaaagcttt 240
agctttgatg caaccttcca tgccaaaaaa caaattccgt gtattgttag catgctgacc 300
aaagaactgt atttctatca cgatgaagtg gatggcgaaa ataccgaaaa tagcgttgat 360
agcaaaagca tcaaaaacct ggaaccgaaa attatccatg gtagcgaaag catggatagc 420
ggtattagcc tggataacag ctataaaatg gattatccgg aaatgggcct gtgcatcatt 480
atcaacaaca aaaactttca caagagcacc ggtatgacca gccgtagcgg caccgatgtt 540
gatgcagcaa atctgcgtga aacctttcgc aatctgaaat atgaagtgcg caataagaat 600
gatctgacgc gtgaagaaat tgtggaactg atgcgtgatg ttagcaaaga agatcatagc 660
aaacgtagca gctttgtttg tgttctgctg agccatggtg aagaaggtat tatctttggc 720
accaatggtc cggttgatct gaaaaaaatc accaactttt ttcgtggtga tcgttgtcgt 780
agcctgaccg gtaaaccgaa actgtttatc attcaggcat gtcgtggcac cgaactggat 840
tgtggtattg aaaccgatta a
1-4. 목적 단백질 과발현 시스템 구축
실시예 1-1, 1-2, 1-3을 통해 선별한 인자들을 이용하여 목적 단백질 과발현 시스템을 구축하였다. 해당 시스템을 증명하기 위해 성장 호르몬 단백질 (human growth hormone, hGH)을 대상으로 유전자 발현 카세트를 설계 및 제작하였다. 본 발명에서 사용한 인간 성장 호르몬의 아미노산 서열과 핵산 서열은 다음과 같다.
서열번호 3: 인간 성장 호르몬 아미노산 서열
FPTIPLSRLF DNAMLRAHRL HQLAFDTYQE FEEAYIPKEQ KYSFLQNPQT SLCFSESIPT 60
PSNREETQQK SNLELLRISL LLIQSWLEPV QFLRSVFANS LVYGASDSNV YDLLKDLEEG 120
IQTLMGRLED GSPRTGQIFK QTYSKFDTNS HNDDALLKNY GLLYCFRKDM DKVETFLRIV 180
QCRSVEGSCG F
서열번호 4: 인간 성장 호르몬 핵산 서열
tttccgacca ttccgctgag ccgtctgttt gataatgcaa tgctgcgtgc acaccgtctg 60
caccagctgg catttgatac ctatcaagaa tttgaagaag cgtatatccc gaaagagcag 120
aaatatagct tcctgcagaa tccgcagacc agcctgtgtt ttagcgaaag cattccgaca 180
ccgagcaatc gtgaagaaac ccagcagaaa agcaatctgg aactgctgcg tattagcctg 240
ctgctgattc agagctggct ggaaccggtg cagtttctgc gtagcgtttt tgcaaatagc 300
ctggtttatg gtgcaagcga tagcaatgtt tatgatctgc tgaaagatct ggaagaaggt 360
attcagaccc tgatgggtcg tctggaagat ggttcaccgc gtaccggtca gatctttaaa 420
cagacctata gcaaattcga taccaacagc cataatgatg atgccctgct gaaaaactat 480
ggtctgctgt attgtttccg caaagatatg gataaagtgg aaacctttct gcgcattgtt 540
cagtgtcgta gcgttgaagg tagctgtggt ttttaa
한편, pETDuet-1 플라스미드 (EMD Millipore Corp.) 와 pAPT 플라스미드 (AP Tech.)를 클로닝 (cloning)을 위한 벡터로서 사용하였다.
히스티딘 6개와 역방향 캐스페이즈-3 인식서열이 결합된 기본 합성 태그 (H6-DEVD)가 성장 호르몬 단백질을 암호화하는 DNA에 결합하도록 PCR을 수행하여 DNA 절편 (H6-DEVD-hGH)을 증폭하였다. 증폭된 DNA 절편과 제한효소 NcoⅠ/HindⅢ로 절단된 pETDuet-1 플라스미드는 겔 추출을 통하여 정제한 다음, 상동재조합 (homologous recombination) 방식으로 클로닝하였다. 역방향 캐스페이즈-3를 암호화하는 DNA 절편을 삽입하기 위해, 1차 클로닝을 완료한 플라스미드를 제한효소 NdeⅠ/XhoⅠ로 절단한 다음, 상동재조합 방식으로 2차 클로닝하였다. 완성된 플라스미드는 pETDuet-H6-DEVD-hGH-T7-rev-CASP3 이며, 제작 모식도는 도 1에 나타내었고, 클로닝을 완료한 결과는 도 11과 도 12에 나타내었다.
pAPT 플라스미드의 경우, 단백질 번역 효율을 증가시키기 위한 인핸서 (enhancer)로서 A/U-rich 서열 (GCTCTTTAACAATTTATCAGATCCAATAGGAGGAACAAT)을 번역 개시 코돈 상위에 삽입하였으며 해당 플라스미드를 pAPT-Y로 명명하였다. pAPT-Y 클로닝에 대한 모식도는 도 2에 나타내었다.
도 3과 같이, PCR을 통해 6종류 태그가 결합된 성장 호르몬 단백질을 암호화하는 DNA를 증폭한 다음, 제한효소 EcoRⅠ/BamHⅠ으로 절단된 pAPT-Y 플라스미드에 상동재조합 방식으로 1차 클로닝하였다. 또한 역방향 캐스페이즈-3가 발현할 수 있도록 Lacuv5 프로모터와 역방향 캐스페이즈-3를 암호화하는 DNA를 1차 클로닝이 완료된 플라스미드에 상기 방식으로 2차 클로닝하였다.
이를 통해 pETDuet-H6-DEVD-hGH-T7-rev-CASP3, pAPT-Y-H6-DEVD-hGH-Lacuv5-rev-CASP3, pAPT-Y-DH6-DEVD-hGH-Lacuv5-rev-CASP3, pAPT-Y-AH6-DEVD-hGH-Lacuv5-rev-CASP3, pAPT-Y-NH6-DEVD-hGH-Lacuv5-rev-CASP3, pAPT-Y-KH6-DEVD-hGH-Lacuv5-rev-CASP3, pAPT-Y-HAK-DEVD-hGH-Lacuv5-rev-CASP3 플라스미드를 확보하였으며 그 모식도를 도 4에 나타내었다. 클로닝을 완료한 결과는 도 13, 도 14, 도 15, 도 16, 도 17, 도 18, 도 19에 나타내었다. 제작한 벡터의 정보는 도 5와 같다.
실시예
2. N-말단 메티오닌이 절단된 목적 단백질의 과발현 시스템 평가
2-1. N-말단 메티오닌이 절단된 성숙 성장 호르몬 단백질
발현양
평가
형질전환이 가능하도록 제작된 대장균(Escherichia coli K-12 W3110 또는 Escherichia coli C41(DE3) 또는 Escherichia coli Rosetta2(DE3))을 1.0x106 cells 이상이 되도록 20 μL씩 튜브에 분주하고 앞서 제작한 플라스미드 10 ng을 각각 섞은 다음, 얼음 위에 5분 방치하였다. 대장균-DNA 혼합물을 전기천공법 (electroporation) 용도의 0.2 cm 큐벳(cuvette)에 옮긴 다음, 2.5 kV 전류를 가하고 SOC 배지(super optimal broth with catabolite repression) 500 μL를 혼합한 후 37 ℃에서 30분간 배양하였다. 카나마이신 (kanamycin) 항생제를 100 μg/mL 함유한 LB (Luria-Bertani) 고체 배지 (agar plate)에 상기 배양액 100 μL를 도말한 다음, 37 ℃에서 16시간 정치 배양하여 형질전환을 완료하였다. 카나마이신에 대해 내성을 보이는 균주를 임의로 선별하여 5 mL LB 액체 배지에 접종한 후(100 μg/mL), 37 ℃에서 배양하였다. 600 nm 파장에서 상기 배양액의 광학 밀도 (optical density, OD)를 측정하였을 때 값이 0.8~1.3인 경우, 1 mM IPTG (Isopropyl β를 배양액에 첨가하여 성장 호르몬 단백질과 역방향 캐스페이즈-3 발현을 3시간 동안 유도하였다. SDS-PAGE (sodium dodecyl sulfate-polyacrylamide gel electrophoresis)와 Bio-Rad Image Lab software version 5.2.1을 이용하여 성장 호르몬 단백질과 역방향 캐스페이즈-3의 발현양을 계산하였다.
역방향 캐스페이즈-3의 부재로 N-말단 메티오닌이 유지되는 균주와 비교하였을 때, 역방향 캐스페이즈-3가 함께 발현하면 N-말단 메티오닌이 제거된 성장 호르몬 단백질 발현이 유도되는 것을 확인하였다(도 6, 도 7 참조). 도 7에서 발현된 성장 호르몬 단백질 중 가장 높은 발현율을 가진 균주를 합성 태그에 따라 분석했으며 그 결과는 표 2에 나타내었다. 역방향 캐스페이즈-3의 경우, 1.0~1.3 % 발현율을 보였다.
tag | Expression Rate ( % ) | |
M-tag- hGH | Cleaved hGH | |
H6 | 1.0 | 41.4 |
DH6 | 1.0 | 52.1 |
AH6 | 1.1 | 45.9 |
NH6 | 1.2 | 47.2 |
KH6 | 1.6 | 51.1 |
HAK | 1.2 | 27.1 |
2-2. N-말단 메티오닌 및 합성 태그의 절단 여부 평가 1
N-말단 메티오닌 절단 여부를 확인하고자 성장 호르몬 단백질과 합성 태그에 대해 웨스턴 블롯 (western blot)을 수행하였다.
상기 IPTG에 의해 단백질 발현이 유도된 세포를 확보한 후, 세포 용해 버퍼 (50 mM Tris-HCl (pH 8.5), 10 mM EDTA)와 초음파분쇄기 (sonicator)를 이용하여 20 % 강도 (amplitude)로 10초씩 열 번의 세포 파쇄를 진행하였다. 파쇄된 세포는 4 ℃에서 12,000 xg로 30분 동안 원심분리하여 수용성 단백질 (soluble protein)과 불수용성 단백질 (insoluble protein 또는 inclusion body)을 확보하였다. 4~12 % Bis-Tris 겔에 상기 SDS-PAGE와 동일한 조건으로 전체 단백질과 수용성, 불수용성 단백질을 로딩(loading)하여 단백질 전기영동을 수행한 후, PVDF 멤브레인 (polyvinylidene fluoride membrane)을 이용하여 단백질 트랜스퍼를 진행하였다. 상기 멤브레인에 불특정 결합을 낮추기 위해 블로킹 (blocking)을 수행하고 1차 항체 anti-His, anti-hGH, anti-CASP3 결합을 유도하였다. 형광 인자가 결합된 2차 항체를 반응시킨 후, Odyssey Infrared Imaging System을 통해 성장 호르몬 단백질과 합성 태그, 그리고 역방향 캐스페이즈-3 유무를 확인하였다. 웨스턴 블롯 결과는 Li-COR Image studio analysis software version 3.1을 이용하여 분석하였다.
역방향 캐스페이즈-3의 부재로 N-말단 메티오닌이 유지되는 균주와 비교하였을 때, 역방향 캐스페이즈-3가 함께 발현하면 성장 호르몬 단백질의 N-말단 메티오닌 및 합성 태그 중 96.12 %가 절단되는 것을 확인하였다(도 8 참조). 이러한 결과는 합성 태그의 종류에 상관없이 동일하게 나타났으며 도 9의 경우 합성 태그가 99.30 % 이상 절단되는 것을 확인하였다.
2-3. N-말단 메티오닌 및 합성 태그의 절단 여부 평가 2
N-말단 메티오닌 절단 여부를 확인하고자 성장 호르몬 단백질과 합성 태그에 대해 N-말단 시퀀싱 (N-terminal sequencing)을 수행하였다. 실시예 2-2.의 불수용성 단백질을 4-12 % Bis-Tris 겔에 로딩하여 SDS-PAGE를 수행하고 Coomassie blue 염색을 통해 성장 호르몬 단백질을 확인 및 확보하였다. 상기 확보한 단백질에 트립신을 처리 (trypsin based enzymatic digestion)한 후 액체 크로마토그래피 질량분광법 (Liquid chromatography-mass spectrometry, LC-MS)을 통해 N-말단 시퀀싱을 수행하였다. 이때 사용한 액체 크로마토그래피 컬럼 (column)은 Acclaim RSLC 120, C18, 2.2 μm Analytical (2.1 mm x 25 cm; 2.2 μm packing C18)이며 이동상 A(mobile phase A)는 0.1% formic acid in water, 이동상 B(mobile phase B)는 0.1% formic acid in acetonitrile을 사용하였고 UV 214 nm에서 분석하였다. 질량분석은 Thermo Q-Exactive Plus- Quad-Orbitrap MS system을 이용하여 300-1,900 m/z 범위에서 진행하였다.
역방향 캐스페이즈-3의 부재로 N-말단 메티오닌이 유지되는 균주의 경우, 합성 태그가 결합된 형태인 'GSHHHHHHDEVDFPTIPLSR' 서열을 확인하였고 역방향 캐스페이즈-3가 함께 발현된 균주의 경우, 성장 호르몬 단백질의 N-말단 메티오닌 및 합성 태그가 절단된 형태인 'FPTIPLSR' 서열을 확인하였다(도 10 참조).
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> POLUS Inc.
<120> Gene Expression Cassette for Expressing a Target Protein of which
Methionine at the N-terminus is Cleaved and Method for Producing
the Target Protein Using the Same
<130> P18-B299
<160> 4
<170> KoPatentIn 3.0
<210> 1
<211> 286
<212> PRT
<213> Homo sapiens
<400> 1
Met Ile Glu Thr Asp Ser Gly Val Asp Asp Asp Met Ala Cys His Lys
1 5 10 15
Ile Pro Val Glu Ala Asp Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly
20 25 30
Tyr Tyr Ser Trp Arg Asn Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser
35 40 45
Leu Cys Ala Met Leu Lys Gln Tyr Ala Asp Lys Leu Glu Phe Met His
50 55 60
Ile Leu Thr Arg Val Asn Arg Lys Val Ala Thr Glu Phe Glu Ser Phe
65 70 75 80
Ser Phe Asp Ala Thr Phe His Ala Lys Lys Gln Ile Pro Cys Ile Val
85 90 95
Ser Met Leu Thr Lys Glu Leu Tyr Phe Tyr His Asp Glu Val Asp Gly
100 105 110
Glu Asn Thr Glu Asn Ser Val Asp Ser Lys Ser Ile Lys Asn Leu Glu
115 120 125
Pro Lys Ile Ile His Gly Ser Glu Ser Met Asp Ser Gly Ile Ser Leu
130 135 140
Asp Asn Ser Tyr Lys Met Asp Tyr Pro Glu Met Gly Leu Cys Ile Ile
145 150 155 160
Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly Met Thr Ser Arg Ser
165 170 175
Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu Thr Phe Arg Asn Leu
180 185 190
Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr Arg Glu Glu Ile Val
195 200 205
Glu Leu Met Arg Asp Val Ser Lys Glu Asp His Ser Lys Arg Ser Ser
210 215 220
Phe Val Cys Val Leu Leu Ser His Gly Glu Glu Gly Ile Ile Phe Gly
225 230 235 240
Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr Asn Phe Phe Arg Gly
245 250 255
Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys Leu Phe Ile Ile Gln
260 265 270
Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly Ile Glu Thr Asp
275 280 285
<210> 2
<211> 861
<212> DNA
<213> Homo sapiens
<400> 2
atgatcgaaa ccgatagcgg tgttgatgat gatatggcct gtcataaaat tccggttgaa 60
gccgattttc tgtatgcata tagcaccgca ccgggttatt atagctggcg taatagcaaa 120
gatggcagct ggtttattca gagcctgtgt gcaatgctga aacagtatgc agataaactg 180
gaattcatgc acattctgac ccgtgttaat cgtaaagttg caaccgaatt tgaaagcttt 240
agctttgatg caaccttcca tgccaaaaaa caaattccgt gtattgttag catgctgacc 300
aaagaactgt atttctatca cgatgaagtg gatggcgaaa ataccgaaaa tagcgttgat 360
agcaaaagca tcaaaaacct ggaaccgaaa attatccatg gtagcgaaag catggatagc 420
ggtattagcc tggataacag ctataaaatg gattatccgg aaatgggcct gtgcatcatt 480
atcaacaaca aaaactttca caagagcacc ggtatgacca gccgtagcgg caccgatgtt 540
gatgcagcaa atctgcgtga aacctttcgc aatctgaaat atgaagtgcg caataagaat 600
gatctgacgc gtgaagaaat tgtggaactg atgcgtgatg ttagcaaaga agatcatagc 660
aaacgtagca gctttgtttg tgttctgctg agccatggtg aagaaggtat tatctttggc 720
accaatggtc cggttgatct gaaaaaaatc accaactttt ttcgtggtga tcgttgtcgt 780
agcctgaccg gtaaaccgaa actgtttatc attcaggcat gtcgtggcac cgaactggat 840
tgtggtattg aaaccgatta a 861
<210> 3
<211> 191
<212> PRT
<213> Homo sapiens
<400> 3
Phe Pro Thr Ile Pro Leu Ser Arg Leu Phe Asp Asn Ala Met Leu Arg
1 5 10 15
Ala His Arg Leu His Gln Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu
20 25 30
Glu Ala Tyr Ile Pro Lys Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro
35 40 45
Gln Thr Ser Leu Cys Phe Ser Glu Ser Ile Pro Thr Pro Ser Asn Arg
50 55 60
Glu Glu Thr Gln Gln Lys Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu
65 70 75 80
Leu Leu Ile Gln Ser Trp Leu Glu Pro Val Gln Phe Leu Arg Ser Val
85 90 95
Phe Ala Asn Ser Leu Val Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp
100 105 110
Leu Leu Lys Asp Leu Glu Glu Gly Ile Gln Thr Leu Met Gly Arg Leu
115 120 125
Glu Asp Gly Ser Pro Arg Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser
130 135 140
Lys Phe Asp Thr Asn Ser His Asn Asp Asp Ala Leu Leu Lys Asn Tyr
145 150 155 160
Gly Leu Leu Tyr Cys Phe Arg Lys Asp Met Asp Lys Val Glu Thr Phe
165 170 175
Leu Arg Ile Val Gln Cys Arg Ser Val Glu Gly Ser Cys Gly Phe
180 185 190
<210> 4
<211> 576
<212> DNA
<213> Homo sapiens
<400> 4
tttccgacca ttccgctgag ccgtctgttt gataatgcaa tgctgcgtgc acaccgtctg 60
caccagctgg catttgatac ctatcaagaa tttgaagaag cgtatatccc gaaagagcag 120
aaatatagct tcctgcagaa tccgcagacc agcctgtgtt ttagcgaaag cattccgaca 180
ccgagcaatc gtgaagaaac ccagcagaaa agcaatctgg aactgctgcg tattagcctg 240
ctgctgattc agagctggct ggaaccggtg cagtttctgc gtagcgtttt tgcaaatagc 300
ctggtttatg gtgcaagcga tagcaatgtt tatgatctgc tgaaagatct ggaagaaggt 360
attcagaccc tgatgggtcg tctggaagat ggttcaccgc gtaccggtca gatctttaaa 420
cagacctata gcaaattcga taccaacagc cataatgatg atgccctgct gaaaaactat 480
ggtctgctgt attgtttccg caaagatatg gataaagtgg aaacctttct gcgcattgtt 540
cagtgtcgta gcgttgaagg tagctgtggt ttttaa 576
Claims (16)
- 목적 단백질을 코딩하는 핵산 및 시스테인 프로테이즈를 코딩하는 핵산을 포함하는 유전자 발현 카세트로, 상기 목적 단백질 N-말단의 첫번째 아미노산인 메티오닌(Met)과 두번째 아미노산 사이에 시스테인 프로테이즈 인식서열이 삽입되어 있는 것을 특징으로 하는 유전자 발현 카세트.
- 제 1항에 있어서, 상기 목적 단백질을 코딩하는 핵산 및 시스테인 프로테이즈를 코딩하는 핵산은 별도의 프로모터에 의해 발현이 조절되는 것을 특징으로 하는 유전자 발현 카세트.
- 제 2항에 있어서, 상기 프로모터는 T3 프로모터, T5 프로모터, T7 프로모터, tac 프로모터, trc 프로모터, trp 프로모터, 아라비노스 프로모터, Lacuv5 프로모터 및 LacI 프로모터로 구성된 군에서 선택되는 것을 특징으로 하는 유전자 발현 카세트.
- 제1항에 있어서, 상기 시스테인 프로테이즈 인식서열은 DEVD, VEID, VEHD 또는 LEHD 인 것을 특징으로 하는 유전자 발현 카세트.
- 제1항에 있어서, 상기 시스테인 프로테이즈는 역방향 캐스페이즈-3 (reverse caspase-3), 역방향 캐스페이즈-6 (reverse caspase-6) 또는 역방향 캐스페이즈-9 (reverse caspase-9)인 것을 특징으로 하는 유전자 발현 카세트.
- 제1항에 있어서, 상기 목적 단백질을 코딩하는 핵산의 번역 개시 코돈 상위에 인핸서가 삽입되어 있는 것을 특징으로 하는 유전자 발현 카세트.
- 제6항에 있어서, 상기 인핸서는 A/U-rich 서열인 것을 특징으로 하는 유전자 발현 카세트.
- 제1항에 있어서, 상기 목적 단백질은 인간 헤모글로빈, 인터루킨-2, 인터페론-베타 또는 인간 성장 호르몬인 것을 특징으로 하는 유전자 발현 카세트.
- 제1항에 있어서, 상기 시스테인 프로테이즈 인식서열의 N-말단에 태그가 추가로 결합되어 있는 것을 특징으로 하는 유전자 발현 카세트.
- 제9항에 있어서, 상기 태그는 His tag, DH6 tag, AH6 tag, NH6 tag, KH6 tag, HAK tag, T7 tag, S-tag, Flag-tag, HA-tag, V5 epitope, PelB 및 Xpress epitope로 구성된 군에서 선택되는 것을 특징으로 하는 유전자 발현 카세트.
- 제1항 내지 10항 중 어느 한 항의 유전자 발현 카세트가 도입된 재조합 벡터.
- 제11항에 있어서, 상기 유전자 발현 카세트는 pAPT 벡터, pETDuet(pETDuet-1) 벡터, pET24a(+) 벡터, pQE30 벡터, pMAL-c2x 벡터, pTrc99a 벡터, pBAD 벡터, pUC18 벡터 및 pUC19벡터로 구성된 군에서 선택되는 벡터에 도입되는 것을 특징으로 하는 재조합 벡터.
- 제1항 내지 제10항 중 어느 한 항의 유전자 발현 카세트가 도입된 재조합 미생물.
- 제13항에 있어서, 상기 미생물은 대장균, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 바실러스 섭틸러스(Bacillus subtilis) 또는 효모인 것을 특징으로 하는 재조합 미생물.
- 다음 단계를 포함하는 목적 단백질의 생산방법:
(a) 제14항의 재조합 미생물을 배양하여 N-말단의 첫번째 아미노산인 메티오닌이 절단된 목적 단백질을 생성하는 단계; 및
(b) 상기 생성된 목적 단백질을 회수하는 단계.
- 제15항에 있어서, 상기 생성된 목적 단백질은 성숙 인간 성장 호르몬인 것을 특징으로 하는 생산방법.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180170531A KR20200080749A (ko) | 2018-12-27 | 2018-12-27 | N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 n-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법 |
US17/418,653 US20220119792A1 (en) | 2018-12-27 | 2019-12-26 | Gene expression cassette for expressing n-terminal methionine-truncated protein of interest and method for producing n-terminal methionine-truncated protein of interest by using same |
EP19905665.6A EP3904520A4 (en) | 2018-12-27 | 2019-12-26 | GENE EXPRESSION CASSETTE FOR EXPRESSING A TRUNCATED N-TERMINAL METHIONINE PROTEIN OF INTEREST AND METHOD FOR PRODUCING A TRUNCATED N-TERMINAL METHIONINE PROTEIN OF INTEREST USING THE SAME |
PCT/KR2019/018464 WO2020138951A1 (ko) | 2018-12-27 | 2019-12-26 | N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 n-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180170531A KR20200080749A (ko) | 2018-12-27 | 2018-12-27 | N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 n-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200080749A true KR20200080749A (ko) | 2020-07-07 |
Family
ID=71126089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180170531A KR20200080749A (ko) | 2018-12-27 | 2018-12-27 | N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 n-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220119792A1 (ko) |
EP (1) | EP3904520A4 (ko) |
KR (1) | KR20200080749A (ko) |
WO (1) | WO2020138951A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024112133A1 (en) * | 2022-11-25 | 2024-05-30 | Lg Chem, Ltd. | Cassette for expression of fusion protein from which methionine at the n-terminus has been removed, and use thereof |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6117639A (en) * | 1998-08-31 | 2000-09-12 | Vertex Pharmaceuticals Incorporated | Fusion proteins, DNA molecules, vectors, and host cells useful for measuring protease activity |
IL129427A0 (en) * | 1999-04-13 | 2000-02-17 | Yeda Res & Dev | Preparation of biologically active molecules |
EP1292697B1 (en) * | 2000-06-15 | 2009-07-22 | SmithKline Beecham Corporation | Method for preparing a physiologically active il-18 polypeptide |
US20060099689A1 (en) * | 2003-02-21 | 2006-05-11 | Mertens Nico M A | Use of caspase enzymes for maturation of engineered recombinant polypeptide fusions |
US8841255B2 (en) * | 2005-12-20 | 2014-09-23 | Duke University | Therapeutic agents comprising fusions of vasoactive intestinal peptide and elastic peptides |
EP1873251A1 (en) * | 2006-06-29 | 2008-01-02 | Chemotherapeutisches Forschungsinstitut Georg-Speyer-Haus | Expression vector(s) for enhanced expression of a protein of interest in eukaryotic or prokaryotic host cells |
KR100980315B1 (ko) * | 2007-10-01 | 2010-09-07 | 한국생명공학연구원 | 대장균시스템을 이용한 인위적 활성화가 가능한 카스파제전구체 대량생산 및 활성화 방법 |
JP5956350B2 (ja) * | 2010-01-25 | 2016-07-27 | アラーガン、インコーポレイテッドAllergan,Incorporated | 単鎖タンパク質をそれらの2鎖形態に細胞内変換する方法 |
KR101423696B1 (ko) * | 2012-07-27 | 2014-07-25 | 가톨릭대학교 산학협력단 | 대장균에서 인간 유전자를 대량발현 시킬 수 있는 t7 프로모터 및 n-말단 ha 태그서열을 포함하는 포유동물 세포 발현 벡터의 이용 |
-
2018
- 2018-12-27 KR KR1020180170531A patent/KR20200080749A/ko not_active Application Discontinuation
-
2019
- 2019-12-26 US US17/418,653 patent/US20220119792A1/en active Pending
- 2019-12-26 EP EP19905665.6A patent/EP3904520A4/en active Pending
- 2019-12-26 WO PCT/KR2019/018464 patent/WO2020138951A1/ko unknown
Non-Patent Citations (5)
Title |
---|
Belagaje, R.M. et al., 1997. Increased production of low molecular weight recombinant proteins in Escherichia coli. Protein Sci. 6 1953~1962. |
Boix, E. et al., 1996. Role of the N terminus in RNase A homologues: Differences in catalytic activity, ribonuclease inhibitor interaction and cytotoxicity. J. Mol. Biol. 257 992~1007. |
Huang, H.C. Wet al., 1998. The Rana catesbeiana rcr gene encoding a cytotoxic ribonuclease. Tissue distribution, cloning, purification, cytotoxicity, and active residues for RNase activity. J. Biol. Chem. 273 6395-6401. |
Notomista, E. et al., 1999. Effective expression and purification of recombinant on-conase, an antitumor protein. FEBS Lett. 463 211-215. |
Shapiro, R. et al., 1988. Expression of Met-(-1) angiogenin in Escherichia coli: Conversion to the authentic less than Glu-1 protein. Anal. Biochem. 175 450-461. |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024112133A1 (en) * | 2022-11-25 | 2024-05-30 | Lg Chem, Ltd. | Cassette for expression of fusion protein from which methionine at the n-terminus has been removed, and use thereof |
Also Published As
Publication number | Publication date |
---|---|
EP3904520A4 (en) | 2022-12-14 |
EP3904520A1 (en) | 2021-11-03 |
US20220119792A1 (en) | 2022-04-21 |
WO2020138951A1 (ko) | 2020-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5027812B2 (ja) | トリプシンの変異体によるインスリン前駆体の切断 | |
US4769326A (en) | Expression linkers | |
CA1200773A (en) | Expression linkers | |
JP4504014B2 (ja) | インスリン分泌性glp−1(7−36)ポリペプチドおよび/またはglp−1類似体を生成する方法 | |
KR100357532B1 (ko) | 사람성장호르몬의 분비생산방법 | |
EP3943599A1 (en) | Aminoacyl-trna synthetase for efficiently introducing lysine derivative in protein | |
US20220411764A1 (en) | Thioredoxin mutant, preparation method thereof, and application thereof in production of recombinant fusion protein | |
CN110093336B (zh) | 一种稳定的胰蛋白酶及其制备方法 | |
JP7266325B2 (ja) | 蛍光タンパク質フラグメントを含む融合タンパク質およびその用途 | |
HU216335B (hu) | Eljárás peptidek előállítására | |
EP0147178A2 (en) | Expression plasmids for improved production of heterologous protein in bacteria | |
KR20200080749A (ko) | N-말단의 메티오닌이 절단된 목적 단백질 발현용 유전자 발현 카세트 및 이를 이용하여 n-말단의 메티오닌이 절단된 목적 단백질을 생산하는 방법 | |
US5955297A (en) | Expression plasmids for improved production of heterologous protein in bacteria | |
CN109136209B (zh) | 肠激酶轻链突变体及其应用 | |
FI93125B (fi) | Kasvuhormonia vapauttavan tekijän sekvenssin sisältävien hybridipolypeptidien ilmentäminen E. colissa | |
Ohsuye et al. | Expression of chemically synthesized α-neo-endorphin gene fused to E. coli alkaline phosphatase | |
JP2549504B2 (ja) | Dna塩基配列、ポリペプチド分泌発現ベクター及び形質転換微生物 | |
US20180118800A1 (en) | Method of preparing glucagon-like peptide-2 (glp-2) analog | |
RU2801248C2 (ru) | Гибридный белок, содержащий фрагменты флуоресцентных белков, и его применение | |
KR102345012B1 (ko) | GroES 융합을 이용한 인간부갑상선호르몬 1-34의 생산방법 | |
WO2023011486A1 (zh) | 高效引入赖氨酸衍生物的氨酰基-tRNA合成酶及其应用 | |
KR100202958B1 (ko) | 인슐린 융합단백질로부터 인슐린을 생산하는데 있어서 효소적 절단을 가능케하는 인슐린 융합단백질 유전자를 가진 발현벡터 및 이를 이용한 사람 인슐린의 제조방법 | |
US20050069975A1 (en) | Methods of enhancing yields of soluble proteins | |
EP1674567A1 (en) | METHOD OF CLEAVING POLYPEPTIDE BY USING OmpT PROTEASE MUTANT | |
KR100436552B1 (ko) | 단백질 분해효소의 기질특이성을 측정하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |