KR20230165291A - 폴리펩티드의 발현 증가를 위한 구축물 및 방법 - Google Patents
폴리펩티드의 발현 증가를 위한 구축물 및 방법 Download PDFInfo
- Publication number
- KR20230165291A KR20230165291A KR1020237037447A KR20237037447A KR20230165291A KR 20230165291 A KR20230165291 A KR 20230165291A KR 1020237037447 A KR1020237037447 A KR 1020237037447A KR 20237037447 A KR20237037447 A KR 20237037447A KR 20230165291 A KR20230165291 A KR 20230165291A
- Authority
- KR
- South Korea
- Prior art keywords
- expression
- seq
- peptide
- protein
- acid sequence
- Prior art date
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 254
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 244
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 117
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000001965 increasing effect Effects 0.000 title claims abstract description 12
- 229920001184 polypeptide Polymers 0.000 title claims description 90
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 71
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 67
- 230000002708 enhancing effect Effects 0.000 claims abstract 2
- 230000004927 fusion Effects 0.000 claims description 51
- 101100121705 Drosophila melanogaster sens gene Proteins 0.000 claims description 45
- 108091033319 polynucleotide Proteins 0.000 claims description 42
- 102000040430 polynucleotide Human genes 0.000 claims description 42
- 239000002157 polynucleotide Substances 0.000 claims description 42
- 150000001413 amino acids Chemical group 0.000 claims description 31
- 239000013604 expression vector Substances 0.000 claims description 18
- 108020001507 fusion proteins Proteins 0.000 claims description 16
- 102000037865 fusion proteins Human genes 0.000 claims description 16
- 238000004519 manufacturing process Methods 0.000 claims description 16
- 108010049264 Teriparatide Proteins 0.000 claims description 13
- OGBMKVWORPGQRR-UMXFMPSGSA-N teriparatide Chemical compound C([C@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)[C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 OGBMKVWORPGQRR-UMXFMPSGSA-N 0.000 claims description 13
- 229960005460 teriparatide Drugs 0.000 claims description 13
- 241000588724 Escherichia coli Species 0.000 claims description 10
- 238000003776 cleavage reaction Methods 0.000 claims description 10
- 230000007017 scission Effects 0.000 claims description 10
- DLSWIYLPEUIQAV-UHFFFAOYSA-N Semaglutide Chemical compound CCC(C)C(NC(=O)C(Cc1ccccc1)NC(=O)C(CCC(O)=O)NC(=O)C(CCCCNC(=O)COCCOCCNC(=O)COCCOCCNC(=O)CCC(NC(=O)CCCCCCCCCCCCCCCCC(O)=O)C(O)=O)NC(=O)C(C)NC(=O)C(C)NC(=O)C(CCC(N)=O)NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)C(CC(C)C)NC(=O)C(Cc1ccc(O)cc1)NC(=O)C(CO)NC(=O)C(CO)NC(=O)C(NC(=O)C(CC(O)=O)NC(=O)C(CO)NC(=O)C(NC(=O)C(Cc1ccccc1)NC(=O)C(NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)C(C)(C)NC(=O)C(N)Cc1cnc[nH]1)C(C)O)C(C)O)C(C)C)C(=O)NC(C)C(=O)NC(Cc1c[nH]c2ccccc12)C(=O)NC(CC(C)C)C(=O)NC(C(C)C)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CCCNC(N)=N)C(=O)NCC(O)=O DLSWIYLPEUIQAV-UHFFFAOYSA-N 0.000 claims description 5
- 108010076818 TEV protease Proteins 0.000 claims description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 5
- 108010060325 semaglutide Proteins 0.000 claims description 5
- 229950011186 semaglutide Drugs 0.000 claims description 5
- 230000001225 therapeutic effect Effects 0.000 claims description 5
- 108010011459 Exenatide Proteins 0.000 claims description 4
- HTQBXNHDCUEHJF-XWLPCZSASA-N Exenatide Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CO)C(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 HTQBXNHDCUEHJF-XWLPCZSASA-N 0.000 claims description 4
- XVVOERDUTLJJHN-UHFFFAOYSA-N Lixisenatide Chemical compound C=1NC2=CC=CC=C2C=1CC(C(=O)NC(CC(C)C)C(=O)NC(CCCCN)C(=O)NC(CC(N)=O)C(=O)NCC(=O)NCC(=O)N1C(CCC1)C(=O)NC(CO)C(=O)NC(CO)C(=O)NCC(=O)NC(C)C(=O)N1C(CCC1)C(=O)N1C(CCC1)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)CC)NC(=O)C(NC(=O)C(CC(C)C)NC(=O)C(CCCNC(N)=N)NC(=O)C(NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)NC(=O)C(CCSC)NC(=O)C(CCC(N)=O)NC(=O)C(CCCCN)NC(=O)C(CO)NC(=O)C(CC(C)C)NC(=O)C(CC(O)=O)NC(=O)C(CO)NC(=O)C(NC(=O)C(CC=1C=CC=CC=1)NC(=O)C(NC(=O)CNC(=O)C(CCC(O)=O)NC(=O)CNC(=O)C(N)CC=1NC=NC=1)C(C)O)C(C)O)C(C)C)CC1=CC=CC=C1 XVVOERDUTLJJHN-UHFFFAOYSA-N 0.000 claims description 4
- 229960001519 exenatide Drugs 0.000 claims description 4
- 108010004367 lixisenatide Proteins 0.000 claims description 4
- 229960001093 lixisenatide Drugs 0.000 claims description 4
- 229920002704 polyhistidine Polymers 0.000 claims description 4
- 108010073046 teduglutide Proteins 0.000 claims description 4
- CILIXQOJUNDIDU-ASQIGDHWSA-N teduglutide Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O)[C@@H](C)CC)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)CC)C1=CC=CC=C1 CILIXQOJUNDIDU-ASQIGDHWSA-N 0.000 claims description 4
- 229960002444 teduglutide Drugs 0.000 claims description 4
- 244000063299 Bacillus subtilis Species 0.000 claims description 3
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 3
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims 1
- 230000002349 favourable effect Effects 0.000 claims 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 abstract description 6
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 abstract description 6
- 150000007523 nucleic acids Chemical group 0.000 description 60
- 108091028043 Nucleic acid sequence Proteins 0.000 description 57
- 125000003275 alpha amino acid group Chemical group 0.000 description 54
- 235000018102 proteins Nutrition 0.000 description 47
- 108020004414 DNA Proteins 0.000 description 32
- 210000004027 cell Anatomy 0.000 description 31
- 108020004705 Codon Proteins 0.000 description 17
- 235000001014 amino acid Nutrition 0.000 description 16
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 13
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 12
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 12
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 12
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 12
- 108010028295 histidylhistidine Proteins 0.000 description 12
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 12
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 102000039446 nucleic acids Human genes 0.000 description 9
- 108020004707 nucleic acids Proteins 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 7
- CTNODEMQIKCZGQ-JYJNAYRXSA-N Phe-Gln-His Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 CTNODEMQIKCZGQ-JYJNAYRXSA-N 0.000 description 7
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 7
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 6
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 6
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 6
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 6
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 6
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 6
- 108010019598 Liraglutide Proteins 0.000 description 6
- YSDQQAXHVYUZIW-QCIJIYAXSA-N Liraglutide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCNC(=O)CC[C@H](NC(=O)CCCCCCCCCCCCCCC)C(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=C(O)C=C1 YSDQQAXHVYUZIW-QCIJIYAXSA-N 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- WMBFONUKQXGLMU-WDSOQIARSA-N Trp-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WMBFONUKQXGLMU-WDSOQIARSA-N 0.000 description 6
- 108010040030 histidinoalanine Proteins 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 229960002701 liraglutide Drugs 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 5
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 5
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 5
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 5
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 5
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 5
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 5
- 108010010147 glycylglutamine Proteins 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 4
- BVELAHPZLYLZDJ-HGNGGELXSA-N Gln-His-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O BVELAHPZLYLZDJ-HGNGGELXSA-N 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 4
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 4
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 4
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 4
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 4
- 238000010217 densitometric analysis Methods 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 3
- 102000005720 Glutathione transferase Human genes 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- GHAFKUCRIVBLDJ-IHRRRGAJSA-N His-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N GHAFKUCRIVBLDJ-IHRRRGAJSA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 3
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 102100040918 Pro-glucagon Human genes 0.000 description 3
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 3
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 3
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 3
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 3
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 210000003000 inclusion body Anatomy 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 2
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 2
- 101800000224 Glucagon-like peptide 1 Proteins 0.000 description 2
- 229940089838 Glucagon-like peptide 1 receptor agonist Drugs 0.000 description 2
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 2
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 2
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 2
- JIUYRPFQJJRSJB-QWRGUYRKSA-N His-His-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JIUYRPFQJJRSJB-QWRGUYRKSA-N 0.000 description 2
- 108091016366 Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 description 2
- WZPIKDWQVRTATP-SYWGBEHUSA-N Ile-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 WZPIKDWQVRTATP-SYWGBEHUSA-N 0.000 description 2
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 2
- 102000004195 Isomerases Human genes 0.000 description 2
- 108090000769 Isomerases Proteins 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 2
- 239000006142 Luria-Bertani Agar Substances 0.000 description 2
- RXWPLVRJQNWXRQ-IHRRRGAJSA-N Met-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 RXWPLVRJQNWXRQ-IHRRRGAJSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 241001674048 Phthiraptera Species 0.000 description 2
- HPXVFFIIGOAQRV-DCAQKATOSA-N Pro-Arg-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O HPXVFFIIGOAQRV-DCAQKATOSA-N 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000012737 fresh medium Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 239000003877 glucagon like peptide 1 receptor agonist Substances 0.000 description 2
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 210000000936 intestine Anatomy 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- GCYXWQUSHADNBF-AAEALURTSA-N preproglucagon 78-108 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 GCYXWQUSHADNBF-AAEALURTSA-N 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- KDZIGQIDPXKMBA-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-methylbutanoyl)amino]acetyl]amino]-3-hydroxypropanoyl]amino]pentanedioic acid Chemical compound CC(C)C(N)C(=O)NCC(=O)NC(CO)C(=O)NC(C(O)=O)CCC(O)=O KDZIGQIDPXKMBA-UHFFFAOYSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 101800002011 Amphipathic peptide Proteins 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- OMSMPWHEGLNQOD-UWVGGRQHSA-N Asn-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UWVGGRQHSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- 102000035101 Aspartic proteases Human genes 0.000 description 1
- 108091005502 Aspartic proteases Proteins 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- MBILEVLLOHJZMG-FXQIFTODSA-N Cys-Gln-Glu Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N MBILEVLLOHJZMG-FXQIFTODSA-N 0.000 description 1
- YZKOXEJTLWZOQL-GUBZILKMSA-N Cys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N YZKOXEJTLWZOQL-GUBZILKMSA-N 0.000 description 1
- 102000015833 Cystatin Human genes 0.000 description 1
- 102000005927 Cysteine Proteases Human genes 0.000 description 1
- 108010005843 Cysteine Proteases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 1
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- KHNJVFYHIKLUPD-SRVKXCTJSA-N Gln-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHNJVFYHIKLUPD-SRVKXCTJSA-N 0.000 description 1
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 1
- RNPGPFAVRLERPP-QEJZJMRPSA-N Gln-Trp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RNPGPFAVRLERPP-QEJZJMRPSA-N 0.000 description 1
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 1
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 1
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 1
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 1
- CTGZVVQVIBSOBB-AVGNSLFASA-N His-His-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTGZVVQVIBSOBB-AVGNSLFASA-N 0.000 description 1
- AKAPKBNIVNPIPO-KKUMJFAQSA-N His-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 AKAPKBNIVNPIPO-KKUMJFAQSA-N 0.000 description 1
- AYUOWUNWZGTNKB-ULQDDVLXSA-N His-Phe-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AYUOWUNWZGTNKB-ULQDDVLXSA-N 0.000 description 1
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 1
- 108091006054 His-tagged proteins Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000788682 Homo sapiens GATA-type zinc finger protein 1 Proteins 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- JQLFYZMEXFNRFS-DJFWLOJKSA-N Ile-Asp-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N JQLFYZMEXFNRFS-DJFWLOJKSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- CNMOKANDJMLAIF-CIQUZCHMSA-N Ile-Thr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O CNMOKANDJMLAIF-CIQUZCHMSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- POMXSEDNUXYPGK-IHRRRGAJSA-N Leu-Met-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N POMXSEDNUXYPGK-IHRRRGAJSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- SCKPOOMCTFEVTN-QTKMDUPCSA-N Met-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCSC)N)O SCKPOOMCTFEVTN-QTKMDUPCSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- FAKYXUOUQCRGMO-FDARSICLSA-N Met-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCSC)N FAKYXUOUQCRGMO-FDARSICLSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 101800001442 Peptide pr Proteins 0.000 description 1
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 1
- GNUCSNWOCQFMMC-UFYCRDLUSA-N Phe-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 GNUCSNWOCQFMMC-UFYCRDLUSA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- VLZGUAUYZGQKPM-DRZSPHRISA-N Phe-Gln-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VLZGUAUYZGQKPM-DRZSPHRISA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- VPFGPKIWSDVTOY-SRVKXCTJSA-N Pro-Glu-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O VPFGPKIWSDVTOY-SRVKXCTJSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- 108010058003 Proglucagon Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- RJHJPZQOMKCSTP-CIUDSAMLSA-N Ser-His-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O RJHJPZQOMKCSTP-CIUDSAMLSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- CJXURNZYNHCYFD-WDCWCFNPSA-N Thr-Lys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CJXURNZYNHCYFD-WDCWCFNPSA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- RYXOUTORDIUWNI-BPUTZDHNSA-N Trp-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RYXOUTORDIUWNI-BPUTZDHNSA-N 0.000 description 1
- YTCNLMSUXPCFBW-SXNHZJKMSA-N Trp-Ile-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O YTCNLMSUXPCFBW-SXNHZJKMSA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 1
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- -1 but not limited to Proteins 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 108050004038 cystatin Proteins 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 235000012631 food intake Nutrition 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 239000008241 heterogeneous mixture Substances 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 125000001841 imino group Chemical group [H]N=* 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000000859 incretin Substances 0.000 description 1
- MGXWVYUBJRZYPE-YUGYIWNOSA-N incretin Chemical class C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)[C@@H](C)O)[C@@H](C)CC)C1=CC=C(O)C=C1 MGXWVYUBJRZYPE-YUGYIWNOSA-N 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000003914 insulin secretion Effects 0.000 description 1
- 230000017730 intein-mediated protein splicing Effects 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108010034507 methionyltryptophan Proteins 0.000 description 1
- 238000013365 molecular weight analysis method Methods 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000001679 solitary nucleus Anatomy 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/60—Growth-hormone releasing factors (GH-RF) (Somatoliberin)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/605—Glucagons
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/635—Parathyroid hormone (parathormone); Parathyroid hormone-related peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
Abstract
본 발명은 단백질 발현 분야에 관한 것이다. 이는 재조합 단백질의 발현 증가를 위한 발현 구축물 및 방법을 제공한다. 보다 구체적으로, 이는 재조합 숙주 세포에서 리라 펩티드의 발현 향상을 위한 구축물 및 방법을 제공한다.
Description
관련 출원에 대한 상호 참조
본 출원은 2021년 3월 31일에 출원된 인도 가특허출원 번호 202141014741에 대한 우선권의 이익을 주장하며, 이의 전체 내용은 참조로 본원에 포함된다.
발명의 분야
본 발명은 단백질 발현 분야에 관한 것이다. 보다 구체적으로, 이는 재조합 폴리펩티드 및 단백질의 발현 증가를 위한 구축물 및 방법에 관한 것이다.
펩티드 치료제는 1920년대 인슐린 요법이 등장한 이후 의료 업무에서 주목할만한 역할을 해왔다. 현재, 시장에는 60개 초과의 승인된 펩티드 약물이 있으며, 그 수는 크게 늘어날 것으로 예상된다.
상업적으로 유용한 단백질 및 펩티드는 합성적으로 생성되거나 천연 공급원으로부터 단리될 수 있다. 그러나, 이러한 방법은 종종 비용이 많이 들고 시간이 많이 걸리며 생성 능력이 제한되는 특징이 있다. 단백질 및 펩티드 생성의 바람직한 방법은 관심 단백질 또는 펩티드를 과발현하도록 조작된 재조합적으로 구축된 유기체의 발효를 통하는 것이다.
그러나, 펩티드의 재조합 발현은 비용 효과적인 생성 수단이 되기 위해서는 극복해야 할 많은 장애물을 가지고 있다. 장애물은 일반적으로 재조합 단백질의 낮은 발현 수준 또는 세포 내에 함유된 단백질분해 효소에 의한 발현된 폴리펩티드의 파괴와 관련된다.
짧은 펩티드는 숙주 세포 프로테아제에 의해 세포 환경에서 분해되기 쉽기 때문에 재조합적으로 생성하기가 어렵다. 따라서, 단리된 생성물은 상이한 아미노산 쇄 길이를 갖는 원하는 폴리펩티드 종의 비균질 혼합물일 수 있다.
또한, 정제가 어려울 수 있어 관심 단백질 또는 펩티드의 특성에 따라 수율이 저조하다. 상기 문제점을 극복하기 위해 소형 펩티드를 대형 융합 태그에 융합시켜 발현하고 있다. 또한, 현재 방법은 융합 단백질을 발현하기 위해 대형 융합 태그를 사용하며 이는 관심 펩티드의 잠재적인 수율을 감소시킨다. 이는 관심 단백질 또는 펩티드의 크기가 작은 상황에서는 문제가 된다.
이러한 상황에서는 관심 펩티드의 수율을 최대화하기 위해 소형 크기의 융합 태그를 사용하는 것이 유리하다. 그러나, 소형 태그가 대형 태그만큼 제대로 작동하는 경우는 거의 없다.
이러한 문제는 과거에 캐리어 폴리펩티드에 융합된 원하는 폴리펩티드를 함유하는 융합 단백질을 생성함으로써 해결되었다. 세포에서 융합 단백질로서 원하는 폴리펩티드의 발현은 종종 파괴적인 효소로부터 원하는 폴리펩티드를 보호하고 융합 단백질이 높은 수율로 정제되도록 할 것이다. 이어서, 융합 단백질을 캐리어 폴리펩티드로부터 원하는 폴리펩티드를 절단하도록 처리하고 원하는 폴리펩티드를 단리한다.
미국 특허 번호 7572884에는 사카로마이세스 세레비지애(Saccharomyces cerevisiae)에서 리라글루티드의 전구체인 재조합 리라 펩티드(Lira-peptide)를 제조하는 방법이 개시되어 있다.
미국 특허 번호 7662913에는 불용성 융합 펩티드를 생성하는 데 사용되는 시스타틴 기반 펩티드 태그의 사용이 개시되어 있다.
미국 특허 번호 8796431에는 봉입체 파트너로서 케토-스테로이드 이소머라제(KSI)를 사용하여 GLP1을 포함하는 펩티드를 효율적으로 생성하는 방법 및 공정이 개시되어 있다.
WO 2003/100021 A1에는 프로모터, 번역 개시 서열, 봉입체 융합 파트너 및 이종 단백질에 작동적으로 연결된 절단 가능한 링커를 포함하는 이종 펩티드/단백질의 생성을 증가시키기 위한 발현 카세트가 개시되어 있다.
WO 2017/021819 A1에는 유비퀴틴 융합 구축물로서 원핵 세포에서 원하는 단백질 또는 펩티드를 코딩하는 합성 올리고뉴클레오티드의 발현에 의해 펩티드 또는 단백질 또는 이의 유도체를 제조하는 방법이 개시되어 있다.
IN 201741024763 A에는 효모 세포에서 신호 펩티드의 올리고뉴클레오티드 서열에 작동적으로 연결된 리라 펩티드를 코딩하는 합성 올리고뉴클레오티드의 발현에 의한 리라글루티드의 제조 방법이 개시되어 있다.
문헌(Yang Liu et al., Biotechnol Lett 36, 1675-1680 (2014))은 이. 콜리(E. coli)의 융합 접합부에서 엔테로키나제 절단 부위와 함께 23 kDa의 글루타티온 S-트랜스퍼라제(GST) 융합 태그를 사용하는 기능성 GLP-1 펩티드의 발현 및 정제 전략을 설명한다.
문헌(Zhao et al., Microb Cell Fact 15, 136 (2016))은 에쉐리키아 콜리(Escherichia coli)에서 GLP1을 포함한 중대형 크기의 펩티드의 절단 가능한 자가 응집 태그의 재조합 발현 및 인테인 매개된 절단을 연구한다.
문헌(Zhao et al., Microb Cell Fact 18, 91 (2019))은 재조합 효소 생성을 증강시키기 위해 발현 태그로서 자가 조립 양친매성 펩티드(SAP)의 사용을 연구한다.
문헌(Ki et al., Appl Microbiol Biotechnol. 2020 Mar;104(6):2411-2425)은 이. 콜리에서 이종 단백질의 발현을 증가시키는 융합 태그에 대한 자세한 검토를 제공한다.
글루카곤 유사 펩티드-1(GLP-1)은 프로글루카곤 펩티드의 조직 특이적 번역 후 처리로부터 유래된 31개 아미노산 길이의 펩티드 호르몬이다. 이는 음식 섭취 시 장의 장내분비 L 세포 및 뇌간의 고립로의 핵 내 특정 뉴런에 의해 생성되고 분비된다. 리라글루티드는 인슐린 분비를 자극하는 내인성 대사 호르몬 GLP-1과 동일한 수용체에 결합하는 장기간 작용하는 글루카곤 유사 펩티드-1 수용체 효능제로 사용되는 인간 인크레틴(대사 호르몬), 글루카곤 유사 펩티드-1(GLP-1)의 유도체이다. 따라서, 숙주에서 재조합 단백질의 발현을 증가시키기 위한 새로운 발현 전략이 필요하다. 본 발명의 발명자들은 재조합 치료 펩티드의 발현을 몇 배로 증강시키려는 노력의 일환으로 재조합 단백질의 고수율 생성을 가능하게 하는 발현 구축물을 제공하였다.
발명의 목적
본 발명의 주요 목적은 관심 단백질을 높은 수율로 생성하기 위한 발현 카세트를 제공하는 것이다.
본 발명의 또 다른 목적은 관심 단백질의 발현을 증가시키는 방법을 제공하는 것이다.
발명의 요약
본 발명은 리라 펩티드와 같은 생물학적 활성 펩티드의 발현 증가 및 효율적 생성을 위한 발현 구축물, 벡터 및 재조합 숙주 세포를 제공한다.
일 실시양태에서, 본 발명은
a)
서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;
b)
서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;
c)
절단 가능한 펩티드 링커를 코딩하는 폴리뉴클레오티드; 및
d)
관심 단백질을 코딩하는 폴리뉴클레오티드
를 포함하는 관심 단백질의 발현을 위한 발현 카세트를 제공하며,
발현 카세트의 상기 폴리뉴클레오티드 서열은 프로모터에 작동적으로 연결된다.
특정 실시양태에서, 본 발명은 융합 폴리펩티드를 수득하기 위해 관심 단백질의 아미노 말단에 융합된
a)
서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드;
b)
서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 갖는 발현 태그 폴리펩티드; 및
c)
절단 가능한 펩티드 링커
를 포함하는 융합 폴리펩티드를 제공한다.
본 발명은
a)
서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;
b)
서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;
c)
절단 가능한 링커를 코딩하는 폴리뉴클레오티드; 및
d)
서열번호 12에 제시된 아미노산 서열을 포함하는 리라 펩티드 또는 이의 기능적 변이체를 코딩하는 폴리뉴클레오티드
를 포함하는 리라 펩티드의 발현을 위한 발현 카세트를 제공하며,
발현 카세트의 상기 폴리뉴클레오티드 서열은 프로모터에 작동적으로 연결된다.
일 실시양태에서, 본 발명은 융합 폴리펩티드를 수득하기 위해 서열번호 12의 아미노산 서열을 포함하는 리라 펩티드 또는 이의 기능적 변이체의 아미노 말단에 융합된
a)
서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드;
b)
서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 갖는 발현 태그 폴리펩티드; 및
c)
절단 가능한 링커 펩티드
를 포함하는 융합 폴리펩티드를 제공한다.
본 발명의 일 실시양태에서, 관심 단백질의 발현 수준은 적어도 85% 증가된다.
도 1a: N-말단 발현 태그 융합이 없는 발현 카세트의 개략도
도 1b: T7 리더와 함께 N-말단 발현 태그(LP2 내지 LP10)를 갖는 발현 카세트의 개략도.
도 1c: T7 리더 없이 N-말단 발현 태그(LP2)를 갖는 발현 카세트의 개략도.
도 1d: T7 리더 없이 N-말단 발현 태그(LP8)를 갖는 발현 카세트의 개략도.
도 2a: 발현 벡터 LP1의 개략도(어떠한 N-말단 발현 태그도 없음)
도 2b: T7 리더 및 N-말단 발현 태그(LP-2)를 갖는 발현 벡터의 개략도.
도 2c: T7 리더는 없고 N-말단 발현 태그(LP-2)는 갖는 발현 벡터의 개략도.
도 2d: T7 리더 및 N-말단 발현 태그(LP-8)를 갖는 발현 벡터의 개략도.
도 2e: T7 리더는 없고 N-말단 발현 태그(LP-8)는 갖는 발현 벡터의 개략도.
도 3a: 리라 펩티드의 발현에 대해 시험된, 상이한 발현 태그 서열을 갖는 클론.
도 3b: 표는 각각의 카세트의 분자량 및 밀도계측 분석에 기초한 레인당 태그부착된 리라 펩티드의 백분율을 나타낸다.
도 4a: 발현 카세트에서 LP-2 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 상대적인 리라 펩티드 발현.
도 4b: 발현 카세트에서 LP-2 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 리라 펩티드 발현에 대한 밀도계측 분석.
도 4c: T7 리더가 없는 것과 비교된 T7 리더를 갖는 리라 펩티드(LP2)의 발현 증가 백분율.
도 5a: 발현 카세트에서 LP-8 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 상대적인 리라 펩티드 발현.
도 5b: 발현 카세트에서 LP-8 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 리라 펩티드 발현에 대한 밀도계측 분석.
도 5c: T7 리더가 없는 것과 비교된 T7 리더를 갖는 리라 펩티드(LP8)의 발현 증가 백분율.
도 6a: Ni-NTA 크로마토그래피를 이용한 N-말단 융합을 함유하는 리라 펩티드의 정제.
도 6b: 역상 크로마토그래피를 이용한 리라 펩티드의 정제.
도 7: 가용성 및 불용성 분획의 리라 펩티드 발현.
도 8: 테리파라티드 발현에 대해 시험된, 상이한 발현 태그 서열을 갖는 클론.
서열 목록 설명
서열번호 1 (T7 리더 서열)
서열번호 2 (발현 태그 LP-2의 아미노산)
서열번호 3 (발현 태그 LP-3의 아미노산 서열)
서열번호 4 (발현 태그 LP-4의 아미노산 서열)
서열번호 5 (발현 태그 LP-5의 아미노산 서열)
서열번호 6 (발현 태그 LP-6의 아미노산 서열)
서열번호 7 (발현 태그 LP-7의 아미노산 서열)
서열번호 8 (발현 태그 LP-8의 아미노산 서열)
서열번호 9 (발현 태그 LP-9의 아미노산 서열)
서열번호 10 (발현 태그 LP-10의 아미노산 서열)
서열번호 11 (TEV 절단 부위의 아미노산 서열)
서열번호 12 (리라 펩티드의 아미노산 서열)
서열번호 13 (발현 카세트 LP1) T7 리더 + 6XHis + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 14 (발현 카세트 LP2) T7 리더 + 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 15 (발현 카세트 LP3) T7 리더 + 6XHis + 발현 태그 LP3 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 16 (발현 카세트 LP4) T7 리더 + 6XHis + 발현 태그 LP4 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 17 (발현 카세트 LP5) T7 리더 + 6XHis + 발현 태그 LP5 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 18 (발현 카세트 LP6) T7 리더 + 6XHis + 발현 태그 LP6 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 19 (발현 카세트 LP7) T7 리더 + 6XHis + 발현 태그 LP7 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 20 (발현 카세트 LP8) T7 리더 + 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 21 (발현 카세트 LP9) T7 리더 + 6XHis + 발현 태그 LP9 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 22 (발현 카세트 LP10) T7 리더 + 6XHis + 발현 태그 LP10 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 23 (발현 카세트 LP11) T7 리더 + 6XArg + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 24 (T7 리더 없는 발현 카세트 LP2) 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 25 (T7 리더 없는 발현 카세트 LP8) 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 26 (서열번호 2를 코딩하는 핵산 서열 - 발현 태그 LP-2)
서열번호 27 (서열번호 3을 코딩하는 핵산 서열 - 발현 태그 LP-3)
서열번호 28 (서열번호 4를 코딩하는 핵산 서열 - 발현 태그 LP-4)
서열번호 29 (서열번호 5를 코딩하는 핵산 서열 - 발현 태그 LP-5)
서열번호 30 (서열번호 6을 코딩하는 핵산 서열 - 발현 태그 LP-6)
서열번호 31 (서열번호 7을 코딩하는 핵산 서열 - 발현 태그 LP-7)
서열번호 32 (서열번호 8을 코딩하는 핵산 서열 - 발현 태그 LP-8)
서열번호 33 (서열번호 9를 코딩하는 핵산 서열 - 발현 태그 LP-9)
서열번호 34 (서열번호 10을 코딩하는 핵산 서열 - 발현 태그 LP-10)
서열번호 35 (서열번호 13을 코딩하는 발현 카세트 - LP1 핵산 서열은 T7 리더 + 6XHis + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 36 (서열번호 14를 코딩하는 발현 카세트 - LP2 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 37 (서열번호 15를 코딩하는 발현 카세트 - LP3 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP3 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 38 (서열번호 16을 코딩하는 발현 카세트 - LP4 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP4 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 39 (서열번호 17을 코딩하는 발현 카세트 - LP5 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP5 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 40 (서열번호 18을 코딩하는 발현 카세트 - LP6 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP6 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 41 (서열번호 19를 코딩하는 발현 카세트 - LP7 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP7 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 42 (서열번호 20을 코딩하는 발현 카세트 - LP8 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 43 (서열번호 21을 코딩하는 발현 카세트 - LP9 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP9 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 44 (서열번호 22를 코딩하는 발현 카세트 - LP10 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP10 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 45 (서열번호 23을 코딩하는 발현 카세트 - LP11 핵산 서열은 T7 리더 + 6XArg + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 46 (서열번호 24를 코딩하는 발현 카세트 - T7 리더 핵산 서열이 없는 LP2는 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 47 (서열번호 25를 코딩하는 발현 카세트 - T7 리더 핵산 서열이 없는 LP8은 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 48 (리라 펩티드를 코딩하는 코돈 최적화된 핵산 서열)
서열번호 49 (테리파라티드의 아미노산 서열)
서열번호 50 (테리파라티드를 코딩하는 코돈 최적화된 핵산 서열)
도 1b: T7 리더와 함께 N-말단 발현 태그(LP2 내지 LP10)를 갖는 발현 카세트의 개략도.
도 1c: T7 리더 없이 N-말단 발현 태그(LP2)를 갖는 발현 카세트의 개략도.
도 1d: T7 리더 없이 N-말단 발현 태그(LP8)를 갖는 발현 카세트의 개략도.
도 2a: 발현 벡터 LP1의 개략도(어떠한 N-말단 발현 태그도 없음)
도 2b: T7 리더 및 N-말단 발현 태그(LP-2)를 갖는 발현 벡터의 개략도.
도 2c: T7 리더는 없고 N-말단 발현 태그(LP-2)는 갖는 발현 벡터의 개략도.
도 2d: T7 리더 및 N-말단 발현 태그(LP-8)를 갖는 발현 벡터의 개략도.
도 2e: T7 리더는 없고 N-말단 발현 태그(LP-8)는 갖는 발현 벡터의 개략도.
도 3a: 리라 펩티드의 발현에 대해 시험된, 상이한 발현 태그 서열을 갖는 클론.
도 3b: 표는 각각의 카세트의 분자량 및 밀도계측 분석에 기초한 레인당 태그부착된 리라 펩티드의 백분율을 나타낸다.
도 4a: 발현 카세트에서 LP-2 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 상대적인 리라 펩티드 발현.
도 4b: 발현 카세트에서 LP-2 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 리라 펩티드 발현에 대한 밀도계측 분석.
도 4c: T7 리더가 없는 것과 비교된 T7 리더를 갖는 리라 펩티드(LP2)의 발현 증가 백분율.
도 5a: 발현 카세트에서 LP-8 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 상대적인 리라 펩티드 발현.
도 5b: 발현 카세트에서 LP-8 발현 태그와 함께 T7 리더 서열의 존재 및 부재 하에서의 리라 펩티드 발현에 대한 밀도계측 분석.
도 5c: T7 리더가 없는 것과 비교된 T7 리더를 갖는 리라 펩티드(LP8)의 발현 증가 백분율.
도 6a: Ni-NTA 크로마토그래피를 이용한 N-말단 융합을 함유하는 리라 펩티드의 정제.
도 6b: 역상 크로마토그래피를 이용한 리라 펩티드의 정제.
도 7: 가용성 및 불용성 분획의 리라 펩티드 발현.
도 8: 테리파라티드 발현에 대해 시험된, 상이한 발현 태그 서열을 갖는 클론.
서열 목록 설명
서열번호 1 (T7 리더 서열)
서열번호 2 (발현 태그 LP-2의 아미노산)
서열번호 3 (발현 태그 LP-3의 아미노산 서열)
서열번호 4 (발현 태그 LP-4의 아미노산 서열)
서열번호 5 (발현 태그 LP-5의 아미노산 서열)
서열번호 6 (발현 태그 LP-6의 아미노산 서열)
서열번호 7 (발현 태그 LP-7의 아미노산 서열)
서열번호 8 (발현 태그 LP-8의 아미노산 서열)
서열번호 9 (발현 태그 LP-9의 아미노산 서열)
서열번호 10 (발현 태그 LP-10의 아미노산 서열)
서열번호 11 (TEV 절단 부위의 아미노산 서열)
서열번호 12 (리라 펩티드의 아미노산 서열)
서열번호 13 (발현 카세트 LP1) T7 리더 + 6XHis + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 14 (발현 카세트 LP2) T7 리더 + 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 15 (발현 카세트 LP3) T7 리더 + 6XHis + 발현 태그 LP3 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 16 (발현 카세트 LP4) T7 리더 + 6XHis + 발현 태그 LP4 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 17 (발현 카세트 LP5) T7 리더 + 6XHis + 발현 태그 LP5 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 18 (발현 카세트 LP6) T7 리더 + 6XHis + 발현 태그 LP6 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 19 (발현 카세트 LP7) T7 리더 + 6XHis + 발현 태그 LP7 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 20 (발현 카세트 LP8) T7 리더 + 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 21 (발현 카세트 LP9) T7 리더 + 6XHis + 발현 태그 LP9 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 22 (발현 카세트 LP10) T7 리더 + 6XHis + 발현 태그 LP10 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 23 (발현 카세트 LP11) T7 리더 + 6XArg + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 24 (T7 리더 없는 발현 카세트 LP2) 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 25 (T7 리더 없는 발현 카세트 LP8) 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 26 (서열번호 2를 코딩하는 핵산 서열 - 발현 태그 LP-2)
서열번호 27 (서열번호 3을 코딩하는 핵산 서열 - 발현 태그 LP-3)
서열번호 28 (서열번호 4를 코딩하는 핵산 서열 - 발현 태그 LP-4)
서열번호 29 (서열번호 5를 코딩하는 핵산 서열 - 발현 태그 LP-5)
서열번호 30 (서열번호 6을 코딩하는 핵산 서열 - 발현 태그 LP-6)
서열번호 31 (서열번호 7을 코딩하는 핵산 서열 - 발현 태그 LP-7)
서열번호 32 (서열번호 8을 코딩하는 핵산 서열 - 발현 태그 LP-8)
서열번호 33 (서열번호 9를 코딩하는 핵산 서열 - 발현 태그 LP-9)
서열번호 34 (서열번호 10을 코딩하는 핵산 서열 - 발현 태그 LP-10)
서열번호 35 (서열번호 13을 코딩하는 발현 카세트 - LP1 핵산 서열은 T7 리더 + 6XHis + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 36 (서열번호 14를 코딩하는 발현 카세트 - LP2 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 37 (서열번호 15를 코딩하는 발현 카세트 - LP3 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP3 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 38 (서열번호 16을 코딩하는 발현 카세트 - LP4 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP4 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 39 (서열번호 17을 코딩하는 발현 카세트 - LP5 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP5 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 40 (서열번호 18을 코딩하는 발현 카세트 - LP6 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP6 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 41 (서열번호 19를 코딩하는 발현 카세트 - LP7 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP7 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 42 (서열번호 20을 코딩하는 발현 카세트 - LP8 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 43 (서열번호 21을 코딩하는 발현 카세트 - LP9 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP9 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 44 (서열번호 22를 코딩하는 발현 카세트 - LP10 핵산 서열은 T7 리더 + 6XHis + 발현 태그 LP10 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 45 (서열번호 23을 코딩하는 발현 카세트 - LP11 핵산 서열은 T7 리더 + 6XArg + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 46 (서열번호 24를 코딩하는 발현 카세트 - T7 리더 핵산 서열이 없는 LP2는 6XHis + 발현 태그 LP2 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 47 (서열번호 25를 코딩하는 발현 카세트 - T7 리더 핵산 서열이 없는 LP8은 6XHis + 발현 태그 LP8 + TEV 인식 부위 + 리라 펩티드로 이루어짐)
서열번호 48 (리라 펩티드를 코딩하는 코돈 최적화된 핵산 서열)
서열번호 49 (테리파라티드의 아미노산 서열)
서열번호 50 (테리파라티드를 코딩하는 코돈 최적화된 핵산 서열)
정의
다르게 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 방법이 속하는 기술 분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본원에 기재된 것과 유사하거나 등가인 임의의 벡터, 숙주 세포, 방법 및 조성물이 또한 벡터, 숙주 세포, 방법 및 조성물의 실시 또는 시험에 사용될 수 있지만, 대표적인 예시가 이제 기술된다.
값의 범위가 제공되는 경우, 그 범위의 상한과 하한 사이의 각각의 개재하는 값 및 그 언급된 범위 내의 임의의 다른 언급된 또는 개재하는 값이 방법 및 조성물에 의해 그 내에 포괄되는 것으로 이해된다. 이러한 더 작은 범위의 상한 및 하한은 독립적으로 더 작은 범위에 포함될 수 있고, 또한 언급된 범위에서 구체적으로 배제된 임의의 한계에 따라 방법 및 조성물에 의해 그 내에 포괄된다. 언급된 범위에 한계 중 하나 또는 둘 모두가 포함되는 경우, 포함된 한계 중 하나 또는 둘 모두를 제외하는 범위도 방법 및 조성물에 포함된다.
명확성을 위해 별도의 실시양태의 맥락에서 기재된 방법의 특정 특색이 단일 실시양태에서 조합되어 제공될 수도 있다는 것이 이해된다. 반대로, 간략화를 위해 단일 실시양태의 맥락에서 기재된 방법 및 조성물의 다양한 특색이 별도로 또는 임의의 적합한 하위 조합으로 제공될 수도 있다. 본원 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태는 문맥에서 명백하게 달리 나타내지 않는 한 복수의 지시대상을 포함한다는 점에 유의한다. 임의의 선택적인 요소를 배제하기 위해 청구범위가 작성될 수 있다는 점도 추가로 언급된다. 따라서, 이 진술은 청구 요소의 인용 또는 "부정적" 제한의 사용과 관련하여 "유일하게", "오직" 등과 같은 독점적인 용어를 사용하기 위한 선행 근거로 사용하기 위한 것이다.
본 개시내용을 읽을 때 당업자에게 명백한 바와 같이, 본원에 기재되고 예시된 개별 실시양태 각각은 본 방법의 범위 또는 취지를 벗어나지 않으면서 임의의 다른 실시양태의 특색으로부터 쉽게 분리되거나 특색과 조합될 수 있는 별개의 성분 및 특색을 갖는다. 임의의 인용된 방법은 인용된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.
용어 "숙주 세포"는 발현 구축물의 대상에 대한 수용자일 수 있거나 수용자였던 개별 세포 또는 세포 배양물을 포함한다. 숙주 세포는 단일 숙주 세포의 자손을 포함한다. 바람직한 숙주 세포는 온혈 유기체의 하부 장에서 흔히 발견되는 에쉐리키아 속의 그람 음성, 통성 혐기성, 막대 모양의 대장균 박테리아인, 이. 콜리로도 알려진 에쉐리키아 콜리 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 및 바실루스 서브틸리스(Bacillus subtilis)이다.
용어 "재조합 균주" 또는 "재조합 숙주 세포"는 본 발명의 발현 구축물 또는 벡터로 형질감염되거나 형질전환된 숙주 세포를 지칭한다.
용어 "발현"은 코딩 서열에 의해 코딩된 생성물의 생물학적 생성을 지칭한다. 대부분의 경우, 코딩 서열을 포함한 DNA 서열은 전사되어 메신저 RNA(mRNA)를 형성한다. 이어서, 메신저 RNA는 번역되어 관련된 생물학적 활성을 갖는 폴리펩티드 생성물을 형성한다. 또한, 발현 과정은 인트론을 제거하기 위한 스플라이싱 및/또는 폴리펩티드 생성물의 번역 후 처리와 같은 RNA 전사 생성물에 대한 추가 처리 단계를 포함할 수 있다.
용어 "발현 벡터" 또는 "발현 구축물"은 숙주로의 형질전환 후 삽입된 핵산 서열의 발현을 가능하게 하도록 설계된 임의의 벡터, 플라스미드 또는 비히클을 지칭한다.
용어 "카세트" 또는 "발현 카세트"는 특정 제한 부위에서 핵산 또는 폴리뉴클레오티드에 삽입될 수 있는 DNA 세그먼트를 지칭한다. DNA 세그먼트는 관심 단백질을 코딩하는 폴리뉴클레오티드를 포함한다. "카세트" 또는 "발현 카세트"는 또한 숙주 세포에서 관심 단백질을 코딩하는 폴리뉴클레오티드의 증강된 발현을 허용하는 요소를 포함할 수 있다. 이러한 요소는 프로모터, 인핸서, 반응 요소, 터미네이터 서열, 폴리아데닐화 서열 등이 포함할 수 있으나 이에 제한되지 않는다.
용어 "프로모터"는 유전자의 전사가 시작되는 위치를 정의하는 DNA 서열을 지칭한다. 프로모터 서열은 전형적으로 전사 개시 부위의 직접 상류 또는 5' 말단에 위치된다. RNA 폴리머라제 및 필요한 전사 인자는 프로모터 서열에 결합하여 전사를 개시한다. 프로모터는 구성적 프로모터 또는 유도성 프로모터일 수 있다. 구성적 프로모터는 발현이 일반적으로 환경 및 발달 요인에 의해 조절되지 않기 때문에 관련된 유전자의 지속적인 전사를 허용하는 프로모터이다. 구성적 프로모터는 유도제가 없는 조건에서 유전자 발현을 유도하고 종종 일반적으로 사용되는 유도성 프로모터보다 더 나은 특징을 나타내기 때문에 유전공학에서 매우 유용한 도구이다. 유도성 프로모터는 생물적 또는 비생물적 요인 및 화학적 또는 물리적 요인의 존재 또는 부재에 의해 유도되는 프로모터이다. 유도성 프로모터는 이에 작동적으로 연결된 유전자의 발현이 유기체의 특정 발달 또는 성장 단계 또는 특정 조직 또는 세포에서 켜지거나 꺼질 수 있기 때문에 유전 공학에서 매우 강력한 도구이다.
용어 "작동적으로 연결된"은 하나의 기능이 다른 것에 의해 영향을 받도록 단일 핵산 단편 상의 핵산 서열의 회합을 지칭한다. 예컨대, 프로모터는 코딩 서열의 발현에 영향을 미칠 수 있는 경우(즉, 코딩 서열이 프로모터의 전사 제어 하에 있는 경우) 코딩 서열과 작동적으로 연결된다.
본원에 사용된 용어 "발현 태그"는 관심 단백질에 부착될 수 있고 관심 재조합 단백질의 용해도, 안정성 및/또는 발현을 지원하는 것으로 추정되는 임의의 펩티드 또는 폴리펩티드를 지칭한다.
"절단 가능한 링커 펩티드"는 절단 인식 서열을 갖는 펩티드 서열을 지칭한다. 절단 가능한 펩티드 링커는 효소적 또는 화학적 절단제에 의해 절단될 수 있다.
용어 "폴리펩티드", "펩티드" 및 "단백질"은 펩티드 결합 또는 변형된 펩티드 결합에 의해 서로 연결된 2개 이상의 아미노산 잔기를 지칭하기 위해 본원에서 상호교환적으로 사용된다. 이 용어는 하나 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학적 모방체인 아미노산 중합체 뿐만 아니라 자연 발생 아미노산 중합체, 변형된 잔기를 함유하는 아미노산 중합체 및 비-자연 발생 아미노산 중합체에도 적용된다. "폴리펩티드"는 일반적으로 펩티드, 올리고펩티드 또는 올리고머로 지칭되는 단쇄 및 일반적으로 단백질로 지칭되는 장쇄를 모두 지칭한다. 폴리펩티드는 20개 유전자 코딩된 아미노산 이외의 아미노산을 함유할 수 있다. 마찬가지로, "단백질"은 단백질, 폴리펩티드, 올리고펩티드 및 펩티드를 포함하는 적어도 2개의 공유적으로 부착된 아미노산을 지칭한다. 단백질은 자연 발생 아미노산 및 펩티드 결합 또는 합성 펩티드모방 구조로 구성될 수 있다. 따라서, 본원에 사용된 "아미노산" 또는 "펩티드 잔기"는 자연 발생 아미노산 및 합성 아미노산 모두를 의미한다. "아미노산"은 프롤린 및 히드록시프롤린과 같은 이미노산 잔기를 포함한다. 측쇄는 (R) 또는 (S) 구성일 수 있다.
발명의 상세한 설명
본 발명은 리라 펩티드와 같은 생물학적 활성 펩티드의 발현 증가 및 효율적 생성을 위한 발현 구축물, 벡터 및 재조합 숙주 세포를 제공한다.
본 발명에 따라 생성된 펩티드는 짧은 융합 태그를 사용하기 때문에 선행 기술 공정에 따라 생성된 펩티드보다 더 효율적으로 생성될 수 있다. 현재 방법은 융합 단백질의 발현을 위해 원하는 관심 펩티드의 잠재적 수율을 감소시키는 대형 융합 태그를 사용한다. 이는 원하는 펩티드가 31개 아미노산인 리라 펩티드와 같이 소형인 상황에서 특히 문제가 된다. 이러한 상황에서는 수율을 최대화하기 위해 가능한 가장 작은 융합 태그를 사용하는 것이 유리하다.
본 발명은 관심 단백질을 코딩하는 핵산이 N-말단에서 T7 리더 펩티드 및 발현 태그에 작동적으로 융합된 발현 구축물을 제공함으로써 숙주 세포에서 관심 단백질의 높은 수율을 달성하기 위한 다차원적 접근법을 고려한다.
일 실시양태에서, 발현 카세트는 관심 단백질을 코딩하는 핵산을 포함한다.
중요한 실시양태에서, 발현 카세트는 또한 관심 단백질의 N-말단에 융합된 T7 리더 펩티드, 발현 태그 및 절단 가능한 링커를 포함하는 융합 폴리펩티드를 코딩할 수 있다.
일 실시양태에서, 발현 카세트는 또한 관심 단백질의 N-말단에 융합된 T7 리더 펩티드, 폴리히스티딘 태그, 발현 태그 및 절단 가능한 링커를 포함하는 융합 폴리펩티드를 코딩할 수 있다.
관심 단백질은 바람직하게는 생체활성 폴리펩티드이다. 더욱 바람직하게는, 이는 인간 또는 동물의 질환을 치료하는 데 유용한 치료 단백질을 포함한다.
본 발명의 일 실시양태에서, 관심 단백질의 발현 수준은 적어도 85% 증가한다.
또 다른 실시양태에서, 관심 단백질은 100개 미만의 아미노산인 치료 펩티드를 포함한다. 바람직한 실시양태에서, 관심 펩티드는 리라 펩티드, 테리파라티드, 엑세나티드, 릭시세나티드, 테두글루티드, 및 세마글루티드와 같으나 이에 제한되지 않는 펩티드를 포함한다.
발현 태그는 관심 단백질에 부착될 수 있고 관심 재조합 단백질의 용해도, 안정성 및/또는 발현을 지원하는 것으로 추정되는 임의의 펩티드 또는 폴리펩티드를 지칭한다.
추가 실시양태에서, 발현 카세트는 서열번호 2-10에 제시된 아미노산 서열을 갖는 발현 태그를 코딩하는 핵산 서열을 포함한다.
바람직한 실시양태에서, 발현 카세트는 서열번호 2(LP-2) 또는 서열번호 8(LP-8)에 제시된 아미노산 서열을 포함한다.
또 다른 실시양태에서, 핵산 서열은 코돈 최적화로 알려진 희귀 코돈 대신 숙주 세포에서의 발현을 위한 바람직한 코돈을 함유한다. 본원에 사용된 용어 "코돈 최적화된"은 핵산 분자의 유전자 또는 코딩 영역의 코돈이 숙주 유기체와 관련하여 바람직한 코돈으로 변경되는 것을 지칭한다.
특정 실시양태에서, 핵산은 "코돈 축퇴성"을 나타낼 수 있다. "코돈 축퇴성"은 구조적으로 상이한 뉴클레오티드와 동일한 기능을 수행하거나 동일한 결과를 산출할 수 있는 뉴클레오티드를 지칭한다.
한 실시양태에서, 코돈 최적화된 발현 태그는 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 및 서열번호 34에 제시된 뉴클레오티드 서열을 포함한다.
한 실시양태에서, 코돈 최적화 발현 카세트는 발현 태그를 코딩하는 핵산, HIS 태그, TEV 인식 부위 및 리라 펩티드를 코딩하는 핵산을 포함한다. 코돈 최적화된 발현 카세트는 서열번호 35, 서열번호 36, 서열번호 37, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45 및 서열번호 46에 제시된 뉴클레오티드 서열을 포함한다.
일 실시양태에서, 발현 카세트는 절단 가능한 링커 펩티드를 코딩하는 뉴클레오티드를 포함한다. 바람직하게는, 발현 카세트는 세린 프로테아제, 아스파르트산 프로테아제, 시스테인 프로테아제 또는 메탈로프로테아제로 절단 가능한 절단 가능한 링커 펩티드를 코딩한다.
바람직한 실시양태에서, 발현 카세트는 서열번호 11에 제시된 아미노산 서열을 갖는 변형된 TEV 프로테아제 절단 부위를 코딩한다.
일 실시양태에서, 본 발명은
a)
서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;
b)
서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;
c)
절단 가능한 펩티드 링커를 코딩하는 폴리뉴클레오티드; 및
d)
관심 단백질을 코딩하는 폴리뉴클레오티드
의 작동적으로 연결된 핵산 서열을 포함하는 관심 단백질의 고수준 발현을 위한 발현 카세트를 제공하며,
발현 카세트의 상기 폴리뉴클레오티드 서열은 프로모터에 작동적으로 연결된다.
또 다른 실시양태에서, 본 발명은
a)
서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;
b)
서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;
c)
절단 가능한 링커를 코딩하는 폴리뉴클레오티드; 및
d)
서열번호 12에 제시된 아미노산 서열을 포함하는 리라 펩티드 또는 이의 기능적 변이체를 코딩하는 폴리뉴클레오티드
의 작동적으로 연결된 핵산 서열을 포함하는 리라 펩티드의 발현을 위한 발현 카세트를 제공한다.
본 발명의 발현 카세트는 프로모터를 포함한다. 프로모터는 구성적 프로모터 또는 유도성 프로모터일 수 있다. 당업자에게 알려진 구성적 또는 유도성 프로모터가 본 발명의 하나 이상의 실시양태에서 발현 카세트에 사용될 수 있다.
일 실시양태에서, 본 발명은 관심 단백질을 발현하기 위한 발현 벡터를 제공하며, 발현 벡터는 상기 기재된 발현 카세트의 적어도 하나의 카피를 포함한다.
발현 벡터는 발현 카세트의 발현을 조절하기 위한 조절 서열, 전사 종결 서열, 선별 마커, 및 다중 클로닝 부위를 추가로 포함할 수 있다. 벡터는 또한 코딩된 폴리펩티드의 직접 수송을 위한 신호 서열을 추가로 포함할 수 있다.
일 실시양태에서, 본 발명에 적합한 벡터는 pD451.SR, pD431.SR, pET28, pET36, pGEX, pBAD, pQE9, pRSET 등을 포함하지만 이에 제한되지 않는다.
일 실시양태에서, 본 발명은 상기 기재된 발현 벡터를 포함하는 재조합 숙주를 제공한다. 적합한 숙주 세포는 이. 콜리, 코리네박테리움 글루타미쿰 및 바실루스 서브틸리스를 포함하지만 이에 제한되지 않는다. 바람직한 실시양태에서, 이. 콜리가 재조합 숙주로 사용된다.
일 실시양태에서, 재조합 숙주 세포는 이. 콜리이고, 이는 BL21(DE3), BL21 Al, HMS174(DE3), DH5ct, W31 10, B834, 오리가미, 로제타, 노바블루(DE3), Lemo21(DE3), T7, ER2566 및 C43(DE3)으로부터 선택되는 균주를 포함한다.
일 실시양태에서, 본 발명의 발현 벡터는 융합 펩티드를 생성하기 위해 재조합 벡터에서 발현된다.
일 실시양태에서, 본 발명은 융합 폴리펩티드를 수득하기 위해 관심 단백질의 아미노 말단에 융합된
a)
서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드;
b)
서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 갖는 발현 태그 폴리펩티드; 및
c)
절단 가능한 펩티드 링커
를 포함하는 융합 폴리펩티드를 제공한다.
일 실시양태에서, 본 발명은 융합 폴리펩티드를 수득하기 위해 서열번호 12의 아미노산 서열을 포함하는 리라 펩티드 또는 이의 기능적 변이체의 아미노 말단에 융합된
a)
서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드;
b)
서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 갖는 발현 태그 폴리펩티드; 및
c)
절단 가능한 링커 펩티드
를 포함하는 융합 폴리펩티드를 제공한다.
한 실시양태에서, 본 발명은 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21, 및 서열번호 22에 제시된 융합 폴리펩티드를 제공한다.
본 발명은 또한 절단 가능한 링커에서 융합 단백질을 절단함으로써 수득되는 관심 단백질의 생성을 증가시키는 방법을 제공한다.
일 실시양태에서, 본 발명은 또한 관심 단백질을 생성하는 방법을 제공하며, 상기 방법은
a) 발현 구축물을 구축하는 단계로서, 발현 구축물은
i. 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;
ii. 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;
iii. 절단 가능한 펩티드 링커를 코딩하는 폴리뉴클레오티드; 및
iv. 관심 단백질을 코딩하는 폴리뉴클레오티드
를 포함하는 단계;
b) 발현 구축물을 발현 벡터에 삽입하는 단계;
c) 재조합 숙주를 발현 벡터로 형질전환시키는 단계;
d) 재조합 숙주를 융합 단백질을 발현하기 위한 최적 조건 하에서 성장시키는 단계로서, 융합 단백질은 관심 단백질의 N-말단에 융합된 T7 리더 폴리펩티드, 발현 태그, 및 절단 가능한 펩티드 링커를 포함하는 단계;
e) 융합 단백질을 세포로부터 단리하는 단계; 및
f) 융합 단백질을 절단 가능한 링커 펩티드에서 절단하여 관심 단백질을 수득하는 단계
를 포함한다.
일 실시양태에서, 본 발명은 또한 리라 펩티드를 생성하는 방법을 제공하며, 상기 방법은
a) 발현 구축물을 구축하는 단계로서, 발현 구축물은
i. 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;
ii. 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;
iii. 절단 가능한 펩티드 링커를 코딩하는 폴리뉴클레오티드; 및
iv. 서열번호 12의 아미노산 서열을 포함하는 리라 펩티드 또는 이의 기능적 변이체를 코딩하는 폴리뉴클레오티드
를 포함하는 단계;
b) 발현 구축물을 발현 벡터에 삽입하는 단계;
c) 재조합 숙주를 발현 벡터로 형질전환시키는 단계;
d) 재조합 숙주를 융합 단백질을 발현하기 위한 최적 조건 하에서 성장시키는 단계로서, 융합 단백질은 리라 단백질의 N-말단에 융합된 T7 리더 폴리펩티드, 발현 태그, 및 절단 가능한 펩티드 링커를 포함하는 단계;
e) 융합 단백질을 세포로부터 단리하는 단계; 및
f) 융합 단백질을 절단 가능한 링커 펩티드에서 절단하여 리라 펩티드를 수득하는 단계
를 포함한다.
인간 GLP-1의 유사체인 리라글루티드는 GLP-1 수용체 효능제로서 역할을 한다. 리라글루티드는 펩티드 전구체(서열번호 12에 제시된 리라 펩티드)의 위치 26에 남아있는 리신 잔기에 글루탐산 스페이서로 C-16 지방산(팔미트산)을 부착함으로써 만들어진다.
또 다른 실시양태에서, 본 발명은 리라 펩티드를 생성하는 방법을 제공하며, 상기 방법은
a) 재조합 벡터(발현 구축물)의 구축 단계,
b) 발현 구축물의 에쉐리키아 콜리로의 형질전환 단계,
c) 펩티드 발현을 위한 클론의 평가 단계,
d) 태그부착된 리라 펩티드의 정제 단계,
e) N-말단 융합 태그의 절단 및 리라 펩티드의 정제 단계
를 포함한다.
본원에 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당업계에 잘 알려져 있으며, 문헌(Sambrook, J., Fritsch, E. F. and Maniatis, T., Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2001))에 기재되어 있다.
상기 개시내용은 일반적으로 본 발명을 설명한다. 하기의 구체적인 실시예를 참조하면 보다 완전한 이해를 얻을 수 있다. 이 실시예는 예시의 목적으로만 기재되었으며, 본 발명의 범위를 제한하려는 의도가 아니다. 본원에 특정한 용어가 사용되었으나, 이러한 용어는 설명적인 의미로 사용된 것이지 제한하려는 목적으로 사용된 것은 아니다.
본 발명의 상이한 실시양태는 하기 실시예를 통해 추가로 정의된다. 하기 실시예는 본 발명을 예시하기 위한 것이며 어떠한 방식으로든 본 발명의 범위를 제한하려는 의도는 아니다.
실시예:
실시예 1: 리라 펩티드 발현 플라스미드 구축
N-말단 융합(도 1a, 1b, 1c, 1d) 및 (서열번호 13 내지 23)의 조합을 갖는 리라 펩티드를 코딩하는 DNA를 이. 콜리에 대해 코돈 최적화하고 합성하였다.
이. 콜리 발현 플라스미드 pD451.SR은 선형화된 형태(SapI 분해됨)로 ATUM에서 구입하였다. 상이한 N-말단 융합과 조합된 리라 펩티드의 합성된 DNA를 SapI 제한 효소로 분해하였다. 제한 분해된 단편을 pD451.SR 선형 플라스미드와 리게이션하고, 이. 콜리 균주로 형질전환시켰다. 리라 펩티드 발현 카세트를 함유하는 생성된 플라스미드(도 2a, 2b, 2c, 2d 및 2e)는 뉴클레오티드 시퀀싱으로 확인되었다.
코돈 최적화된 발현 태그는 서열번호 26, 서열번호 27, 서열번호 28, 서열번호 29, 서열번호 30, 서열번호 31, 서열번호 32, 서열번호 33, 및 서열번호 34에 제시된 뉴클레오티드 서열을 포함한다.
코돈 최적화된 발현 카세트는 발현 태그를 코딩하는 핵산, HIS 태그, TEV 인식 부위 및 리라 펩티드를 코딩하는 핵산을 포함한다. 코돈 최적화된 발현 카세트는 서열번호 35, 서열번호 36, 서열번호 37, 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45, 서열번호 46 및 서열번호 47에 제시된 뉴클레오티드 서열을 포함한다.
실시예 2: 이. 콜리의 형질전환 및 펩티드 발현
카세트 LP1 내지 LP11을 함유하는 서열 확인된 플라스미드 DNA를 염화칼슘 열 충격 형질전환 방법을 통해 이. 콜리 BL21(DE3)에 형질전환시킨 후, 50 μg/ml 카나마이신 항생제를 함유하는 LB 한천에 도말하였다. 형질전환된 이. 콜리 세포를 50 μg/ml 카나마이신을 함유한 5 ml LB 배지에서 37℃의 진탕 인큐베이터에서 밤새 배양한 후, 새로운 배지로 1:100 비율로 희석하여 OD가 ~0.6에 도달할 때까지 성장시켰다.
이어서, IPTG를 1 mM의 최종 농도로 되도록 첨가하고, 진탕 인큐베이터에서 37℃에서 4시간 동안 인큐베이션하였다. 배양된 세포 OD는 펩티드 발현 분석을 위해 SDS-PAGE 겔에 로딩하기 전에 정규화되었다(도 3a). LP1(서열번호 35), LP3(서열번호 37), LP11(서열번호 45)을 제외한 모든 카세트의 겔에서 리라 펩티드의 발현이 관찰되었다.
각각의 레인의 총 단백질 중 리라 펩티드 밴드 밀도를 정량화하기 위해 GE로부터의 이미지-퀀트(Image-Quant) 800 겔 문서화 시스템 및 이의 소프트웨어를 사용하여 겔에 대해 밀도계측 분석을 실시하였다.
클론의 선택은 발현 태그의 가장 작은 크기 및 리라 펩티드 수율이 더 높을 것으로 예상되는 겔 상의 리라 펩티드 밴드의 더 높은 밀도에 근거하였다.
발현 태그가 없는 리라 펩티드는 겔에서 어떠한 발현도 나타내지 않는 것으로 확인되었으며, 이는 발현 태그가 발현에 필수적임을 나타낸다. LP2 및 LP8 클론은 발현 태그 크기가 비교적 작고 리라 펩티드 밴드 밀도가 더 높기 때문에 추가 분석을 위해 선택되었다(도 3b).
LP2 및 LP8 클론에서 리라 펩티드 발현에 대한 T7 리더와 발현 태그 사이에 시너지 효과가 있는지를 확인하기 위해, 본 발명자들은 T7 리더가 없는 LP2 및 LP8 카세트(서열번호 24 및 25)를 구축하고 평가하였다(도 2c & 2e).
T7 리더를 갖는 LP2 및 LP8의 펩티드 발현은 T7 리더가 없는 LP2 및 LP8보다 적어도 85% 더 높은 것으로 확인되었다(도 4a, b, c & 5a, b, c).
실시예 3: N-말단 융합을 함유하는 리라 펩티드의 정제
음파 절차를 이용하여 세포를 용해시키고 이어 용해물을 원심분리한 후, 불용성 펠릿을 8M 우레아에 용해시켰다.
샘플을 Ni-NTA 매트릭스에 로딩하였다. His 태그부착된 단백질은 결합하고 다른 단백질은 매트릭스를 통과한다. 세척 후, His 태그부착된 펩티드를 단계 구배를 갖는 이미다졸을 사용하여 용출하여 펩티드를 불순물로부터 분리하였다(도 6a).
실시예 4: N-말단 융합 태그의 제거 및 리라 펩티드의 정제
정제된 태그부착된 리라 펩티드를 TEV 프로테아제에 적용하여 N-말단 융합 태그를 절단하였다. 이어서, 샘플을 역상 컬럼 크로마토그래피에 로딩하여 리라 펩티드를 정제하였다(도 6b). 정제된 리라 펩티드 아미노산 서열 및 온전한 매쓰을 LC/MS를 사용하여 확인하였다.
실시예 5: 테리파라티드의 발현
T7 리더 펩티드, 폴리히스티딘 태그, 발현 태그(서열번호 26-34) 및 변형된 TEV 절단 가능한 링커를 포함하는 N-말단 융합의 조합과 서열번호 49의 아미노산 서열을 갖는 테리파라티드를 코딩하는 DNA를 이. 콜리에 대해 코돈 최적화하고 합성하였다. 서열번호 26-34의 발현 태그를 포함하는 발현 구축물을 TP2-TP10으로 명명한다. 발현 구축물 TP1은 어떠한 발현 태그도 함유하지 않으며, 발현 구축물 TP11은 T7 리더 + 6XArg + TEV 인식 부위 + 테리파라티드를 포함한다.
이. 콜리 발현 플라스미드 pD451.SR은 선형화된 형태(SapI 분해됨)로 ATUM에서 구입하였다. 상이한 N-말단 융합과 조합된 테리파라티드의 합성된 DNA를 SapI 제한 효소로 분해하였다. 제한 분해된 단편을 pD451.SR 선형 플라스미드와 리게이션하고, 이. 콜리 균주로 형질전환시켰다. 테리파라티드 발현 카세트를 함유하는 생성된 플라스미드는 뉴클레오티드 시퀀싱에 의해 확인되었다.
카세트 TP1 내지 TP11을 함유하는 서열 확인된 플라스미드 DNA를 염화칼슘 열 충격 형질전환 방법을 통해 이. 콜리 BL21(DE3)에 형질전환시킨 후, 50 μg/ml 카나마이신 항생제를 함유하는 LB 한천에 플레이팅하였다. 형질전환된 이. 콜리 세포를 50 μg/ml 카나마이신을 함유한 5 ml LB 배지에서 37℃의 진탕 인큐베이터에서 밤새 배양한 후, 새로운 배지로 1:100 비율로 희석하고 OD가 ~0.6에 도달할 때까지 성장시켰다.
이어서, IPTG를 1 mM의 최종 농도로 첨가하고, 진탕 인큐베이터에서 37℃에서 4시간 동안 인큐베이션하였다. 배양된 세포 OD는 펩티드 발현 분석을 위해 SDS-PAGE 겔에 로딩하기 전에 정규화되었다(도 8). 유도되지 않은(UI) 샘플을 대조군으로 사용하였다. TP3를 제외한 모든 카세트의 겔에서 테리파라티드의 발현이 관찰되었다.
발명의 이점
본 연구에서 T7 리더와 조합된 태그 LP-2(23AA) 및 태그 LP-8(12AA)과 같은 매우 짧은 융합 태그를 사용하여 리라 펩티드의 높은 발현 수준을 달성하였다. 융합 태그는 봉입체로의 응집을 유도하고, 단백질의 안정성을 증가시키고, 숙주 세포 분해 효소의 작용으로부터 펩티드를 보호하고, 발현 후 정제에도 도움을 준다. 수용성 및 불용성 분획에서 리라 펩티드의 발현을 나타내는 도 7은 융합 펩티드의 대부분이 불용성 분획에서 확인되었음을 나타낸다. 본 발명의 태그는 GST (26 kDa), 티오렉독신 Trx(12 kDa), MBP 태그(42 kDa), 케토스테로이드 이소머라제(KSI) 14 kDa, 및 SUMO 14 kDa와 같은 일반적으로 사용되는 융합 태그와 비교하여 크기가 매우 작다. 관심 펩티드의 발현을 개선하기 위해 가능한 가장 짧은 펩티드 태그를 사용하면 대형 융합 태그 사용의 한계를 극복하고 수율을 개선하여 제조 비용을 절감할 수 있다.
SEQUENCE LISTING
<110> Biological E Limited
<120> CONSTRUCTS AND METHODS FOR INCREASED EXPRESSION OF POLYPEPTIDES
<130> IP58562
<140> 202141014741
<141> 2021-03-31
<160> 50
<170> PatentIn version 3.5
<210> 1
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Peptide Sequence
<400> 1
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg
1 5 10
<210> 2
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 2
Gly Ser Gly Gln Gly Gln Ala Gln Tyr Leu Ala Ala Ser Leu Val Val
1 5 10 15
Phe Thr Asn Tyr Ser Gly Asp
20
<210> 3
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 3
Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala
1 5 10 15
Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu
20 25 30
Thr Pro Arg Arg Ala Ser Ala
35
<210> 4
<211> 73
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 4
Met Val Leu Thr Lys Lys Lys Leu Gln Asp Leu Val Arg Glu Val Ala
1 5 10 15
Pro Asn Glu Gln Leu Asp Glu Asp Val Glu Glu Met Leu Leu Gln Ile
20 25 30
Ala Asp Asp Phe Ile Glu Ser Val Val Thr Ala Ala Cys Gln Leu Ala
35 40 45
Arg His Arg Lys Ser Ser Thr Leu Glu Val Lys Asp Val Gln Leu His
50 55 60
Leu Glu Arg Gln Trp Asn Met Trp Ile
65 70
<210> 5
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 5
Ser Arg Arg Pro Arg Gln Leu Gln Gln Arg Gln
1 5 10
<210> 6
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 6
Ser Glu Glu Pro Glu Gln Leu Gln Gln Glu Gln Ser Arg Arg Pro Arg
1 5 10 15
Gln Leu Gln Gln Arg Gln
20
<210> 7
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 7
Ala Glu Glu Glu Glu Ile Leu Leu Glu Val Ser Leu Val Phe Lys Val
1 5 10 15
Lys Glu Phe Ala Pro Asp Ala Pro Leu Phe Thr Gly Pro Ala Tyr
20 25 30
<210> 8
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 8
Ser Ala Gly Asp Leu Lys Phe Val Lys Val Val Ala
1 5 10
<210> 9
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 9
Lys Thr Lys Gln Leu Met Ser Phe Ala Pro Ser His Asn
1 5 10
<210> 10
<211> 125
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 10
Met His Thr Pro Glu His Ile Thr Ala Val Val Gln Arg Phe Val Ala
1 5 10 15
Ala Leu Asn Ala Gly Asp Leu Asp Gly Ile Val Ala Leu Phe Ala Asp
20 25 30
Asp Ala Thr Val Glu Asp Pro Val Gly Ser Glu Pro Arg Ser Gly Thr
35 40 45
Ala Ala Ile Arg Glu Phe Tyr Ala Asn Ser Leu Lys Leu Pro Leu Ala
50 55 60
Val Glu Leu Thr Gln Glu Val Arg Ala Val Ala Asn Glu Ala Ala Phe
65 70 75 80
Ala Phe Thr Val Ser Phe Glu Tyr Gln Gly Arg Lys Thr Val Val Ala
85 90 95
Pro Ile Asp His Phe Arg Phe Asn Gly Ala Gly Lys Val Val Ser Ile
100 105 110
Arg Ala Leu Phe Gly Glu Lys Asn Ile His Ala Cys Gln
115 120 125
<210> 11
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 11
Glu Asn Leu Tyr Phe Gln
1 5
<210> 12
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 12
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
20 25 30
<210> 13
<211> 55
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 13
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His
1 5 10 15
His His Glu Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser
20 25 30
Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala
35 40 45
Trp Leu Val Arg Gly Arg Gly
50 55
<210> 14
<211> 78
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 14
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His
1 5 10 15
His His Gly Ser Gly Gln Gly Gln Ala Gln Tyr Leu Ala Ala Ser Leu
20 25 30
Val Val Phe Thr Asn Tyr Ser Gly Asp Glu Asn Leu Tyr Phe Gln His
35 40 45
Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln
50 55 60
Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
65 70 75
<210> 15
<211> 94
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 15
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His
1 5 10 15
His His Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe
20 25 30
Leu Ala Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser
35 40 45
Leu Leu Thr Pro Arg Arg Ala Ser Ala Glu Asn Leu Tyr Phe Gln His
50 55 60
Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln
65 70 75 80
Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
85 90
<210> 16
<211> 128
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 16
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His
1 5 10 15
His His Met Val Leu Thr Lys Lys Lys Leu Gln Asp Leu Val Arg Glu
20 25 30
Val Ala Pro Asn Glu Gln Leu Asp Glu Asp Val Glu Glu Met Leu Leu
35 40 45
Gln Ile Ala Asp Asp Phe Ile Glu Ser Val Val Thr Ala Ala Cys Gln
50 55 60
Leu Ala Arg His Arg Lys Ser Ser Thr Leu Glu Val Lys Asp Val Gln
65 70 75 80
Leu His Leu Glu Arg Gln Trp Asn Met Trp Ile Glu Asn Leu Tyr Phe
85 90 95
Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu
100 105 110
Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
115 120 125
<210> 17
<211> 66
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 17
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His
1 5 10 15
His His Ser Arg Arg Pro Arg Gln Leu Gln Gln Arg Gln Glu Asn Leu
20 25 30
Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr
35 40 45
Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly
50 55 60
Arg Gly
65
<210> 18
<211> 77
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 18
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His
1 5 10 15
His His Ser Glu Glu Pro Glu Gln Leu Gln Gln Glu Gln Ser Arg Arg
20 25 30
Pro Arg Gln Leu Gln Gln Arg Gln Glu Asn Leu Tyr Phe Gln His Ala
35 40 45
Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala
50 55 60
Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly
65 70 75
<210> 19
<211> 86
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 19
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His
1 5 10 15
His His Ala Glu Glu Glu Glu Ile Leu Leu Glu Val Ser Leu Val Phe
20 25 30
Lys Val Lys Glu Phe Ala Pro Asp Ala Pro Leu Phe Thr Gly Pro Ala
35 40 45
Tyr Glu Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp
50 55 60
Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp
65 70 75 80
Leu Val Arg Gly Arg Gly
85
<210> 20
<211> 67
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 20
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His
1 5 10 15
His His Ser Ala Gly Asp Leu Lys Phe Val Lys Val Val Ala Glu Asn
20 25 30
Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser
35 40 45
Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg
50 55 60
Gly Arg Gly
65
<210> 21
<211> 68
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 21
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His
1 5 10 15
His His Lys Thr Lys Gln Leu Met Ser Phe Ala Pro Ser His Asn Glu
20 25 30
Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser
35 40 45
Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val
50 55 60
Arg Gly Arg Gly
65
<210> 22
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 22
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg His His His His
1 5 10 15
His His Met His Thr Pro Glu His Ile Thr Ala Val Val Gln Arg Phe
20 25 30
Val Ala Ala Leu Asn Ala Gly Asp Leu Asp Gly Ile Val Ala Leu Phe
35 40 45
Ala Asp Asp Ala Thr Val Glu Asp Pro Val Gly Ser Glu Pro Arg Ser
50 55 60
Gly Thr Ala Ala Ile Arg Glu Phe Tyr Ala Asn Ser Leu Lys Leu Pro
65 70 75 80
Leu Ala Val Glu Leu Thr Gln Glu Val Arg Ala Val Ala Asn Glu Ala
85 90 95
Ala Phe Ala Phe Thr Val Ser Phe Glu Tyr Gln Gly Arg Lys Thr Val
100 105 110
Val Ala Pro Ile Asp His Phe Arg Phe Asn Gly Ala Gly Lys Val Val
115 120 125
Ser Ile Arg Ala Leu Phe Gly Glu Lys Asn Ile His Ala Cys Gln Glu
130 135 140
Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser
145 150 155 160
Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val
165 170 175
Arg Gly Arg Gly
180
<210> 23
<211> 55
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 23
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Arg Arg Arg Arg
1 5 10 15
Arg Arg Glu Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser
20 25 30
Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala
35 40 45
Trp Leu Val Arg Gly Arg Gly
50 55
<210> 24
<211> 67
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 24
Met His His His His His His Gly Ser Gly Gln Gly Gln Ala Gln Tyr
1 5 10 15
Leu Ala Ala Ser Leu Val Val Phe Thr Asn Tyr Ser Gly Asp Glu Asn
20 25 30
Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser
35 40 45
Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg
50 55 60
Gly Arg Gly
65
<210> 25
<211> 56
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide sequence
<400> 25
Met His His His His His His Ser Ala Gly Asp Leu Lys Phe Val Lys
1 5 10 15
Val Val Ala Glu Asn Leu Tyr Phe Gln His Ala Glu Gly Thr Phe Thr
20 25 30
Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile
35 40 45
Ala Trp Leu Val Arg Gly Arg Gly
50 55
<210> 26
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 26
ggtagcggtc agggtcaagc acagtatctg gcagcaagcc tggttgtttt taccaattat 60
agcggtgat 69
<210> 27
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 27
atgaataaca acgacctgtt tcaggcaagc cgtcgtcgtt ttctggcaca gttaggtggt 60
ctgaccgttg caggtatgct gggtccgagc ctgctgacac cgcgtcgtgc aagcgca 117
<210> 28
<211> 219
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 28
atggttctga ccaaaaaaaa gctgcaggat ctggttcgtg aagttgcacc gaatgaacag 60
ctggatgaag atgttgaaga aatgctgctg cagattgccg atgattttat tgaaagcgtt 120
gttaccgcag catgtcagct ggcacgtcat cgtaaaagca gcaccctgga agttaaagat 180
gttcagctgc atctggaacg tcagtggaat atgtggatt 219
<210> 29
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 29
agccgtcgtc cgcgtcagct gcagcagcgt caa 33
<210> 30
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 30
agcgaagaac cggaacagct gcagcaagaa cagagccgtc gtccgcgtca gctgcaacag 60
cgtcaa 66
<210> 31
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 31
gccgaagaag aagaaattct gctggaagtt agcctggtgt ttaaggtgaa agaatttgca 60
ccggatgcac cgctgtttac cggtccggca tat 93
<210> 32
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 32
tcagccggtg atctgaaatt tgttaaagtt gttgcc 36
<210> 33
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 33
aaaaccaaac agctgatgag ctttgcaccg agccataat 39
<210> 34
<211> 375
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 34
atgcatacac cggaacatat taccgcagtt gttcagcgtt ttgttgcagc actgaatgcc 60
ggtgatctgg atggtattgt tgcactgttt gcagatgatg caaccgttga agatccggtt 120
ggtagcgaac cgcgtagcgg caccgcagca attcgtgaat tttatgcaaa tagcctgaaa 180
ctgccgctgg ccgttgaact gacccaagaa gttcgcgcag ttgcaaatga agcagcattt 240
gcatttaccg tgagctttga atatcagggt cgtaaaaccg ttgttgcacc gattgatcat 300
tttcgtttta atggtgccgg taaagttgtt agcattcgtg ccctgtttgg cgaaaaaaac 360
attcatgcat gtcaa 375
<210> 35
<211> 168
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 35
atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcatcatca ccatgaaaac 60
ctgtattttc agcatgcaga aggcaccttt acctcagatg ttagcagcta tctggaaggt 120
caggcagcaa aagaatttat tgcatggctg gttcgtggtc gtggttaa 168
<210> 36
<211> 237
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 36
atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatggtagc 60
ggtcagggtc aagcacagta tctggcagca agcctggttg tttttaccaa ttatagcggt 120
gatgagaacc tgtattttca gcatgcagaa ggcaccttta cctcagatgt tagcagctat 180
ctggaaggtc aggcagcaaa agaatttatt gcatggctgg ttcgtggtcg tggttaa 237
<210> 37
<211> 285
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 37
atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatatgaat 60
aacaacgacc tgtttcaggc aagccgtcgt cgttttctgg cacagttagg tggtctgacc 120
gttgcaggta tgctgggtcc gagcctgctg acaccgcgtc gtgcaagcgc agaaaatctg 180
tattttcagc atgcagaagg cacctttacc tcagatgtta gcagctatct ggaaggtcag 240
gcagcaaaag aatttattgc atggctggtt cgtggtcgtg gttaa 285
<210> 38
<211> 387
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 38
atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatatggtt 60
ctgaccaaaa aaaagctgca ggatctggtt cgtgaagttg caccgaatga acagctggat 120
gaagatgttg aagaaatgct gctgcagatt gccgatgatt ttattgaaag cgttgttacc 180
gcagcatgtc agctggcacg tcatcgtaaa agcagcaccc tggaagttaa agatgttcag 240
ctgcatctgg aacgtcagtg gaatatgtgg attgaaaacc tgtattttca gcatgcagaa 300
ggcaccttta cctcagatgt tagcagttat ctggaaggcc aggcagcaaa agaatttatt 360
gcatggctgg tgcgtggtcg tggttaa 387
<210> 39
<211> 201
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 39
atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatagccgt 60
cgtccgcgtc agctgcagca gcgtcaagaa aatctgtatt ttcagcatgc agaaggcacc 120
tttacctcag atgttagcag ctatctggaa ggtcaggcag caaaagaatt tattgcatgg 180
ctggttcgtg gtcgtggtta a 201
<210> 40
<211> 234
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 40
atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatagcgaa 60
gaaccggaac agctgcagca agaacagagc cgtcgtccgc gtcagctgca acagcgtcaa 120
gaaaatctgt attttcagca tgcagaaggc acctttacct cagatgttag cagctatctg 180
gaaggtcagg cagcaaaaga atttattgca tggctggttc gtggtcgtgg ttaa 234
<210> 41
<211> 261
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 41
atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatgccgaa 60
gaagaagaaa ttctgctgga agttagcctg gtgtttaagg tgaaagaatt tgcaccggat 120
gcaccgctgt ttaccggtcc ggcatatgaa aatctgtatt ttcagcatgc agaaggcacc 180
tttacctcag atgttagcag ctatctggaa ggtcaggcag caaaagaatt tattgcatgg 240
ctggttcgtg gtcgtggtta a 261
<210> 42
<211> 204
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 42
atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcattcagcc 60
ggtgatctga aatttgttaa agttgttgcc gagaacctgt attttcagca tgcagaaggc 120
acctttacct cagatgttag cagctatctg gaaggtcagg cagcaaaaga atttattgca 180
tggctggttc gtggtcgtgg ttaa 204
<210> 43
<211> 207
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 43
atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcataaaacc 60
aaacagctga tgagctttgc accgagccat aatgaaaatc tgtattttca gcatgccgaa 120
ggcaccttta ccagtgatgt tagcagctat ctggaaggtc aggcagcaaa agaatttatt 180
gcatggctgg ttcgtggtcg tggttaa 207
<210> 44
<211> 543
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 44
atggcaagca tgaccggtgg tcagcagatg ggtcgtcatc atcaccatca tcatatgcat 60
acaccggaac atattaccgc agttgttcag cgttttgttg cagcactgaa tgccggtgat 120
ctggatggta ttgttgcact gtttgcagat gatgcaaccg ttgaagatcc ggttggtagc 180
gaaccgcgta gcggcaccgc agcaattcgt gaattttatg caaatagcct gaaactgccg 240
ctggccgttg aactgaccca agaagttcgc gcagttgcaa atgaagcagc atttgcattt 300
accgtgagct ttgaatatca gggtcgtaaa accgttgttg caccgattga tcattttcgt 360
tttaatggtg ccggtaaagt tgttagcatt cgtgccctgt ttggcgaaaa aaacattcat 420
gcatgtcaag aaaacctgta ttttcagcat gcagaaggca cctttacctc agatgttagc 480
agctatctgg aaggtcaggc agcaaaagaa tttattgcat ggctggttcg tggtcgtggt 540
taa 543
<210> 45
<211> 168
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 45
atggcaagca tgaccggtgg tcagcagatg ggtcgtcgtc gccgtcgtcg gcgtgaaaat 60
ctgtattttc agcatgcaga aggcaccttt acctcagatg ttagcagcta tctggaaggt 120
caggcagcaa aagaatttat tgcatggctg gttcgtggtc gtggttaa 168
<210> 46
<211> 204
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 46
atgcatcatc accatcatca tggtagcggt cagggtcaag cacagtatct ggcagcaagc 60
ctggttgttt ttaccaatta tagcggtgat gagaacctgt attttcagca tgcagaaggc 120
acctttacct cagatgttag cagctatctg gaaggtcagg cagcaaaaga atttattgca 180
tggctggttc gtggtcgtgg ttaa 204
<210> 47
<211> 171
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 47
atgcatcatc accatcatca ttcagccggt gatctgaaat ttgttaaagt tgttgccgag 60
aacctgtatt ttcagcatgc agaaggcacc tttacctcag atgttagcag ctatctggaa 120
ggtcaggcag caaaagaatt tattgcatgg ctggttcgtg gtcgtggtta a 171
<210> 48
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 48
catgcagaag gcacctttac ctcagatgtt agcagctatc tggaaggtca ggcagcaaaa 60
gaatttattg catggctggt tcgtggtcgt ggt 93
<210> 49
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence
<400> 49
Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn
1 5 10 15
Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His
20 25 30
Asn Phe
<210> 50
<211> 102
<212> DNA
<213> Artificial Sequence
<220>
<223> Nucleic acid sequence
<400> 50
agcgttagcg aaattcagct gatgcataat ctgggcaaac atctgaatag catggaacgt 60
gttgaatggc tgcgtaaaaa actgcaggat gtgcacaact tt 102
Claims (25)
- 관심 단백질의 발현을 위한 발현 카세트로서, 상기 발현 카세트는
a) 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;
b) 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;
c) 절단 가능한 펩티드 링커를 코딩하는 폴리뉴클레오티드; 및
d) 관심 단백질을 코딩하는 폴리뉴클레오티드
를 포함하고,
발현 카세트의 상기 폴리뉴클레오티드 서열은 프로모터에 작동적으로 연결된, 발현 카세트. - 제1항에 있어서, 상기 발현 카세트가 폴리히스티딘 태그를 코딩하는 폴리뉴클레오티드를 추가로 포함하는 것인 발현 카세트.
- 제1항에 있어서, 절단 가능한 링커가 서열번호 11에 제시된 아미노산 서열을 갖는 변형된 TEV 프로테아제 절단 부위를 포함하는 것인 발현 카세트.
- 제1항에 있어서, 관심 단백질이 100개 미만의 아미노산인 치료 펩티드를 포함하는 것인 발현 카세트.
- 제1항에 있어서, 관심 단백질이 리라 펩티드(Lira-peptide), 테리파라티드(Teriparatide), 엑세나티드(Exenatide), 릭시세나티드(Lixisenatide), 테두글루티드(Teduglutide) 및 세마글루티드(Semaglutide)를 포함하는 군으로부터 선택되는 것인 발현 카세트.
- 제1항에 있어서, 관심 단백질이 리라 펩티드인 발현 카세트.
- 제1항에 있어서, 관심 단백질의 발현 수준이 적어도 85% 증가하는 것인 발현 카세트.
- 리라 펩티드의 발현을 위한 발현 카세트로서, 상기 발현 카세트는
a) 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드를 코딩하는 폴리뉴클레오티드;
b) 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 포함하는 발현 태그 폴리펩티드를 코딩하는 폴리뉴클레오티드;
c) 절단 가능한 펩티드 링커를 코딩하는 폴리뉴클레오티드; 및
d) 서열번호 12에 제시된 아미노산 서열을 포함하는 리라 펩티드 또는 이의 기능적 변이체를 코딩하는 폴리뉴클레오티드
를 포함하고,
발현 카세트의 상기 폴리뉴클레오티드 서열은 프로모터에 작동적으로 연결된, 발현 카세트. - 제8항에 있어서, 절단 가능한 링커가 서열번호 11에 제시된 아미노산 서열을 갖는 변형된 TEV 프로테아제 절단 부위를 포함하는 것인 발현 카세트.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 발현 카세트가 서열번호 36-44에 제시된 폴리뉴클레오티드 서열을 포함하는 것인 발현 카세트.
- 제1항 내지 제10항 중 어느 한 항의 발현 카세트의 적어도 하나의 카피를 포함하는, 관심 단백질의 발현을 위한 발현 벡터.
- 제1항 또는 제11항에 있어서, 관심 단백질의 발현에 사용하기 위한 것인 바현 카세트 또는 발현 벡터.
- 제1항 내지 제10항 중 어느 한 항의 발현 카세트를 포함하는 발현 벡터를 포함하는, 관심 단백질의 생성을 증강시키기 위한 숙주 세포.
- 제13항에 있어서, 상기 숙주 세포가 이. 콜리(E. coli), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 및 바실루스 서브틸리스(Bacillus subtilis)를 포함하는 군으로부터 선택되는 것인 숙주 세포.
- 제14항에 있어서, 이. 콜리 균주가 BL21(DE3), BL21 Al, HMS174(DE3), DH5ct, W31 10, B834, 오리가미, 로제타, 노바블루(DE3), Lemo21(DE3), T7, ER2566 및 C43(DE3)을 포함하는 군으로부터 선택되는 것인 숙주 세포.
- 융합 폴리펩티드를 수득하기 위해 관심 단백질의 아미노 말단에 융합된
a) 서열번호 1의 아미노산 서열을 포함하는 T7 리더 폴리펩티드;
b) 서열번호 2-10을 포함하는 군으로부터 선택되는 아미노산 서열을 갖는 발현 태그 폴리펩티드; 및
c) 절단 가능한 펩티드 링커
를 포함하는 융합 단백질. - 제16항에 있어서, 상기 융합 폴리펩티드가 폴리히스티딘 태그를 추가로 포함하는 것인 융합 폴리펩티드.
- 제16항에 있어서, 절단 가능한 링커가 서열번호 11에 제시된 아미노산 서열을 갖는 변형된 TEV 프로테아제 절단 부위를 포함하는 것인 융합 폴리펩티드.
- 제16항에 있어서, 관심 단백질이 아미노산 길이가 100개 미만인 치료 펩티드를 포함하는 것인 융합 폴리펩티드.
- 제16항에 있어서, 관심 단백질이 리라 펩티드, 테리파라티드, 엑세나티드, 릭시세나티드, 테두글루티드, 및 세마글루티드를 포함하는 군으로부터 선택되는 것인 융합 폴리펩티드.
- 제16항에 있어서, 관심 단백질이 서열번호 12의 아미노산 서열에 제시된 리라 펩티드 또는 이의 기능적 등가물인 융합 폴리펩티드.
- 제16항에 있어서, 상기 융합 폴리펩티드가 서열번호 14-22에 제시된 아미노산 서열을 포함하는 것인 융합 폴리펩티드.
- 관심 단백질을 생성하는 방법으로서,
a) 제13항 내지 제15항 중 어느 한 항의 숙주 세포를 유리한 조건 하에서 배양하여 제16항 내지 제22항 중 어느 한 항의 융합 폴리펩티드를 수득하는 단계;
b) 단계 a)에서 수득된 융합 폴리펩티드를 단리하는 단계; 및
c) 단계 b)에서 수득된 융합 폴리펩티드를 절단 가능한 링커에서 절단하여 관심 단백질을 수득하는 단계
를 포함하는, 관심 단백질을 생성하는 방법. - 제23항에 있어서, 관심 단백질이 리라 펩티드, 테리파라티드, 엑세나티드, 릭시세나티드, 테두글루티드 및 세마글루티드를 포함하는 군으로부터 선택되는 것인 방법.
- 제23항에 있어서, 관심 단백질이 서열번호 12의 아미노산 서열에 제시된 리라 펩티드 또는 이의 기능적 등가물인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN202141014741 | 2021-03-31 | ||
IN202141014741 | 2021-03-31 | ||
PCT/IN2022/050327 WO2022208554A2 (en) | 2021-03-31 | 2022-03-31 | Constructs and methods for increased expression of polypeptides |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230165291A true KR20230165291A (ko) | 2023-12-05 |
Family
ID=81387046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237037447A KR20230165291A (ko) | 2021-03-31 | 2022-03-31 | 폴리펩티드의 발현 증가를 위한 구축물 및 방법 |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP4314034A2 (ko) |
JP (1) | JP2024513203A (ko) |
KR (1) | KR20230165291A (ko) |
CN (1) | CN117916254A (ko) |
AU (1) | AU2022247419A1 (ko) |
BR (1) | BR112023019824A2 (ko) |
CA (1) | CA3213580A1 (ko) |
WO (1) | WO2022208554A2 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117801124A (zh) * | 2024-02-29 | 2024-04-02 | 天津凯莱英生物科技有限公司 | 利西那肽前体的融合蛋白及其应用 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030082671A1 (en) | 2001-07-24 | 2003-05-01 | Thomas Hoeg-Jensen | Method for making acylated polypeptides |
EP1572720A4 (en) * | 2002-05-24 | 2008-12-24 | Nps Allelix Corp | PROCESS FOR THE ENZYMATIC PRODUCTION OF GLP-2 (1-34) AND GLP-2 (1-33) PEPTIDES |
EP1554302A4 (en) * | 2002-05-24 | 2006-05-03 | Restoragen Inc | DNA RECOMBINATION METHODS AND PRODUCTS FOR HIGH-YIELD PRODUCTION OF POLYPEPTIDES |
ES2343061T3 (es) | 2002-05-24 | 2010-07-22 | Medtronic, Inc. | Metodos y constructos de dna para produccion de polipeptidos con rendimiento alto. |
US7662913B2 (en) | 2006-10-19 | 2010-02-16 | E. I. Du Pont De Nemours And Company | Cystatin-based peptide tags for the expression and purification of bioactive peptides |
EP2499255A4 (en) | 2009-11-09 | 2013-06-19 | Univ Colorado Regents | EFFECTIVE PRODUCTION OF PEPTIDES |
WO2017021819A1 (en) | 2015-07-31 | 2017-02-09 | Dr. Reddy’S Laboratories Limited | Process for preparation of protein or peptide |
KR20220058631A (ko) * | 2019-09-13 | 2022-05-09 | 바이오로지칼 이 리미티드 | 재조합 치료 펩타이드의 발현을 위한 n-말단 연장부 서열 |
-
2022
- 2022-03-31 CN CN202280036899.5A patent/CN117916254A/zh active Pending
- 2022-03-31 WO PCT/IN2022/050327 patent/WO2022208554A2/en active Application Filing
- 2022-03-31 KR KR1020237037447A patent/KR20230165291A/ko unknown
- 2022-03-31 BR BR112023019824A patent/BR112023019824A2/pt unknown
- 2022-03-31 EP EP22719041.0A patent/EP4314034A2/en active Pending
- 2022-03-31 JP JP2023560380A patent/JP2024513203A/ja active Pending
- 2022-03-31 CA CA3213580A patent/CA3213580A1/en active Pending
- 2022-03-31 AU AU2022247419A patent/AU2022247419A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2024513203A (ja) | 2024-03-22 |
AU2022247419A1 (en) | 2023-10-05 |
WO2022208554A2 (en) | 2022-10-06 |
CA3213580A1 (en) | 2022-10-06 |
CN117916254A (zh) | 2024-04-19 |
AU2022247419A9 (en) | 2024-02-22 |
BR112023019824A2 (pt) | 2023-11-07 |
WO2022208554A3 (en) | 2022-11-03 |
EP4314034A2 (en) | 2024-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104619726B (zh) | 由超折叠绿色荧光蛋白构成的融合蛋白及其用途 | |
KR100959549B1 (ko) | 글루카곤 유사 펩타이드 1 glp-1(7-36)과 glp-1 유사체를 생산하는 방법 | |
US9200306B2 (en) | Methods for production and purification of polypeptides | |
CN110724187B (zh) | 一种高效表达利拉鲁肽前体的重组工程菌及其应用 | |
US10000544B2 (en) | Process for production of insulin and insulin analogues | |
KR20200037819A (ko) | 재조합 단백질 발현을 위한 융합 태그 | |
CN110835366B (zh) | 促进蛋白质可溶性表达的标签多肽及其用途 | |
KR20230165291A (ko) | 폴리펩티드의 발현 증가를 위한 구축물 및 방법 | |
KR102345011B1 (ko) | GroES 융합을 이용한 글루카곤 유사 펩타이드-1 또는 이의 유사체의 생산방법 | |
WO2020187270A1 (zh) | 含有荧光蛋白片段的融合蛋白及其用途 | |
US11267863B2 (en) | N-terminal fusion partner for producing recombinant polypeptide, and method for producing recombinant polypeptide using same | |
KR100368073B1 (ko) | 융합파트너를 이용한 재조합 단백질의 제조방법 | |
CN114651063A (zh) | 用于表达重组治疗性肽的n-末端延伸序列 | |
KR101830792B1 (ko) | 항균 펩타이드를 포함하는 불용성 융합단백질 및 이를 이용한 항균 펩타이드의 제조 방법 | |
KR101622373B1 (ko) | 지지체로서 불용성 녹색형광단백질을 이용한 항균 펩타이드의 제조방법 | |
KR102017542B1 (ko) | 융합 폴리펩타이드를 이용하여 글루카곤 유사 펩타이드-2 또는 이의 유사체를 생산하는 방법 | |
Wang et al. | High‐level expression of cecropin CMIV in E. coli from a fusion construct containing the human tumor necrosis factor | |
CA2529282C (en) | Recombinant igf expression systems | |
JP2020513834A (ja) | ペプチドの発現および大規模生産 | |
KR20230006225A (ko) | 발현 수준 및 가용성이 증대된 인간 엔테로키나제 융합 단백질 및 그 제조방법 | |
OA20681A (en) | N-terminal extension sequence for expression of recombinant therapeutic peptides. | |
EA044776B1 (ru) | Последовательность n-концевого удлинения для экспрессии рекомбинантных терапевтических пептидов | |
Kim et al. | Expression of Active Antibacterial Bumblebee Abaecin in Escherichia coli Cells | |
KR20140018732A (ko) | 보리 리보솜 억제 단백질을 이용한 재조합 단백질의 대량생산용 벡터 및 이를 이용한 재조합 단백질의 대량생산 방법 |