KR20220105157A - 스플릿 인테인 시스템을 사용하는 단백질 정제 - Google Patents
스플릿 인테인 시스템을 사용하는 단백질 정제 Download PDFInfo
- Publication number
- KR20220105157A KR20220105157A KR1020227016527A KR20227016527A KR20220105157A KR 20220105157 A KR20220105157 A KR 20220105157A KR 1020227016527 A KR1020227016527 A KR 1020227016527A KR 20227016527 A KR20227016527 A KR 20227016527A KR 20220105157 A KR20220105157 A KR 20220105157A
- Authority
- KR
- South Korea
- Prior art keywords
- intein
- protein
- sequence
- variant
- solid phase
- Prior art date
Links
- 230000017730 intein-mediated protein splicing Effects 0.000 title claims abstract description 136
- 238000001742 protein purification Methods 0.000 title abstract description 12
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 162
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 149
- 239000003446 ligand Substances 0.000 claims abstract description 46
- 238000004587 chromatography analysis Methods 0.000 claims abstract description 4
- 235000018102 proteins Nutrition 0.000 claims description 137
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 61
- 235000001014 amino acid Nutrition 0.000 claims description 42
- 239000007790 solid phase Substances 0.000 claims description 42
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 claims description 39
- 238000009739 binding Methods 0.000 claims description 39
- 238000000034 method Methods 0.000 claims description 36
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 35
- 229940024606 amino acid Drugs 0.000 claims description 34
- 150000001413 amino acids Chemical class 0.000 claims description 34
- 238000003776 cleavage reaction Methods 0.000 claims description 32
- 229920005989 resin Polymers 0.000 claims description 25
- 239000011347 resin Substances 0.000 claims description 23
- 239000003513 alkali Substances 0.000 claims description 22
- 230000007017 scission Effects 0.000 claims description 21
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 17
- 235000009582 asparagine Nutrition 0.000 claims description 14
- 239000012539 chromatography resin Substances 0.000 claims description 14
- 230000001965 increasing effect Effects 0.000 claims description 14
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 13
- 229960001230 asparagine Drugs 0.000 claims description 13
- 238000005406 washing Methods 0.000 claims description 13
- 125000000539 amino acid group Chemical group 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 10
- 238000006467 substitution reaction Methods 0.000 claims description 10
- 235000018417 cysteine Nutrition 0.000 claims description 9
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 9
- 229920000936 Agarose Polymers 0.000 claims description 8
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 6
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 6
- 238000001261 affinity purification Methods 0.000 claims description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 230000035772 mutation Effects 0.000 claims description 6
- 230000003068 static effect Effects 0.000 claims description 6
- 241000700605 Viruses Species 0.000 claims description 5
- 230000007935 neutral effect Effects 0.000 claims description 5
- 239000002245 particle Substances 0.000 claims description 5
- 230000001172 regenerating effect Effects 0.000 claims description 5
- 150000001768 cations Chemical class 0.000 claims description 4
- 108020001507 fusion proteins Proteins 0.000 claims description 4
- 102000037865 fusion proteins Human genes 0.000 claims description 4
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 241000424623 Nostoc punctiforme Species 0.000 claims description 3
- -1 antibody mimic Proteins 0.000 claims description 3
- 239000011324 bead Substances 0.000 claims description 3
- 230000003197 catalytic effect Effects 0.000 claims description 3
- 239000002738 chelating agent Substances 0.000 claims description 3
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 claims description 3
- 230000000670 limiting effect Effects 0.000 claims description 3
- 230000002269 spontaneous effect Effects 0.000 claims description 3
- 229960005486 vaccine Drugs 0.000 claims description 3
- 241000894006 Bacteria Species 0.000 claims description 2
- 108010001857 Cell Surface Receptors Proteins 0.000 claims description 2
- 102000019034 Chemokines Human genes 0.000 claims description 2
- 108010012236 Chemokines Proteins 0.000 claims description 2
- 102000004127 Cytokines Human genes 0.000 claims description 2
- 108090000695 Cytokines Proteins 0.000 claims description 2
- 102000004190 Enzymes Human genes 0.000 claims description 2
- 108090000790 Enzymes Proteins 0.000 claims description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 claims description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 claims description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 2
- 239000000427 antigen Substances 0.000 claims description 2
- 108091007433 antigens Proteins 0.000 claims description 2
- 102000036639 antigens Human genes 0.000 claims description 2
- 150000001508 asparagines Chemical class 0.000 claims description 2
- 239000003795 chemical substances by application Substances 0.000 claims description 2
- 238000009792 diffusion process Methods 0.000 claims description 2
- 239000000835 fiber Substances 0.000 claims description 2
- 239000002657 fibrous material Substances 0.000 claims description 2
- 150000004676 glycans Chemical class 0.000 claims description 2
- 239000003102 growth factor Substances 0.000 claims description 2
- 239000005556 hormone Substances 0.000 claims description 2
- 229940088597 hormone Drugs 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 239000006249 magnetic particle Substances 0.000 claims description 2
- 239000012528 membrane Substances 0.000 claims description 2
- 102000006240 membrane receptors Human genes 0.000 claims description 2
- 239000000025 natural resin Substances 0.000 claims description 2
- 229920001282 polysaccharide Polymers 0.000 claims description 2
- 239000005017 polysaccharide Substances 0.000 claims description 2
- 239000012260 resinous material Substances 0.000 claims description 2
- 229920003002 synthetic resin Polymers 0.000 claims description 2
- 239000000057 synthetic resin Substances 0.000 claims description 2
- 230000001225 therapeutic effect Effects 0.000 claims description 2
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical compound NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 claims 2
- 241000124008 Mammalia Species 0.000 claims 1
- CHJJGSNFBQVOTG-UHFFFAOYSA-N N-methyl-guanidine Natural products CNC(N)=N CHJJGSNFBQVOTG-UHFFFAOYSA-N 0.000 claims 1
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 claims 1
- 229960001948 caffeine Drugs 0.000 claims 1
- 239000004202 carbamide Substances 0.000 claims 1
- 230000003196 chaotropic effect Effects 0.000 claims 1
- SWSQBOPZIKWTGO-UHFFFAOYSA-N dimethylaminoamidine Natural products CN(C)C(N)=N SWSQBOPZIKWTGO-UHFFFAOYSA-N 0.000 claims 1
- 230000002209 hydrophobic effect Effects 0.000 claims 1
- 238000005342 ion exchange Methods 0.000 claims 1
- 230000003278 mimic effect Effects 0.000 claims 1
- RYYVLZVUVIJVGH-UHFFFAOYSA-N trimethylxanthine Natural products CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 claims 1
- 238000001042 affinity chromatography Methods 0.000 abstract description 6
- 229920001184 polypeptide Polymers 0.000 description 21
- 210000004899 c-terminal region Anatomy 0.000 description 20
- 239000012634 fragment Substances 0.000 description 19
- 238000000746 purification Methods 0.000 description 18
- 210000004027 cell Anatomy 0.000 description 17
- 239000000872 buffer Substances 0.000 description 16
- 239000000499 gel Substances 0.000 description 15
- 150000007523 nucleic acids Chemical class 0.000 description 14
- 108020004414 DNA Proteins 0.000 description 13
- 238000010828 elution Methods 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 239000002121 nanofiber Substances 0.000 description 13
- 102000039446 nucleic acids Human genes 0.000 description 13
- 108020004707 nucleic acids Proteins 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 12
- 125000003729 nucleotide group Chemical group 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 239000000356 contaminant Substances 0.000 description 10
- 239000002773 nucleotide Substances 0.000 description 10
- 239000007787 solid Substances 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 108091035707 Consensus sequence Proteins 0.000 description 9
- 238000007792 addition Methods 0.000 description 9
- 239000000306 component Substances 0.000 description 9
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 9
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 7
- 238000011068 loading method Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 239000002002 slurry Substances 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 239000012535 impurity Substances 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 229920000642 polymer Polymers 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 5
- 108700019146 Transgenes Proteins 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 239000011534 wash buffer Substances 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 239000004593 Epoxy Substances 0.000 description 3
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 3
- 102000010562 Peptide Elongation Factor G Human genes 0.000 description 3
- 108010077742 Peptide Elongation Factor G Proteins 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000005755 formation reaction Methods 0.000 description 3
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 210000003000 inclusion body Anatomy 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 108091005573 modified proteins Proteins 0.000 description 3
- 102000035118 modified proteins Human genes 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- 239000008363 phosphate buffer Substances 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 230000001323 posttranslational effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- PWYFCPCBOYMOGB-LKTVYLICSA-N Ala-Gln-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PWYFCPCBOYMOGB-LKTVYLICSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 2
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 2
- JOCQXVJCTCEFAZ-CIUDSAMLSA-N Asp-His-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O JOCQXVJCTCEFAZ-CIUDSAMLSA-N 0.000 description 2
- ODNWIBOCFGMRTP-SRVKXCTJSA-N Asp-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CN=CN1 ODNWIBOCFGMRTP-SRVKXCTJSA-N 0.000 description 2
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 2
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 2
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 2
- QRTVJGKXFSYJGW-KBIXCLLPSA-N Ile-Glu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N QRTVJGKXFSYJGW-KBIXCLLPSA-N 0.000 description 2
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 2
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 2
- 239000006137 Luria-Bertani broth Substances 0.000 description 2
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 2
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- WURZLPSMYZLEGH-UNQGMJICSA-N Phe-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N)O WURZLPSMYZLEGH-UNQGMJICSA-N 0.000 description 2
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108010028230 Trp-Ser- His-Pro-Gln-Phe-Glu-Lys Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 125000000217 alkyl group Chemical group 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 150000001507 asparagine derivatives Chemical class 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000002585 base Substances 0.000 description 2
- 229960000074 biopharmaceutical Drugs 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000012228 culture supernatant Substances 0.000 description 2
- 230000006240 deamidation Effects 0.000 description 2
- 238000000326 densiometry Methods 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000012153 distilled water Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000011067 equilibration Methods 0.000 description 2
- 239000006167 equilibration buffer Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 229960004198 guanidine Drugs 0.000 description 2
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 108091005601 modified peptides Proteins 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002797 proteolythic effect Effects 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000003381 solubilizing effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 108010029384 tryptophyl-histidine Proteins 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- WOVKYSAHUYNSMH-RRKCRQDMSA-N 5-bromodeoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 WOVKYSAHUYNSMH-RRKCRQDMSA-N 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 1
- 244000105975 Antidesma platyphyllum Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 1
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 1
- SQZIAWGBBUSSPJ-ZKWXMUAHSA-N Asn-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N SQZIAWGBBUSSPJ-ZKWXMUAHSA-N 0.000 description 1
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- UHGUKCOQUNPSKK-CIUDSAMLSA-N Asn-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N UHGUKCOQUNPSKK-CIUDSAMLSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 1
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- KFAFUJMGHVVYRC-DCAQKATOSA-N Asp-Leu-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O KFAFUJMGHVVYRC-DCAQKATOSA-N 0.000 description 1
- JXGJJQJHXHXJQF-CIUDSAMLSA-N Asp-Met-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O JXGJJQJHXHXJQF-CIUDSAMLSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 241000253373 Caldanaerobacter subterraneus subsp. tengcongensis Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 1
- BOMGEMDZTNZESV-QWRGUYRKSA-N Cys-Tyr-Gly Chemical compound SC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 BOMGEMDZTNZESV-QWRGUYRKSA-N 0.000 description 1
- HPZAJRPYUIHDIN-BZSNNMDCSA-N Cys-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N HPZAJRPYUIHDIN-BZSNNMDCSA-N 0.000 description 1
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 1
- 108010059378 Endopeptidases Proteins 0.000 description 1
- 102000005593 Endopeptidases Human genes 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- ININBLZFFVOQIO-JHEQGTHGSA-N Gln-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O ININBLZFFVOQIO-JHEQGTHGSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- LJLPOZGRPLORTF-CIUDSAMLSA-N Glu-Asn-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O LJLPOZGRPLORTF-CIUDSAMLSA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- XJQDHFMUUBRCGA-KKUMJFAQSA-N His-Asn-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XJQDHFMUUBRCGA-KKUMJFAQSA-N 0.000 description 1
- 101000619708 Homo sapiens Peroxiredoxin-6 Proteins 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 1
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 1
- 108010058683 Immobilized Proteins Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 1
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 239000007987 MES buffer Substances 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 108700020482 Maltose-Binding protein Proteins 0.000 description 1
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 102100022239 Peroxiredoxin-6 Human genes 0.000 description 1
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 1
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 1
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 1
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- 229920012266 Poly(ether sulfone) PES Polymers 0.000 description 1
- 229920002845 Poly(methacrylic acid) Polymers 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 1
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 1
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 1
- 229920002125 Sokalan® Polymers 0.000 description 1
- 239000004809 Teflon Substances 0.000 description 1
- 229920006362 Teflon® Polymers 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- PUEWAXRPXOEQOW-HJGDQZAQSA-N Thr-Met-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O PUEWAXRPXOEQOW-HJGDQZAQSA-N 0.000 description 1
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 1
- DNCUODYZAMHLCV-XGEHTFHBSA-N Thr-Pro-Cys Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N)O DNCUODYZAMHLCV-XGEHTFHBSA-N 0.000 description 1
- AXEJRUGTOJPZKG-XGEHTFHBSA-N Thr-Val-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O AXEJRUGTOJPZKG-XGEHTFHBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- IBBBOLAPFHRDHW-BPUTZDHNSA-N Trp-Asn-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N IBBBOLAPFHRDHW-BPUTZDHNSA-N 0.000 description 1
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 1
- MNMYOSZWCKYEDI-JRQIVUDYSA-N Tyr-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MNMYOSZWCKYEDI-JRQIVUDYSA-N 0.000 description 1
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 239000003463 adsorbent Substances 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000003450 affinity purification method Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 230000010516 arginylation Effects 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 239000012131 assay buffer Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 102000021178 chitin binding proteins Human genes 0.000 description 1
- 108091011157 chitin binding proteins Proteins 0.000 description 1
- 238000011210 chromatographic step Methods 0.000 description 1
- 239000012501 chromatography medium Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 230000006251 gamma-carboxylation Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 235000009424 haa Nutrition 0.000 description 1
- 150000003278 haem Chemical group 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000026045 iodination Effects 0.000 description 1
- 238000006192 iodination reaction Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000003760 magnetic stirring Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- PJUIMOJAAPLTRJ-UHFFFAOYSA-N monothioglycerol Chemical compound OCC(O)CS PJUIMOJAAPLTRJ-UHFFFAOYSA-N 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920002492 poly(sulfone) Polymers 0.000 description 1
- 239000004584 polyacrylic acid Substances 0.000 description 1
- 229920002239 polyacrylonitrile Polymers 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920001610 polycaprolactone Polymers 0.000 description 1
- 239000004632 polycaprolactone Substances 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 229940002612 prodrug Drugs 0.000 description 1
- 239000000651 prodrug Substances 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 230000016434 protein splicing Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 229940043131 pyroglutamate Drugs 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000006340 racemization Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229910052938 sodium sulfate Inorganic materials 0.000 description 1
- 235000011152 sodium sulphate Nutrition 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 229940035024 thioglycerol Drugs 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
- C07K1/16—Extraction; Separation; Purification by chromatography
- C07K1/22—Affinity chromatography or related techniques based upon selective absorption processes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/54—Interleukins [IL]
- C07K14/545—IL-1
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K17/00—Carrier-bound or immobilised peptides; Preparation thereof
- C07K17/02—Peptides being immobilised on, or in, an organic carrier
- C07K17/10—Peptides being immobilised on, or in, an organic carrier the carrier being a carbohydrate
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/90—Fusion polypeptide containing a motif for post-translational modification
- C07K2319/92—Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain
Abstract
본 발명은 주로 크로마토그래피 분야에서 단백질 정제에 관한 것이다. 보다 밀접하게, 본 발명은 개선된 C-인테인 태그 및 N-인테인 리간드를 갖는 스플릿 인테인 시스템을 사용하는 친화성 크로마토그래피에 관한 것이며, 여기서 표적 단백질은 천연 N-말단을 갖는 태그 없는 최종 생성물로서 정제될 수 있다.
Description
본 발명은, 주로 크로마토그래피 분야에서, 단백질 정제에 관한 것이다. 보다 밀접하게, 본 발명은 개선된 C-인테인 태그 및 N-인테인 리간드를 갖는 스플릿 인테인 시스템을 사용하는 친화성 크로마토그래피에 관한 것이며, 여기서 표적 단백질은 천연 N-말단을 갖는 태그 없는 최종 생성물로서 정제될 수 있다.
인테인은 효소 서열을 방해하고 2개의 플랭킹 폴리펩티드의 자체 절단 및 라이게이션을 촉매하여 활성 단백질을 생성하는 인-프레임 삽입으로서 발현되는 단백질 요소이다. 유전적으로, 인테인은 두 가지 별개의 방식으로 코딩된다: 2개의 플랭킹 엑스테인 서열을 방해하는 무손상 인테인으로서, 또는 스플릿 인테인으로서 (여기서 각 엑스테인 및 인테인의 일부는 2개의 상이한 유전자에 의해 코딩됨). 이들은 생명공학 및 단백질 정제 도구로서 큰 가능성을 갖고 있지만, 자연에서 발견되는 신속한 동력학 특성을 갖는 스플릿 인테인은 인테인-엑스테인 접합부의 특정 아미노산에 의존하여, 천연 단백질 서열의 친화성 정제 및 회수를 위해 인테인에 융합될 수 있는 단백질을 심각하게 제한한다. 특히, 노스톡 푼크티포르메(Nostoc punctiforme)로부터의 프로토타입 스플릿 인테인 DNAE는 단백질 정제 적용에 적합한 동력학 특성을 나타낸다. 그러나, 그의 활성은 C-엑스테인의 +2 위치에서의 페닐알라닌에 의존한다. 이 의존성은 심각하게 좁혀지고 그의 일반적인 적용가능성을 손상시킨다.
인테인은 재조합 단백질 정제를 위한 자기-절단 단백질로서의 적용을 포함하여 생명공학에서 여러 중요한 기능을 성취하도록 조작되었다. 스플릿 인테인은 친화성 리간드 및 자기-절단 특성을 동시에 제공할 수 있기 때문에 이와 관련하여 특히 유망하다. 단백질 정제에서, 정제의 대상체인 표적 단백질은 어느 하나의 엑스테인으로 치환될 수 있다. 현재까지, 스플릿 인테인의 DNAE 패밀리는 C-말단 절단 단백질 정제 접근법에서 가장 가능성이 높은 것으로 제시되어 있다.
WO2014/004336은 지지체에 부착될 수 있는 스플릿 인테인 N-단편 및 스플릿 인테인 C-단편에 융합된 단백질을 기재하고 있다. 고체 지지체는 입자, 비드, 수지 또는 슬라이드일 수 있다.
WO2014/110393은 스플릿 인테인 N-단편 및 정제 태그와 접촉되는 스플릿 인테인 C-단편에 융합된 관심 단백질을 기재하고 있다. N-단편은 정제 태그를 통해 고체상에 부착될 수 있으며, 친화성 정제 방법이 논의된다.
US 10 066027은 단백질 정제 시스템 및 상기 시스템을 사용하는 방법을 기재하고 있다. 고정화될 수 있는 N-말단 인테인 세그먼트, 및 자기-절단 특성을 가지며 관심 단백질에 부착될 수 있는 C-말단 인테인 세그먼트를 포함하는 스플릿 인테인이 개시되어 있다. N-말단 인테인 세그먼트에는 외인성 조건에 더 민감하게 만드는 민감도 향상 모티프가 제공되어 있다.
US 10 308 679는 N-인테인 폴리펩티드 및 N-인테인 가용화 파트너를 포함하는 융합 단백질, 및 이러한 융합 단백질을 포함하는 친화성 매트릭스를 기재하고 있다.
WO 2018/091424는 하기 단계를 포함하는, 아미노-말단, (N-말단), 스플릿 인테인 단편을 친화성 리간드로서 포함하는 친화성 크로마토그래피 수지의 제조 방법을 기재하고 있다: a) 박테리아 세포, 바람직하게는 이. 콜라이(E. coli)의 봉입체에서 불용성 단백질로서 N-말단 스플릿 인테인 단편 단백질을 발현하는 단계, b) 상기 봉입체를 수확하는 단계; c) 상기 봉입체를 가용화하고 발현된 단백질을 방출하는 단계; d) 고체 지지체 상에 상기 단백질을 결합시키는 단계; e) 상기 단백질을 리폴딩하는 단계; f) 고체 지지체로부터 상기 단백질을 방출하는 단계; 및 g) 친화성 크로마토그래피 수지를 형성하기 위해 크로마토그래피 수지 상에 리간드로서 상기 단백질을 고정화시키는 단계. 이 절차는 2-10 mg/ml 수지의 리간드 밀도의 고정화를 가능하게 할 수 있다.
상기 기재된 바와 같이, 스플릿 인테인은 조합된 친화성 태그 및 태그 절단 메커니즘을 사용하여 단백질 정제에 사용되었다. 그러나, 이러한 시스템의 유용성은 여러 인자에 의해 제한된다. 첫째, 절단을 수행하고 태그 없는 단백질의 정제를 달성하기 위해 의도된 생성물의 스플라이스 접합부에 아미노산 요구사항, 즉 C-엑스테인의 +2 위치에서의 Phe의 요구사항이 있다. N-말단에 무관한 아미노산이 없는 재조합 단백질 생산이 매우 바람직하다. 둘째, 단백질 방출 절단은 충분히 신속해야 하고, 허용가능한 수율을 제공해야 한다. 셋째, 고체 지지체에 부착하기 위한 스플릿 인테인 N- 또는 C-단편의 용해성 요구사항이 있다. 넷째, 지금까지 태그 없는 단백질의 대규모 정제에 적합한 이용가능한 스플릿 인테인 시스템이 없다.
본 발명은 선행 기술의 단점을 극복하고, 스플릿 인테인 시스템을 사용하는 단 하나의 신속한 친화성 크로마토그래피 단계에서 태그 없는/천연 단백질의 일반적인 정제를 가능하게 한다.
본 발명은 천연 스플릿 인테인의 N-인테인 단백질 변이체 서열 또는 천연 인테인 및 스플릿 인테인으로부터 유래된 컨센서스 서열을 제공하며, 여기서 N-인테인 변이체는 서열에 존재하는 모든 아스파라긴 (N) 아미노산 잔기를 제거하도록 천연 서열 또는 컨센서스 서열과 비교하여 변형된다. 바람직하게는 모든 이러한 N-인테인 변이체 서열은 위치 1에서의 시스테인 (C)을 시스테인이 아닌 임의의 다른 아미노산으로 치환하도록 추가로 변형된다.
본 발명은 천연 스플릿 인테인의 N-인테인 단백질 변이체 또는 인테인/스플릿 인테인으로부터 유래된 컨센서스 서열을 제공하며, 여기서 N-인테인 단백질 변이체는 변이체 서열의 위치 36에 아스파라긴 (N)을 포함하지 않는다. 이 위치는 1번인 초기 촉매 시스테인으로부터 시작하여 천연 스플릿 인테인과의 통상적인 클러스터 정렬에 따라 계산된다. 이 위치는 선행 기술 및 천연 N-인테인 서열에서 N으로 보존되지만, 본 발명자들은 이 위치가 탈아미드화에 덜 민감한 다른 아미노산, 예컨대 히스티딘 (H 또는 His) 또는 글루타민 (Q 또는 Gln)으로 돌연변이되어, 이에 의해 예를 들어 크로마토그래피 절차 동안 증가된 pH 값에 대한 저항성을 제공하기 때문에 중요한 증가된 알칼리 안정성을 달성할 수 있음을 발견하였다. 적어도 위치 36에서의 N은 돌연변이되어야 하지만, N-인테인 서열에서 더 많은 N이 바람직하게는 H 또는 Q로 돌연변이될 수 있다는 것도 고려된다.
본 발명은 또한 관심 표적 단백질 (POI)의 +2 위치에서의 페닐알라닌의 절대 요구사항을 극복하는 N- 및 C-인테인을 제공한다. 본 발명의 N- 및 C-인테인은 임의의 재조합 단백질의 생산에 사용될 수 있다. 본 발명의 N- 및 C-인테인을 사용함으로써, 태그 절단은 태그 인테인 및 POI의 정확한 접합부에서 발생할 것이며, 이는 POI가 친화성 태그에 의해 코딩되는 무관한 아미노산 없이 천연 형태로 발현될 것임을 의미한다. 더욱이, 본 발명의 인테인 서열을 사용하여, POI가 높은 수율 및 빠른 절단 동력학으로 생산된다. N-인테인은 알칼리 조건 하에 재생될 수 있는 고체상에 커플링된다.
본 발명은 첨부된 청구범위에 정의된 바와 같은 N-인테인, C-인테인, 스플릿 인테인 시스템 및 이를 사용하는 방법을 제공한다.
도 1은 SPR 바이오센서 칩에 커플링된 본 발명에 따른 N-인테인 리간드 (A40, A41 및 A48)에 대한 상대적 결합 용량을 제시하는 그래프이다.
도 2는 SPR 센서 칩에 커플링된 본 발명에 따른 N-인테인 리간드 (B72, B22, A48) 및 비교 리간드 (A53)에 대한 상대적 결합 용량을 제시하는 스테이플 다이어그램이다.
도 3은 본 발명의 N-인테인 리간드의 정적 결합 용량을 제시한다. 아미노산 분석 (AAA)은 통상적인 방법에 의해 수행된다. A48 프로토타입은 에폭시 화학에 의해 다공성 아가로스 입자에 커플링된다.
도 4a는 실험 6의 정제 결과의 크로마토그램이다.
도 4b는 실험 6으로부터의 SDS PAGE 결과를 제시한다.
도 5는 SPR 바이오센서 칩에 커플링된 본 발명에 따른 N-인테인 리간드 (A40 및 A48)에 대한 상대적 결합 용량을 제시하는 그래프이다.
도 2는 SPR 센서 칩에 커플링된 본 발명에 따른 N-인테인 리간드 (B72, B22, A48) 및 비교 리간드 (A53)에 대한 상대적 결합 용량을 제시하는 스테이플 다이어그램이다.
도 3은 본 발명의 N-인테인 리간드의 정적 결합 용량을 제시한다. 아미노산 분석 (AAA)은 통상적인 방법에 의해 수행된다. A48 프로토타입은 에폭시 화학에 의해 다공성 아가로스 입자에 커플링된다.
도 4a는 실험 6의 정제 결과의 크로마토그램이다.
도 4b는 실험 6으로부터의 SDS PAGE 결과를 제시한다.
도 5는 SPR 바이오센서 칩에 커플링된 본 발명에 따른 N-인테인 리간드 (A40 및 A48)에 대한 상대적 결합 용량을 제시하는 그래프이다.
정의
명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수형 "하나"는 문맥이 명백하게 달리 언급하지 않는 한 복수의 지시대상을 포함한다. 그러므로, 예를 들어 "관능기", "알킬" 또는 "잔기"에 대한 언급은 2개 이상의 이러한 관능기, 알킬 또는 잔기 등의 혼합물을 포함한다.
범위는 "약" 하나의 특정 값 및/또는 "약" 또 다른 특정 값으로 본원에서 표현될 수 있다. 이러한 범위가 표현될 때, 추가 측면은 하나의 특정 값 및/또는 다른 특정 값을 포함한다. 유사하게, 값이 근사치로서 표현될 때, 선행사 "약"을 사용하여, 특정 값이 추가 측면을 형성한다는 것이 이해될 것이다. 범위의 각각의 종점은 다른 종점과 관련하여 그리고 다른 종점과는 독립적으로 둘 다의 경우에 유의하다는 것이 추가로 이해될 것이다. 또한, 본원에 수많은 값이 개시되어 있고, 각각의 값은 또한 그 값 자체에 더하여 "약" 해당 특정 값으로서 본원에 개시되어 있는 것으로 이해된다. 예를 들어, 값 "10"이 개시되면, "약 10"도 개시되는 것이다. 또한, 2개의 특정 단위 사이의 각 단위가 또한 개시되는 것으로 이해된다. 예를 들어, 10 및 15가 개시되면, 11, 12, 13 및 14도 개시된다.
구체적으로 달리 언급하지 않는 한, 구성성분의 중량 퍼센트 (wt. %)는 구성성분이 포함된 제형 또는 조성물의 총 중량을 기준으로 한다.
본원에서 사용된 바와 같은 용어 "임의의" 또는 "임의로"는 후속적으로 기재된 사건 또는 상황이 발생할 수 있거나 발생할 수 없음을 의미하고, 설명은 상기 사건 또는 상황이 발생하는 경우 및 발생하지 않는 경우를 포함한다.
본원에서 사용된 바와 같은 용어 "접촉"은 화합물이 표적의 활성에 직접적으로 영향을 미칠 수 있는 방식으로; 즉, 표적 자체와 상호작용함으로써, 또는 간접적으로; 즉, 표적의 활성이 의존하는 또 다른 분자, 보조인자, 인자 또는 단백질과 상호작용함으로써, 2개의 생물학적 실체를 함께 가져오는 것을 지칭한다. "접촉"은 또한 공유결합적으로 또는 다른 방식으로 결합하는 2개의 생물학적 실체, 예컨대 펩티드의 상호작용을 용이하게 하는 것을 의미할 수 있다.
본원에서 사용된 바와 같은 "키트"는 키트를 구성하는 적어도 2개의 구성성분의 집합체를 의미한다. 함께, 구성성분은 주어진 목적을 위한 기능 단위를 구성한다. 개별 구성원 구성성분은 물리적으로 함께 또는 별도로 패키징될 수 있다. 예를 들어, 키트 사용 지침서를 포함하는 키트는 물리적으로 다른 개별 구성원 구성성분과 함께 지침서를 포함하거나 포함하지 않을 수 있다. 대신에, 지침서는 종이 형태 또는 컴퓨터 판독가능 메모리 장치에 공급되거나 인터넷 웹사이트로부터 다운로드될 수 있는 전자 형태의 별도의 구성원 구성성분으로서 또는 녹음된 프레젠테이션으로서 공급될 수 있다.
본원에서 사용된 바와 같은 "지침서(들)"는 키트와 관련된 관련 물질 또는 방법론을 설명하는 문서를 의미한다. 이들 물질은 하기의 임의의 조합을 포함할 수 있다: 배경 정보, 구성성분의 목록 및 이들의 이용가능성 정보 (구매 정보 등), 키트 사용을 위한 간략한 또는 상세한 프로토콜, 문제 해결, 참고문헌, 기술 지원, 및 임의의 다른 관련 문서. 지침서는 키트와 함께, 또는 종이 형태 또는 컴퓨터 판독가능 메모리 장치에 공급되거나 인터넷 웹사이트로부터 다운로드될 수 있는 전자 형태의 별도의 구성원 구성성분으로서 또는 녹음된 프레젠테이션으로서 공급될 수 있다. 지침서는 하나 이상의 문서로 구성될 수 있으며, 향후 업데이트를 포함하기 위한 것이다.
용어 "펩티드", "폴리펩티드" 및 "단백질"은 본원에서 상호교환가능하게 사용되며, 단백질 및 그의 단편을 포함한다. 폴리펩티드는 아미노산 잔기 서열로서 본원에 개시되어 있다. 이러한 서열은 아미노에서 카르복시 말단의 방향으로 왼쪽에서 오른쪽으로 작성된다. 표준 명명법에 따라, 아미노산 잔기 서열은 하기와 같이 표시된 바와 같이 세 글자 또는 한 글자 코드에 의해 명명된다: 알라닌 (Ala, A), 아르기닌 (Arg, R), 아스파라긴 (Asn, N), 아스파르트산 (Asp, D), 시스테인 (Cys, C), 글루타민 (Gln, Q), 글루탐산 (Glu, E), 글리신 (Gly, G), 히스티딘 (His, H), 이소류신 (Ile, I), 류신 (Leu, L), 리신 (Lys, K), 메티오닌 (Met, M), 페닐알라닌 (Phe, F), 프롤린 (Pro, P), 세린 (Ser, S), 트레오닌 (Thr, T), 트립토판 (Trp, W), 티로신 (Tyr, Y), 및 발린 (Val, V). 펩티드는 임의의 올리고펩티드, 폴리펩티드, 유전자 생성물, 발현 생성물 또는 단백질을 포함한다. 펩티드는 연속적인 아미노산으로 구성되며, 자연 발생 또는 합성 분자를 포함한다.
또한, 본원에서 사용된 바와 같은 용어 "펩티드"는 펩티드 결합 또는 변형된 펩티드 결합에 의해 서로 연결된 아미노산, 예를 들어 펩티드 동배체 등을 지칭하며, 20개의 유전자-코딩된 아미노산 이외의 변형된 아미노산을 함유할 수 있다. 펩티드는 자연적 프로세스, 예컨대 번역 후 프로세싱에 의해, 또는 관련 기술분야에 널리 공지된 화학적 변형 기술에 의해 변형될 수 있다. 변형은 펩티드 백본, 아미노산 측쇄 및 아미노 또는 카르복실 말단을 포함하여 펩티드의 어느 곳에서나 발생할 수 있다. 동일한 유형의 변형이 주어진 폴리펩티드의 여러 부위에서 동일하거나 다양한 정도로 존재할 수 있다. 또한, 주어진 펩티드는 많은 유형의 변형을 가질 수 있다. 변형은 제한 없이, 별개의 도메인 또는 모티프의 연결, 아세틸화, 아실화, ADP-리보실화, 아미드화, 공유결합 가교 또는 고리화, 플라빈의 공유결합 부착, 헴 모이어티의 공유결합 부착, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유결합 부착, 지질 또는 지질 유도체의 공유결합 부착, 포스파티딜이노시톨의 공유결합 부착, 디술피드 결합 형성, 탈메틸화, 시스테인 또는 피로글루타메이트의 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 아이오딘화, 메틸화, 미리스토일화, 산화, 페길화, 단백질분해성 프로세싱, 인산화, 프레닐화, 라세미화, 셀레노일화, 황산화, 및 단백질에 아미노산의 운반-RNA 매개 첨가, 예컨대 아르기닐화를 포함한다. (문헌 [Proteins-Structure and Molecular Properties 2nd Ed., T. E. Creighton, W.H. Freeman and Company, New York (1993)]; [Posttranslational Covalent Modification of Proteins, B. C. Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)] 참조).
본원에서 사용된 바와 같은 "변이체"는 원래 서열의 것과 동일하거나 실질적으로 유사한 생물학적 활성을 보유하는 분자를 지칭한다. 변이체는 동일하거나 상이한 종으로부터 유래하거나 천연 또는 이전 분자에 기초한 합성 서열일 수 있다. 더욱이, 본원에서 사용된 바와 같은 "변이체"는 부모 분자 (예를 들어, 본원에 개시된 단백질 또는 펩티드)의 구조로부터 획득된 구조를 갖고 구조 또는 서열이 본원에 개시된 것과 충분히 유사한 분자를 지칭하며, 그 유사성에 기초하여 관련 기술분야의 통상의 기술자는 모 분자와 비교하여 동일하거나 유사한 활성 및 유용성을 나타낼 것으로 예상할 것이다. 예를 들어, 주어진 펩티드에서 특정 아미노산을 치환하는 것은 모체와 유사한 활성을 갖는 변이체 펩티드를 생성할 수 있다.
본 발명의 문맥에서, 변이체 단백질의 치환은 하기와 같이 표시된다: [원래 아미노산/서열에서의 위치/치환된 아미노산]. 예를 들어, 히스티딘 (H)으로 돌연변이된 아미노산 서열의 위치 36에서의 아스파라긴 (N)은 "N36H" 또는 "N36에서 H"로서 상호교환가능하게 표시된다.
본원에서 사용된 바와 같은 용어 "관심 단백질 (POI)"은 임의의 합성 또는 자연 발생 단백질 또는 펩티드를 포함한다. 따라서 이 용어는 약물, 백신, 및 분자, 예컨대 단백질, 펩티드 등을 포함하는 생물약제로서 전통적으로 간주되는 화합물을 포함한다. 치료제의 예는 널리 공지된 문헌 참고문헌, 예컨대 머크 인덱스(Merck Index) (14판), 의사용 탁상 편람(Physicians' Desk Reference) (64판), 및 치료제의 약리학적 기초(The Pharmacological Basis of Therapeutics) (1판)에 기재되어 있으며, 제한 없이, 의약; 질환 또는 질병의 치료, 예방, 진단, 치유 또는 완화에 사용되는 물질; 신체의 구조 또는 기능에 영향을 미치는 물질, 또는 생리학적 환경에 배치된 후 생물학적으로 활성이 되거나 더 활성이 되는 전구약물을 포함한다.
본원에서 사용된 바와 같은 "단리된 펩티드" 또는 "정제된 펩티드"는 발현 숙주 세포 용해물, 성장 배지 구성성분, 완충액 구성성분, 세포 배양 상청액, 또는 합성 시험관내 번역 시스템의 구성성분을 포함하나 이에 제한되지는 않는, 펩티드가 자연에서 정상적으로 회합되는 물질, 또는 펩티드가 인공 발현 또는 생산 시스템에서 회합되는 물질이 실질적으로 없는 펩티드 (또는 그의 단편)를 의미하는 것으로 의도된다. 본원에 개시된 펩티드 또는 그의 단편은 예를 들어 천연 공급원 (예를 들어, 포유동물 세포)으로부터의 추출에 의해, 펩티드를 코딩하는 재조합 핵산의 발현 (예를 들어, 세포에서 또는 무세포 번역 시스템에서)에 의해, 또는 펩티드의 화학적 합성에 의해 수득될 수 있다. 또한, 펩티드 단편은 이들 방법 중 임의의 것에 의해 또는 전장 단백질 및/또는 펩티드를 절단함으로써 수득될 수 있다.
본원에서 사용된 바와 같은 단어 "또는"은 특정 목록의 임의의 한 구성원을 의미하고, 또한 해당 목록의 구성원들의 임의의 조합을 포함한다.
본원에서 사용된 바와 같은 어구 "핵산"은 왓슨-크릭 염기-쌍형성에 의해 상보적인 핵산에 혼성화할 수 있는 자연 발생 또는 합성 올리고뉴클레오티드 또는 폴리뉴클레오티드 (DNA 또는 RNA 또는 DNA-RNA 하이브리드, 단일-가닥 또는 이중-가닥, 센스 또는 안티센스 여부에 관계없이)를 지칭한다. 본 발명의 핵산은 또한 뉴클레오티드 유사체 (예를 들어, BrdU), 및 비-포스포디에스테르 뉴클레오시드간 연결 (예를 들어, 펩티드 핵산 (PNA) 또는 티오디에스테르 연결)을 포함할 수 있다. 특히, 핵산은 제한 없이, DNA, RNA, cDNA, gDNA, ssDNA, dsDNA 또는 이들의 임의의 조합을 포함할 수 있다.
본원에서 사용된 바와 같은 "단리된 핵산" 또는 "정제된 핵산"은 본 발명의 DNA가 유래된 유기체의 자연-발생 게놈에서 유전자를 플랭킹하는 유전자가 없는 DNA를 의미하는 것으로 의도된다. 따라서 이 용어는 예를 들어 벡터, 예컨대 자가 복제 플라스미드 또는 바이러스에 혼입되거나; 또는 원핵생물 또는 진핵생물의 게놈 DNA (예를 들어, 트랜스진)에 혼입되거나; 또는 별도의 분자 (예를 들어, PCR, 제한 엔도뉴클레아제 소화, 또는 화학적 또는 시험관내 합성에 의해 생산된 cDNA 또는 게놈 또는 cDNA 단편)로서 존재하는 재조합 DNA를 포함한다. 이것은 또한 추가 폴리펩티드 서열을 코딩하는 하이브리드 유전자의 일부인 재조합 DNA를 포함한다. 용어 "단리된 핵산"은 또한 단리된 DNA 분자에 의해 코딩되거나, 또는 화학적으로 합성되거나, 또는 적어도 일부 세포 구성성분, 예를 들어 다른 유형의 RNA 분자 또는 펩티드 분자로부터 분리되거나 실질적으로 없는 RNA, 예를 들어 mRNA 분자를 지칭한다.
본원에서 사용된 바와 같은 "엑스테인"은 인테인의 일부가 아니고 인테인의 절단 시 스플라이싱되거나 절단될 수 있는 인테인-변형 단백질의 부분을 지칭한다.
"인테인"은 단백질에서 인-프레임 개재 서열을 지칭한다. 인테인은 유리 인테인 및 성숙 단백질을 생성하기 위해 번역 후 단백질 스플라이싱 프로세스를 통해 단백질로부터 그의 자체 절단을 촉매할 수 있다. 인테인은 또한 인테인 N-말단 또는 인테인 C-말단 중 어느 하나, 또는 인테인-엑스테인 말단 둘 다에서 인테인-엑스테인 결합의 절단을 촉매할 수 있다. 본원에서 사용된 바와 같은 "인테인"은 미니-인테인, 변형된 또는 돌연변이된 인테인, 및 스플릿 인테인을 포함한다.
본원에서 사용된 바와 같은 용어 "스플릿 인테인"은 N-말단 및 C-말단 인테인 세그먼트가 스플라이싱 또는 절단 반응에 대해 기능적인 인테인으로 비공유결합적으로 재회합하거나 재구성할 수 있는 별도의 분자가 되도록 N-말단 인테인 세그먼트 및 C-말단 인테인 세그먼트 사이에 하나 이상의 펩티드 결합 파단이 존재하는 임의의 인테인을 지칭한다. 임의의 촉매적으로 활성인 인테인 또는 그의 단편은 본원에 개시된 시스템 및 방법에서 사용하기 위한 스플릿 인테인을 유도하는데 사용될 수 있다. 예를 들어, 한 측면에서 스플릿 인테인은 진핵생물 인테인으로부터 유래될 수 있다. 또 다른 측면에서, 스플릿 인테인은 박테리아 인테인으로부터 유래될 수 있다. 또 다른 측면에서, 스플릿 인테인은 고세균 인테인으로부터 유래될 수 있다. 바람직하게는, 그렇게 유래된 스플릿 인테인은 스플라이싱 반응을 촉매하는데 필수적인 아미노산 서열만을 보유할 것이다.
본원에서 사용된 바와 같은 "N-말단 인테인 세그먼트" 또는 "N-인테인"은 상응하는 C-말단 인테인 세그먼트와 조합될 때 스플라이싱 및/또는 절단 반응에 대해 기능적인 N-말단 아미노산 서열을 포함하는 임의의 인테인 서열을 지칭한다. 그러므로 N-말단 인테인 세그먼트는 또한 스플라이싱이 발생할 때 스플라이싱되는 서열을 포함한다. N-말단 인테인 세그먼트는 자연 발생 (천연) 인테인 서열의 N-말단 부분의 변형인 서열을 포함할 수 있다. 비-인테인 잔기는 또한 추가 기능성, 예컨대 친화성 정제되거나 공유결합적으로 고정화되는 능력을 제공하기 위해 인테인 세그먼트에 유전적으로 융합될 수 있다.
본원에서 사용된 바와 같은 "C-말단 인테인 세그먼트" 또는 "C-인테인"은 상응하는 N-말단 인테인 세그먼트와 조합될 때 스플라이싱 또는 절단 반응에 대해 기능적인 C-말단 아미노산 서열을 포함하는 임의의 인테인 서열을 지칭한다. 한 측면에서, C-말단 인테인 세그먼트는 스플라이싱이 발생할 때 스플라이싱되는 서열을 포함한다. 또 다른 측면에서, C-말단 인테인 세그먼트는 그의 C-말단에 융합된 펩티드 서열로부터 절단된다. C-말단 인테인의 C-말단으로부터 절단된 서열은 본원에서 "관심 단백질 POI"로 지칭되며, 이하에서 더 자세히 논의된다. C-말단 인테인 세그먼트는 자연 발생 (천연) 인테인 서열의 C-말단 부분의 변형인 서열을 포함할 수 있다. 예를 들어, C 말단 인테인 세그먼트는 이러한 추가 및/또는 돌연변이된 잔기의 포함이 C-말단 인테인 세그먼트가 스플라이싱 또는 절단에 대해 비기능적이게 하지 않는 한 추가 아미노산 잔기 및/또는 돌연변이된 잔기를 포함할 수 있다.
컨센서스 서열은 정렬된 관련 서열을 나타내는 DNA, RNA 또는 단백질의 서열이다. 관련 서열의 컨센서스 서열은 상이한 방식으로 정의될 수 있지만, 정상적으로 각 위치에서 가장 흔한 뉴클레오티드(들) 또는 아미노산 잔기(들)에 의해 정의된다. 본 발명의 컨센서스 서열의 예는 서열식별번호(SEQ ID NO): 6의 N-인테인 컨센서스 서열이다.
본원에서 사용된 바와 같은 용어 "스플라이싱하다" 또는 "스플라이싱한다"는 폴리펩티드의 중앙 부분을 절단하여 2개 이상의 더 작은 폴리펩티드 분자를 형성하는 것을 의미한다. 일부 경우에, 스플라이싱은 또한 2개 이상의 더 작은 폴리펩티드를 함께 융합하여 새로운 폴리펩티드를 형성하는 단계를 포함한다. 스플라이싱은 또한 스플릿 인테인의 작용을 통해 2개의 별도의 유전자 생성물에 코딩된 2개의 폴리펩티드의 연결을 지칭할 수 있다.
본원에서 사용된 바와 같은 용어 "절단하다" 또는 "절단한다"는 단일 폴리펩티드를 분할하여 2개 이상의 더 작은 폴리펩티드 분자를 형성하는 것을 의미한다. 일부 경우에, 절단은 종종 "단백질분해성 절단"으로 지칭되는 외인성 엔도펩티다제의 첨가에 의해 매개된다. 다른 경우에, 절단은 종종 "자기-절단"으로 지칭되는 절단된 펩티드 서열 중 하나 또는 둘 다의 고유 활성에 의해 매개될 수 있다. 절단은 또한 본원에 기재된 스플릿 인테인 시스템의 작용에서와 같이 비-단백질분해성 제3 펩티드의 첨가에 의해 유도되는 2개의 폴리펩티드의 자기-절단을 지칭할 수 있다.
용어 "융합된"은 공유결합적으로 결합된 것을 의미한다. 예를 들어, 제1 펩티드는 두 펩티드가 서로 공유결합적으로 결합될 때 (예를 들어, 펩티드 결합을 통해) 제2 펩티드에 융합된다.
본원에서 사용된 바와 같은 "단리된" 또는 "실질적으로 순수한" 물질은 자연적으로 동반되는 구성성분으로부터 분리된 것이다. 전형적으로, 폴리펩티드는 자연적으로 연관된 다른 단백질 및 자연-발생 유기 분자가 적어도 50 중량% (예를 들어, 60 중량%, 70 중량%, 80 중량%, 90 중량%, 95 중량% 및 99 중량%) 없을 때 실질적으로 순수하다.
본원에서, "결합하다" 또는 "결합한다"는 한 분자가 샘플 내의 또 다른 분자를 인식하여 이에 접착하지만, 샘플 내의 다른 분자를 실질적으로 인식하거나 접착하지 않는 것을 의미한다. 한 분자는 다른 분자에 대해 약 105 내지 106 리터/몰 초과의 결합 친화성을 갖는 경우 또 다른 분자에 "특이적으로 결합한다".
본원에 언급된 핵산, 뉴클레오티드 서열, 단백질 또는 아미노산 서열은 단리되거나 정제되거나 화학적으로 합성되거나 재조합 DNA 기술을 통해 생산될 수 있다. 이들 방법 모두는 관련 기술분야에 널리 공지되어 있다.
본원에서 사용된 바와 같은 용어 "변형된" 또는 "돌연변이된" ("변형된 인테인" 또는 "돌연변이된 인테인"에서와 같이)은 천연 또는 자연 발생 구조와 비교할 때 언급되는 핵산 또는 아미노산 서열, 예컨대 인테인에서의 하나 이상의 변형을 지칭한다. 이러한 변형은 치환, 첨가 또는 결실일 수 있다. 변형은 언급되는 구조, 예컨대 인테인의 하나 이상의 아미노산 잔기 또는 하나 이상의 뉴클레오티드에서 발생할 수 있다.
본원에서 사용된 바와 같은 용어 "변형된 펩티드", "변형된 단백질" 또는 "변형된 관심 단백질" 또는 "변형된 표적 단백질"은 변형된 단백질을 지칭한다.
본원에서 사용된 바와 같은 "작동가능하게 연결된"은 생체분자의 정상적인 기능이 수행될 수 있도록 서로에 대한 구성으로 2개 이상의 생체분자의 회합을 지칭한다. 뉴클레오티드 서열과 관련하여, "작동가능하게 연결된"은 서열의 정상적인 기능이 수행될 수 있도록 서로에 대한 구성으로 효소적 라이게이션에 의해 또는 다른 방식으로 2개 이상의 핵산 서열의 회합을 지칭한다. 예를 들어, 프리-서열 또는 분비성 리더를 코딩하는 뉴클레오티드 서열은 폴리펩티드의 분비에 참여하는 프리-단백질로서 발현되는 경우 폴리펩티드에 대한 뉴클레오티드 서열에 작동가능하게 연결되고; 프로모터 또는 인핸서는 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동가능하게 연결되고; 리보솜 결합 부위는 서열의 번역을 용이하게 하도록 위치되는 경우 코딩 서열에 작동가능하게 연결된다.
"서열 상동성"은 핵산 또는 단백질 서열이 공통의 진화적 기원을 갖기 때문에 유사한 상황을 지칭할 수 있다. "서열 상동성"은 서열이 매우 유사함을 표시할 수 있다. 서열 유사성은 관찰가능하며; 상동성은 관찰에 기초할 수 있다. "매우 유사한"은 적어도 70% 동일성, 상동성 또는 유사성; 적어도 75% 동일성, 상동성 또는 유사성; 적어도 80% 동일성, 상동성 또는 유사성; 적어도 85% 동일성, 상동성 또는 유사성; 적어도 90% 동일성, 상동성 또는 유사성; 예컨대 적어도 93% 또는 적어도 95% 또는 심지어 적어도 97% 동일성, 상동성 또는 유사성을 의미할 수 있다. 뉴클레오티드 서열 유사성 또는 상동성 또는 동일성은 NCBI에서 입수가능한 문헌 [Myers et al. (1988) CABIOS 4:11-17]의 "Align" 프로그램을 사용하여 결정될 수 있다. 추가적으로 또는 대안적으로, 아미노산 서열 유사성 또는 동일성 또는 상동성은 NCBI에서 이용가능한 BlastP 프로그램 (Altschul et al. Nucl. Acids Res. 25:3389-3402)을 사용하여 결정될 수 있다. 대안적으로 또는 추가적으로, 용어 "유사성" 또는 "동일성" 또는 "상동성"은 예를 들어 뉴클레오티드 서열과 관련하여 두 서열 간의 상동성의 정량적 측정을 표시하는 것으로 의도된다.
대안적으로 또는 추가적으로, 서열과 관련하여 "유사성"은 동일한 뉴클레오티드를 갖는 위치의 수를 두 서열 중 더 짧은 것의 뉴클레오티드의 수로 나눈 것을 지칭하며, 여기서 두 서열의 정렬은 문헌 [Wilbur and Lipman algorithm. (1983) Proc. Natl. Acad. Sci. USA 80:726]에 따라 결정될 수 있다. 예를 들어, 20개 뉴클레오티드의 윈도우 크기, 4개 뉴클레오티드의 단어 길이, 및 4의 갭 페널티의 사용, 및 정렬을 포함한 서열 데이터의 컴퓨터-지원 분석 및 해석은 상업적으로 이용가능한 프로그램 (예를 들어, 인텔리제네틱스™ 스위트(Intelligenetics™ Suite), 인텔리제네틱스 인크.(Intelligenetics Inc.) (CA))을 사용하여 편리하게 수행될 수 있다. RNA 서열이 유사하다고 언급되거나 DNA 서열과 서열 동일성 정도를 갖는 경우, DNA 서열의 티미딘 (T)은 RNA 서열의 우라실 (U)과 동일한 것으로 간주된다. 하기 참고문헌은 또한 두 단백질의 아미노산 잔기의 상대적 동일성 또는 상동성 또는 유사성을 비교하기 위한 알고리즘을 제공하고, 추가적으로 또는 대안적으로 전술한 것과 관련하여, 퍼센트 상동성 또는 동일성 또는 유사성을 결정하기 위해 참고문헌을 사용할 수 있다. 문헌 [Needleman et al. (1970) J. Mol. Biol. 48:444-453]; [Smith et al. (1983) Advances App. Math. 2:482-489]; [Smith et al. (1981) Nuc. Acids Res. 11:2205-2220]; [Feng et al. (1987) J. Molec. Evol. 25:351-360]; [Higgins et al. (1989) CABIOS 5:151-153]; [Thompson et al. (1994) Nuc. Acids Res. 22:4673-480]; 및 [Devereux et al. (1984) 12:387-395]. "엄격한 혼성화 조건"은 관련 기술분야에 널리 공지된 용어이며; 예를 들어 문헌 [Sambrook, "Molecular Cloning, A Laboratory Manual" second ed., CSH Press, Cold Spring Harbor, 1989]; ["Nucleic Acid Hybridization, A Practical Approach", Hames and Higgins eds., IRL Press, Oxford, 1985]을 참조하며; 또한 서열 비교가 있는 도 2 및 그의 설명을 참조한다.
용어 "플라스미드" 및 "벡터" 및 "카세트"는 종종 세포의 중앙 대사의 일부가 아니며 대개 원형 이중-가닥 DNA 분자의 형태로 유전자를 보유하는 염색체외 요소를 지칭한다. 이러한 요소는 임의의 공급원으로부터 유래된 단일- 또는 이중-가닥 DNA 또는 RNA의 자가 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오티드 서열 (선형 또는 원형)일 수 있으며, 여기서 수많은 뉴클레오티드 서열은 세포 내로 적절한 3' 비번역된 서열과 함께 선택된 유전자 생성물에 대한 프로모터 단편 및 DNA 서열을 도입할 수 있는 고유한 구축물로 연결되거나 재조합된다. 전형적으로, "벡터"는 클로닝을 위한 추가적인 다중 삽입 부위를 함유하는 변형된 플라스미드 및 숙주 세포에서의 발현을 위해 선택된 유전자 생성물 (즉, 트랜스진)에 대한 DNA 서열을 함유하는 "발현 카세트"이다. 이 "발현 카세트"는 전형적으로 ORF의 전사 및 번역에 필요한 모든 필수 조절 서열과 함께 5' 프로모터 영역, 트랜스진 ORF 및 3' 종결자 영역을 포함한다. 그러므로, 발현 카세트의 숙주로의 통합은 카세트에서 트랜스진 ORF의 발현을 허용한다.
용어 "완충액" 또는 "완충된 용액"은 그의 짝산-염기 범위의 작용에 의해 pH 변화에 저항하는 용액을 지칭한다.
용어 "로딩 완충액" 또는 "평형 완충액"은 칼럼에 단백질 제제를 로딩하기 위해 단백질 제제와 혼합되는 염 또는 염들을 함유하는 완충액을 지칭한다. 이 완충액은 또한 로딩 전에 칼럼을 평형화하고 단백질을 로딩한 후 칼럼으로 세척하는데 사용된다.
용어 "세척 완충액"은 관심 단백질 (예를 들어 C-말단 인테인 단편에 커플링된 것과 같음)의 로딩 후에 및 관심 단백질의 용리 전에 칼럼 (예를 들어) 위로 통과되는 완충액을 지칭하기 위해 본원에서 사용된다. 세척 완충액은 원하는 단백질의 실질적인 용리 없이 하나 이상의 오염물질을 제거하는 역할을 할 수 있다.
용어 "용리 완충액"은 칼럼으로부터 원하는 단백질을 용리하는데 사용되는 완충액을 지칭한다. 본원에서 사용된 바와 같은 용어 "용액"은 물을 포함하는 완충된 또는 비완충된 용액을 지칭한다.
용어 "세척"은 고체 지지체, 예컨대 크로마토그래피 수지를 통해 또는 그 위로 적절한 완충액을 통과시키는 것을 의미한다.
고체 지지체로부터 분자 (예를 들어 원하는 단백질 또는 오염물질)를 "용리"한다는 용어는 이러한 물질로부터 분자를 제거하는 것을 의미한다.
용어 "오염물질" 또는 "불순물"은 정제될 단백질의 샘플에 존재하는 임의의 외래 또는 불쾌한 분자, 특히 생물학적 거대분자, 예컨대 DNA, RNA 또는 정제될 단백질이 아닌 단백질을 지칭한다. 오염물질은 예를 들어 정제될 단백질을 발현 및/또는 분비하는 세포로부터의 다른 단백질을 포함한다.
단백질 정제와 관련하여 사용된 바와 같은 용어 "분리하다" 또는 "단리하다"는 원하는 단백질 및 제2 단백질 또는 다른 오염물질 또는 불순물 혼합물을 모두 포함하는 혼합물에서 제2 단백질 또는 다른 오염물질 또는 불순물의 혼합물로부터 원하는 단백질을 분리하여, 원하는 단백질의 분자의 적어도 대부분이 제2 단백질의 분자 또는 다른 오염물질 또는 불순물의 혼합물의 적어도 대부분을 포함하는 혼합물의 부분으로부터 제거되도록 하는 것을 지칭한다.
원하는 단백질 및 하나 이상의 오염물질을 포함하는 조성물 또는 용액으로부터 원하는 단백질을 "정제하다" 또는 "정제하는"이라는 용어는 조성물 또는 용액으로부터 적어도 하나의 오염물질을 (완전히 또는 부분적으로) 제거함으로써 조성물 또는 용액 중 원하는 단백질의 순도 정도를 증가시키는 것을 의미한다.
N-인테인 단백질 변이체
본 발명은 광범위한 아미노산 저항성으로 절단하여 최종 생성물로서 태그 없는 관심 단백질 (POI)을 생성하는 본 발명에 따른 스플릿 인테인 시스템을 사용하는 단일 단계의 친화성 크로마토그래피 및 친화성 태그 절단 메커니즘에 관한 것이다. 인테인의 2개의 절반은 친화성 리간드 (N-인테인) 및 친화성 태그 (C-인테인)이며 빠르게 회합한다. 크로마토그래피 수지에 하나의 절반 (N-인테인)을 고정화시키는 것은 용액으로부터 POI에 커플링된 다른 절반 (C-인테인)의 캡처를 가능하게 한다. Zn2+ 이온의 존재 하에, 절단 반응이 억제되어, 불순물을 세척하면서 안정적인 복합체가 형성되는 것을 가능하게 한다. 불순물을 제거한 후, 킬레이트제 또는 환원제를 첨가하고, 절단 반응을 진행하여, POI의 수집을 가능하게 하는 반면, 인테인 태그는 크로마토그래피 수지에 연결된 동족 인테인에 비공유결합적으로 결합된 상태로 유지된다.
바람직하게는 본 발명은 천연 스플릿 인테인의 N-인테인 단백질 변이체 서열 또는 천연 인테인 및 스플릿 인테인으로부터 유래된 컨센서스 서열을 제공하며, 여기서 N-인테인 변이체는 서열에 존재하는 모든 아스파라긴 (N) 아미노산 잔기를 제거하도록 천연 서열 또는 컨센서스 서열과 비교하여 변형된다. 바람직하게는 모든 이러한 서열은 N-인테인 변이체 서열의 위치 1에 시스테인 (C)을 포함하지 않는다.
바람직하게는, 본 발명은 변이체 서열의 위치 36에 아스파라긴 (N)을 포함하지 않는 N-인테인 단백질 변이체 서열을 제공한다. 이 위치는 1번인 초기 촉매 시스테인으로부터 시작하여 천연 스플릿 인테인과의 통상적인 클러스터 정렬에 따라 계산된다. 이 위치는 선행 기술 및 천연 N-인테인 서열에서 N으로 보존되지만, 본 발명자들은 이 위치가 천연 N-인테인 단백질 서열과 비교하여 증가된 알칼리 안정성을 제공하는 아미노산으로 돌연변이될 수 있으며, 이는 예를 들어 크로마토그래피 절차 동안 증가된 pH 값에 대한 저항성을 제공하기 때문에 중요하다는 것을 발견하였다. 바람직하게는 증가된 알칼리 안정성을 제공하는 아미노산은 히스티딘 (H 또는 His) 또는 글루타민 (Q 또는 Gln)이다.
천연 인테인은 관련 기술분야에 공지되어 있다. 인테인 목록은 하기 표 1에서 볼 수 있다. 모든 인테인은 스플릿 인테인으로 만들어질 잠재성을 갖는 반면, 일부 인테인은 자연적으로 스플릿 형태로 존재한다. 표에서 볼 수 있는 모든 인테인은 스플릿 인테인으로 존재하거나, 보존된 N이 알칼리 안정성을 부여하는 또 다른 아미노산, 예컨대 H 또는 Q로 대체되도록 위치 36에서 본 발명에 따라 변형된 스플릿 인테인으로 만들어질 잠재성을 갖는다.
표 1-자연 발생 인테인
개시된 조성물의 스플릿 인테인 또는 개시된 방법에서 사용될 수 있는 스플릿 인테인은 변형된 또는 돌연변이된 인테인일 수 있다. 변형된 인테인은 N-말단 인테인 세그먼트, C-말단 인테인 세그먼트, 또는 둘 다에 대한 변형을 포함할 수 있다. 변형은 스플릿 인테인의 어느 한 부분의 N-말단 C-말단에 추가 아미노산을 포함할 수 있거나, 스플릿 인테인의 어느 한 부분 내에 있을 수 있다. 표 2는 아미노산, 이들의 약자, 극성 및 전하의 목록을 제시한다.
표 2-아미노산의 목록
바람직하게는, 본 발명은 노스톡 푼크티포르메 (Npu)의 천연 N-인테인 도메인의 N-인테인 단백질 변이체를 제공하며, 여기서 천연 N-인테인 도메인은 하기 서열을 가지며:
여기서 단백질 변이체는 서열식별번호: 1의 천연 N-인테인의 알칼리 안정성과 비교하여 N-인테인 단백질 변이체의 알칼리 안정성을 증가시키는 아미노산으로의 서열식별번호: 1의 위치 36에서의 아스파라긴 (N)의 아미노산 치환을 포함한다.
바람직하게는, 본 발명은 서열식별번호: 1의 N-인테인 단백질 변이체를 제공하며, 여기서 단백질 변이체는 서열식별번호: 1의 천연 N-인테인의 알칼리 안정성과 비교하여 N-인테인 단백질 변이체의 알칼리 안정성을 증가시키는 아미노산으로의 서열식별번호: 1의 위치 36에서의 아스파라긴 (N)의 아미노산 치환에 더하여, 시스테인이 아닌 임의의 다른 아미노산으로의 서열식별번호: 1의 위치 1에서의 시스테인 (C)의 아미노산 치환을 포함한다.
본 발명은 또한 참조 단백질의 N-인테인 단백질 변이체를 제공하며, 여기서 참조 단백질은 서열식별번호: 1과 적어도 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖고, 바람직하게는 여기서 참조 단백질은 서열식별번호: 1과 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖고, 여기서 본 발명의 N-인테인 단백질 변이체는 서열식별번호: 1의 천연 N-인테인의 알칼리 안정성과 비교하여 N-인테인 단백질 변이체의 알칼리 안정성을 증가시키는 아미노산으로의 참조 단백질의 위치 36에서의 아스파라긴 (N)의 아미노산 치환을 포함한다.
또 다른 실시양태에서, N-인테인은 N-인테인 컨센서스 유래 서열인 서열식별번호: 2의 아미노산 서열을 포함한다. 서열식별번호: 2에 기초한 N-인테인 변이체 서열은 또한 서열식별번호: 1의 천연 N-인테인의 알칼리 안정성과 비교하여 N-인테인 단백질 변이체의 알칼리 안정성을 증가시키는 N 이외의 위치 36에서의 아미노산을 포함한다. 바람직하게는 알칼리 안정성을 증가시키는 아미노산은 아스파라긴 (N)과 비교하여 탈아미드화에 덜 민감한 아미노산이다. 서열식별번호: 2의 아미노산 서열은 하기와 같다:
여기서
위치 20, 35, 70, 73 및 95에서의 X는 각각 독립적으로 K, R 또는 A로부터 선택되고;
위치 28에서의 X는 C, A 또는 S이고;
위치 36에서의 X는 N, H 또는 Q이고;
위치 25에서의 X는 N 또는 R이고;
위치 59에서의 X는 D 또는 C이고;
위치 80에서의 X는 E 또는 Q이고;
위치 90에서의 X는 Q, R 또는 K이다.
본 발명에 따른 N-인테인의 바람직한 실시양태는 본원에서 A48, B22, B72 및 A41로 지칭되는 N-인테인 변이체의 군으로부터 선택되며, 여기서: A48은 서열식별번호: 2의 서열을 가지며, 여기서:
위치 20, 35, 70, 73 및 95에서의 X는 R이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 H이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q이고;
B22는 서열식별번호: 2의 서열을 가지며, 여기서:
위치 20, 35, 70, 73 및 95에서의 X는 A이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 H이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q이고;
B72는 서열식별번호: 2의 서열을 가지며, 여기서:
위치 20, 35, 70, 73 및 95에서의 X는 K이고;
위치 28에서의 X는 C이고;
위치 36에서의 X는 H이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q이다.
A40은 서열식별번호: 2의 서열을 가지며, 여기서:
위치 20, 35, 70, 73 및 95에서의 X는 R이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 N이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q이다.
A41은 서열식별번호: 2의 서열을 가지며, 여기서:
위치 20, 35, 70, 73 및 95에서의 X는 K이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 N이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q이고;
비교 리간드 A53은 서열식별번호: 2의 서열을 가지며, 여기서:
위치 20, 35, 70, 73 및 95에서의 X는 K이고;
위치 28에서의 X는 C이고;
위치 36에서의 X는 N이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q이다.
본 발명의 N-인테인은 고체상, 예컨대 멤브레인, 섬유, 입자, 비드 또는 칩에 커플링될 수 있다. 고체상은 천연 또는 합성 기원의 크로마토그래피 수지, 예컨대 천연 또는 합성 수지, 바람직하게는 폴리사카라이드, 예컨대 아가로스일 수 있다. 고체상, 예컨대 크로마토그래피 수지에는 매립된 자성 입자가 제공되어 있을 수 있다. 또 다른 실시양태에서 고체상은 비확산 제한 수지/섬유질 물질이다.
이 경우에 고체상은 하나 이상의 중합체성 나노섬유 기질, 예컨대 전기방사된 중합체 나노섬유로부터 형성될 수 있다. 본 발명에서 사용하기 위한 중합체 나노섬유는 전형적으로 10 nm 내지 1000 nm의 평균 직경을 갖는다. 중합체 나노섬유의 길이는 특별히 제한되지 않는다. 중합체 나노섬유는 적합하게는 모노필라멘트 나노섬유일 수 있고, 예를 들어 원형, 타원형 또는 본질적으로 원형/타원형 단면을 가질 수 있다. 전형적으로, 하나 이상의 중합체 나노섬유는 각각 하나 이상의 중합체 나노섬유를 포함하는 하나 이상의 부직포 시트의 형태로 제공된다. 하나 이상의 중합체 나노섬유를 포함하는 부직포 시트는 각각의 나노섬유가 본질적으로 무작위로 배향된 상기 하나 이상의 중합체 나노섬유의 매트이며, 즉 나노섬유 또는 나노섬유들이 특정 패턴을 채택하도록 제작되지 않았다. 부직포 시트는 전형적으로 1 내지 40 g/m2의 면적 밀도를 갖는다. 부직포 시트는 전형적으로 5 내지 120 μm의 두께를 갖는다. 중합체는 크로마토그래피 방법에서 크로마토그래피 매질, 즉 흡착제로서 사용하기에 적합한 중합체여야 한다. 적합한 중합체는 폴리아미드, 예컨대 나일론, 폴리아크릴산, 폴리메타크릴산, 폴리아크릴로니트릴, 폴리스티렌, 폴리술폰, 예를 들어 폴리에테르술폰 (PES), 폴리카프로락톤, 콜라겐, 키토산, 폴리에틸렌 옥시드, 아가로스, 아가로스 아세테이트, 셀룰로스, 셀룰로스 아세테이트, 및 이들의 조합을 포함한다.
본 발명에 따른 N-인테인은 고체 지지체에 매우 높은 정도로 고정화될 수 있으며, 수지 (팽윤된 겔) ml당 0.2-2 μmole/ml N-인테인이 커플링된다.
본 발명에 따른 N-인테인은 C-말단 상의 하나 이상, 예컨대 적어도 2개의 Lys를 포함하는 Lys-꼬리를 통해 고체상에 커플링될 수 있다. 대안적으로, N-인테인은 C-말단 상의 Cys-꼬리를 통해 고체상에 커플링된다.
C-인테인 단백질 변이체
바람직하게는 본 발명은 또한 하기와 같은 하기 서열식별번호: 3의 서열 또는 이와 적어도 50%, 60%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 서열 및 바람직하게는 이와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 서열을 포함하는 C-인테인을 제공한다:
N-인테인 및 C-인테인의 선택은 동일한 야생형 스플릿 인테인으로부터 유래될 수 있거나 (예를 들어, 둘 다 Npu로부터 유래됨, 또는 N- 또는 C-인테인의 변이체), 또는 대안적으로 상이한 야생형 스플릿 인테인 또는 컨센서스 스플릿 인테인 서열로부터 선택될 수 있음이 이해될 것이며, 이는 상이한 C-단편 (예를 들어, Ssp C-단편 또는 그의 변이체를 갖는 Npu N-단편 또는 그의 변이체)에 대한 N-단편의 친화성이 개시된 방법에서 사용하기에 충분한 결합 친화성을 여전히 유지한다는 것이 발견되었기 때문이다.
본 발명의 인테인 변이체를 포함하는 벡터
제3 측면에서, 본 발명은 서열식별번호: 3의 상기 C-인테인 및 관심 단백질 (POI)을 코딩하는 유전자를 포함하는 벡터에 관한 것이다. 또한, C-말단 인테인 세그먼트를 코딩하는 핵산을 포함하는 벡터, 뿐만 아니라 상기 벡터를 포함하는 세포주가 본원에 개시되어 있다. 본원에서 사용된 바와 같이, 플라스미드 또는 바이러스 벡터는 개시된 핵산, 예컨대 C-말단 인테인 세그먼트 및 관심 펩티드를 코딩하는 것을 분해 없이 세포 내로 수송하고 이들이 전달될 수 있는 세포에서 유전자의 발현을 제공하는 프로모터를 포함하는 작용제이다. 한 예에서, C-말단 인테인 세그먼트 및 관심 펩티드는 바이러스 또는 레트로바이러스로부터 유래된다. 레트로바이러스 벡터는 다른 바이러스 벡터보다 더 큰 유전적 페이로드, 즉 트랜스진 또는 마커 유전자를 운반할 수 있으며, 이러한 이유로 일반적으로 사용되는 벡터이다. 그러나, 비증식 세포에서는 유용하지 않다. 아데노바이러스 벡터는 상대적으로 안정적이고, 작업하기 쉽고, 높은 역가를 갖고, 에어로졸 제형으로 전달될 수 있고, 비분열 세포를 형질감염시킬 수 있다. 폭스 바이러스 벡터는 크고, 유전자 삽입을 위한 여러 부위를 가지며; 이들은 열안정적이고, 실온에서 저장될 수 있다.
스플릿 인테인 시스템
바람직하게는, 본 발명은 상기 기재된 바와 같은 N-인테인 및 C-인테인을 포함하는, 관심 단백질 (POI)의 친화성 정제를 위한 스플릿 인테인 시스템을 제공한다.
바람직하게는 N-인테인은 증가된 알칼리 안정성을 위한 N36H 돌연변이를 포함한다.
바람직하게는 N-인테인은 고체상에 부착되고, C-인테인은 POI와 공동-발현되고, POI의 친화성 정제를 위한 태그로서 사용된다. 그 반대의 경우도 가능하며, 즉, C-인테인을 고체상에 부착하고 N-인테인을 태그로서 사용하지만, 전자가 바람직하다.
본 발명에 따른 스플릿 인테인 시스템에서 N-인테인 리간드의 알칼리 안정성은 알칼리 조건, 예컨대 0.05-0.5 M NaOH 하에 고체상으로부터 POI의 절단 후 재생을 가능하게 한다. 고체상은 최대 100회 재생될 수 있다.
한 실시양태에서, C-인테인 및 추가 태그는 POI와 공동-발현된다. 추가 태그는 임의의 통상적인 크로마토그래피 태그, 예컨대 IEX 태그 또는 친화성 태그일 수 있다.
관심 단백질 (POI)을 정제하는 방법
제5 측면에서, 본 발명은 본 발명에 따른 스플릿 인테인 시스템을 사용하여 관심 단백질 (POI)을 정제하는 방법에 관한 것이며, 방법은 중성 pH, 예컨대 6-8에서 및 (자발적 절단을 손상시키는) 2가 양이온의 존재 하에 C-인테인 및 N-인테인을 회합시키는 단계; 2가 양이온의 존재 하에 상기 고체상을 세척하는 단계; C-인테인 및 POI 사이의 자발적 절단을 허용하도록 킬레이트제를 첨가하는 단계; 태그 없는 POI를 수집하는 단계; 및 알칼리 조건, 예컨대 0.5M NaOH 하에 상기 고체상을 재생하는 단계를 포함한다.
이 프로토콜은 Zn에 민감하지 않은 단백질에 적합하다. 장점은 수지와의 긴 접촉 시간 및 큰 샘플 부피의 첨가이다. 샘플 로딩은 긴 시간 동안, 예컨대 최대 1.5시간 동안 이루어질 수 있다.
본 발명에 따라 30% 초과, 바람직하게는 50% 초과, 가장 바람직하게는 80% 초과의 POI 수율이 4시간 미만의 절단에서 달성된다.
본 발명은 N-인테인이 고체상에 고정화될 때 높은 리간드 밀도를 가능하게 한다. 바람직하게는 N-인테인은 단백질 정제를 위한 크로마토그래피 수지, 예컨대 아가로스 또는 임의의 다른 적합한 수지에 부착된다. 본 발명에 따라 침강된 수지 ml당 0.2-2 μmole/ml C-인테인 결합된 POI의 정적 결합 용량을 달성하는 것이 가능하다.
친화성 태그
본 발명은 또한 관심 단백질 (POI)의 정제 방법으로서, POI를 본 발명에 따른 C-인테인 및 추가 태그와 공동-발현하는 단계; 상기 추가 태그를 고체상 상의 그의 결합 파트너에 결합시키는 단계; POI 및 C-인테인을 절단하는 단계; 중성 pH에서 고체상에 부착된 N-인테인에 상기 C-인테인을 결합시키고, 상기 POI로부터 상기 결합된 C-인테인 및 N-인테인을 절단하는 단계; 및 알칼리 조건, 예컨대 0.5M NaOH 하에 상기 고체상을 재생하는 단계를 포함하는 방법에 관한 것이다. 이 트윈 태그의 목적: 증가된 순도 (이중 친화성 정제를 가능하게 함), 용해성, 검출능.
친화성 태그는 단백질의 거동을 변화시키는 단백질 코딩 서열과 함께 프레임에서 클로닝된 펩티드 또는 단백질 서열일 수 있다. 친화성 태그는 세포로부터 단백질을 정제하는 방법에서 사용될 수 있는 단백질의 N- 또는 C-말단에 첨부될 수 있다. 친화성 태그를 포함하는 펩티드를 발현하는 세포는 상청액/세포 배양 배지에서 신호 서열로 발현될 수 있다. 친화성 태그를 포함하는 펩티드를 발현하는 세포는 또한 펠릿화, 용해될 수 있으며, 세포 용해물은 친화성 태그에 리간드를 표시하는 칼럼, 수지 또는 기타 고체 지지체에 적용될 수 있다. 친화성 태그 및 임의의 융합된 펩티드는 고체 지지체에 결합되어 있으며, 이는 또한 비결합된 (오염물질) 단백질을 제거하기 위해 완충액을 사용하여 수 차례 세척될 수 있다. 관심 단백질은 친화성 태그에 부착된 경우, 친화성 태그가 리간드로부터 해리되어 정제된 단백질을 생성하도록 완충액을 통해 고체 지지체로부터 용리될 수 있거나, 또는 가용성 프로테아제를 사용하여 결합된 친화성 태그로부터 절단될 수 있다. 본원에 개시된 바와 같이, 친화성 태그는 활성 인테인 복합체에서 C-인테인 세그먼트의 자기-절단 메커니즘을 통해 절단된다.
친화성의 예는 융합된 표적 단백질의 정제를 용이하게 하기 위해 고정화된 말토스에 결합할 수 있는 말토스 결합 단백질; 고정화된 키틴에 결합할 수 있는 키틴 결합 단백질; 고정화된 글루타티온에 결합할 수 있는 글루타티온 S 트랜스퍼라제; 고정화된 킬레이트된 금속에 결합할 수 있는 폴리-히스티딘; 고정화된 항-FLAG 항체에 결합할 수 있는 FLAG 옥타펩티드를 포함하나 이에 제한되지는 않는다.
친화성 태그는 또한 선택적 침전, 이온 교환 크로마토그래피, 침전-가능 리간드에 대한 결합, 투석 (표적 단백질의 크기 및/또는 전하를 변화시킴으로써) 및 기타 고도로 선택적인 분리 방법을 포함하나 이에 제한되지는 않는 다양한 방법을 통해 개시된 변형된 펩티드를 사용하여 관심 단백질의 정제를 용이하게 하기 위해 사용될 수 있다.
일부 측면에서, 리간드에 실제로 결합하지 않지만 대신에 선택적으로 침전되거나 고정화된 상응하는 결합 도메인에 대한 리간드로서 작용하는 친화성 태그가 사용될 수 있다. 이들 경우에, 태그는 보다 일반적으로 정제 태그로 지칭된다. 예를 들어, ELP 태그는 특정 염 및 온도 조건 하에 선택적으로 침전되어, 융합된 펩티드가 원심분리에 의해 정제되도록 한다. 또 다른 예는 고정화된 단백질 A 또는 단백질 G-결합 도메인에 대한 리간드 역할을 하는 항체 Fc 도메인이다.
관심 단백질
모든 프로토콜에 대한 표적 단백질은 하기와 같다: 임의의 재조합 단백질, 특별히 천연 또는 거의 천연 N-말단 서열을 필요로 하는 단백질, 예를 들어 치료 단백질 후보, 생물제제, 항체 단편, 항체 모방체, 단백질 스캐폴드, 효소, 재조합 단백질 또는 펩티드, 예컨대 성장 인자, 시토카인, 케모카인, 호르몬, 항원 (바이러스, 박테리아, 효모, 포유동물) 생산, 백신 생산, 세포 표면 수용체, 융합 단백질.
본 발명은 이제 일부 비제한적인 실시예 및 첨부 도면과 관련하여 더 자세히 설명될 것이다.
실시예
실험 1: 본 발명의 N-인테인 리간드의 알칼리 안정성
본 발명에 따른 N-인테인 리간드 A40, A41 및 A48을, 약 450 반응 단위 (RU) 이상의 고정화된 수준을 제공하기에 충분한 양으로 비아코어(Biacore)™ CM5 센서 칩 (씨티바, 스웨덴) 상에 고정화시켰다. 고정화된 표면에 대한 C-인테인 태그부착된 POI의 상대적 결합 용량을 추적하기 위해, 20 μg/ml C-인테인 (서열식별번호: 3) 태그부착된 녹색 형광 단백질 (GFP)을 칩 위로 1분 동안 유동시키고, 신호 강도를 주목하였다. 그 후, 표면을 제자리 세정 (CIP), 즉 10분 동안 실온 22 ± 3℃에서 100 mM NaOH, 4 M 구아니딘-HCl로 플러싱하였다. 이것을 50 사이클 동안 반복하였고, 고정화된 리간드 알칼리 안정성은 각 사이클 후에 상대적 C-인테인 태그부착된 GFP 결합 용량 (신호 강도)의 상대적 손실로 이어졌다.
결과는 도 1에 제시되어 있고, 리간드 A48 (N36H 돌연변이 포함)이 리간드 A41 및 A40과 비교하여 개선된 알칼리 안정성을 가짐을 표시한다. 알칼리 안정성은 천연 서열과 비교하여 추가로 개선되었다. 또한, N36H 돌연변이는 야생형 Npu N-인테인 서열 (서열식별번호: 1과 비교하여 C1A 돌연변이를 갖는 A52)과 비교하여 알칼리 안정성을 유의하게 개선하였다.
50 CIP 사이클 후 상대적 잔여 결합 용량 (%)는 A40 및 A41의 경우 55%인 반면, A48의 경우 69%였다. 0.5M NaOH를 사용한 알칼리 안정성은 도 5에 제시되어 있다.
도 5는 20 사이클 동안 A40 및 A48에 대한 결과를 제시한다. 상대적 잔여 결합 용량 (%)
CIP: 2분. 100 mM NaOH, 4 M Gdn-HCl, 이어서 2분. 0.5 M NaOH.
실험 2: 본 발명의 N-인테인 리간드의 알칼리 안정성
정제된 N-인테인 리간드 A53, B72, B22 및 A48을, 약 450 반응 단위 (RU) 이상의 고정화된 수준을 제공하기에 충분한 양으로 비아코어™ CM5 센서 칩 (씨티바, 스웨덴) 상에 고정화시켰다. 고정화된 표면에 대한 비절단가능한 C-인테인 태그부착된 POI의 상대적 결합 용량을 추적하기 위해, 20 μg/ml 비절단가능한 C-인테인 (서열식별번호: 3) 태그부착된 IL-1b를 칩 위로 1분 동안 유동시키고, 신호 강도를 주목하였다. 그 후, 표면을 제자리 세정 (CIP), 즉 10분 동안 실온 22 ± 3℃에서 100 mM NaOH, 4 M 구아니딘-HCl로 플러싱하였다. 이것을 50 사이클 동안 반복하였고, 고정화된 리간드 알칼리 안정성은 각 사이클 후에 비절단가능한 C-인테인 태그부착된 IL-1b 결합 용량 (신호 강도)의 상대적 손실로 이어졌다.
결과는 도 2에 제시되어 있고, N36H 돌연변이를 갖는 3개의 리간드 (A48, B22 및 B72) 모두가 리간드 A53과 비교하여 개선된 알칼리 안정성을 가짐을 표시한다. 50 CIP 사이클 후 상대적 잔여 결합 용량 (%)은 A53의 경우 오직 20%인 반면, B72의 경우 28%, B22의 경우 30% 및 A48의 경우 35%였다.
실험 3: 아가로스 겔 수지에 대한 N-인테인 리간드 A48의 고정화
5 밀리리터의 에폭시 활성화된 가교된 활성화된 겔 수지를 폴리프로필렌 테스트-튜브에 첨가하였다. 포스페이트 완충액 중 C-말단 Lys-꼬리를 갖는 N-인테인 리간드 A48 135 밀리그램에 상응하는 2.7 밀리리터를 튜브에 첨가한 후, 1.3 밀리리터의 포스페이트 완충액 (pH 12.1)을 첨가하여 아가로스 수지 슬러리를 약 50%로 조절한 후, 2 그램의 황산나트륨을 첨가하였다. 생성된 반응 혼합물의 pH를 11.5로 조절하였다. 그리고 반응 혼합물을 진탕 테이블에서 33℃까지 가열하고, 33℃에서 4시간 동안 계속 진탕하였다. 그 후, 슬러리를 유리 필터로 옮기고, 10 밀리리터의 증류수로 3회 세척하였다. 세척 후, 겔을 3구 둥근 바닥 플라스크 (RBF)로 옮기고, 375 마이크로리터의 티오글리세롤을 갖는 5 밀리리터의 Tris 완충액 (pH 8.6)을 첨가하였다. 반응 혼합물을 45℃에서 2시간 동안 진탕 테이블에 두었다. 반응 후, 슬러리를 유리 필터로 옮겼다. 겔을 5 밀리리터의 염기성 세척 완충액으로 3회 세척한 후, 5 밀리리터의 산성 세척 완충액으로 3회 세척하였다. 이 염기/산 세척을 2회 더 반복하여, 이 단계에서 총 18회 세척하였다. 그 후, 겔 수지를 5 밀리리터의 증류수로 10회 세척하였다. 세척되고 배수된 겔을 분석 전에 냉장고에서 20% 에탄올에서 보관하였다.
겔 수지의 건조 중량은 겔 1 밀리리터의 중량을 측정함으로써 결정하였다. 샘플 준비에서, 2 그램의 배수된 겔 수지를 2 그램의 물과 잘 혼합하여 약 50% 수지 슬러리를 제공한 후, 슬러리를 1 mL 테프론 큐브에 첨가하였다. 그 후, 진공을 적용하여 큐브의 겔을 배수하였으며, 그러므로 1 mL의 겔을 수득하였다. 겔을 건조 중량 저울로 옮겼다. 건조 온도를 105℃로 설정하고 35분 후에 중량을 결정하였다.
건조 중량 결정 후 아미노산 분석을 측정하였다. 상응하는 건조 중량 및 단백질의 크기 및 1차 아미노 서열의 정보를 사용하여, 리간드 밀도를 mg/mL 겔 수지에서 유도할 수 있었다.
커플링된 아가로스 수지에 대한 결과는 90.6 mg/ml의 건조-중량 및 1.38 umole/ml에 상응하는 18.4 mg/ml의 리간드 함량이었다.
실험 4: 리간드 밀도와 관련된 정적 결합 용량
본원에 제시된 제안된 용량 방법은 테스트 튜브에서 수지의 결합 용량을 측정할 수 있다.
반응 설정
간단히 말해서, 다양한 리간드 밀도를 갖는 고정화된 A48 리간드를 갖는 프로토타입 수지 및 이중 태그부착된 테스트-단백질 A43 (서열식별번호: 5)을 검정 완충액 (2x PBS)에서 각각 2.5% 수지 슬러리 및 0.4mg/mL로 별도로 희석하였다. 50μL의 2.5% 수지 슬러리를 일루스트라(ILLUSTRA)™ 마이크로스핀 칼럼에 첨가한 다음, 150μL의 희석된 A43 (서열식별번호: 5)을 첨가하였다. 반응물을 3000rcf에서 1분 동안 원심분리하기 전에 2시간 고정된 시점 동안 22℃에서 1450rpm에서 진탕하면서 인큐베이션하도록 하였다.
SDS-PAGE
원심분리된 샘플 (절단된 단백질 및 비결합된 비절단된 단백질 함유)을 2x SDS-PAGE 환원 샘플 완충액과 1:1 혼합하고, 5분 동안 95℃에서 끓이고, SDS-PAGE (18μL 로딩)를 수행하였다. 밀도계 부피로부터 농도를 계산할 수 있기 위해, C-인테인 태그부착된 테스트-단백질, A43 (서열식별번호: 5) 표준을 첨가하였다 (대개 18.75-300μg/mL 사이의 5점 표준). 겔을 60분 동안 쿠마시 염색 (~100mL/겔)한 후, 온화하게 진탕하면서 120-180분 동안 실온에서 탈색하였다 (배경이 완전히 깨끗해질 때까지). IQ TL 소프트웨어를 사용하여 비절단된/비결합된 및 절단된 테스트-단백질의 밀도계 정량화를 수행하였다. 그 후, 밀도계 원시 데이터를 마이크로소프트 엑셀로 내보냈다.
SBC 계산
반응에서 테스트-단백질 입력이 알려져 있기 때문에, 하기 방정식에 의해 정적 결합 용량 (SBC)을 간접적으로 계산할 수 있다:
도 3은 본 발명의 N-인테인 리간드의 정적 결합 용량을 제시한다. 아미노산 분석 (AAA)은 통상적인 방법에 의해 수행되었다. A48 프로토타입은 에폭시 화학에 의해 다공성 아가로스 입자에 커플링되었다.
실험 5: Zn 프로토콜을 사용한 및 이를 사용하지 않은 신장 인자 G의 정제
써모아나에로박터 텡콘겐시스(Thermoanaerobacter tengcongensis)로부터의 신장 인자 G (Ef-G)를 고정화된 리간드 A48을 갖는 수지 프로토타입을 사용하여 이 실시예에서 정제하였다. C-인테인 (서열식별번호: 3) 태그부착된 EfG를 이. 콜라이 균주 BL21 (DE3)에서 세포내에서 발현하였다.
발효 수확 후 동결된 세포-펠릿을 해동하고, 자성 교반에 의해 추출 완충액 (20 mM Tris-HCl, pH 8.0)으로 재현탁시켰다. DNAse I (소 췌장) 및 1 mM MgSO4를 첨가한 후, 리소자임 (계란)을 첨가하였다. 30분 동안 실온에서 교반한 후, 재현탁되고 리소자임 처리된 세포 현탁액을 수조에서 70-75℃로 가열하고, 이 온도에서 5분 동안 유지하였다. 추출물을 얼음 위에서 잠시 냉각한 후, 추출물을 원심분리에 의해 정화하였다.
Zn-비함유 프로토콜을 사용한 정제는 AKTA™ 아반트(Avant) 시스템에서 샘플 로딩 및 세척 동안 2 ml/분으로 수행한 후 1 ml/분으로 수행하였다. 고정화된 A48 리간드를 함유하는 1 ml 하이트랩™ 칼럼을 사용하였다. C-인테인 태그부착된 표적 단백질의 평형화 및 결합을 pH 6.3에서 100 mM NaCl로 보충된 20 mM MES 완충액에서 수행하였고, 2M 아세트산을 사용하여 샘플을 pH 6.3으로 조절하였다. 샘플 적용 후 칼럼 세척 및 후속 용리를 pH 8.0에서 400 mM NaCl로 보충된 20 mM Tris-HCl 완충액으로 수행하였다. 칼럼 세척 후, 유동을 실온에서 4시간의 인큐베이션 동안 중단한 다음, 절단된 EfG를 용리하였다. 유동의 제2 정지를 첨가하여 제2 용리를 허용하였으며, 이를 추가 16시간의 인큐베이션 후에 수행하였다.
하이트랩(HiTrap)™ 칼럼에서 4시간 인큐베이션 후에 17.8 mg 순수한, 태그-비함유 EfG를 용리하였다. 용리된 단백질 및 CIPed 단백질 간의 질량 차이는 질량 분광광도법 분석에 따른 C-인테인 태그의 질량과 동일하였다. SDS-PAGE에 따른 순도는 슈퍼덱스(Superdex)™ 200 증가에 대한 SEC-분석에서와 마찬가지로 높았다. 총 단백질 양을 280 nm에서의 이론적 UV 흡수 계수 및 희석된 용리 및 CIP 분획에 대한 UV-신호로부터 계산하였다.
평형화 완충액 및 정화된 샘플에 대한 Zn-이온을 포함하는 프로토콜을 사용하여 정제를 반복하였다. 최종 Zn-농도는 1.6 mM이었다. 유속을 샘플 적용 동안 0.5 ml/분으로 감소시킨 후, 세척 및 용리 동안 1 ml/분으로 증가시켰다. 세척 및 용리를 50 mM Tris-HCl, 20 mM 이미다졸 완충액 pH 7.5로 수행하였다. 이 정제에서 단 하나의 용리 피크만이 수집되었으며, 이는 칼럼 세척 후 4시간의 인큐베이션 후였다.
하이트랩™ 칼럼에서 4시간 인큐베이션 후 16.6 mg 순수한, 태그-비함유 EfG를 용리하였다. 슈퍼덱스™ 200 증가에 대한 SEC-분석에 따른 순도는 92%였다. 총 단백질 양을 280 nm에서의 이론적 UV 흡수 계수 및 희석된 용리 분획에 대한 UV-신호로부터 계산하였다.
실험 6: IL-1β의 정제
고정화된 A48 리간드를 함유하는 1 ml 하이트랩™ 칼럼을 이. 콜라이 BL21 (DE3)에서 세포내에서 발현되고 초음파처리에 의해 용해된 C-인테인 태그부착된 표적 단백질 IL-1β (서열식별번호: 5)의 정제에 사용하였다. 가용성 단백질을 원심분리에 의해 수확하고, A48 리간드로 고정화된 1mL 하이트랩™ 칼럼에 로딩하였다. Zn-비함유 프로토콜 (실험 4에서와 같이)을 샘플 로딩 및 세척 동안 4 ml/분 (600cm/h 선형 유속)으로 AKTA™ 아반트 시스템에서 사용하였다. 그 후, 실행을 4시간 동안 일시 중지한 다음, 1 mL/분으로 다시 유동을 개시하여 절단된 단백질 (4h 절단 분획)을 용리하였다. 그 후, 실행을 추가 12시간 동안 다시 일시 중지한 다음, 1 mL/분으로 유동을 시작하여 4시간 후에 비절단된 단백질을 용리하였다. 세척 및 용리의 평형화 및 결합을 하나의 단일 완충액으로 수행하였다. 정제로부터의 크로마토그램은 도 4a에 제시되어 있다. 출발 물질, 플로우 스루, 세척 분획, 4h 및 16h 용리 분획은 SDS-PAGE 및 쿠마시 염색 및 IQTL 소프트웨어를 사용한 후속 분석을 거쳤다 (도 4b).
하이트랩™ 칼럼에서 4시간 인큐베이션 후에 9.4 mg 절단된 IL-1β가 용리되었고, 16시간 후에 추가적인 1.1mg이 용리되었다. 순도는 SDS-PAGE 분석에 따라 99.5 (4시간) 및 99.8% (16시간)였다. 총 단백질 양을 280 nm에서 절단된 단백질의 이론적 UV 흡수 계수로부터 계산하였다.
실험 7: SARS-COV-2의 수용체 결합 도메인의 정제
C-인테인으로 태그부착된 SARS-COV-2 NCBI의 수용체 결합 도메인 (RBD)은 ExpiHEK 세포에서 발현되었고, 세포 배양 배지에서 분비되었다. AKTA™ 아반트 FPLC 시스템을 사용하여 세포 배양 상청액에 염 또는 기타 첨가제를 첨가하지 않고 고정화된 A48 리간드를 갖는 1mL 하이트랩 칼럼에 대략 210mL 상청액을 로딩하였다. 샘플 적용 및 세척을 4mL/분 (로드 시간 ~52.5분 (600cm/h 선형 유속))으로 수행한 다음, 6 칼럼 부피의 세척 후, 4시간 동안 일시 중지/유지 단계를 수행하였다. 용리 단계를 1mL/분으로 수행하였다. 칼럼을 추가 68시간 동안 방치한 후 제2 용리를 수행하였다. 300mM NaCl로 보충된 단일 40mM 포스페이트 완충액 pH 7.4 완충액을 모든 크로마토그래피 단계에 사용하였다.
이론적 흡광도 0.1% 계수를 사용하여 유니콘(Unicorn)™ 소프트웨어 (씨티바 스웨덴 아베) 내에서 단백질 농도 및 수율을 결정하였다. 순도를 밀도계 SDS-PAGE 분석에 의해 결정하였다. 이 실험을 위해 총 14.1mg의 절단된 단백질이 96% 초과의 순도로 수득되었다. 이론적 분자량은 ~25kDa인 반면, 실험적 SDS-PAGE 분석은 33 kDa의 분자량을 나타내며, 이는 2개의 글리코실화에 의해 설명되고, 또한 질량 분광광도법 분석에 의해 결정되었다.
CCT-RBD 단백질은 하기 서열을 갖는다:
신호 서열- 굵은 밑줄.
CCT-태그- 점선 밑줄.
RBD 도메인은 이중 밑줄임.
His Tag- 파선 밑줄
절단된 단백질로부터의 순도 결과는 표 3에서 볼 수 있다.
표 3
실험 8: 2개의 칼럼에 대한 탠덤 태그부착 및 친화성 정제
이. 콜라이 BL21(DE3)을 A43 발현 플라스미드 트윈스트렙(TwinStrep)™ 및 C-인테인 (서열식별번호: 3) 태그부착된 IL-1b로 형질전환하고, 50 μg/ml 카나마이신을 함유하는 한천 플레이트에 플레이팅하였다. 다음날, 단일 콜로니를 고르고, 5 ml의 루리아-버타니(Luria-Bertani) (LB) 브로쓰에서 OD600 0.6으로 성장시켰다. 배양물을 동일한 항생제를 함유하는 200 ml LB 브로쓰로 옮기고, OD600이 0.6이 될 때까지 37℃에서 성장시켰다. 이소프로필 b-D-1-티오갈락토피라노사이드 (IPTG, 0.5 mM)를 첨가함으로써 22℃에서 16시간 동안 단백질 발현을 유도하였다. 발현 후, 세포를 15분 동안 4,000 x g에서 원심분리에 의해 수확하고, 사용할 때까지 -80℃에서 저장하였다.
정제를 위해, 세포 펠릿을 습윤-중량 그램당 10 ml로 완충액 A1 (100 mM Tris-HCl, 150 mM NaCl, 1 mM EDTA, pH 8.0)에 재현탁하고, 초음파처리 (소닉스 비브라셀(Sonics Vibracell), 마이크로팁, 30% 진폭, 2초 켜기, 4초 끄기, 총 3분)에 의해 파괴하였다.
가용성 분획을 함유하는 상청액을 4℃에서 20분 동안 40,000 x g에서 원심분리 후 수집하고, 5 ml 하이트랩™ 칼럼, 스트렙탁틴™ XT (지이 헬스케어(GE Healthcare), 스웨덴)를 통해 통과하였다. 280 nm에서 UV-흡광도가 20 mAU 미만이 될 때까지 칼럼을 동일한 완충액 A1로 세척하였다. 결합된 C-인테인 태그부착된 IL-1b를 완충액 B1 (100 mM Tris-HCl, 150 mM NaCl, 1 mM EDTA, 50 mM 비오틴, pH 8.0)에서 용리하고 수집하였다.
억제제 ZnCl2를 첨가하지 않고 고정화된 N-인테인 리간드 A48을 함유하는 수지로 패킹된 1 ml 하이트랩™ 칼럼에 정제된 단백질을 즉시 적용하였다. 절단된, 태그-비함유 IL-1b를 플로우-스루에서 수집하였다.
트윈스트렙 - 점선 밑줄
CCT - 굵은 밑줄
IL1b (테스트-단백질) - 밑줄
본원에 언급된 특허 및 과학 문헌은 관련 기술분야의 통상의 기술자가 이용할 수 있는 지식을 확립한다. 본원에 인용된 모든 미국 특허 및 공개된 또는 비공개된 미국 특허 출원은 참조로 포함된다. 본원에 인용된 모든 공개된 외국 특허 및 특허 출원은 본원에 참조로 포함된다. 본원에 인용된 다른 모든 공개된 참고문헌, 문서, 원고 및 과학 문헌은 본원에 참조로 포함된다.
본 발명은 그의 바람직한 실시양태를 참조하여 구체적으로 제시되고 설명되었지만, 첨부된 청구범위에 의해 포함된 본 발명의 범위를 벗어나지 않으면서 형태 및 세부사항의 다양한 변화가 이루어질 수 있다는 것이 관련 기술분야의 통상의 기술자에 의해 이해될 것이다. 또한, 본원에 기재된 실시양태는 상호 배타적이지 않으며, 다양한 실시양태로부터의 특징이 본 발명에 따라 전체적으로 또는 부분적으로 조합될 수 있음을 이해해야 한다.
SEQUENCE LISTING
<110> CYTIVA BIOPROCESS R&D AB
<120> IMPROVED PROTEIN PURIFICATION
<130> 100001.00164
<140> PCT/EP2020/082966
<141> 2020-11-20
<150> GB 1917046.3
<151> 2019-11-22
<160> 5
<170> PatentIn version 3.5
<210> 1
<211> 97
<212> PRT
<213> Nostoc punctiforme
<400> 1
Cys Leu Ser Tyr Glu Thr Glu Ile Leu Thr Val Glu Tyr Gly Leu Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Lys Arg Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Asn Asn Gly Asn Ile Tyr Thr Gln Pro Val Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Phe Glu Tyr Cys Leu Glu Asp Gly Ser
50 55 60
Leu Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Val Asp Gly Gln
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Arg Glu Leu Asp Leu Met Arg
85 90 95
Val
<210> 2
<211> 97
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<220>
<221> VARIANT
<222> (20)..(20)
<223> /replace="R" or "A"
<220>
<221> VARIANT
<222> (25)..(25)
<223> /replace="R"
<220>
<221> VARIANT
<222> (28)..(28)
<223> /replace="A" or "S"
<220>
<221> VARIANT
<222> (35)..(35)
<223> /replace="R" or "A"
<220>
<221> VARIANT
<222> (36)..(36)
<223> /replace="H" or "Q"
<220>
<221> VARIANT
<222> (59)..(59)
<223> /replace="C"
<220>
<221> VARIANT
<222> (70)..(70)
<223> /replace="R" or "A"
<220>
<221> VARIANT
<222> (73)..(73)
<223> /replace="R" or "A"
<220>
<221> VARIANT
<222> (80)..(80)
<223> /replace="Q"
<220>
<221> VARIANT
<222> (90)..(90)
<223> /replace="R" or "K"
<220>
<221> VARIANT
<222> (95)..(95)
<223> /replace="R" or "A"
<220>
<221> SITE
<222> (1)..(97)
<223> /note="Variant residues given in the sequence have no
preference with respect to those in the annotations
for variant positions"
<400> 2
Ala Leu Ser Tyr Asp Thr Glu Ile Leu Thr Val Glu Tyr Gly Phe Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Glu Glu Asn Ile Glu Cys Thr Val Tyr Ser
20 25 30
Val Asp Lys Asn Gly Phe Val Tyr Thr Gln Pro Ile Ala Gln Trp His
35 40 45
Asn Arg Gly Glu Gln Glu Val Phe Glu Tyr Asp Leu Glu Asp Gly Ser
50 55 60
Ile Ile Arg Ala Thr Lys Asp His Lys Phe Met Thr Thr Asp Gly Glu
65 70 75 80
Met Leu Pro Ile Asp Glu Ile Phe Glu Gln Gly Leu Asp Leu Lys Gln
85 90 95
Val
<210> 3
<211> 35
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
C-intein sequence"
<400> 3
Val Lys Ile Val Ser Arg Lys Ser Leu Gly Val Gln Asn Val Tyr Asp
1 5 10 15
Ile Gly Val Glu Lys Asp His Asn Phe Leu Leu Ala Asn Gly Leu Ile
20 25 30
Ala Ser Asn
35
<210> 4
<211> 284
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 4
Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro
1 5 10 15
Gly Ser Thr Gly Val Lys Ile Val Ser Arg Lys Ser Leu Gly Val Gln
20 25 30
Asn Val Tyr Asp Ile Gly Val Glu Lys Asp His Asn Phe Leu Leu Ala
35 40 45
Asn Gly Leu Ile Ala Ser Asn Arg Val Gln Pro Thr Glu Ser Ile Val
50 55 60
Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn
65 70 75 80
Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser
85 90 95
Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser
100 105 110
Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys
115 120 125
Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val
130 135 140
Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr
145 150 155 160
Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn
165 170 175
Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu
180 185 190
Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu
195 200 205
Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn
210 215 220
Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val
225 230 235 240
Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His
245 250 255
Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys
260 265 270
Asn Lys Cys Val Asn Phe His His His His His His
275 280
<210> 5
<211> 230
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 5
Met Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly
20 25 30
Gly Gly Ser Gly Gly Gly Ser Val Lys Ile Val Ser Arg Lys Ser Leu
35 40 45
Gly Val Gln Asn Val Tyr Asp Ile Gly Val Glu Lys Asp His Asn Phe
50 55 60
Leu Leu Ala Asn Gly Leu Ile Ala Ser Asn Ala Phe Val Arg Ser Leu
65 70 75 80
Asn Cys Thr Leu Arg Asp Ser Gln Gln Lys Ser Leu Val Met Ser Gly
85 90 95
Pro Tyr Glu Leu Lys Ala Leu His Leu Gln Gly Gln Asp Met Glu Gln
100 105 110
Gln Val Val Phe Ser Met Ser Phe Val Gln Gly Glu Glu Ser Asn Asp
115 120 125
Lys Ile Pro Val Ala Leu Gly Leu Lys Glu Lys Asn Leu Tyr Leu Ser
130 135 140
Cys Val Leu Lys Asp Asp Lys Pro Thr Leu Gln Leu Glu Ser Val Asp
145 150 155 160
Pro Lys Asn Tyr Pro Lys Lys Lys Met Glu Lys Arg Phe Val Phe Asn
165 170 175
Lys Ile Glu Ile Asn Asn Lys Leu Glu Phe Glu Ser Ala Gln Phe Pro
180 185 190
Asn Trp Tyr Ile Ser Thr Ser Gln Ala Glu Asn Met Pro Val Phe Leu
195 200 205
Gly Gly Thr Lys Gly Gly Gln Asp Ile Thr Asp Phe Thr Met Gln Phe
210 215 220
Val Ser Ser Ala Ala Ala
225 230
Claims (39)
- 천연 스플릿 인테인의 적어도 하나의 아미노산 치환을 포함하는 N-인테인 변이체로서, 여기서 N-인테인 단백질 변이체 서열은 초기 촉매 시스테인으로부터 측정된 바와 같이 적어도 위치 36에 아스파라긴 (N)을 포함하지 않고, 여기서 치환된 아미노산은 천연 N-인테인 단백질 서열 또는 컨센서스 N-인테인 서열과 비교하여 증가된 알칼리 안정성을 제공하는 것인 N-인테인 변이체.
- 제1항에 있어서, 증가된 알칼리 안정성을 제공하는 치환된 아미노산이 H 또는 Q인 N-인테인 변이체.
- 제3항에 있어서, 알칼리 안정성을 증가시키는 아미노산 치환이 히스티딘 (H) 또는 글루타민 (Q)인 N-인테인 단백질 변이체.
- 제4항에 있어서, 알칼리 안정성을 증가시키는 아미노산 치환이 히스티딘 (H)인 N-인테인 단백질 변이체.
- 제6항에 있어서,
위치 20, 35, 70, 73 및 95에서의 X는 R이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 H이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q인
N-인테인 변이체 서열. - 제6항에 있어서,
위치 20, 35, 70, 73 및 95에서의 X는 A이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 H이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q인
N-인테인 변이체 서열. - 제6항에 있어서,
위치 20, 35, 70, 73 및 95에서의 X는 K이고;
위치 28에서의 X는 C이고;
위치 36에서의 X는 H이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q인
N-인테인 변이체 서열. - 제6항에 있어서,
위치 20, 35, 70, 73 및 95에서의 X는 R이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 N이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q인
N-인테인 변이체 서열. - 제6항에 있어서,
위치 20, 35, 70, 73 및 95에서의 X는 K이고;
위치 28에서의 X는 A이고;
위치 36에서의 X는 N이고;
위치 25에서의 X는 N이고;
위치 59에서의 X는 D이고;
위치 80에서의 X는 E이고;
위치 90에서의 X는 Q인
N-인테인 변이체 서열. - 제1항 내지 제11항 중 어느 한 항에 있어서, 고체상, 예컨대 멤브레인, 섬유, 입자, 비드 또는 칩에 커플링된 N-인테인 변이체 서열.
- 제12항에 있어서, 고체상이 천연 또는 합성 기원의 크로마토그래피 수지인 N-인테인 변이체 서열.
- 제12항 또는 제13항에 있어서, 고체상이 크로마토그래피 수지, 예컨대 천연 또는 합성 수지, 바람직하게는 폴리사카라이드, 예컨대 아가로스인 N-인테인 변이체 서열.
- 제13항에 있어서, 고체상에는 매립된 자성 입자가 제공되어 있는 것인 N-인테인 변이체 서열.
- 제12항에 있어서, 고체상이 비확산 제한 수지/섬유질 물질인 N-인테인 변이체 서열.
- 제12항 또는 제13항에 있어서, N-인테인이 C-말단 상의 하나 이상의 Lys를 포함하는 Lys-꼬리를 통해 고체상에 커플링된 것인 N-인테인 변이체 서열.
- 제12항 또는 제13항에 있어서, N-인테인이 C-말단 상의 Cys-꼬리를 통해 고체상에 커플링된 것인 N-인테인 변이체 서열.
- 제12항 내지 제18항 중 어느 한 항에 있어서, 고체상, 바람직하게는 크로마토그래피 수지 ml당 (팽윤된 겔 ml당) 0.2-2 μmole/ml N-인테인이 커플링된 것인 N-인테인 변이체 서열.
- 제1항 내지 제19항 중 어느 한 항에 있어서, N-인테인이 0.05M-0.5M, 바람직하게는 0.1-0.5M NaOH에 상응하는 알칼리 조건 하에 안정적인 것인 N-인테인 서열.
- 제21항에 따른 C-인테인 및 관심 단백질 (POI)을 코딩하는 유전자를 포함하는 벡터.
- 천연 N-인테인의 N-인테인 변이체 서열 및 C-인테인을 포함하는, 관심 단백질 (POI)의 친화성 정제를 위한 스플릿 인테인 시스템으로서, 여기서 N-인테인 변이체 서열은 천연 N-인테인과 비교하여 N36H 또는 N36Q 돌연변이를 갖는 것인 스플릿 인테인 시스템.
- 제23항에 있어서, 제1항 내지 제20항 중 어느 한 항의 N-인테인 서열 변이체 및 서열식별번호: 3의 C-인테인 변이체 서열을 포함하는 스플릿 인테인 시스템.
- 제23항 또는 제24항에 있어서, C-인테인 및 추가 태그가 POI와 공동-발현되는 것인 스플릿 인테인 시스템.
- 제23항 내지 제25항 중 어느 한 항에 있어서, N-인테인이 고체상에 고정화되고, 고체상이 고체상으로부터 POI의 절단 후 재생되는 것인 스플릿 인테인 시스템.
- 제26항에 있어서, 고체상이 알칼리 조건, 예컨대 0.05-0.5 M NaOH 하에 재생되는 것인 스플릿 인테인 시스템.
- 제26항 또는 제27항에 있어서, 고체상이 최대 100 사이클, 예컨대 최대 50 사이클 재생되는 것인 스플릿 인테인 시스템.
- 하나 이상의 N-인테인 변이체 서열 리간드를 포함하는 크로마토그래피 수지를 포함하는 크로마토그래피 칼럼으로서, 여기서 N-인테인 변이체 서열은 제1항 내지 제20항 중 어느 한 항에 정의된 바와 같은 것인 크로마토그래피 칼럼.
- 제23항 내지 제29항 중 어느 한 항에 따른 스플릿 인테인 시스템을 사용하여 C-인테인 태그부착된 관심 단백질 (POI)을 정제하는 방법으로서, 여기서 N-인테인은 고체상에 고정화되며; 중성 pH, 예컨대 6-8에서 및 2가 양이온의 존재 하에 C-인테인 및 N-인테인을 접촉시키는 단계; 2가 양이온의 존재 하에 상기 고체상을 세척하는 단계; C-인테인 및 POI 사이의 자발적 절단을 허용하도록 킬레이트제를 첨가하는 단계; 태그 없는 POI를 수집하는 단계; 및 알칼리 조건, 예컨대 0.05-0.5M NaOH 하에 상기 고체상을 재생하는 단계를 포함하는 방법.
- 제23항 내지 제29항 중 어느 한 항에 따른 스플릿 인테인 시스템을 사용하여 C-인테인 태그부착된 관심 단백질 (POI)을 정제하는 방법으로서, 여기서 N-인테인은 고체상에 고정화되며; 중성 pH, 예컨대 6-8에서, 바람직하게는 높은 유속 하에 C-인테인 및 N-인테인을 접촉시키는 단계; 상기 고체상을 세척하는 단계; C-인테인 및 POI 사이의 절단 후 태그 없는 POI를 수집하는 단계; 및 알칼리 조건, 예컨대 0.05-0.5M NaOH 하에 상기 고체상을 재생하는 단계를 포함하는 방법.
- 관심 단백질 (POI)의 정제 방법으로서, POI를 서열식별번호: 3에 따른 C-인테인 및 추가 태그와 공동-발현하는 단계; 상기 추가 태그를 제1 고체상 상의 그의 결합 파트너에 결합시키는 단계; POI 및 C-인테인을 절단하는 단계; 중성 pH에서 제2 고체상에 부착된 N-인테인에 상기 C-인테인을 결합시키고, 상기 POI로부터 상기 결합된 C-인테인 및 N-인테인을 절단하는 단계; 및 알칼리 조건, 예컨대 0.05-0.5M NaOH 하에 상기 제2 고체상을 재생하는 단계를 포함하는 방법.
- 제32항에 있어서, 추가 태그가 친화성 태그, 이온 교환, 소수성 상호작용, 용해성, 다중모드인 방법.
- 제30항 내지 제33항 중 어느 한 항에 있어서, 알칼리 조건이 카오트로프제, 예컨대 구아니딘 또는 우레아와 조합되고, 고체상이 최대 100회 재생될 수 있는 것인 방법.
- 제30항 내지 제34항 중 어느 한 항에 있어서, POI가 천연 또는 거의 천연 N-말단 서열을 필요로 하는 단백질, 예를 들어 치료 단백질 후보, 생물제제, 항체 단편, 항체 모방체, 효소, 재조합 단백질 또는 펩티드, 예컨대 성장 인자, 시토카인, 케모카인, 호르몬, 항원 (바이러스, 박테리아, 효모, 포유동물) 생산, 백신 생산, 세포 표면 수용체, 융합 단백질인 방법.
- 제30항 내지 제35항 중 어느 한 항에 있어서, 30% 초과, 바람직하게는 50% 초과, 가장 바람직하게는 80% 초과의 POI 수율이 4시간 미만의 절단에서 달성되는 것인 방법.
- 제30항 내지 제36항 중 어느 한 항에 있어서, N-인테인이 크로마토그래피 수지 상에 고정화되고, 정적 결합 용량이 침강된 수지 ml당 0.2-2 μmole/ml C-인테인 결합된 POI인 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 모든 아스파라긴 (N) 아미노산 잔기가 천연 N-인테인 단백질 서열과 비교하여 증가된 알칼리 안정성을 제공하는 아미노산 잔기로 치환된 것인 N-인테인 변이체.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 모든 아스파라긴 (N) 아미노산 잔기가 증가된 알칼리 안정성을 제공하는 아미노산 잔기로 치환되고, 제1 잔기의 시스테인이 임의의 다른 아미노산으로 치환된 것인 N-인테인 변이체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB1917046.3A GB201917046D0 (en) | 2019-11-22 | 2019-11-22 | Improved protein production |
GB1917046.3 | 2019-11-22 | ||
PCT/EP2020/082966 WO2021099607A1 (en) | 2019-11-22 | 2020-11-20 | Protein purification using a split intein system |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220105157A true KR20220105157A (ko) | 2022-07-26 |
Family
ID=69137378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227016527A KR20220105157A (ko) | 2019-11-22 | 2020-11-20 | 스플릿 인테인 시스템을 사용하는 단백질 정제 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP4061932A1 (ko) |
JP (1) | JP2023502335A (ko) |
KR (1) | KR20220105157A (ko) |
CN (1) | CN114698379A (ko) |
CA (1) | CA3155170A1 (ko) |
GB (1) | GB201917046D0 (ko) |
WO (1) | WO2021099607A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20240007210A (ko) | 2021-05-12 | 2024-01-16 | 씨티바 바이오프로세스 알&디 에이비 | 개선된 단백질 정제 |
CN114606252A (zh) * | 2022-04-20 | 2022-06-10 | 广州市乾相生物科技有限公司 | 一种基于过滤法的寡肽合成及纯化方法 |
CN115028741A (zh) * | 2022-06-21 | 2022-09-09 | 苏州工业园区唯可达生物科技有限公司 | 一种肿瘤抗原抗体复合物及制备方法和应用 |
CN115925830B (zh) * | 2022-08-15 | 2023-11-07 | 广州市乾相生物科技有限公司 | 一种内含肽变体及其在生物法制备类蛇毒肽前体中的应用 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6177780B2 (ja) * | 2011-09-28 | 2017-08-09 | エラ、ビオテック、ソシエダッド、アノニマEra Biotech, S.A. | スプリットインテインおよびその使用 |
US20150344549A1 (en) | 2012-06-27 | 2015-12-03 | The Trustees Of Princeton University | Split inteins, conjugates and uses thereof |
WO2014056199A1 (zh) * | 2012-10-12 | 2014-04-17 | 清华大学 | 多肽的产生和纯化方法 |
US10087213B2 (en) | 2013-01-11 | 2018-10-02 | The Texas A&M University System | Intein mediated purification of protein |
CN107406514B (zh) | 2014-11-03 | 2021-11-30 | 默克专利有限公司 | 可溶内含肽融合蛋白以及用于纯化生物分子的方法 |
US10066027B2 (en) | 2015-01-09 | 2018-09-04 | Ohio State Innovation Foundation | Protein production systems and methods thereof |
CN105316353A (zh) * | 2015-02-13 | 2016-02-10 | 上海交通大学 | 一种利用碱性标签和内含肽融合表达纯化重组蛋白的方法 |
HUE062276T2 (hu) * | 2016-01-29 | 2023-10-28 | Univ Princeton | Kivételes splicing aktivitású osztott inteinek |
CN105925596A (zh) * | 2016-02-23 | 2016-09-07 | 上海交通大学 | 基于内含肽的药用重组蛋白的合成方法 |
US11124539B2 (en) | 2016-11-16 | 2021-09-21 | Cytiva Bioprocess R&D Ab | Chromatography resin, production and use thereof |
-
2019
- 2019-11-22 GB GBGB1917046.3A patent/GB201917046D0/en not_active Ceased
-
2020
- 2020-11-20 JP JP2022526270A patent/JP2023502335A/ja active Pending
- 2020-11-20 CA CA3155170A patent/CA3155170A1/en active Pending
- 2020-11-20 CN CN202080080416.2A patent/CN114698379A/zh active Pending
- 2020-11-20 KR KR1020227016527A patent/KR20220105157A/ko unknown
- 2020-11-20 EP EP20820794.4A patent/EP4061932A1/en active Pending
- 2020-11-20 WO PCT/EP2020/082966 patent/WO2021099607A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
CN114698379A (zh) | 2022-07-01 |
WO2021099607A1 (en) | 2021-05-27 |
CA3155170A1 (en) | 2021-05-27 |
GB201917046D0 (en) | 2020-01-08 |
EP4061932A1 (en) | 2022-09-28 |
JP2023502335A (ja) | 2023-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220105157A (ko) | 스플릿 인테인 시스템을 사용하는 단백질 정제 | |
US10662231B2 (en) | Fusion proteins of superfolder green fluorescent protein and use thereof | |
US10844099B2 (en) | Streptavidin muteins and methods of using them | |
EP2495253B1 (en) | Novel immunoglobulin-binding proteins with improved specificity | |
US20100168395A1 (en) | Novel polypeptide, an affinity chromatography material, and a method for separating and/or purifying immunoglobulin | |
US20110151538A1 (en) | Affinity purification by cohesin-dockerin interaction | |
KR20140007394A (ko) | 면역 글로불린 결합성 신규 폴리펩티드 | |
JP5951509B2 (ja) | 免疫グロブリンGFc領域結合ポリペプチド | |
AU2017257203A1 (en) | Streptavidin muteins and methods of using them | |
JP2013528567A5 (ko) | ||
CN113195521A (zh) | Mtu ΔI-CM内含肽变体和其应用 | |
KR20190015240A (ko) | 보툴리눔 신경독소의 정제 및 활성화 방법 | |
KR20140135959A (ko) | 온-컬럼 효소적 절단 | |
Austin et al. | The substrate specificity of Metarhizium anisopliae and Bos taurus carboxypeptidases A: Insights into their use as tools for the removal of affinity tags | |
EP2912051B1 (en) | Method for the separation of proteins containing an albumin-binding domain | |
JP2009536821A5 (ko) | ||
JP4481260B2 (ja) | 抗体結合性ペプチド | |
WO2016063926A1 (ja) | 精製方法、精製キット、および、これらに用いられる酸化ケイ素結合タグ | |
JP2024516907A (ja) | 向上したタンパク質精製 | |
CA3180878A1 (en) | Fusion polypeptides for target peptide production | |
RU2728652C1 (ru) | Рекомбинантная плазмидная ДНК pET19b-SAV, обеспечивающая синтез полноразмерного белка стрептавидина Streptomyces avidinii, штамм бактерий Escherichia coli - продуцент растворимого полноразмерного белка стрептавидина Streptomyces avidinii | |
WO2015049230A1 (en) | An orthogonal set of tag-cleaving proteases for purification of proteins and stoichiometric protein complexes | |
CN104945488B (zh) | 一种具有免疫球蛋白结合能力的多肽 | |
US20240132538A1 (en) | Protein purification using a split intein system | |
KR102637595B1 (ko) | 알칼리내성이 증가된 면역글로불린-결합 단백질 변이체 및 이의 용도 |