KR20230148340A - 단클론성 항체의 개선된 단백질 시퀀싱을 위한 전자 이동 해리 및 질량 분광분석 - Google Patents
단클론성 항체의 개선된 단백질 시퀀싱을 위한 전자 이동 해리 및 질량 분광분석 Download PDFInfo
- Publication number
- KR20230148340A KR20230148340A KR1020237031896A KR20237031896A KR20230148340A KR 20230148340 A KR20230148340 A KR 20230148340A KR 1020237031896 A KR1020237031896 A KR 1020237031896A KR 20237031896 A KR20237031896 A KR 20237031896A KR 20230148340 A KR20230148340 A KR 20230148340A
- Authority
- KR
- South Korea
- Prior art keywords
- antibody
- mass spectrometry
- polypeptide
- subunit
- fragment
- Prior art date
Links
- 238000001077 electron transfer detection Methods 0.000 title claims abstract description 136
- 238000004949 mass spectrometry Methods 0.000 title claims abstract description 110
- 238000000734 protein sequencing Methods 0.000 title description 3
- 238000000034 method Methods 0.000 claims abstract description 170
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 106
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 103
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 17
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 123
- 239000012634 fragment Substances 0.000 claims description 122
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 114
- 229920001184 polypeptide Polymers 0.000 claims description 107
- 238000004885 tandem mass spectrometry Methods 0.000 claims description 42
- 108010021625 Immunoglobulin Fragments Proteins 0.000 claims description 26
- 102000008394 Immunoglobulin Fragments Human genes 0.000 claims description 26
- 238000004458 analytical method Methods 0.000 claims description 26
- 238000000132 electrospray ionisation Methods 0.000 claims description 20
- 238000004811 liquid chromatography Methods 0.000 claims description 20
- 239000003153 chemical reaction reagent Substances 0.000 claims description 19
- 238000001360 collision-induced dissociation Methods 0.000 claims description 19
- 238000002955 isolation Methods 0.000 claims description 19
- 230000027756 respiratory electron transport chain Effects 0.000 claims description 19
- 238000010846 tandem mass spectrometry analysis Methods 0.000 claims description 19
- 230000035484 reaction time Effects 0.000 claims description 16
- 238000013401 experimental design Methods 0.000 claims description 13
- 238000004366 reverse phase liquid chromatography Methods 0.000 claims description 12
- 238000004587 chromatography analysis Methods 0.000 claims description 11
- 238000010494 dissociation reaction Methods 0.000 claims description 10
- 230000005593 dissociations Effects 0.000 claims description 10
- 102000037865 fusion proteins Human genes 0.000 claims description 10
- 108020001507 fusion proteins Proteins 0.000 claims description 10
- 239000000825 pharmaceutical preparation Substances 0.000 claims description 10
- 238000006303 photolysis reaction Methods 0.000 claims description 10
- 238000001042 affinity chromatography Methods 0.000 claims description 9
- 239000003638 chemical reducing agent Substances 0.000 claims description 9
- 230000006862 enzymatic digestion Effects 0.000 claims description 9
- 238000002013 hydrophilic interaction chromatography Methods 0.000 claims description 9
- 238000004191 hydrophobic interaction chromatography Methods 0.000 claims description 9
- 238000004255 ion exchange chromatography Methods 0.000 claims description 9
- 238000001542 size-exclusion chromatography Methods 0.000 claims description 9
- 239000000611 antibody drug conjugate Substances 0.000 claims description 8
- 229940049595 antibody-drug conjugate Drugs 0.000 claims description 8
- 229940127557 pharmaceutical product Drugs 0.000 claims description 8
- 238000013459 approach Methods 0.000 abstract description 23
- 230000001225 therapeutic effect Effects 0.000 abstract description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 9
- 208000035475 disorder Diseases 0.000 abstract description 7
- 238000001311 chemical methods and process Methods 0.000 abstract description 2
- 201000010099 disease Diseases 0.000 abstract description 2
- 235000018102 proteins Nutrition 0.000 description 90
- 238000013400 design of experiment Methods 0.000 description 53
- 150000001413 amino acids Chemical class 0.000 description 35
- 150000002500 ions Chemical class 0.000 description 27
- 230000004481 post-translational protein modification Effects 0.000 description 27
- 238000013467 fragmentation Methods 0.000 description 22
- 238000006062 fragmentation reaction Methods 0.000 description 22
- 239000000523 sample Substances 0.000 description 20
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 18
- 239000000427 antigen Substances 0.000 description 17
- 102000036639 antigens Human genes 0.000 description 17
- 108091007433 antigens Proteins 0.000 description 17
- 238000012163 sequencing technique Methods 0.000 description 13
- 238000007792 addition Methods 0.000 description 12
- 235000001014 amino acid Nutrition 0.000 description 12
- 229940024606 amino acid Drugs 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 12
- 238000003556 assay Methods 0.000 description 11
- 230000029087 digestion Effects 0.000 description 11
- 238000001228 spectrum Methods 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 239000002243 precursor Substances 0.000 description 8
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- 206010057175 Mass conditions Diseases 0.000 description 7
- 239000004365 Protease Substances 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 7
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 6
- 241000880493 Leptailurus serval Species 0.000 description 6
- 108091005804 Peptidases Proteins 0.000 description 6
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 239000012491 analyte Substances 0.000 description 6
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 6
- 239000012071 phase Substances 0.000 description 6
- 235000019419 proteases Nutrition 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 108090000288 Glycoproteins Proteins 0.000 description 5
- 102000003886 Glycoproteins Human genes 0.000 description 5
- 108060003951 Immunoglobulin Proteins 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 5
- 238000004925 denaturation Methods 0.000 description 5
- 230000036425 denaturation Effects 0.000 description 5
- 229940088598 enzyme Drugs 0.000 description 5
- 102000018358 immunoglobulin Human genes 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- XYONNSVDNIRXKZ-UHFFFAOYSA-N S-methyl methanethiosulfonate Chemical compound CSS(C)(=O)=O XYONNSVDNIRXKZ-UHFFFAOYSA-N 0.000 description 4
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 4
- 229960004539 alirocumab Drugs 0.000 description 4
- -1 chromoproteins Proteins 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 238000011960 computer-aided design Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 229950003468 dupilumab Drugs 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 229960000598 infliximab Drugs 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 238000012510 peptide mapping method Methods 0.000 description 4
- 230000013777 protein digestion Effects 0.000 description 4
- 229950006348 sarilumab Drugs 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 3
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 3
- 201000011001 Ebola Hemorrhagic Fever Diseases 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 3
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 3
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 3
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 3
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 3
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 3
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 3
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Natural products NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 3
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 3
- 229960002964 adalimumab Drugs 0.000 description 3
- 229960002833 aflibercept Drugs 0.000 description 3
- 108010081667 aflibercept Proteins 0.000 description 3
- 239000002168 alkylating agent Substances 0.000 description 3
- 229940100198 alkylating agent Drugs 0.000 description 3
- 230000029936 alkylation Effects 0.000 description 3
- 238000005804 alkylation reaction Methods 0.000 description 3
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 229940121420 cemiplimab Drugs 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 239000003398 denaturant Substances 0.000 description 3
- 235000019253 formic acid Nutrition 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 3
- 210000004408 hybridoma Anatomy 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 229960001886 rilonacept Drugs 0.000 description 3
- 108010046141 rilonacept Proteins 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 239000003643 water by type Substances 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- PBVAJRFEEOIAGW-UHFFFAOYSA-N 3-[bis(2-carboxyethyl)phosphanyl]propanoic acid;hydrochloride Chemical compound Cl.OC(=O)CCP(CCC(O)=O)CCC(O)=O PBVAJRFEEOIAGW-UHFFFAOYSA-N 0.000 description 2
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 2
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 2
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 2
- 206010003210 Arteriosclerosis Diseases 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 2
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 201000001320 Atherosclerosis Diseases 0.000 description 2
- VIRYODQIWJNWNU-NRPADANISA-N Cys-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N VIRYODQIWJNWNU-NRPADANISA-N 0.000 description 2
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 2
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 2
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 2
- WTDHULULXKLSOZ-UHFFFAOYSA-N Hydroxylamine hydrochloride Chemical compound Cl.ON WTDHULULXKLSOZ-UHFFFAOYSA-N 0.000 description 2
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 2
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 2
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 2
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 2
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 2
- 102000013463 Immunoglobulin Light Chains Human genes 0.000 description 2
- 108010065825 Immunoglobulin Light Chains Proteins 0.000 description 2
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 2
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 2
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 2
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- JDMKQHSHKJHAHR-UHFFFAOYSA-N Phe-Phe-Leu-Tyr Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)CC1=CC=CC=C1 JDMKQHSHKJHAHR-UHFFFAOYSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 2
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 2
- ODHCTXKNWHHXJC-GSVOUGTGSA-N Pyroglutamic acid Natural products OC(=O)[C@H]1CCC(=O)N1 ODHCTXKNWHHXJC-GSVOUGTGSA-N 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 2
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- CYVQBKQYQGEELV-NKIYYHGXSA-N Thr-His-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CYVQBKQYQGEELV-NKIYYHGXSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- YOPQYBJJNSIQGZ-JNPHEJMOSA-N Thr-Tyr-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 YOPQYBJJNSIQGZ-JNPHEJMOSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 2
- OXVPMZVGCAPFIG-BQFCYCMXSA-N Val-Gln-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N OXVPMZVGCAPFIG-BQFCYCMXSA-N 0.000 description 2
- 229930003448 Vitamin K Natural products 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- ODHCTXKNWHHXJC-UHFFFAOYSA-N acide pyroglutamique Natural products OC(=O)C1CCC(=O)N1 ODHCTXKNWHHXJC-UHFFFAOYSA-N 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 230000010933 acylation Effects 0.000 description 2
- 238000005917 acylation reaction Methods 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 230000009435 amidation Effects 0.000 description 2
- 238000007112 amidation reaction Methods 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 150000001450 anions Chemical class 0.000 description 2
- 238000009175 antibody therapy Methods 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 229960000397 bevacizumab Drugs 0.000 description 2
- 229940126587 biotherapeutics Drugs 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 239000012930 cell culture fluid Substances 0.000 description 2
- 238000012710 chemistry, manufacturing and control Methods 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- VXIVSQZSERGHQP-UHFFFAOYSA-N chloroacetamide Chemical compound NC(=O)CCl VXIVSQZSERGHQP-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 229960002806 daclizumab Drugs 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011143 downstream manufacturing Methods 0.000 description 2
- 229940126534 drug product Drugs 0.000 description 2
- 229940088679 drug related substance Drugs 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- GVEPBJHOBDJJJI-UHFFFAOYSA-N fluoranthrene Natural products C1=CC(C2=CC=CC=C22)=C3C2=CC=CC3=C1 GVEPBJHOBDJJJI-UHFFFAOYSA-N 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 2
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 229960001743 golimumab Drugs 0.000 description 2
- 229960004198 guanidine Drugs 0.000 description 2
- 239000012561 harvest cell culture fluid Substances 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000005040 ion trap Methods 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 210000004962 mammalian cell Anatomy 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 150000007523 nucleic acids Chemical group 0.000 description 2
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 2
- SHUZOJHMOBOZST-UHFFFAOYSA-N phylloquinone Natural products CC(C)CCCCC(C)CCC(C)CCCC(=CCC1=C(C)C(=O)c2ccccc2C1=O)C SHUZOJHMOBOZST-UHFFFAOYSA-N 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 229960004641 rituximab Drugs 0.000 description 2
- 230000009450 sialylation Effects 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- UMGDCJDMYOKAJW-UHFFFAOYSA-N thiourea Chemical compound NC(N)=S UMGDCJDMYOKAJW-UHFFFAOYSA-N 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 229960003989 tocilizumab Drugs 0.000 description 2
- 229960000575 trastuzumab Drugs 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 2
- 108010052774 valyl-lysyl-glycyl-phenylalanyl-tyrosine Proteins 0.000 description 2
- 235000019168 vitamin K Nutrition 0.000 description 2
- 239000011712 vitamin K Substances 0.000 description 2
- 150000003721 vitamin K derivatives Chemical class 0.000 description 2
- 229940046010 vitamin k Drugs 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- CRDAMVZIKSXKFV-YFVJMOTDSA-N (2-trans,6-trans)-farnesol Chemical group CC(C)=CCC\C(C)=C\CC\C(C)=C\CO CRDAMVZIKSXKFV-YFVJMOTDSA-N 0.000 description 1
- 239000000260 (2E,6E)-3,7,11-trimethyldodeca-2,6,10-trien-1-ol Substances 0.000 description 1
- ZQJHYRVSKHGGJY-YPKJBDGSSA-N (2s,3r)-2-[[(2s)-2-[[(2s)-1-[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carbonyl]amino]-3-phenylpropanoyl]amino]-3-hydroxybutanoic acid Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 ZQJHYRVSKHGGJY-YPKJBDGSSA-N 0.000 description 1
- OJISWRZIEWCUBN-QIRCYJPOSA-N (E,E,E)-geranylgeraniol Chemical group CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CO OJISWRZIEWCUBN-QIRCYJPOSA-N 0.000 description 1
- KIUMMUBSPKGMOY-UHFFFAOYSA-N 3,3'-Dithiobis(6-nitrobenzoic acid) Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(SSC=2C=C(C(=CC=2)[N+]([O-])=O)C(O)=O)=C1 KIUMMUBSPKGMOY-UHFFFAOYSA-N 0.000 description 1
- KFDVPJUYSDEJTH-UHFFFAOYSA-N 4-ethenylpyridine Chemical compound C=CC1=CC=NC=C1 KFDVPJUYSDEJTH-UHFFFAOYSA-N 0.000 description 1
- CERZMXAJYMMUDR-QBTAGHCHSA-N 5-amino-3,5-dideoxy-D-glycero-D-galacto-non-2-ulopyranosonic acid Chemical compound N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO CERZMXAJYMMUDR-QBTAGHCHSA-N 0.000 description 1
- MJZJYWCQPMNPRM-UHFFFAOYSA-N 6,6-dimethyl-1-[3-(2,4,5-trichlorophenoxy)propoxy]-1,6-dihydro-1,3,5-triazine-2,4-diamine Chemical compound CC1(C)N=C(N)N=C(N)N1OCCCOC1=CC(Cl)=C(Cl)C=C1Cl MJZJYWCQPMNPRM-UHFFFAOYSA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 108010064733 Angiotensins Proteins 0.000 description 1
- 102000015427 Angiotensins Human genes 0.000 description 1
- 244000105975 Antidesma platyphyllum Species 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 1
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- QNFRBNZGVVKBNJ-PEFMBERDSA-N Asp-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QNFRBNZGVVKBNJ-PEFMBERDSA-N 0.000 description 1
- UZNSWMFLKVKJLI-VHWLVUOQSA-N Asp-Ile-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O UZNSWMFLKVKJLI-VHWLVUOQSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- VWWAFGHMPWBKEP-GMOBBJLQSA-N Asp-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)O)N VWWAFGHMPWBKEP-GMOBBJLQSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- GHAHOJDCBRXAKC-IHPCNDPISA-N Asp-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N GHAHOJDCBRXAKC-IHPCNDPISA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- GYNUXDMCDILYIQ-QRTARXTBSA-N Asp-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N GYNUXDMCDILYIQ-QRTARXTBSA-N 0.000 description 1
- 241000228251 Aspergillus phoenicis Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 201000004569 Blindness Diseases 0.000 description 1
- 208000025721 COVID-19 Diseases 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 206010052358 Colorectal cancer metastatic Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 1
- GEEXORWTBTUOHC-FXQIFTODSA-N Cys-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N GEEXORWTBTUOHC-FXQIFTODSA-N 0.000 description 1
- PGBLJHDDKCVSTC-CIUDSAMLSA-N Cys-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O PGBLJHDDKCVSTC-CIUDSAMLSA-N 0.000 description 1
- BBQIWFFTTQTNOC-AVGNSLFASA-N Cys-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N BBQIWFFTTQTNOC-AVGNSLFASA-N 0.000 description 1
- SMEYEQDCCBHTEF-FXQIFTODSA-N Cys-Pro-Ala Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O SMEYEQDCCBHTEF-FXQIFTODSA-N 0.000 description 1
- CMYVIUWVYHOLRD-ZLUOBGJFSA-N Cys-Ser-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CMYVIUWVYHOLRD-ZLUOBGJFSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 1
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 206010012438 Dermatitis atopic Diseases 0.000 description 1
- 230000010777 Disulfide Reduction Effects 0.000 description 1
- 101710164770 Drosomycin Proteins 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 101150028540 Drs gene Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 108091006020 Fc-tagged proteins Proteins 0.000 description 1
- 108010008177 Fd immunoglobulins Proteins 0.000 description 1
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 1
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 1
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 1
- FOCSWPCHUDVNLP-PMVMPFDFSA-N His-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC4=CN=CN4)N FOCSWPCHUDVNLP-PMVMPFDFSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- 101001057508 Homo sapiens Ubiquitin-like protein ISG15 Proteins 0.000 description 1
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 1
- 230000006133 ISGylation Effects 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 1
- FADXGVVLSPPEQY-GHCJXIJMSA-N Ile-Cys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FADXGVVLSPPEQY-GHCJXIJMSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 1
- QQFSKBMCAKWHLG-UHFFFAOYSA-N Ile-Phe-Pro-Pro Chemical compound C1CCC(C(=O)N2C(CCC2)C(O)=O)N1C(=O)C(NC(=O)C(N)C(C)CC)CC1=CC=CC=C1 QQFSKBMCAKWHLG-UHFFFAOYSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- RHGKLRLOHDJJDR-BYPYZUCNSA-N L-citrulline Chemical compound NC(=O)NCCC[C@H]([NH3+])C([O-])=O RHGKLRLOHDJJDR-BYPYZUCNSA-N 0.000 description 1
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 1
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 1
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- 102000010750 Metalloproteins Human genes 0.000 description 1
- 108010063312 Metalloproteins Proteins 0.000 description 1
- 102000015728 Mucins Human genes 0.000 description 1
- 108010063954 Mucins Proteins 0.000 description 1
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- BACYUWVYYTXETD-UHFFFAOYSA-N N-Lauroylsarcosine Chemical compound CCCCCCCCCCCC(=O)N(C)CC(O)=O BACYUWVYYTXETD-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 1
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 1
- HDFGOPSGAURCEO-UHFFFAOYSA-N N-ethylmaleimide Chemical compound CCN1C(=O)C=CC1=O HDFGOPSGAURCEO-UHFFFAOYSA-N 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- RHGKLRLOHDJJDR-UHFFFAOYSA-N Ndelta-carbamoyl-DL-ornithine Natural products OC(=O)C(N)CCCNC(N)=O RHGKLRLOHDJJDR-UHFFFAOYSA-N 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- 208000022873 Ocular disease Diseases 0.000 description 1
- 101710116435 Outer membrane protein Proteins 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 1
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 1
- JOXIIFVCSATTDH-IHPCNDPISA-N Phe-Asn-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JOXIIFVCSATTDH-IHPCNDPISA-N 0.000 description 1
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- KIQUCMUULDXTAZ-HJOGWXRNSA-N Phe-Tyr-Tyr Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O KIQUCMUULDXTAZ-HJOGWXRNSA-N 0.000 description 1
- 102000007982 Phosphoproteins Human genes 0.000 description 1
- 108010089430 Phosphoproteins Proteins 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 1
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010059712 Pronase Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- UEJYSALTSUZXFV-SRVKXCTJSA-N Rigin Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UEJYSALTSUZXFV-SRVKXCTJSA-N 0.000 description 1
- 102000051619 SUMO-1 Human genes 0.000 description 1
- 108700038981 SUMO-1 Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- 102000002669 Small Ubiquitin-Related Modifier Proteins Human genes 0.000 description 1
- 108010043401 Small Ubiquitin-Related Modifier Proteins Proteins 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- 108090001109 Thermolysin Proteins 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 1
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 1
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 1
- VEYXZZGMIBKXCN-UBHSHLNASA-N Trp-Asp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VEYXZZGMIBKXCN-UBHSHLNASA-N 0.000 description 1
- VTHNLRXALGUDBS-BPUTZDHNSA-N Trp-Gln-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VTHNLRXALGUDBS-BPUTZDHNSA-N 0.000 description 1
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- SSSDKJMQMZTMJP-BVSLBCMMSA-N Trp-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 SSSDKJMQMZTMJP-BVSLBCMMSA-N 0.000 description 1
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- GZUIDWDVMWZSMI-KKUMJFAQSA-N Tyr-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GZUIDWDVMWZSMI-KKUMJFAQSA-N 0.000 description 1
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 1
- AUZADXNWQMBZOO-JYJNAYRXSA-N Tyr-Pro-Arg Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 AUZADXNWQMBZOO-JYJNAYRXSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 102100027266 Ubiquitin-like protein ISG15 Human genes 0.000 description 1
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 1
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- SBJCTAZFSZXWSR-AVGNSLFASA-N Val-Met-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SBJCTAZFSZXWSR-AVGNSLFASA-N 0.000 description 1
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 1
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 1
- QPJSIBAOZBVELU-BPNCWPANSA-N Val-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N QPJSIBAOZBVELU-BPNCWPANSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 229930003268 Vitamin C Natural products 0.000 description 1
- XYVNHPYNSPGYLI-UUOKFMHZSA-N [(2r,3s,4r,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)-4-hydroxy-2-(phosphonooxymethyl)oxolan-3-yl] dihydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H]1O XYVNHPYNSPGYLI-UUOKFMHZSA-N 0.000 description 1
- 229960000446 abciximab Drugs 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 229960000548 alemtuzumab Drugs 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 238000012863 analytical testing Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 108090000987 aspergillopepsin I Proteins 0.000 description 1
- 229960003852 atezolizumab Drugs 0.000 description 1
- 201000008937 atopic dermatitis Diseases 0.000 description 1
- 229950002916 avelumab Drugs 0.000 description 1
- 229960004669 basiliximab Drugs 0.000 description 1
- 229960003270 belimumab Drugs 0.000 description 1
- 229950000321 benralizumab Drugs 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229950008086 bezlotoxumab Drugs 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 230000006287 biotinylation Effects 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 229960003008 blinatumomab Drugs 0.000 description 1
- 229960000455 brentuximab vedotin Drugs 0.000 description 1
- 229960003735 brodalumab Drugs 0.000 description 1
- 229950002817 burosumab Drugs 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229960001838 canakinumab Drugs 0.000 description 1
- 229940034605 capromab pendetide Drugs 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- UHBYWPGGCSDKFX-UHFFFAOYSA-N carboxyglutamic acid Chemical compound OC(=O)C(N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-UHFFFAOYSA-N 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000007910 cell fusion Effects 0.000 description 1
- 229960003115 certolizumab pegol Drugs 0.000 description 1
- 229960005395 cetuximab Drugs 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 238000010382 chemical cross-linking Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 108700010039 chimeric receptor Proteins 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 230000006329 citrullination Effects 0.000 description 1
- 235000013477 citrulline Nutrition 0.000 description 1
- 229960002173 citrulline Drugs 0.000 description 1
- 230000035071 co-translational protein modification Effects 0.000 description 1
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 229940093530 coenzyme a Drugs 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000003431 cross linking reagent Substances 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 229960002204 daratumumab Drugs 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000006240 deamidation Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 229960001251 denosumab Drugs 0.000 description 1
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 102000038379 digestive enzymes Human genes 0.000 description 1
- 108091007734 digestive enzymes Proteins 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 229960004497 dinutuximab Drugs 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 208000018459 dissociative disease Diseases 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 229950009791 durvalumab Drugs 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 229960002224 eculizumab Drugs 0.000 description 1
- 229960004137 elotuzumab Drugs 0.000 description 1
- 229950006925 emicizumab Drugs 0.000 description 1
- 108010003914 endoproteinase Asp-N Proteins 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000009483 enzymatic pathway Effects 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229960002027 evolocumab Drugs 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 1
- 229940043259 farnesol Drugs 0.000 description 1
- 229930002886 farnesol Natural products 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 102000034240 fibrous proteins Human genes 0.000 description 1
- 108091005899 fibrous proteins Proteins 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 229960003297 gemtuzumab ozogamicin Drugs 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- XWRJRXQNOHXIOX-UHFFFAOYSA-N geranylgeraniol Chemical group CC(C)=CCCC(C)=CCOCC=C(C)CCC=C(C)C XWRJRXQNOHXIOX-UHFFFAOYSA-N 0.000 description 1
- OJISWRZIEWCUBN-UHFFFAOYSA-N geranylnerol Chemical group CC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CCO OJISWRZIEWCUBN-UHFFFAOYSA-N 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 102000034238 globular proteins Human genes 0.000 description 1
- 108091005896 globular proteins Proteins 0.000 description 1
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 230000006237 glutamylation Effects 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 230000006238 glycylation Effects 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 235000009424 haa Nutrition 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 229950010245 ibalizumab Drugs 0.000 description 1
- 229960002308 idarucizumab Drugs 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 229950004101 inotuzumab ozogamicin Drugs 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 230000008863 intramolecular interaction Effects 0.000 description 1
- 230000026045 iodination Effects 0.000 description 1
- 238000006192 iodination reaction Methods 0.000 description 1
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 1
- 229960005386 ipilimumab Drugs 0.000 description 1
- 230000006122 isoprenylation Effects 0.000 description 1
- 229960005435 ixekizumab Drugs 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 230000000598 lipoate effect Effects 0.000 description 1
- 230000006144 lipoylation Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- MHCFAGZWMAWTNR-UHFFFAOYSA-M lithium perchlorate Chemical compound [Li+].[O-]Cl(=O)(=O)=O MHCFAGZWMAWTNR-UHFFFAOYSA-M 0.000 description 1
- 229910001486 lithium perchlorate Inorganic materials 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229960005108 mepolizumab Drugs 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 229960005027 natalizumab Drugs 0.000 description 1
- 229960000513 necitumumab Drugs 0.000 description 1
- CERZMXAJYMMUDR-UHFFFAOYSA-N neuraminic acid Natural products NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO CERZMXAJYMMUDR-UHFFFAOYSA-N 0.000 description 1
- 229960003301 nivolumab Drugs 0.000 description 1
- 229960003347 obinutuzumab Drugs 0.000 description 1
- 229950005751 ocrelizumab Drugs 0.000 description 1
- 229960002450 ofatumumab Drugs 0.000 description 1
- 229950008516 olaratumab Drugs 0.000 description 1
- 229960000470 omalizumab Drugs 0.000 description 1
- 230000000771 oncological effect Effects 0.000 description 1
- 229960001972 panitumumab Drugs 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 229960002621 pembrolizumab Drugs 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 229960002087 pertuzumab Drugs 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 230000003285 pharmacodynamic effect Effects 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229930001119 polyketide Natural products 0.000 description 1
- 125000000830 polyketide group Chemical group 0.000 description 1
- 229930001118 polyketide hybrid Natural products 0.000 description 1
- 125000003308 polyketide hybrid group Chemical group 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000011165 process development Methods 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- BDERNNFJNOPAEC-UHFFFAOYSA-N propan-1-ol Chemical compound CCCO BDERNNFJNOPAEC-UHFFFAOYSA-N 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 238000012514 protein characterization Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000000197 pyrolysis Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 229960002633 ramucirumab Drugs 0.000 description 1
- 229960003876 ranibizumab Drugs 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 229960003254 reslizumab Drugs 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 108700004121 sarkosyl Proteins 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 229960004540 secukinumab Drugs 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 229960003323 siltuximab Drugs 0.000 description 1
- BEOOHQFXGBMRKU-UHFFFAOYSA-N sodium cyanoborohydride Chemical compound [Na+].[B-]C#N BEOOHQFXGBMRKU-UHFFFAOYSA-N 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 108010059339 submandibular proteinase A Proteins 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L sulfate group Chemical group S(=O)(=O)([O-])[O-] QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 238000006277 sulfonation reaction Methods 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 150000003505 terpenes Chemical group 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229940126622 therapeutic monoclonal antibody Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229950005515 tildrakizumab Drugs 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- CRDAMVZIKSXKFV-UHFFFAOYSA-N trans-Farnesol Natural products CC(C)=CCCC(C)=CCCC(C)=CCO CRDAMVZIKSXKFV-UHFFFAOYSA-N 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 229960001612 trastuzumab emtansine Drugs 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 1
- 238000001946 ultra-performance liquid chromatography-mass spectrometry Methods 0.000 description 1
- 238000000825 ultraviolet detection Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 229960003824 ustekinumab Drugs 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 229960004914 vedolizumab Drugs 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
- 229940106067 zinbryta Drugs 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
- G01N30/7233—Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6818—Sequencing of polypeptides
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6854—Immunoglobulins
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Biochemistry (AREA)
- Pathology (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Peptides Or Proteins (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 개시내용은 질환 또는 장애를 치료하기 위해 인간 대상체에게 투여하기에 적합하도록 단백질의 균질성을 보장하기 위해 치료적 단백질, 특히 항체의 아미노산 서열을 정확하게 측정하기 위한 개선된 방법을 제공한다. 상기 방법은 분석 물리 화학 기술, 특히 유도 전자 이동 해리(ETD) 및 질량 분광법(MS) 접근법을 사용하여 높은 정확도와 사용 속도로 분자의 강력한 서열 커버리지를 제공한다.
Description
관련 출원에 대한 상호 참조
본 출원은 2021년 2월 25일에 출원된 미국 가특허 출원 제63/153,886호의 우선권 및 이익을 주장하며, 이 출원은 본 명세서에 참조로 포함된다.
분야
본 발명의 양태는 일반적으로 항체 서열 충실도를 특징화하는 방법에 관한 것이다. 보다 구체적으로, 본 개시내용은 전자 이동 해리(ETD) 및 질량 분광분석(MS)을 사용하여 더 높은 서열 정확도 및 커버리지(coverage)를 달성하기 위한 분석적 물리 화학 기술, 단백질 단편 선택 기준 및 다변량 분석을 제공한다.
단클론성 항체(mAb) 치료제는 그의 높은 특이성 및 바람직한 약동학적 특성으로 인해 생물의학적 시장에서 주요 세력으로 남을 준비가 되어 있다(Walsh, 2018, Nat Biotechnol , 36:1136-1145; Kaplon 등, 2020, Mabs, 12:1703531; Mould and Meibohm, 2016, BioDrugs, 30:275-293). 단클론성 항체(mAb)의 적절한 기능에 대한 글리코실화 및 디설파이드 결합의 중요성으로 인해 mAb는 종종 포유동물 세포 시스템에서 생산된다.
그러나, 포유동물 세포 시스템에서의 생산은 mAb 기능에 필요한 변형을 적용하는 것 외에도 생성물 이종성을 도입하는 것으로 알려져 있다(Meibohm 등, 2019, Pharmaceutical Biotechnology Fundamentals and Applications, 5판). 번역 후 변형(PTM) 미세 이종성이 안정성, 용해도, 및 약력학적 및 약동학적 특성을 포함하여 mAb 치료제의 중요한 품질 속성에 영향을 미칠 수 있기 때문에, 규제 기관은 생성물 품질과 일관성을 보장하기 위해 광범위한 분석적 특징화를 필요로 한다(Meibohm 등).
질량 분광분석(MS) 기술, 구체적으로 탑-다운(top-down) 및 바텀-업(bottom-up) MS는 항체의 구조적 특징화에 강력한 도구인 것으로 입증되었다. 각각의 접근법은 단백질 구조 및 잠재적 번역 후 변형에 관한 고유한 정보를 제공한다(Fornelli 등, 2018, Anal Chem, 90:8421-8429; Wang 등, 2019, Sci Rep, 9:2345). 질량 분광분석은 액체 크로마토그래피, 예를 들어 액체 크로마토그래피-질량 분광분석(LC-MS) 또는 액체 크로마토그래피-탠덤 질량 분광분석(LC-MS2 또는 LC-MS/MS)과 함께 사용되어 피분석물, 예를 들어 항체를 특징화하는 능력을 더 강화시킬 수 있다.
탑-다운 MS는 온전한 질량 분석과 탠덤 질량 분광분석(MS2)을 조합하고, 효소 분해를 필요로 하지 않으며, 예를 들어 번역 후 변형, 단백질 구조 및 약물-표적 상호작용에 관한 풍부한 정보를 제공한다(Donnelly 등, 2019, Nat Methods, 16:587-594). 그러나, 항체와 같은 대형 생물의약품의 탑-다운 MS2는 제한이 있다. 이들 중 주된 것은 임의의 효소 처리 없이 가능한 서열 커버리지를 제한하는 대분자의 엄청난 크기이다(Fornelli 등).
바텀-업 MS는 아미노산-수준 분할로 서열 커버리지를 제공할 수 있는 대안적인 접근법이다. 이 기술의 한 가지 결점은 높은 서열 커버리지가, 예를 들어 단백질 변성, 디설파이드 환원, 시스테인 알킬화 및/또는 관심 단백질의 효소 분해를 포함하는 광범위한 샘플 제조 비용으로 발생한다는 것이다(Nielsen 등, 2008, Nat Methods, 5:459-460; Lippincott 등, 1999, Anal Biochem, 267:57-64). 바텀-업 MS는 노동 집약적일 뿐만 아니라 샘플 제조 동안 화학적 변형 인공물을 도입할 수도 있다. 이 위험 때문에 바텀-업 MS는 샘플 제조-유도된 인공물을 최소화하는 최적화된 방법을 생산하기 위해 광범위한 개발이 필요하다.
미들-다운(middle-down) MS는 탑-다운 및 바텀-업 MS 분석의 이점을 조합한 항체 특징화에 대한 대안적인 접근법이다(Chait, 2006, Science, 314:65-66; Fornelli 등, 2014, Anal Chem, 86:3005-3012; Tsybin 등, 2011, Anal Chem, 83:8919-8927; Fornelli 등, 2012, Mol Cell Proteomics, 11:1758-1767). 미들-다운 MS 분석은 종종 S. 파이오제네스(IdeS)의 면역글로불린 G-분해 효소를 사용하여 단클론성 항체(mAb)를 그의 서브유닛으로 절단한다. mAb 서브유닛의 미들-다운 MS 분석은 전자-전달 해리(ETD)와 커플링될 수 있는데, 이는 제한된 프로테아제 소화로 생성된 큰 서브유닛이 ETD 단편화 분석에 우선적인 +3 전하보다 더 큰 값을 소유하기 때문이다. 이들 고도로 충전된 기상 전구체 이온은 ETD로 단편화되어 c-이온 및 z-이온 시리즈를 생산하고, 이는 관심 단백질, 예컨대 아미노산 서열 및 PTM 동일성에 대한 구조적 정보를 나타낸다(Mikesh 등, 2006, Biochim Biophys Acta , Proteins Proteomics, 1764:1811-1822; Syka 등, 2004, PNAS, 101:9528-9533; Zhurov 등, 2013, Chem Soc Rev, 42:5014-5030).
ETD에 의한 전구체 이온의 단편화는 이온-이온 상호작용 동안 저에너지 전자를 이용하고, 발열 공정을 통해 진행되어 백본 절단을 유도하기 때문에 불안정한 PTM은 MS2 스펙트럼에서 보존되어 특이적 아미노산에 대한 그의 확인 및 국소화를 가능하게 한다(Brodbelt, 2016, Anal Chem, 88:30-51). 온전한 단클론성 항체의 전자-전달 해리 단편화는 Tsybin 등에 의해 처음 보고된 반면, 단클론성 항체 서브유닛의 ETD 단편화는 Fornelli 등에 의해 처음 제시되었다.
ETD를 사용한 미들-다운 분석에 대한 이전의 연구에서는 역상 액체 크로마토그래피 질량 분광분석(RPLC-MS) 실행당 Fc/2 서브유닛에 대해 최대 49%의 서열 커버리지가 달성되고, 적어도 6개의 ETD 실행을 조합하여 이 커버리지를 최대 68%까지 증가시켰을 수 있다는 것을 입증하였다(Fornelli 등 2014). 보다 최근에는 ETD 실행(59.8%) 3회, 전자 전달 고에너지 충돌 해리(EThcD) 실행(51.7%) 1회 및 자외선 광해리(UVPD) 실행(61.2%) 2회를 분석에 통합하여 다중 단편화 기술을 조합시킴으로써 커버리지가 87%까지 더 개선된 것으로 나타났다(Fornelli 등 2018; Fornelli 등 2014).
현재 시판되는 질량 분광계는 광범위한 적용을 위해 제작되었기 때문에 특정 적용에 대한 최적의 파라미터를 찾기 위해서는 광범위한 기기 파라미터 최적화가 필요하다. 미충족 요구는 mAb 서브유닛의 ETD MS2 서열 커버리지를 최대화하기 위한 최적의 파라미터를 결정하는 방법이다.
하이브리드 단편화 방법 및 UVPD를 포함한 질량 분광계 및 단편화 방법의 진전으로 인해 분석가가 고려해야 하는 기기 파라미터의 수가 비례하여 증가하였다. 항체 서브유닛의 서열 커버리지를 증가시키기 위한 많은 상이한 접근법 및 파라미터를 사용하여 최적의 일련의 조건을 찾는 것이 주요 과제가 될 수 있다. ETD의 경우, 많은 이용 가능한 파라미터 간의 상호작용과 이들이 전하 감소, 단편화 효율 및 MS2 스펙트럼의 품질에 미치는 영향은 종종 간과되며, 전형적으로 분석에 사용된 설정은 종종 확립된 이론, 이전의 경험 또는 공개된 방법에 기초한다. Orbitrap Fusion Lumos Tribrid와 같은 보다 최근의 질량 분광계는 ETD에 대한 복잡한 보정 루틴을 포함하지만, 이들은 안지오텐신과 같은 상대적으로 작은 피분석물을 사용하여 수행되고, 큰 단백질의 탑- 또는 미들-다운 분석 동안 단편화된 더 큰 이온을 대표하지 않는다. 또한, 이들 루틴은 ETD 단편 생산에 영향을 미칠 수 있는 기기 드리프트의 모든 공급원과 최적의 파라미터에 대한 그의 후속 영향을 설명하지 않는다.
따라서, 최대 MS2 서열 커버리지를 제공하고, 모든 질량 분광계에 적용될 수 있는 기기 ETD 작동 조건을 최적화하기 위한 체계적인 접근법에 대한 필요성이 존재한다.
따라서, 단백질, 특히 항체 및 항체 서브유닛의 정확하고 정밀한 시퀀싱을 위한 간단한 방법을 제공하는 것이 바람직할 것이다.
요약
따라서, 본 발명의 목적은 단클론성 항체 서브유닛의 서열 커버리지를 최대화하기 위해 최적 전자 이동 해리(ETD) 파라미터를 결정하는 데 사용될 수 있는 통계적 실험 설계(DOE) 접근법을 이용하는 것이다. 또한, 이 방법은 각 항체가 전자 이동 해리(ETD) 실험 중에 약간 다르게 단편화될 수 있기 때문에 분자 특이적 매개 변수를 결정하기 위해 치료용 단클론성 항체의 어레이에 적용할 수 있다.
특히, 본 발명은 ETD 및 MS, 예를 들어 LC-MS2를 사용하는 항체 또는 항체 서브유닛과 같은 단백질의 정확한 드 노보 시퀀싱에 유용한 방법을 제공한다. 방법은 DOE에서 D-최적 기기 설정이 식별되고 선택되도록 알려준다.
최적의 ETD MS2 파라미터를 찾기 위한 한 가지 접근법은 실험 설계(DOE)를 이용하는 것이고, 이를 통해 상이한 파라미터 조합을 스크리닝하여 서브유닛의 최대 서열 커버리지를 제공하는 파라미터를 찾을 수 있다. MS 기기 파라미터의 수를 고려할 때 비효율적인 "한 번에 하나의 인자(one-factor at a time; OFAT)"를 평가하는 대신 DOE를 사용하면 기기의 다양한 파라미터를 동시에 평가할 수 있다.
구체적으로, m/z(질량 대 전하 비율) 단리 창(isolation window), ETD 반응 시간, ETD 시약 표적 및 MS2 AGC 표적(자동 이득 제어가 있는 탠덤 질량 분광법)은 ETD MS2 스펙트럼 품질에 영향을 미치는 중요한 파라미터이므로 전반적인 MS2 서브유닛 서열 커버리지에 영향을 미칠 수 있다.
작업 부하를 줄이고 여전히 의미 있는 모델을 유지하기 위해, D-최적 설계가 채택되었다. D-최적 설계는 DOE의 D-효율을 최대화하기 위해 모든 가능한 조합의 서브세트를 선택하는 컴퓨터 지원 설계이다(de Aguiar 등, 1995, Chemom Intell Lab Syst, 30:199-210). D-최적 설계는 ETD에 적용하여 ETD MS2 서열 커버리지를 제어하는 관련 파라미터를 외삽하고(선택한 결과에 영향을 미치는 사용자가 선택한 파라미터 그룹을 기준으로 사용), 각 파라미터와 상호작용의 효과 크기를 추정하고, 이러한 선택된 파라미터 조합으로 인한 반응을 예측하고, 궁극적으로 최대 커버리지를 달성하기 위해 개선된 작동 조건을 결정한다(Randall 등, 2013, J Am Soc Mass Spectrom, 24:1501-1512; Kelstrup 등, 2012, J Proteom Res, 11:3487-3497; Sun 등, 2013, Rapid Commun Mass Spectrom, 27:157-162; Coffey 및 Yang, 2018, Statistics for Biotechnology Process Development).
따라서, DOE는 특히 ETD MS2 분석에 적용될 때 폴리펩티드, 예를 들어 mAb 또는 mAb 서브유닛의 서열 커버리지를 개선하기 위해 본 발명의 방법을 사용하여 적용될 수 있는 강력한 수학적 도구이다.
본 발명은 또한 본 발명의 방법에 따라 시퀀싱된 단백질, 예를 들어 항체, 변이체 또는 항체 융합체를 제공한다.
본 발명의 이점은 예를 들어, 치료적 항체와 같은 단백질의 고속 및 정확한 드 노보 시퀀싱을 위해 분석 물리 화학을 사용하는 강력하고 매우 정확한 검정; 제조 훈련의 일부로서 위의 결과로 더 높은 수준의 서열 신뢰도로 생산된 치료적 항체; 임상 개발 및 상업적 사용에서 완벽한 항체 제조를 위한 광범위한 응용; 임의의 공개된 ETD 접근법보다 단클론성 항체 서브유닛의 더 높은 서열 커버리지; 샘플 인공물 없이 PTM 정보가 온전한 더 높은 시퀀스 범위, 즉 불안정한 PTM이 보존됨; 더 높은 서열 커버리지(SC), 예를 들어 공지된 방법에 비해 19-26% 개선 및 100% SC에 도달할 가능성; 및 최소한의 단계, 사용 용이성 및 저렴한 비용을 포함하지만 이에 제한되지 않는다.
본 개시내용은 폴리펩티드의 서열 커버리지를 개선하는 방법을 제공한다. 일부 예시적인 구현예에서, 방법은 (a) 서열 커버리지에 영향을 미치는 탠덤 질량 분광법에 대한 적어도 2개의 파라미터를 선택하는 단계; 및 (b) 상기 적어도 2개의 파라미터 각각의 값을 결정하기 위해 D-최적 실험 설계를 사용하는 단계를 포함하되, 상기 값은 최대화 서열 커버리지에 기반하여 선택된다.
한 양태에서, 상기 폴리펩티드는 항체, 이중특이성 항체, 단클론성 항체, 융합 단백질, 항체-약물 접합체, 항체 단편, 항체 서브유닛, 숙주 세포 단백질, 단백질 약제학적 생성물, 또는 그의 소화 단편이다.
한 양태에서, 방법은 폴리펩티드의 2개 이상의 서브유닛에 대해 순차적으로 또는 병렬적으로 방법을 수행하는 것을 추가로 포함한다. 특정 양태에서, 상기 서브유닛은 항체의 Fc/2, Fd 또는 LC 서브유닛을 포함하는 군으로부터 선택된다.
한 양태에서, 상기 탠덤 질량 분광법은 미들-다운 질량 분광법이다.
한 양태에서, 상기 질량 분광계는 전기분무 이온화 질량 분광계, 나노 전기분무 이온화 질량 분광계 또는 Orbitrap 기반 질량 분광계이다.
한 양태에서, 상기 탠덤 질량 분광법은 전자 이동 해리, 충돌 유도 해리, 전자 이동/충돌 유도 해리, 전자 이동/고에너지 충돌 해리, 자외선 광해리 또는 그의 조합을 포함한다. 또 다른 양태에서, 상기 탠덤 질량 분광법은 자동 이득 제어를 포함한다.
한 양태에서, 상기 질량 분광계는 액체 크로마토그래피 시스템에 커플링된다. 특정 양태에서, 상기 액체 크로마토그래피 시스템은 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 혼합식 크로마토그래피 또는 그의 조합을 포함한다.
한 양태에서, 상기 적어도 2개의 파라미터는 m/z 단리 창, ETD 반응 시간, ETD 시약 표적, MS2 AGC 표적 및 그의 임의의 조합을 포함하는 군으로부터 선택된다.
본 개시내용은 또한 폴리펩티드의 아미노산 서열을 결정하는 방법을 제공한다. 일부 예시적인 구현예에서, 방법은 (a) D-최적 실험 설계를 사용하여 폴리펩티드에 대한 탠덤 질량 분광법에 대한 적어도 2개의 파라미터 값을 결정하는 단계로서, 상기 값은 최대 서열 커버리지를 기반으로 선택되는, 단계; 및 (b) 상기 적어도 2개의 파라미터의 상기 값을 사용하여 상기 폴리펩티드를 탠덤 질량 분광법 분석에 적용하여 상기 폴리펩티드의 아미노산 서열을 결정하는 단계를 포함한다.
한 양태에서, 폴리펩티드는 항체, 이중특이성 항체, 단클론성 항체, 융합 단백질, 항체-약물 접합체, 항체 단편, 항체 서브유닛, 숙주 세포 단백질, 단백질 약제학적 생성물, 또는 그의 소화 단편이다.
한 양태에서, 방법은 폴리펩티드의 2개 이상의 서브유닛에 대해 순차적으로 또는 병렬적으로 방법을 수행하는 것을 추가로 포함한다. 특정 양태에서, 상기 서브유닛은 항체의 Fc/2, Fd 또는 LC 서브유닛을 포함하는 군으로부터 선택된다.
한 양태에서, 상기 탠덤 질량 분광법은 미들-다운 질량 분광법이다.
한 양태에서, 상기 질량 분광계는 전기분무 이온화 질량 분광계, 나노 전기분무 이온화 질량 분광계 또는 Orbitrap 기반 질량 분광계이다. 또 다른 양태에서, 상기 탠덤 질량 분광법은 전자 이동 해리, 충돌 유도 해리, 전자 이동/충돌 유도 해리, 전자 이동/고에너지 충돌 해리, 자외선 광해리 또는 그의 조합을 포함한다. 추가 양태에서, 상기 탠덤 질량 분광법은 자동 이득 제어를 포함한다.
한 양태에서, 상기 질량 분광계는 액체 크로마토그래피 시스템에 커플링된다. 특정 양태에서, 상기 액체 크로마토그래피 시스템은 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 혼합식 크로마토그래피 또는 그의 조합을 포함한다.
한 양태에서, 상기 적어도 2개의 파라미터는 m/z 단리 창, ETD 반응 시간, ETD 시약 표적, MS2 AGC 표적 및 그의 임의의 조합을 포함하는 군으로부터 선택된다.
한 양태에서, 방법은 탠덤 질량 분광법 분석 전에 상기 폴리펩티드를 효소 분해시키는 단계를 추가로 포함한다. 특정 양태에서, 상기 효소 분해는 상기 폴리펩티드를 IdeS에 접촉시키는 것을 포함한다. 또 다른 양태에서, 방법은 탠덤 질량 분광법 분석 전에 상기 폴리펩티드를 환원시키는 단계를 추가로 포함한다.
한 양태에 있어서, 방법은 방법을 독립적으로 2회 이상 수행하고 각각의 탠덤 질량 분광법 분석으로부터 확인된 단편을 조합하여 상기 폴리펩티드의 아미노산 서열을 결정하는 단계를 추가로 포함한다.
본 개시내용은 폴리펩티드의 서열 커버리지를 개선하는 추가 방법을 제공한다. 일부 예시적인 구현예에서, 방법은 (a) 상이한 단편 크기의 선택 각각의 단편 수에 영향을 미치는 탠덤 질량 분광법에 대한 적어도 2개의 파라미터를 선택하는 단계; 및 (b) D-최적 실험 설계를 사용하여 상기 적어도 2개의 파라미터 각각의 값을 결정하는 단계로서, 상기 값은 상기 선택된 단편 크기 각각에 대해 가장 큰 수의 단편을 생성하는 것에 기반하여 선택되는, 단계를 포함한다.
한 양태에서, 상기 폴리펩티드는 항체, 이중특이성 항체, 단클론성 항체, 융합 단백질, 항체-약물 접합체, 항체 단편, 항체 서브유닛, 숙주 세포 단백질, 단백질 약제학적 생성물, 또는 그의 소화 단편이다.
한 양태에서, 방법은 폴리펩티드의 2개 이상의 서브유닛에 대해 순차적으로 또는 병렬적으로 방법을 수행하는 것을 추가로 포함한다. 특정 양태에서, 상기 서브유닛은 항체의 Fc/2, Fd 또는 LC 서브유닛을 포함하는 군으로부터 선택된다.
한 양태에서, 상기 탠덤 질량 분광법은 미들-다운 질량 분광법이다.
한 양태에서, 상기 질량 분광계는 전기분무 이온화 질량 분광계, 나노 전기분무 이온화 질량 분광계 또는 Orbitrap 기반 질량 분광계이다.
한 양태에서, 상기 탠덤 질량 분광법은 전자 이동 해리, 충돌 유도 해리, 전자 이동/충돌 유도 해리, 전자 이동/고에너지 충돌 해리, 자외선 광해리 또는 그의 조합을 포함한다. 또 다른 양태에서, 상기 탠덤 질량 분광법은 자동 이득 제어를 포함한다.
한 양태에서, 상기 질량 분광계는 액체 크로마토그래피 시스템에 커플링된다. 특정 양태에서, 상기 액체 크로마토그래피 시스템은 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 혼합식 크로마토그래피 또는 그의 조합을 포함한다.
한 양태에서, 상기 적어도 2개의 파라미터는 m/z 단리 창, ETD 반응 시간, ETD 시약 표적, MS2 AGC 표적 및 그의 임의의 조합을 포함하는 군으로부터 선택된다.
한 양태에서, 상기 단편 크기는 약 5,000 Da 미만의 단편, 약 5,000 Da 내지 약 10,000 Da의 단편 및 약 10,000 Da 초과의 단편을 포함하는 군으로부터 선택된다.
본 개시내용은 또한 폴리펩티드의 아미노산 서열을 결정하는 또 다른 방법을 추가로 제공한다. 일부 예시적인 구현예에서, 방법은 (a) D-최적 실험 설계를 사용하여 폴리펩티드에 대한 탠덤 질량 분광법에 대한 적어도 2개의 파라미터 값을 결정하는 단계로서, 상기 값은 각각의 상이한 단편 크기의 선택에 대해 가장 큰 수의 단편을 생성하는 것에 기반하여 선택되는, 단계; (b) 각각의 선택된 단편 크기에 대해 상기 적어도 2개의 파라미터의 상기 값을 사용하여 상기 폴리펩티드를 탠덤 질량 분광법 분석에 적용하는 단계; 및 (c) 선택된 단편 크기 각각에 대한 상기 적어도 2개의 파라미터의 상기 값을 사용하여 상기 탠덤 질량 분광법 분석으로부터 확인된 단편을 조합하여 상기 폴리펩티드의 아미노산 서열을 결정하는 단계를 포함한다.
한 양태에서, 상기 폴리펩티드는 항체, 이중특이성 항체, 단클론성 항체, 융합 단백질, 항체-약물 접합체, 항체 단편, 항체 서브유닛, 숙주 세포 단백질, 단백질 약제학적 생성물, 또는 그의 소화 단편이다.
한 양태에서, 방법은 폴리펩티드의 2개 이상의 서브유닛에 대해 순차적으로 또는 병렬적으로 방법을 수행하는 것을 추가로 포함한다. 특정 양태에서, 상기 서브유닛은 항체의 Fc/2, Fd 또는 LC 서브유닛을 포함하는 군으로부터 선택된다.
한 양태에서, 상기 탠덤 질량 분광법은 미들-다운 질량 분광법이다.
한 양태에서, 상기 질량 분광계는 전기분무 이온화 질량 분광계, 나노 전기분무 이온화 질량 분광계 또는 Orbitrap 기반 질량 분광계이다. 또 다른 양태에서, 상기 탠덤 질량 분광법은 전자 이동 해리, 충돌 유도 해리, 전자 이동/충돌 유도 해리, 전자 이동/고에너지 충돌 해리, 자외선 광해리 또는 그의 조합을 포함한다. 추가 양태에서, 상기 탠덤 질량 분광법은 자동 이득 제어를 포함한다.
한 양태에서, 상기 질량 분광계는 액체 크로마토그래피 시스템에 커플링된다. 특정 양태에서, 상기 액체 크로마토그래피 시스템은 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 혼합식 크로마토그래피 또는 그의 조합을 포함한다.
한 양태에서, 상기 적어도 2개의 파라미터는 m/z 단리 창, ETD 반응 시간, ETD 시약 표적, MS2 AGC 표적 및 그의 임의의 조합을 포함하는 군으로부터 선택된다.
한 양태에서, 방법은 탠덤 질량 분광법 분석 전에 상기 폴리펩티드를 효소 분해시키는 단계를 추가로 포함한다. 특정 양태에서, 상기 효소 분해는 상기 폴리펩티드를 IdeS에 접촉시키는 것을 포함한다. 또 다른 양태에서, 방법은 탠덤 질량 분광법 분석 전에 상기 폴리펩티드를 환원시키는 단계를 추가로 포함한다.
제39항에 있어서, 방법은 방법을 독립적으로 2회 이상 수행하고 각각의 탠덤 질량 분광법 분석으로부터 확인된 단편을 조합하여 상기 폴리펩티드의 아미노산 서열을 결정하는 단계를 추가로 포함한다.
본 개시내용은 항체의 아미노산 서열을 결정하기 위한 추가 방법을 제공한다. 일부 예시적인 구현예에서, 방법은 (a) 항체의 서브유닛 각각에 대한 서열 커버리지에 영향을 미치는 ETD-MS2에 대한 적어도 2개의 파라미터를 선택하는 단계로서, 상기 서브유닛은 Fd, Fc/2 및 LC를 포함하는, 단계; (b) D-최적 실험 설계를 사용하여 상기 서브유닛 각각에 대한 상기 적어도 2개의 파라미터 각각의 값을 결정하는 단계로서, 상기 값은 상기 서브유닛의 최대화 서열 커버리지에 기반하여 선택되는, 단계; (c) 상기 항체를 IdeS 및 환원제에 접촉시켜 상기 서브유닛을 생성하는 단계; (d) 상기 적어도 2개의 파라미터의 상기 값을 사용하여 상기 서브유닛 각각을 ETD-MS2 분석에 적용하여 상기 서브유닛 각각의 단편의 아미노산 서열을 확인하는 단계; (e) 단계 (d)를 적어도 1회 이상 독립적으로 반복하여 상기 서브유닛 각각의 추가 단편의 아미노산 서열을 확인하는 단계; 및 (f) (d) 및 (e)의 상기 단편의 상기 아미노산 서열을 조합하여 상기 항체의 아미노산 서열을 결정하는 단계를 포함한다.
본 개시내용은 항체의 아미노산 서열을 결정하기 위한 또 다른 방법을 제공한다. 일부 예시적인 구현예에서, 방법은 (a) 항체의 서브유닛 각각의 작은, 중간 및 큰 단편의 수에 영향을 미치는 ETD-MS2에 대한 적어도 2개의 파라미터를 선택하는 단계로서, 상기 서브유닛은 Fd, Fc/2 및 LC를 포함하고, 상기 작은 단편은 약 5,000 Da 미만의 단편으로 구성되고, 상기 중간 단편은 약 5,000 Da 내지 약 10,000 Da의 단편으로 구성되고, 상기 큰 단편은 10,000 Da 초과의 단편으로 구성되는, 단계; (b) D-최적 실험 설계를 사용하여 상기 서브유닛 각각에 대한 상기 단편 크기 각각에 대한 상기 적어도 2개의 파라미터 각각의 값을 결정하는 단계로서, 상기 값은 상기 서브유닛에 대한 상기 크기의 가장 큰 수의 단편을 생성하는 것에 기반하여 선택되는, 단계; (c) 상기 항체를 IdeS 및 환원제에 접촉시켜 상기 서브유닛을 생성하는 단계; (d) 상기 단편 크기 각각에 대한 상기 적어도 2개의 파라미터의 상기 값을 사용하여 상기 서브유닛 각각을 ETD-MS2 분석에 적용하여 상기 서브유닛 각각의 단편의 아미노산 서열을 확인하는 단계; (e) 단계 (d)를 적어도 1회 이상 독립적으로 반복하여 상기 서브유닛 각각의 추가 단편의 아미노산 서열을 확인하는 단계; 및 (f) (d) 및 (e)의 상기 단편의 상기 아미노산 서열을 조합하여 상기 항체의 아미노산 서열을 결정하는 단계를 포함한다.
본 발명의 이들 및 다른 양태는 다음의 설명 및 첨부된 도면과 함께 고려될 때 더 잘 이해되고 이해될 것이다. 다음 설명은 다양한 구현예 및 그 많은 특정 세부 사항을 나타내지만, 예시로서 제공되며 제한되지 않는다. 많은 대체, 수정, 추가 또는 재배열이 본 발명의 범위 내에서 이루어질 수 있다.
본 명세서에 통합되고 그 일부를 구성하는 첨부 도면은 본 개시내용의 여러 구현예를 예시하고 설명과 함께 본 개시의 원리를 설명하는 역할을 한다.
도 1은 표시된 바와 같이 네(4)개의 단계를 갖는 본 발명의 검정의 개략도를 보여준다. 단계 1은 표시된 바와 같이, IdeS 효소에 의해 매개되는 소화 단계를 보여 세(3)개의 25 킬로달톤(kD) 폴리펩티드는 생성되고, 이들은 Fd(항체의 중쇄 가변 영역), Fc/2(항체의 불변 영역의 Fc 단편) 및 LC(항체의 경쇄 가변 영역)이다. 단계 2는 상기 언급된 항체 단편의 서열 커버리지를 위한 ETD의 최적 사용을 위한 예시적인 DOE 모델링을 보여준다. 단계 3은 DOE 엔벨로프 내에서 적용될 수 있는 3개의 상이한 설정의 예시적인 적용을 보여준다. 단계 4는 대부분의 잔기가 정확하게 식별되는 항체 서브유닛의 개선된 서열 커버리지(SC)의 예시적인 출력을 보여준다.
도 2a는 예시적인 구현예에 따라 본 발명의 방법을 사용하여 항체의 Fc/2, LC 및 Fd 서브유닛의 예측 및 관찰된 서열 커버리지의 비교를 보여준다. G1F만이 Fc/2 서브유닛의 서열 커버리지를 결정하는 데 포함되었다.
도 2b는 예시적인 구현예에 따라 본 발명의 방법을 사용하여 항체의 LC 서브유닛에 대한 각각의 저질량, 중질량 및 고질량 크기의 단편의 예측 및 관찰된 수를 비교한 것이다.
도 2c는 예시적인 구현예에 따라 저질량, 중질량 및 고질량 단편을 생성하도록 최적화된 설정을 사용한 항체의 Fc/2, LC 및 Fd 서브유닛 단편의 크기 분포를 보여준다.
도 3a는 예시적인 구현예에 따라 서브유닛 각각에 대해 3개의 독립적인 ETD 단편화 실행을 조합한 후 항체의 Fc/2, LC 및 Fd 서브유닛의 서열 커버리지를 보여준다.
도 3a는 예시적인 구현예에 따라 저질량, 중질량 및/또는 고질량 단편을 생성하도록 최적화된 설정을 사용하여 다수의 독립적인 ETD 단편화 실행을 조합한 후 항체의 Fc/2, LC 및 Fd 서브유닛의 서열 커버리지를 보여준다.
도 4는 본 발명의 모델링 및 검정에 적용하기에 적합한 치료적 항체의 예시적인 항체 경쇄 및 중쇄 서열을 보여준다.
도 1은 표시된 바와 같이 네(4)개의 단계를 갖는 본 발명의 검정의 개략도를 보여준다. 단계 1은 표시된 바와 같이, IdeS 효소에 의해 매개되는 소화 단계를 보여 세(3)개의 25 킬로달톤(kD) 폴리펩티드는 생성되고, 이들은 Fd(항체의 중쇄 가변 영역), Fc/2(항체의 불변 영역의 Fc 단편) 및 LC(항체의 경쇄 가변 영역)이다. 단계 2는 상기 언급된 항체 단편의 서열 커버리지를 위한 ETD의 최적 사용을 위한 예시적인 DOE 모델링을 보여준다. 단계 3은 DOE 엔벨로프 내에서 적용될 수 있는 3개의 상이한 설정의 예시적인 적용을 보여준다. 단계 4는 대부분의 잔기가 정확하게 식별되는 항체 서브유닛의 개선된 서열 커버리지(SC)의 예시적인 출력을 보여준다.
도 2a는 예시적인 구현예에 따라 본 발명의 방법을 사용하여 항체의 Fc/2, LC 및 Fd 서브유닛의 예측 및 관찰된 서열 커버리지의 비교를 보여준다. G1F만이 Fc/2 서브유닛의 서열 커버리지를 결정하는 데 포함되었다.
도 2b는 예시적인 구현예에 따라 본 발명의 방법을 사용하여 항체의 LC 서브유닛에 대한 각각의 저질량, 중질량 및 고질량 크기의 단편의 예측 및 관찰된 수를 비교한 것이다.
도 2c는 예시적인 구현예에 따라 저질량, 중질량 및 고질량 단편을 생성하도록 최적화된 설정을 사용한 항체의 Fc/2, LC 및 Fd 서브유닛 단편의 크기 분포를 보여준다.
도 3a는 예시적인 구현예에 따라 서브유닛 각각에 대해 3개의 독립적인 ETD 단편화 실행을 조합한 후 항체의 Fc/2, LC 및 Fd 서브유닛의 서열 커버리지를 보여준다.
도 3a는 예시적인 구현예에 따라 저질량, 중질량 및/또는 고질량 단편을 생성하도록 최적화된 설정을 사용하여 다수의 독립적인 ETD 단편화 실행을 조합한 후 항체의 Fc/2, LC 및 Fd 서브유닛의 서열 커버리지를 보여준다.
도 4는 본 발명의 모델링 및 검정에 적용하기에 적합한 치료적 항체의 예시적인 항체 경쇄 및 중쇄 서열을 보여준다.
달리 기재하지 않는 한, 본 명세서에 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 당업자가 통상적으로 이해하는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 임의의 방법 및 물질이 실시 또는 시험에 사용될 수 있지만, 이제 특정 방법 및 물질이 기재된다.
용어 "a"는 "적어도 하나"를 의미하는 것으로 이해되어야 하고, 용어들 "약" 및 "대략"은 당업자가 이해할 수 있는 바와 같이 표준 변이를 허용하는 것으로 이해되어야 하며, 범위가 제공되는 경우 엔드포인트가 포함된다. 본 명세서에서 사용된 바와 같이, 용어들 "포함하다(include)", "포함하다(includes)" 및 "포함하는(including)"은 비제한적인 것을 의미하고, 각각 "포함하다(comprise)", "포함하다(comprises)" 및 "포함하는(comprising)"을 의미하는 것으로 이해된다.
본 명세서에서 사용된 바와 같이, 용어 "단백질" 또는 "관심 단백질"은 공유 결합된 아미드 결합을 갖는 임의의 아미노산 폴리머를 포함할 수 있다. 단백질은 일반적으로 당업계에서 "폴리펩티드"로서 알려진 하나 이상의 아미노산 폴리머 사슬을 포함한다. "폴리펩티드"는 펩티드 결합을 통해 연결된 아미노산 잔기, 관련된 천연 발생 구조적 변이체 및 합성 비-천연 발생 그의 유사체로 구성된 폴리머를 지칭한다. "합성 펩티드 또는 폴리펩티드"는 비-천연 발생 펩티드 또는 폴리펩티드를 지칭한다. 합성 펩티드 또는 폴리펩티드는, 예를 들어 자동화 폴리펩티드 합성기를 사용하여 합성될 수 있다. 다양한 고상 펩티드 합성 방법이 당업자에게 알려져 있다. 단백질은 하나 또는 다중 폴리펩티드를 포함하여 단일 기능 생체분자를 형성할 수 있다. 또 다른 예시적인 양태에서, 단백질은 항체 단편, 나노바디, 재조합 항체 키메라, 사이토카인, 케모카인, 펩티드 호르몬 등을 포함할 수 있다. 관심 단백질은 바이오-치료용 단백질, 연구 또는 요법에 사용된 재조합 단백질, 트랩 단백질 및 다른 키메라 수용체 Fc-융합 단백질, 키메라 단백질, 항체, 단클론성 항체, 다클론성 항체, 인간 항체 및 이중특이성 항체 중 임의의 것을 포함할 수 있다. 단백질은 재조합 세포 기반 생산 시스템, 예컨대 곤충 바큘로바이러스 시스템, 효모 시스템(예를 들어, 피치아 속) 및 포유동물 시스템(예를 들어, CHO 세포 및 CHO-K1 세포와 같은 CHO 유도체)을 사용하여 생산될 수 있다. 바이오 치료용 단백질과 그의 생산에 대해 논의한 최근 검토를 위해 Ghaderi 등의 문헌["바이오 치료용 당단백질을 위한 생산 플랫폼. 비-인간 시알릴화의 발생, 영향 및 과제"]을 참조한다(Darius Ghaderi 등, Production platforms for biotherapeutic glycoproteins. Occurrence, impact, and challenges of non-human sialylation, 28 BIOTECHNOLOGY AND GENETIC ENGINEERING REVIEWS 147-176 (2012), 이의 전체 교시는 본 출원에 참조로 포함됨). 일부 예시적인 구현예에서, 단백질은 변형, 부가물 및 다른 공유 결합된 모이어티를 포함한다. 이들 변형, 부가물 및 모이어티는, 예를 들어 아비딘, 스트렙타비딘, 바이오틴, 글리칸(예를 들어, N-아세틸갈락토사민, 갈락토스, 뉴라민산, N-아세틸글루코사민, 푸코스, 만노스 및 다른 단당류), PEG, 폴리히스티딘, FLAGtag, 말토스 결합 단백질(MBP), 키틴 결합 단백질(CBP), 글루타티온-S-트랜스퍼라제(GST) myc-에피토프, 형광 표지 및 다른 염료 등을 포함한다. 단백질은 조성물 및 용해도를 기준으로 분류될 수 있고, 따라서 단순 단백질, 예컨대 구상 단백질 및 섬유상 단백질; 접합 단백질, 예컨대 핵단백질, 당단백질, 점액단백질, 색소단백질, 인단백질, 메탈로단백질 및 리포단백질; 및 유래 단백질, 예컨대 일차 유래 단백질 및 이차 유래 단백질을 포함할 수 있다.
본 명세서에서 사용된 용어 "재조합 단백질"은 적합한 숙주 세포에 도입된 재조합 발현 벡터에 운반된 유전자의 전사 및 번역의 결과로 생성된 단백질을 지칭한다. 특정한 예시적인 구현예에서, 재조합 단백질은 항체, 예를 들어 키메라, 인간화 또는 완전 인간 항체일 수 있다. 특정한 예시적인 구현예에서, 재조합 단백질은 다음으로 구성된 군으로부터 선택된 아이소타입의 항체일 수 있다: IgG, IgM, IgA1, IgA2, IgD 또는 IgE. 특정한 예시적인 구현예에서 항체 분자는 전장 항체(예를 들어, IgG1)이거나 대안적으로 항체가 단편(예를 들어, Fc 단편 또는 Fab 단편)일 수 있다.
용어 "항체"는 질환 또는 장애, 예를 들어 면역 또는 종양학적 장애를 조절하기 위해 대상체에 도입하기에 적합한 치료적 면역결합제, 예를 들어 단클론성 항체, 이중 또는 다중특이성 항체를 지칭한다. 용어 "항체"는 단클론성 항체, 이중특이성 항체, 다중특이성을 갖는 항체 조성물뿐만 아니라 항체 단편 또는 서브유닛(예를 들어, Fab, F(ab')2, scFv, Fv, Fd, Fc/2, 및 LC), 항체 유도체, 융합, 변이체, 및 유사체를 기재하는 것으로 광범위하게 해석되어야 한다.
용어 "항체"는 4개의 폴리펩티드 사슬, 이황화 결합에 의해 상호 연결된 2개의 중쇄(H) 및 2개의 경쇄(L)를 포함하는 면역글로불린 분자뿐만 아니라 그의 다량체(예를 들어, IgM)를 포함한다. 각 중쇄는 중쇄 가변 영역(본 명세서에서는 HCVR 또는 VH로 약칭함) 및 중쇄 불변 영역을 포함한다. 중쇄 불변 영역은 CH1, CH2 및 CH3의 3개 도메인을 포함한다. 각각의 경쇄는 경쇄 가변 영역(본 명세서에서 LCVR 또는 VL로 약칭함) 및 경쇄 불변 영역을 포함한다. 경쇄 불변 영역은 하나의 도메인(CL1)을 포함한다. VH 및 VL 영역은 프레임워크 영역(FR)이라고 하는 보다 보존된 영역이 산재되어 있는 상보성 결정 영역(CDR)이라고 하는 초가변성 영역으로 더 세분화될 수 있다. 각각의 VH 및 VL은 아미노 말단에서 카복시 말단까지 FR1, CDR1, FR2, CDR2, FR3, CDR3 및 FR4의 순서로 배열된 3개의 CDR 및 4개의 FR로 구성된다. 본 발명의 상이한 구현예에서, 항-big-ET-1 항체(또는 이의 항원 결합 부분)의 FR은 인간 생식계열 서열과 동일할 수 있거나 천연적으로 또는 인공적으로 변형될 수 있다. 아미노산 공통 서열은 2개 이상의 CDR의 나란히 있는 분석에 기반하여 정의될 수 있다. 본 명세서에서 사용된 용어 "항체"는 또한 완전 항체 분자의 항원 결합 단편을 포함한다.
본 명세서에 사용되는 항체의 "항원 결합 부분", 항체의 "항원 결합 단편" 등의 용어는 복합체를 형성하기 위해 항원에 특이적으로 결합하는 임의의 자연 발생, 효소적으로 얻을 수 있는, 합성, 또는 유전적으로 조작된 폴리펩티드 또는 당단백질을 포함한다. 항체의 항원 결합 단편은 예를 들어 항체 가변 및 선택적으로 불변 도메인을 인코딩하는 DNA의 조작 및 발현을 수반하는 재조합 유전 공학 기술 또는 단백분해 소화와 같은 임의의 적합한 표준 기술을 사용하여 완전 항체 분자로부터 유래될 수 있다. 이러한 DNA는 공지되어 있고/있거나 예를 들어 상업적 공급원, DNA 라이브러리(예를 들어 파아지-항체 라이브러리 포함)로부터 쉽게 입수할 수 있거나 합성될 수 있다. DNA는 예를 들어 하나 이상의 가변 및/또는 불변 도메인을 적합한 배열으로 배열하거나 코돈을 도입하거나 시스테인 잔기를 생성하거나 아미노산을 변형, 추가 또는 결실하는 것 등을 위해 화학적으로 또는 분자 생물학 기술을 사용하여 시퀀싱 및 조작할 수 있다.
본원에 사용된 바와 같이, "항체 단편"은 예를 들어 항체의 항원 결합 또는 가변 영역과 같은 온전한 항체의 일부를 포함한다. 항체 단편의 예는 Fab 단편, Fab' 단편, F(ab')2 단편, scFv 단편, Fv 단편, dsFv 디아바디, dAb 단편, Fd' 단편, Fd 단편, 및 단리된 상보성 결정 영역 (CDR) 영역, 뿐만 아니라 항체 단편으로부터 형성된 트리아바디, 테트라바디, 선형 항체, 단쇄 항체 분자, 및 다중 특이성 항체를 포함하지만 이에 제한되지 않는다. Fv 단편은 면역글로불린 중쇄와 경쇄 가변 영역의 조합이고, ScFv 단백질은 면역글로불린 경쇄와 중쇄 가변 영역이 펩타이드 링커로 연결된 재조합 단일 사슬 폴리펩티드 분자이다. 일부 예시적인 구현예에서, 항체 단편은 모 항체와 동일한 항원에 결합하는 단편인 모 항체의 충분한 아미노산 서열을 포함하고; 일부 예시적인 구현예에서, 단편은 모 항체에 필적하는 친화도로 항원에 결합하고/하거나 항원에 결합하기 위해 모 항체와 경쟁한다. 항체 단편은 임의의 수단에 의해 생성될 수 있다. 예를 들어, 항체 단편은 온전한 항체의 단편화에 의해 효소적으로 또는 화학적으로 생성될 수 있고/있거나 부분 항체 서열을 인코딩하는 유전자로부터 재조합적으로 생산될 수 있다. 대안적으로 또는 추가로, 항체 단편은 전체적으로 또는 부분적으로 합성적으로 생산될 수 있다. 항체 단편은 선택적으로 단일 사슬 항체 단편을 포함할 수 있다. 대안적으로 또는 추가로, 항체 단편은 예를 들어 이황화 결합에 의해 함께 연결된 다중 사슬을 포함할 수 있다. 항체 단편은 선택적으로 다중 분자 복합체를 포함할 수 있다. 기능적 항체 단편은 전형적으로 적어도 약 50개의 아미노산을 포함하고 보다 전형적으로는 적어도 약 200개의 아미노산을 포함한다.
본 명세서에서 사용된 용어 "Fd"는 대략 25 kD인 항체의 중쇄 가변 영역을 포함하는 항체 서브유닛을 지칭한다(또한 도 1 참조). 본 명세서에서 사용된 용어 "Fc/2"는 대략 25 kD인 항체의 중쇄 불변 영역을 포함하는 항체 서브유닛을 지칭한다(또한 도 1 참조). 본 명세서에서 사용된 용어 "LC"는 대략 25 kD인 항체의 경쇄 가변 영역을 포함하는 항체 서브유닛을 지칭한다(또한 도 1 참조).
용어 "이중특이성 항체"는 2개 이상의 에피토프에 선택적으로 결합할 수 있는 항체를 포함한다. 이중특이성 항체는 일반적으로 2개의 상이한 분자(예를 들어, 항원) 또는 동일한 분자(예를 들어, 동일한 항원)에 상이한 에피토프에 특이적으로 결합하는 각각의 중쇄를 갖는 2개의 상이한 중쇄를 포함한다. 이중특이성 항체가 2개의 상이한 에피토프(제1 에피토프 및 제2 에피토프)에 선택적으로 결합할 수 있는 경우, 제1 에피토프에 대한 제1 중쇄의 친화도는 일반적으로 제2 에피토프에 대한 제1 중쇄의 친화도보다 적어도 1 내지 2 또는 3 또는 4배 더 낮을 것이며, 그 반대도 마찬가지이다. 이중특이성 항체에 의해 인식되는 에피토프는 동일하거나 상이한 표적(예를 들어, 동일하거나 상이한 단백질)에 있을 수 있다. 예를 들어, 동일한 항원의 상이한 에피토프를 인식하는 중쇄를 조합하여 이중특이성 항체를 만들 수 있다. 예를 들어, 동일한 항원의 상이한 에피토프를 인식하는 중쇄 가변 서열을 인코딩하는 핵산 서열은 상이한 중쇄 불변 영역을 인코딩하는 핵산 서열에 융합될 수 있고 이러한 서열은 면역글로불린 경쇄를 발현하는 세포에서 발현될 수 있다.
전형적인 이중특이성 항체는 각각 3개의 중쇄 CDR, 이어서 CH1 도메인, 힌지, CH2 도메인 및 CH3 도메인을 갖는 2개의 중쇄, 및 항원 결합 특이성을 부여하지 않지만 각 중쇄와 결합할 수 있거나 각 중쇄와 결합할 수 있고 중쇄 항원 결합 영역에 의해 결합된 하나 이상의 에피토프에 결합할 수 있거나 각각의 중쇄와 회합할 수 있고 하나 또는 둘 다의 에피토프에 하나 또는 둘 다의 중쇄에 대한 결합을 가능하게 하는 면역글로불린 경쇄를 갖는다. BsAb는 Fc 영역(IgG 유사)을 갖는 것과 Fc 영역이 결여된 것의 두 가지 주요 부류로 나눌 수 있으며, 후자는 일반적으로 Fc를 포함하는 IgG 및 IgG 유사 이중특이성 분자보다 작다. IgG 유사 bsAb는 트리오맙, 놉 인투 홀(knobs into holes) IgG (kih IgG), crossMab, orth-Fab IgG, 이중-가변 도메인 Ig (DVD-Ig), 투-인-원(two-in-one) 또는 이중 작용 Fab (DAF), IgG-단쇄 Fv (IgG-scFv), 또는 κλ-바디로 제한되지 않는 것과 같은 상이한 형식을 가질 수 있다. 비-IgG 유사 상이한 형식은 탠덤 scFvs, 디아바디 포맷, 단일 사슬 디아바디, 탠덤 디아바디(TandAbs), 이중-친화성 재표적화 분자 (DART), DART-Fc, 나노바디, 또는 독-앤-락(dock-and-lock, DNL) 방법에 의해 생산된 항체를 포함한다 (문헌[Gaowei Fan, Zujian Wang & Mingju Hao, Bispecific antibodies and their applications, 8 JOURNAL OF HEMATOLOGY & ONCOLOGY 130; E. Kontermann, Bispecific Antibodies, HANDBOOK OF THERAPEUTIC ANTIBODIES 265-310 (2014)], 이의 전체 교시가 본 명세서에 포함됨). bsAb를 생산하는 방법은 2개의 상이한 하이브리도마 세포주의 체세포 융합, 화학적 가교제를 수반하는 화학적 접합, 재조합 DNA 기술을 활용한 유전적 접근에 기반한 쿼드로마 기술에 제한되지 않는다.
본 명세서에 사용된 "다중특이성 항체"는 적어도 2개의 상이한 항원에 대한 결합 특이성을 갖는 항체를 지칭한다. 이러한 분자는 일반적으로 2개의 항원(즉, 이중특이성 항체, bsAb)에만 결합하지만, 삼중특이성 항체 및 KIH 삼중특이성과 같은 추가 특이성을 갖는 항체는 또한 본 명세서에 개시된 시스템 및 방법에 의해 처리될 수 있다.
본 명세서에서 사용된 용어 "단클론성 항체"는 하이브리도마 기술을 통해 생산된 항체로 제한되지 않는다. 단클론성 항체는 이용가능하거나 당업계에 공지된 임의의 수단에 의해 임의의 진핵, 원핵 또는 파아지 클론을 포함하는 단클론성으로부터 유래 수 있다. 본 개시내용에 유용한 단클론성 항체는 하이브리도마, 재조합 및 파아지 디스플레이 기술 또는 그의 조합의 사용을 포함하는 당업계에 공지된 매우 다양한 기술을 사용하여 제조될 수 있다.
본 명세서에서 사용된 용어 "NISTmAb"는 단클론성 항체 표준 "국립표준기술연구소 인간화 IgG1κ 단일클론항체 표준(National Institute of Standards & Technology Humanized IgG1κ Monoclonal Antibody standard; NISTmAb)"을 지칭한다.
본 명세서에 사용되는 일반 용어 "번역 후 변형" 또는 "PTM"은 리보솜 합성 동안(번역 동시 변형) 또는 후에(번역 후 변형) 폴리펩티드가 겪는 공유 변형을 지칭한다. PTM은 일반적으로 특정 효소 또는 효소 경로에 의해 도입된다. 많은 것은 단백질 백본 내의 특정 특징적인 단백질 서열(지문 서열)의 위치에서 발생한다. 수백 개의 PTM이 기록되었으며 이러한 변형은 단백질 구조 또는 기능의 일부 양태에 변함없이 영향을 미친다(Walsh, G. "Proteins" (2014) 2판n, Wiley 및 Sons, Ltd. 공개, ISBN: 9780470669853). 다양한 번역 후 변형은 절단, N-말단 확장, 단백질 분해, N-말단의 아실화, 바이오티닐화(바이오틴에 의한 라이신 잔기의 아실화), C-말단의 아미드화, 글리코실화, 요오드화, 보결 기의 공유 부착, 아세틸화(통상적으로 단백질의 N-말단에서 아세틸 기의 첨가), 알킬화(통상적으로 라이신 또는 아르기닌 잔기에서 알킬 그룹(예를 들어 메틸, 에틸, 프로필)의 첨가), 메틸화, 아데닐화, ADP-리보실화, 폴리펩티드 사슬 내에서 그 사이에서 공유 교차 연결, 설폰화, 프레닐화, 비타민 C 의존적 변형 (프롤린 및 라이신 하이드록실화 및 카복시 말단 아미드화), γ-카복시글루타메이트(glu 잔기)를 형성하는 글루탐산 잔기의 카복실화에서 비타민 K가 보조 인자인 비타민 K 의존적 변형, 글루타밀화 (글루탐산 잔기의 공유결합), 글라이실화 (공유결합 글리신 잔기), 글리코실화 (글리코실 기를 아스파라긴, 하이드록실라이신, 세린, 또는 트레오닌에 첨가하면 당단백질이 생성됨), 이소프레닐화 (이소프레노이드 그룹 예컨대 파르네솔 및 제라닐게라니올의 첨가), 리포일화 (리포에이트 작용기의 부착), 포스포판테테이닐화 (지방산, 폴리케타이드, 비-리보솜 펩티드 및 류신 생합성에서와 같이 조효소 A로부터의 4'-포스포판테테이닐 모이어티의 첨가), 인산화 (포스페이트 기의, 통상적으로 세린, 티로신, 트레오닌 또는 히스티딘에의 첨가), 및 황산화 (설페이트 기의, 통상적으로 티로신 잔기에의 첨가)을 포함하지만 이에 제한되지 않는다. 아미노산의 화학적 성질을 변경하는 번역 후 변형은 시트룰린화 (탈이미드화에 의해 아르기닌에서 시트룰린으로 전환), 및 탈아미드화 (글루타민에서 글루탐산으로 또는 아스파라긴에서 아스파르트산으로 전환)을 포함하지만 이에 제한되지 않는다. 구조적 변화를 수반하는 번역 후 변형에는 이황화 가교(2개의 시스테인 아미노산의 공유 결합) 및 단백분해 절단(펩티드 결합에서 단백질의 절단)의 형성이 포함되지만 이에 제한되지 않는다. 예시적인 구현예에서, 번역후 변형은 단백질 C-말단에서 라이신의 절단이다. 특정 번역 후 변형은 다른 단백질 또는 펩티드의 첨가, 예컨대 ISGylation (ISG15 단백질 (인터페론 자극 유전자)에 대한 공유결합), 수모일화 (SUMO 단백질 (작은 유비퀴틴 관련 개질제)에 대한 공유결합) 및 유비퀴틴화 (단백질 유비퀴틴에 대한 공유결합)을 수반한다 UniProt에서 큐레이팅한 PTM의 보다 자세한 제어 어휘에 대해 문헌[European Bioinformatics InstituteProtein Information ResourceSIB Swiss Institute of Bioinformatics, European Bioinformatics Institute Drs - Drosomycin precursor - Drosophila melanogaster (Fruit fly) - Drs gene & protein, http://www.uniprot.org/docs/ptmlist] 참고. 일부 예시적인 구현예에서, 본 발명의 방법은 폴리펩티드, 예를 들어 항체의 번역 후 변형을 확인, 정량화 및/또는 특징화하는 데 사용될 수 있다.
본 명세서에 사용되는 "샘플"은 세포 배양액(CCF), 수확된 세포 배양액(HCCF), 다운스트림 프로세싱의 임의의 단계, 원료 의약품(DS) 또는 최종 제형화된 생성물을 포함하는 의약품(DP)과 같은 바이오프로세서의 임의의 단계로부터 얻을 수 있다. 일부 특정한 예시적인 구현예에서, 샘플은 정화, 크로마토그래피 생산 또는 여과의 다운스트림 프로세스의 임의의 단계로부터 선택될 수 있다.
일부 예시적인 구현예에서, 관심 단백질을 포함하는 샘플은 LC-MS 분석 전에 제조될 수 있다. 제조 단계에는 변성, 알킬화, 희석, 환원 및 분해가 포함될 수 있다.
본 명세서에서 사용된 용어 "단백질 알킬화제" 또는 "알킬화 제제"는 단백질에서 특정 유리 아미노산 잔기를 알킬화하는 데 사용되는 제제를 지칭한다. 단백질 알킬화제의 비제한적 예는 요오드아세트아미드 (IOA/IAA), 클로로아세트아미드 (CAA), 아크릴아미드 (AA), N-에틸말레이미드 (NEM), 메틸 메탄티오설포네이트 (MMTS), 및 4-비닐피리딘 또는 그의 조합이다.
본 명세서에 사용되는 "단백질 변성" 또는 "변성"은 분자의 3차원 형상이 원래 상태로부터 변경되는 과정을 지칭할 수 있다. 단백질 변성은 단백질 변성제를 사용하여 수행할 수 있다. 단백질 변성제의 비제한적 예에는 열, 높거나 낮은 pH, DTT와 같은 환원제 또는 무질서유발제(chaotropic agent)에 대한 노출이 포함된다. 여러 무질서유발제가 단백질 변성제로 사용될 수 있다. 무질서유발 용질은 수소 결합, 반 데르 발스 힘 및 소수성 효과와 같은 비공유 힘에 의해 매개되는 분자 내 상호 작용을 방해하여 시스템의 엔트로피를 증가시킨다. 무질서유발제의 비제한적 예는 부탄올, 에탄올, 염화구아니디늄, 과염소산리튬, 아세트산리튬, 염화마그네슘, 페놀, 프로판올, 나트륨 도데실 설페이트, 티오우레아, N-라우로일사르코신, 우레아 및 그의 염을 포함한다.
본 명세서에서 사용된 용어 "소화"는 단백질의 하나 이상의 펩티드 결합의 가수분해를 지칭한다. 적절한 가수분해제(예를 들어, 효소적 소화 또는 비효소적 소화)를 사용하여 샘플에서 단백질을 소화하는 방법에는 여러 가지가 있다. 구성 펩티드로의 단백질의 소화는 펩티드 맵핑 분석을 사용하여 추가로 분석할 수 있는 "펩티드 소화"를 생산할 수 있다. "펩티드 소화"라는 용어는 적절한 크기의 폴리펩티드가 본 발명의 방법을 사용하여 조사될 수 있도록, 항체 단백질 서열을 소화할 수 있는 하나 이상의 효소(예를 들어, IdeS)와 함께 인큐베이션할 때 본 명세서에 기재된 바와 같은 폴리펩티드, 예를 들어 항체를 노출시켜 생성된 펩티드 혼합물을 지칭한다.
본 명세서에서 사용된 용어 "소화 효소"는 단백질의 소화를 수행할 수 있는 다수의 상이한 제제 중 임의의 것을 지칭한다. 효소 분해를 수행할 수 있는 가수분해제의 비제한적 예는 아스페르길루스 사이토이(Aspergillus Saitoi)로부터의 프로테아제, 엘라스타제, 서브틸리신, 프로테아제 XIII, 펩신, 트립신, Tryp-N, 키모트립신, 아스페르길로펩신 I, LysN 프로테아제 (Lys-N), LysC 엔도프로테이나제 (Lys-C), 엔도프로테이나제 Asp-N (Asp-N), 엔도프로테이나제 Arg-C (Arg-C), 엔도프로테이나제 Glu-C (Glu-C) 또는 외막 단백질 T (OmpT), 스트렙토코쿠스 파이오제네스 (IdeS)의 면역글로불린 분해 효소, 서몰라이신, 파파인, 프로나제, V8 프로테아제 또는 그의 생물학적 활성 단편 또는 동형체 또는 그의 조합을 포함한다 단백질 소화에 이용 가능한 기술에 대한 최근 검토는 문헌[Switazar 등, "Protein Digestion: An Overview of the Available Techniques and Recent Developments" (Linda Switzar, Martin Giera & Wilfried M. A. Niessen, Protein Digestion: An Overview of the Available Techniques and Recent Developments, 12 JOURNAL OF PROTEOME RESEARCH 1067-1077 (2013))]를 참고한다.
본 명세서에서 사용된 용어 "단백질 환원제" 또는 "환원 제제"는 단백질에서 이황화 가교의 환원에 사용되는 제제를 지칭한다. 단백질을 환원시키기 위해 사용되는 단백질 환원제의 비제한적 예는 디티오트레이톨 (DTT), β-머캅토에탄올, 엘만(Ellman) 시약, 하이드록실아민 하이드로클로라이드, 나트륨 시아노보로하이드라이드, 트리스(2-카복시에틸)포스핀 하이드로클로라이드 (TCEP-HCl), 또는 그의 조합이다. 종래의 단백질 분석 방법인 환원된 펩티드 맵핑은 LC-MS 분석 전에 단백질 환원을 수반한다. 대조적으로, 비-환원 펩티드 맵핑은 내인성 이황화 결합을 보존하기 위해 환원의 샘플 준비 단계를 생략한다. 일부 예시적인 구현예에서, 환원제는 IdeS를 사용하여 소화한 후 항체의 서브유닛을 분리하는 데 사용된다.
본 명세서에서 사용되는 용어 "액체 크로마토그래피"는 액체에 의해 운반되는 생물학적/화학적 혼합물이 고정 액체 또는 고상을 통해(또는 내부로) 유동할 때 성분의 차등 분포의 결과로서 성분으로 분리될 수 있는 공정을 지칭한다. 액체 크로마토그래피의 비제한적 예는 역상 액체 크로마토그래피 (RPLC), 이온교환 크로마토그래피, 크기 배제 크로마토그래피, 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 또는 혼합식 크로마토그래피를 포함한다. 일부 양태에서, 적어도 하나의 관심 단백질 또는 펩티드 소화물을 함유하는 샘플은 전술한 크로마토그래피 방법 중 임의의 하나 또는 그의 조합에 적용될 수 있다. 크로마토그래피를 사용하여 분리된 피분석물은 피분석물이 크로마토그래피 컬럼을 통해 이동하는 속도를 반영하는 고유한 체류 시간을 특징으로 한다. 피분석물은 한 축에 체류 시간을 표시하고 다른 축에는 측정된 신호를 표시하는 크로마토그램을 사용하여 비교될 수 있고, 여기서 측정된 신호는 예를 들어 UV 검출 또는 형광 검출을 통해 생성될 수 있다.
본 명세서에서 사용되는 "질량 분광계"라는 용어는 특정 분자종을 식별하고 이들의 정확한 질량을 측정할 수 있는 장치를 포함한다. 이 용어는 폴리펩티드 또는 펩티드가 특징화될 수 있는 임의의 분자 검출기를 포함하는 것을 의미한다. 질량 분광계는 이온 공급원, 질량 분석기 및 검출기의 세 가지 주요 부분을 포함할 수 있다. 이온 공급원의 역할은 기상 이온을 생성하는 것이다. 피분석물 원자, 분자 또는 클러스터는 기체 상태로 전달될 수 있으며 동시에(전자분무 이온화(ESI)에서와 같이) 또는 별도의 공정을 통해 이온화될 수 있다. 이온 공급원의 선택은 적용에 따라 다르다.
일부 예시적인 구현예에서, 질량 분광계는 탠덤 질량 분광계일 수 있다. 본 명세서에서 사용되는 용어 "탠덤 질량 분광법"은 다중 단계의 질량 선택 및 질량 분리를 사용하여 샘플 분자에 대한 구조적 정보를 얻는 기술을 포함한다. 전제 조건은 첫 번째 질량 선택 단계 후에 단편이 예측 가능하고 제어 가능한 방식으로 형성되도록 샘플 분자가 기상으로 변환되고 이온화된다는 것이다. MS/MS 또는 MS2는 먼저 전구체 이온(MS1)을 선택 및 단리하고 단편화하여 의미 있는 정보를 얻는 방식으로 수행할 수 있다. 탠덤 MS는 다양한 분석기 조합으로 성공적으로 수행되었다. 특정 적용을 위해 조합할 분석기는 감도, 선택성, 속도뿐만 아니라 크기, 비용 및 이용가능성과 같은 다양한 요인에 의해 결정될 수 있다. 탠덤 MS 방법의 두 가지 주요 범주는 탠덤-인-공간(tandem-in-space) 및 탠덤-인-시간(tandem-in-time)이지만, 탠덤-인-시간 분석기가 공간에서 커플링되거나 탠덤-인-공간 분석기와 커플링되는 하이브리드도 있다. 탠덤-인-공간 질량 분광계는 이온 공급원, 전구체 이온 활성화 장치 및 최소 2개의 비-트랩핑 질량 분석기로 구성된다.
탠덤 질량 분광법은 폴리펩티드 피분석물의 단편화 패턴, 예를 들어 a- 및 x-이온, b- 및 y-이온 또는 c- 및 z-이온에 따라 이온 시리즈를 생성할 수 있다. 본 명세서에서 사용된 용어 "c-이온" 및 "z-이온"은 폴리펩티드가 분석 기술 ETD에 적용될 때 관찰되는 우세한 이온을 의미한다.
본 명세서에서 사용된 용어 "총 이온 크로마토그램" 또는 "총 이온 전류 크로마토그램"(TIC)은 체류 시간에 대한 총 신호 강도를 플로팅하는 LC-MS 데이터의 표현을 지칭한다.
본 명세서에서 사용된 용어 "탑-다운"은 예를 들어 온전한 질량 분석에서 입력 샘플이 크거나 온전한 단백질/폴리펩티드인 분석 기술을 의미한다. 본 명세서에 사용되는 "바텀-업"이라는 용어는 입력 샘플이 예를 들어 펩티드 맵핑에서 작은 서브유닛으로 감소된 단백질/폴리펩티드인 분석 기술을 지칭한다. 본 명세서에 사용되는 용어 "미들-다운"은 예를 들어 IdeS에 의한 항체 소화를 사용하여 중간 크기의 서브유닛으로 감소된 단백질/폴리펩티드가 입력 샘플인 분석 기술을 지칭한다.
본 명세서에서 사용된 용어 "m/z" 또는 "질량 대 전하 비율"은 예를 들어 LC-MS, LC-MS/MS 및/또는 ETD를 사용하여 폴리펩티드의 양태를 특성화하기 위한 분석 파라미터를 의미하고, 여기서 m은 질량을 나타내고 z는 관찰된 이온의 전하 수를 나타낸다. 특정 m/z 분리 기능은 기기 이온의 한 섹션에서 선택되어 중간 영역에서 해리된 다음, 생성 이온이 m/z 분리 및 데이터 수집을 위해 다른 분석기로 전송되도록 설계할 수 있다. 탠덤-인-시간에서는 이온 공급원에서 생성된 질량 분광계 이온을 동일한 물리적 장치에서 포획, 단리, 단편화 및 m/z 분리할 수 있다.
질량 분광계에 의해 식별된 펩티드는 온전한 단백질, 그의 존재비, 그의 번역 후 변형 또는 다른 변형의 대용 대표로 사용할 수 있다. 이들은 실험 및 이론적 MS/MS 데이터를 연관시켜 단백질 특성화에 사용할 수 있으며 후자는 단백질 서열 데이터베이스의 가능한 펩티드로부터 생성된다. 특성화에는 단백질 단편의 아미노산 시퀀싱, 단백질 시퀀싱 결정, 단백질 드 노보 시퀀싱 결정, 번역 후 변형 또는 서열 변이체 찾기, 번역 후 변형 또는 서열 변이체 확인 또는 상용성 분석, 또는 그의 조합이 포함되나 이에 제한되지 않는다.
일부 예시적인 양태에서, 질량 분광계는 나노전기분무 또는 나노분무에서 작동할 수 있다. 본 명세서에서 사용된 용어 "나노전기분무" 또는 "나노분무"는 종종 외부 용매 전달을 사용하지 않고 매우 낮은 용매 유속, 전형적으로 샘플 용액의 분당 수백 나노리터 이하에서 전기분무 이온화를 지칭한다. 나노전기분무를 형성하는 전기분무 주입 설정은 정적 나노전기분무 방출체 또는 동적 나노전자분무 방출체를 사용할 수 있다. 정적 나노전자분무 방출체는 장기간에 걸쳐 소량의 샘플(피분석물) 용액 부피를 지속적으로 분석한다. 동적 나노전기분무 방출체는 모세관 컬럼과 용매 전달 시스템을 사용하여 질량 분광계로 분석하기 전에 혼합물에서 크로마토그래피 분리를 수행한다.
일부 예시적인 구현예에서, 질량 분석기는 사중극자 질량 분석기, 예를 들어 삼중 사중극자 질량 분광계일 수 있다. 본 명세서에 사용되는 용어 "RF"는 고주파 (RF) 충돌 사중극자를 사용하여 폴리펩티드를 특징화하기 위한 분석 기술을 지칭한다.
질량 분광계는 예를 들어, 충돌 유도 해리 (CID), 전자 이동 해리 (ETD), 전자 이동/충돌 유도 해리 (ETciD), 전자 이동/고에너지 충돌 해리 (EThcD), 또는 자외선 광해리 (UVPD)를 포함하는 다양한 단편화 또는 분석 기술 중 하나 이상을 사용할 수 있다.
일부 예시적인 구현예에서, 질량 분광법 분석은 자동 이득 제어(AGC)를 사용할 수 있다. AGC는 기기 소스에서 전송되는 동적 이온 유동에 대한 자동화된 조절을 제공할 수 있으며, 그 결과 질량 분석기에서 보다 일정한 이온 모집단을 생성하여 샘플의 상대적 존재비의 광범위한 범위에 맞게 조정할 수 있다. 본 명세서에서 사용되는 "MS2 AGC"라는 용어는 자동 이득 제어를 이용한 탠덤 질량 분광법 분석을 지칭한다.
일부 예시적인 구현예에서, 질량 분광법은 고유 조건 하에서 수행될 수 있다. 본 명세서에 사용되는 용어 "고유 조건"은 피분석물에서 비-공유 상호작용을 보존하는 조건 하에서 질량 분광법을 수행하는 것을 포함할 수 있다. 고유 MS에 대한 자세한 검토는 다음 검토를 참조한다: 문헌[Elisabetta Boeri Erba & Carlo Petosa, The emerging role of native mass spectrometry in characterizing the structure and dynamics of macromolecular complexes, 24 PROTEIN SCIENCE 1176-1192 (2015)].
본 명세서에 사용되는 "데이터베이스"라는 용어는 예를 들어 FASTA 형식의 파일 형태로 샘플에 존재할 수 있는 컴파일된 단백질 서열 수집을 지칭한다. 관련 단백질 서열은 연구 중인 종의 cDNA 서열에서 유래될 수 있다. 예를 들어 Uniprot 또는 Swiss-prot에서 호스팅하는 데이터베이스를 포함하는 관련 단백질 서열을 검색하는 데 사용할 수 있는 공개 데이터베이스이다. 데이터베이스는 본 명세서에서 "생물정보학 도구"라고 하는 것을 사용하여 검색할 수 있다. 생물정보학 도구는 데이터베이스의 모든 가능한 서열에 대해 해석되지 않은 MS/MS 스펙트럼을 검색하고 해석된(주석이 달림) MS/MS 스펙트럼을 출력으로 제공하는 기능을 제공한다. 이러한 도구의 비제한적인 예는 Mascot (www.matrixscience.com), Spectrum Mill (www.chem.agilent.com), PLGS (www.waters.com), PEAKS (www.bioinformaticssolutions.com), Proteinpilot (download.appliedbiosystems.com/proteinpilot), Phenyx (www.phenyx-ms.com), Sorcerer (www.sagenresearch.com), OMSSA (www.pubchem.ncbi.nlm.nih.gov/omssa/), X!Tandem (www.thegpm.org/TANDEM/), Protein Prospector (prospector.ucsf.edu/prospector/mshome.htm), Byonic (www.proteinmetrics.com/products/byonic) 또는 Sequest (fields.scripps.edu/sequest)이다.
본 명세서에서 사용된 용어 "DOE"는 선택된 기기 설정, 다변량 분석 및/또는 컴퓨터 지원 설계 및 소프트웨어에 의해 촉진될 수 있는 실험 설계를 지칭한다.
본 명세서에 사용되는 "D-최적 설계"라는 용어는 예를 들어 ETD 및 MS를 사용하여 폴리펩티드의 시퀀싱에 적합한 파라미터의 DOE 세트를 지칭한다. 파라미터는 예를 들어 m/z 단리 창, ETD 반응 시간, ETD 시약 표적, 및 MS2 AGC 표적을 포함할 수 있다. 중요하다고 생각되는 경우, ETD MS2 스펙트럼 품질에 영향을 미치는 파라미터는 전체 폴리펩티드 단편/서브유닛 서열 커버리지를 달성하기 위해 최적화될 수 있다. 파라미터는 이전 사용자 경험 및 이전 문헌을 기반으로 중요하게 간주될 수 있다. 이 공정에는 컴퓨터 지원 설계가 포함되며 여기서 모든 관련 조합의 서브세트는 설계의 D-효율성을 최대화한다는 목표로 선택된다.
본 명세서에서 사용된 용어 "D-효율성"은 작업부하를 줄이고 의미 있는 모델 또는 D-최적 실험 설계(DOE)를 제공하기 위한 컴퓨터 지원 설계를 지칭한다.
본 명세서에서 사용되는 용어 "THRASH 알고리즘"은 DOE 및 D-최적의 양태를 수행하기 위한 분석 소프트웨어를 지칭한다.
달리 기재되지 않는 한, 본 명세서에서 사용되는 모든 용어 및 구문은 그 용어 또는 구문이 사용되는 문맥으로부터 명백히 반대되는 것이 명시되거나 명백하지 않는 한, 해당 용어 및 구문이 당업계에서 획득한 의미를 포함한다.
본 개시내용은 이전에 달성되거나 보고된 것보다 더 높은 정밀도로 폴리펩티드, 특히 항체 단편(예를 들어, Fd, Fc/2 및 LC)의 고충실도 아미노산 잔기 시퀀싱을 정확하게 수행하는 방법을 제공한다. 본 발명의 검정은 예를 들어 임상 시험 또는 상업적 사용에서 항체 후보를 평가하기 위한 필수 품질관리 도구이다.
본 발명의 방법의 예시적인 작업 흐름이 도 1에 도시되어 있으며, 여기서 예시적인 단계는 실험 설계(DOE) 입력 파라미터에 의해 통지된다. 이 DOE는 전자 이동 해리(ETD) 및 질량 분광법(MS)의 적용을 알려 주어, 이전에 달성된 것보다 주어진 항체 서브유닛의 더 높은 서열 커버리지(SC)를 제공한다.
새로운 실험 설계(DOE) 파라미터 세트를 사용하는 본 발명의 검정은 고도로 정확한 측정을 제공하도록 보정될 수 있다. 이 검정 충실도는 복잡한 단백질 분자, 특히 인간 대상체에게 도입되도록 설계된 치료적 항체의 제조에 핵심이다.
항체 시퀀싱에 DOE 접근법을 사용하는 능력을 입증하기 위해, 이 방법을 NISTmAb(National Institute of Standards & Technology Humanized IgG1κ Monoclonal Antibody standard)에 적용되었다. DOE 접근법을 사용하여, MS2 파라미터를 최적화하여 ETD 단편화 및 효율에 영향을 미치고 NISTmAb 단클론성 항체 표준의 서열 커버리지를 최대화하였다. 최적의 파라미터를 사용한 3가지 LC-MS2 획득의 조합은 Fc/2, LC 및 Fd에 대해 각각 71%, 74% 및 58%의 매우 높은 서열 커버리지를 초래하였다. "낮음", "중간" 및 "높음" m/z 범위에서 단편 수를 최대화하는 데 필요한 파라미터를 모델링하는 이 DOE 전략의 능력이 NISTmAb 서브유닛의 서열 커버리지를 훨씬 더 높인다는 것이 추가로 입증되었다.
이 DOE 전략은 궁극적으로 총 6개의 실행이 조합되었을 때 Fc/2, LC 및 Fd에 대해 각각 80%, 84% 및 72%의 NISTmAb 서브유닛의 훨씬 더 높은 서열 커버리지를 초래하였다. 이러한 결과는 이전에 보고된 방법과 비교할 때 단클론성 항체 서브유닛의 더 높은 ETD 서열 커버리지를 입증한다. 이 접근법은 다른 mAb 분자에도 적용되었으며 도 3a 및 도 3b에 나타낸 바와 같이 유사한 결과가 달성되었다.
본 발명은 PTM을 온전하게 유지하면서 치료적 항체의 미세 구조 및 정확한 아미노산 서열의 정확한 결정을 제공한다는 것을 이해해야 한다. 따라서, 본 발명은 임의의 상업적으로 생산된 치료적 항체의 CMC(Chemistry, Manufacturing, and Controls)를 보완하고 개선한다(예를 들어, 도 4 참조).
예를 들어, 본 발명은 다수의 항체 요법의 균질성 보호 및 제조를 완벽하게 할 수 있게 한다. 이러한 항체 요법은 예를 들어, 압식시맙, 아달리무맙, 아달리무맙-atto, 아도-트라스투주맙 엠탄신, 알렘투주맙, 알리로쿠맙, 아테졸리주맙, 아벨루맙, 바실릭시마맙, 벨리무맙, 베바시주맙, 베즐로톡수맙, 블리나투모맙, 브렌툭시맙 베도틴, 브로달루맙, 카나키누맙, 카프로맙 펜데타이드, 세르톨리주맙 페골, 세툭시맙, 다클리주맙 (Zenapax), 다클리주맙 (Zinbryta), 다라투무맙, 데노수맙, 디누툭시맙, 두필루맙, 더발루맙, 에쿨리주맙, 엘로투주맙, 에볼로쿠맙, 골리무맙, 골리무맙, 이브리투모맙 티욱세탄, 이다루시주맙, 인플릭시맙, 인플릭시맙-abda, 인플릭시맙-dyyb, 이필리무맙 익세키주맙, 메폴리주맙, 나탈리주맙, 네시투무맙, 니볼루맙, 오빌톡삭시맙, 오비누투주맙, 오크렐리주맙, 오파투무맙, 올라라투맙, 오말리주맙, 팔리바주맙, 파니투무맙, 펨브롤리주맙, 페르투주맙, 라무시루맙, 라니비주맙, 락시바쿠맙, 레슬리주맙, 리툭시맙, 세쿠키누맙, 실툭시맙, 토실리주맙, 토실리주맙, 트라스투주맙, 우스테키누맙, 베돌리주맙, 사릴루맙, 리툭시맙 및 하이알로니다제구셀쿠맙, 이노투주맙 오조가미신, 아달리무맙-adbm, 젬투주맙 오조가미신, 베바시주맙-awwb, 벤랄리주맙, 및 에미시주맙-kxwh. 트라스투주맙-dkst, 인플릭시맙-qbtx, 이발리주맙-uiyk, 틸드라키주맙-asmn, 부로수맙-twza, 및 에레누맙-aooe를 포함한다.
본 발명에 대한 다양한 징후 대상체를 위한 관심 다른 치료적 항체, 항체 단편, 항체 융합 단백질, 수용체, 또는 수용체 단백질은 예를 들어, 아플리베르셉트 (예를 들어, 안구 장애 치료용); 릴로나셉트 (예를 들어, 실명 및 전이성 결장직장암 치료용); 알리로쿠맙 (예를 들어, 가족성 고콜레스테롤혈증 또는 임상 죽상동맥경화성 심혈관 질환 (ASCVD) 치료용); 두필루맙 (예를 들어, 아토피성 피부염 치료용); 사릴루맙 (예를 들어, 류마티스성 관절염 및 COVID-19 치료용); 세미플리맙 (예를 들어, PD-1 관련된 질환 치료용); 및 에볼라 치료용 항체를 포함한다.
본 개시내용은 폴리펩티드를 시퀀싱하는 방법을 제공한다. 일부 예시적인 구현예에서, 방법은 더 작은 폴리펩티드 서열이 얻어지도록 폴리펩티드를 소화물에 노출시키는 단계; ETD 및 MS에 대한 D-최적 파라미터를 선택하는 단계; D-최적 파라미터 하에서 단백질 소화물을 ETD 및 MS에 노출시키는 단계; 및 폴리펩티드의 아미노산 서열을 결정하는 단계를 포함한다.
한 양태에서, 폴리펩티드는 항체, 항체 변이체 또는 항체 융합체이다.
한 양태에서, 분해는 IdeS 효소에 의해 매개된다. 또 다른 양태에서, 더 작은 폴리펩티드는 Fd, Fc/2 및 LC를 포함하는 군으로부터 선택된다.
한 양태에서, D-최적 파라미터는 ETD, MS, MS1, MS2, MS2 AGC, LC-MS 및 LC-MS2를 포함하는 군으로부터 선택된 분석 화학에 대해 선택된다.
한 양태에서, ETD는 EThcD, ETciD 및 UVPD를 포함하는 군으로부터 선택된다.
한 양태에서, MS는 MS1, MS2, MS2 AGC, LC-MS, 및 LC-MS2를 포함하는 군으로부터 선택된다.
한 양태에서, 폴리펩티드 아미노산 서열의 결정은 적어도 50%, 60%, 70%, 80%, 90% 및 100%이다.
본 개시내용은 폴리펩티드를 시퀀싱하기 위한 추가적인 방법을 제공한다. 일부 예시적인 구현예에서, 방법은 더 작은 폴리펩티드 서열이 얻어지도록 폴리펩티드를 소화물에 노출시키는 단계; ETD 및 LC-MS2에 대한 D-최적 파라미터를 선택하는 단계; D-최적 파라미터 하에서 단백질 소화물을 ETD 및 LC-MS2에 노출시키는 단계; 및 폴리펩티드의 아미노산 서열을 결정하는 단계를 포함한다.
한 양태에서, 폴리펩티드는 항체, 항체 변이체 또는 항체 융합체이다. 특정 양태에서, 항체 또는 항체 융합체는 아플리베르셉트, 릴로나셉트, 알리로쿠맙, 두필루맙, 사릴루맙, 세미플리맙, 및 항-에볼라 항체를 포함하는 군으로부터 선택된다.
본 개시내용은 또한 상기 기술된 임의의 방법에 따라 시퀀싱된 폴리펩티드를 제공한다.
한 양태에서, 폴리펩티드는 항체, 항체 변이체 및 항체 융합체를 포함하는 군으로부터 선택된다. 또 다른 양태에서, 폴리펩티드는 아플리베르셉트, 릴로나셉트, 알리로쿠맙, 두필루맙, 사릴루맙, 세미플리맙, 및 항-에볼라 항체를 포함하는 군으로부터 선택된다.
실시예
하기 실시예는 예시적인 목적을 위해 제공되고, 첨부된 청구항에 의해 정의되는 본 발명을 제한하는 것으로 해석되어서는 안 된다. 본 출원 내에 인용된 모든 참조문헌 및 특허는 본 명세서에 참조로 포함된다.
물질 및 방법. 본 발명은, 당업자에 의해 실시될 때, 예를 들어 문헌[Sambrook 등 "Molecular Cloning: A Laboratory Manual", 3rd ed. 2001; Ausubel 등 "Short Protocols in Molecular Biology", 5판 1995; "Methods in Enzymology", Academic Press, Inc.; MacPherson, Hames and Taylor (eds.). "PCR 2: A practical approach", 1995; Harlow and Lane (eds.) "Antibodies, a Laboratory Manual" 1988; Freshney (ed.) "Culture of Animal Cells", 4판 2000; "Methods in Molecular Biology" vol. 149 ("The ELISA Guidebook" by John Crowther) Humana Press 2001, 및 이 논문의 최종판 (예를 들어, "Molecular Cloning" by Michael Green (4판 2012) 및 "Culture of Animal Cells" by Freshney (7판, 2015), 뿐만 아니라 최신 전자 버전]에 기재된 바와 같은 약제학적 화학, 면역학, 분자 생물학, 세포 생물학, 재조합 DNA 기술 및 검정 기술 분야에서의 종래의 기술을 사용할 수 있다.
펩티드 및 단백질, 특히 항체 및 이의 서브유닛에 대한 물리적 화학 분석을 수행하는 데 유용한 방법은 본 개시내용 내에서 제공할 뿐만 아니라 다음의 참고 문헌 및 최신 전자 버전, 예컨대 문헌[Pradip Kumar Ghosh의 "Introduction to Protein Mass Spectrometry", 2015, Jennie R. Lill 및 Wendy Sandoval의 "Analytical Characterization of Biotherapeutics", 2017, Mary S. Lipton 및 Ljiljana Pasa-Tolic의 "Mass Spectrometry of Proteins and Peptides: Methods and Protocols Second Edition (Methods in Molecular Biology)" 2008, Tristan Vaughan, Jane Osbourn, 등의 "Protein Therapeutics, Methods and Principles in Medicinal Chemistry", 2017, Alisa G. Woods 및 Costel C. Darie의 "Advancements of Mass Spectrometry in Biomedical Research", 2019; 및 Mike S. Lee 및 Qin C. Ji의 "Protein Analysis using Mass Spectrometry: Accelerating Protein Biotherapeutics from Lab to Patient", 2017]에 기재되어 있다.
시약. 액체 크로마토그래피-질량 분광분석(LC-MS) 등급의 물, 이소프로판올(IPA) 및 아세토니트릴(ACN)을 Fisher Chemical(뉴저지주 페어 론)에서 구입하였다. 포름산(FA), 디티오트레이톨(DTT), 8M 구아니딘-HCl을 Thermo Scientific(일리노이주 록포드)에서 구입하였다. FabRICATOR(IdeS) 프로테아제를 Genovis(메사추세츠주 케임브리지)에서 구입하였다.
샘플 제조. 시판되고 있는 인간화된 IgG1 단클론성 항체 표준인 NISTmAb를 MilliporeSigma(미주리주 세인트루이스)에서 구입하였다. 100 μg의 NISTmAb를 37℃에서 30분 동안 10 단위/μL의 FabRICATOR 프로테아제로 소화하였다. 소화 후, 100 μL의 구아니딘-HCl과 25 μL의 1.0 M DTT를 첨가하고, 샘플을 37℃에서 45분 동안 인큐베이션하여 항체를 Fd, Fc/2 및 LC 서브유닛으로 환원시켰다.
액체 크로마토그래피. 역상 액체 크로마토그래피(RPLC)를 Waters Corp.(메사추세츠주 밀포드)의 2원 용매 매니저(BSM)가 장착된 I-클래스 UPLC® 기기 상에서 수행하였다. MS 분석 전에 Waters Corp.(메사추세츠주 밀포드)의 Protein BEH C4 VanGuardTM 컬럼을 사용하여 모든 샘플을 탈염하였다. 탈염 단계 후, Waters Corp.의 1 mm × 150 mm 단백질 BEH C4(300 Å, 1.7 μm) 컬럼을 사용하여 단편을 분리하였다. 이동상 A(MPA)는 물 중 0.1%의 FA이었고, 이동상 B(MPB)는 60%의 ACN, 39.9%의 IPA 및 0.1%의 FA이었다.
각각의 실험에 대해 1 μg의 소화되고 환원된 항체를 컬럼에 로딩하였다. 샘플 로딩 후, 샘플을 5%의 MPB에서 5분 동안 탈염하였다. 이어서 구배를 2분에 걸쳐 20%의 MPB로 증가시킨 다음 28분에 걸쳐 60%의 MPB로 증가시켰다. 유속은 100 μL/분이었다. 단백질 용리 후, 다음 샘플 주입 전에 컬럼을 5%의 MPB로 회복시켰다.
질량 분광분석. I-클래스 기기를 기기의 전단에 위치한 ETD 시약 공급원이 장착된 Thermo Scientific Fusion Lumos Tribrid 질량 분광계의 ESI 공급원에 커플링하였다. 분무 전압을 3700 V로 설정하였고, 이온 전달 튜브 온도를 350℃까지 설정하였다. 실험 설계(DOE) 실행 전에 세 가지 MS1 실험을 수행하여 각각의 서브유닛에 대한 용리 창과 전하 분포를 측정하고, 실행들 간에 최소한의 체류 시간 이동이 있는지를 확인하였다.
세 가지 MS1 실험으로부터의 정보를 사용하여 DOE에 기초한 상이한 표적화된 MS2를 생성하였다. MS2 실험의 경우, Orbitrap 해상도를 120,000으로 설정하였고, 질량 범위를 일반(350 내지 2000 m /z)으로 설정하였고, RF 렌즈 백분율을 30으로 설정하였다. 각각의 MS2 스캔은 10개의 마이크로스캔을 합성한 것이었다. 사중극자를 전구체 단리에 사용하였고, 단리 윈도우를 초기 MS1 실험에 기초한 가장 강렬한 전하 상태에 집중시켰다.
데이터 분석. JMP 통계적 소프트웨어를 사용하여 선택된 인자에 기초한 상이한 DOE 실행을 생성하였다. 각각의 실행에 대해 총 이온 크로마토그램(TIC)을 초기에 Xcalibur에서 평가하여 각각의 서브유닛에 대한 스캔 범위를 측정하였다. 이어서 ProSight PC 4.0의 THRASH 알고리즘을 사용하여 Xcalibur로부터 측정된 각각의 스캔 범위에 대한 MS2 스펙트럼의 동위원소 클러스터를 디콘볼루션(deconvolute)하였다. ProSight PC의 THRASH 파라미터를 다음과 같이 설정하였다: 잡음에 대한 최소 신호 비율을 8로 설정하였고, 최소 RL(신뢰성) 값을 0.95로 설정하였다. MS2 단편 질량 허용 오차를 20 ppm으로 설정하였다.
디콘볼루션 후 ProSight 결과를 ProSight Lite로 내보냈고, 여기서 적절한 번역 후 변형(PTM)을 서브유닛 서열에 추가하였으며, 총 서브유닛 커버리지를 MS2 단편에 기반하여 측정하였다. 이어서 서열 커버리지 결과를 JMP 통계적 소프트웨어로 내보냈고, 여기서 각각의 서브유닛에 대해 모델링을 수행하여 선택된 인자와 측정된 반응 간의 관계를 측정하였다.
다음의 작업 실시예는 폴리펩티드, 특히 항체 서브유닛의 개선된 아미노산 시퀀싱을 위한 예시적인 방법을 입증한다.
실시예 1. 실험 설계(DOE)의 전략
이 실시예는 항체 서브유닛의 정확한 시퀀싱을 위해 전자 전달 해리(ETD) 파라미터를 최적화하기 위한 실험 설계(DOE) 고려사항들을 기재하고 있다.
먼저, 이전의 지식과 경험, 및 공개된 문헌으로부터의 정보를 사용하여 ETD MS2 인자를 측정하여 평가하고, 설계 공간의 범위를 설정하였다. 설계 공간 외부에 있는 범위 설정은 인자와 반응 간의 유의미한 관계를 제공하지 않기 때문에 배제하였다. 적절한 결과에 영향을 미치는 파라미터, 예를 들어 서열 커버리지 또는 주어진 크기의 식별된 단편의 수는 당업자에 의해 선택될 수 있다는 것을 이해해야 한다.
ETD MS2 서열 커버리지 또는 식별된 단편의 수와 관련된 것으로 간주되는 선택된 인자에는 단리 윈도우, ETD 반응 시간, ETD 시약 표적 및 MS2 AGC 표적이 포함되었다. 인자들 간의 곡선 관계가 있는지 확인하기 위해 각각의 인자를 세 가지 상이한 수준에서 평가하였다. 단리 윈도우를 100, 400 및 700 m /z에서 평가하였다. ETD 반응 시간을 5, 10 및 15 ms에서 평가하였다. ETD 시약 표적을 1.0E5, 5.5E5 및 1.0E6에서 평가하였다. MS2 AGC 표적을 5.0E4, 5.3E5 및 1.0E6에서 평가하였다.
ETD MS2 스펙트럼에 영향을 미치는 인자들 간의 관계를 평가하기 위한 한 가지 가능한 접근법은 전체 인자 DOE로 진행하는 것이다. 그러나, 인자와 수준의 수를 선택하면 전체 인자 DOE는 실행 시간과 데이터 분석 측면에서 상당한 자원을 차지하는 81개의 실행을 필요로 할 것이다. 대신에 DOE의 D-효율 파라미터를 최대화하기 위해 28개의 UPLC-MS 실행만이 필요한 D-최적의 DOE를 사용하여 보다 효율적인 접근법을 선택하였다.
따라서, 이 실시예는 정확도 및 서열 커버리지를 유지하면서 폴리펩티드를 시퀀싱하는데 사용 용이성을 위해 DOE 파라미터를 최적화하는 값을 예시하는 본 발명의 양태를 나타낸다.
실시예
2. 최대 서열
커버리지를
생성하기 위한 예측 모델로부터의 최적의 조건
본 실시예는 항체 서브유닛의 최대 아미노산 잔기 커버리지를 생성하기 위한 예시적인 최적의 검정 조건을 기재하고 있다.
첫 번째 목표는 단일 실행에서 ETD 미들-다운 서열 커버리지를 최대화하는 DOE를 사용하여 최적의 일련의 조건을 찾는 것이었다. ETD 최적화를 위해 평가 단리 창, ETD 반응 시간, ETD 시약 표적 및 MS2 AGC 표적을 선택하였다.
MS2 ETD용 선형 이온 트랩으로 전송되는 이온의 m/z 범위를 조절하는 단리 창을 각각의 서브유닛에 대한 MS1 스펙트럼에서 관찰된 가장 강렬한 전하 상태에 집중시켰다.
전자 전달 해리 반응 시간은 플루오르안텐 음이온이 전구체 이온과 반응하는 기간을 지칭하고, ETD 시약 표적은 선형 이온 트랩에 주사되어 전구체 이온과 반응할 수 있는 플루오르안텐 음이온의 양을 지칭한다.
관찰 결과 언급된 파라미터는 MS2 ETD 스펙트럼의 품질에 대해 직접적인 책임이 있으므로 MS2 서열 커버리지에 영향을 미칠 수 있다는 것을 제시하였다. 초기에 JMP 통계적 소프트웨어를 사용하여 선택된 파라미터의 가능한 모든 조합으로부터 서브세트를 측정하였다.
이들 모델의 D-효율성을 최대화하기 위해 수행된 각각의 DOE에 대해 총 28개의 실행을 수집하였고, 각각의 서브유닛의 ETD MS2 스펙트럼에 영향을 미치는 파라미터를 별도로 모델링하여 최대 서열 커버리지를 제공하는 최적의 파라미터 설정을 측정하였다.
ProSight PC에서 THRASH 알고리즘을 사용하여 데이터를 프로세싱한 후 결과를 ProSight Lite로 내보냈고, 여기서 번역 후 변형, 예컨대 Fc/2 서브유닛의 N-연결된 글리코실화 및 Fd 서브유닛의 N-말단 글루타민의 파이로글루탐산으로의 전환을 기록하였다. Fc/2의 경우, G1F가 NISTmAb의 가장 풍부한 글리코형이기 때문에 G1F 종만이 서열 커버리지를 계산하는 데 포함되었다. Fd의 경우, 대부분의 글루타민이 빠르게 파이로글루탐산으로 전환되고, 따라서 주요 종으로 간주되기 때문에 파이로글루탐산이 있는 서열이 고려되었다.
DOE의 결과에 기반하여 최적의 Fc/2 파라미터는 단리 폭, ETD 반응 시간, ETD 시약 표적 및 MS2 AGC 표적에 대해 각각 539.8 m /z, 15 ms, 9.2E5 및 9.5E5인 것으로 밝혀졌다. Fc/2에 대한 모델은 도 2a, 패널 A에서 나타낸 바와 같이 모델-예측된 서열 커버리지와 관찰된 실제 서열 커버리지 간의 강한 상관관계를 나타낸다. 최적의 ETD 파라미터를 사용한 3회 실행의 평균 미들-다운 서열 커버리지는 Fc/2 서브유닛에 대해 61.0%이었다.
단리 폭, ETD 반응 시간, ETD 시약 표적 및 MS2 AGC 표적에 대해 각각 397.1 m /z, 15 ms, 9.3E5 및 1E6인 것으로 나타낸 DOE 모델은 도 2a, 패널 B에서 나타낸 바와 같이 NISTmAb 경쇄(LC)의 최대 서열 커버리지를 달성하기 위한 최적의 작동 파라미터이었다. 최적의 ETD 단편화를 위한 파라미터를 사용한 3회 실행을 평균화하였을 때 경쇄의 62.0% 서열 커버리지가 달성된 것으로 관찰되었다.
마지막으로, Fd 서브유닛의 경우, 503.6 m /z의 단리 폭, 15 ms의 ETD 반응 시간, 7.9E5의 ETD 시약 표적 및 8.0E5의 MS2 AGC 표적이 도 2a, 패널 C에서 나타낸 바와 같이 ETD를 사용한 최대 서열 커버리지를 위한 최적의 작동 파라미터인 것으로 측정되었다.
DOE 모델로부터 최대 서열 커버리지를 위한 최적의 파라미터를 측정할 때, 모델-예측된 값이 실제 값과 어떻게 비교되는지를 측정하기 위해 파라미터를 사용하여 3회 실험을 수행하였다. 실제의 실험 값은 도 2a에서 나타낸 바와 같이 관찰된 최소 퍼센트 오차로 모델 예측된 값과 강한 상관관계를 나타낸다.
따라서, 본 실시예는 본 발명의 DOE 전략이 폴리펩티드, 예를 들어 항체 서브유닛의 아미노산 서열 커버리지를 최대화하기 위한 최적의 파라미터 설정의 유도를 야기하였고, 이는 관찰된 서열 커버리지와 잘 일치한다는 것을 입증한다.
실시예 3. 다중 LC-MS 실행으로부터 조합된 서열 커버리지
본 실시예는 폴리펩티드, 예를 들어 항체 단편의 최대 아미노산 잔기 서열 커버리지를 생성하기 위한 예시적인 검정 조건을 기재하고 있다.
다중 MS2 실행으로부터 ETD 단편화 실행을 조합시키면 단클론성 항체 서브유닛의 서열 커버리지를 추가로 증가시킬 수 있는 것으로 나타났다(Fornelli 등 2018; Fornelli 등 2012). 본 발명의 DOE 전략을 사용하여 최대 서열 커버리지에 대한 최적의 ETD 파라미터를 측정한 후, 3개의 독립적 ETD RPLC-MS2 실행으로부터 식별된 단편을 조합하여 각각의 서브유닛의 조합된 서열 커버리지를 측정하였다. 이 접근법은 도 3a에서 나타낸 바와 같이 Fc/2, LC 및 Fd 서브유닛에 대한 서열 커버리지를 10 내지 12% 증가시켰다.
따라서, 본 실시예는 본 발명의 방법이 독립적 ETD LC-MS 실험으로부터 식별된 단편을 조합함으로써 항체 서열 커버리지를 추가로 개선하기 위해 사용될 수 있다는 것을 입증한다.
실시예
4. 개선된 항체 서브유닛 서열
커버리지를
위한
저질량
,
중질량
및 고질량의 최대 단편 수 수득
본 실시예는 폴리펩티드, 예를 들어 항체 서브유닛의 최대 아미노산 잔기 서열 커버리지를 생성하기 위한 검정 조건을 설계하는 새로운 방법을 입증한다.
초기 DOE 결과는 최적화된 ETD 파라미터에 의해 생산된 대다수의 c-이온 및 z-이온이 각각의 mAb 서브유닛의 N-말단 및 C-말단에 더 가깝게 집중되는 경향이 있다는 것을 밝혔다. 이들 결과에 기반하여 상이한 크기의 단편, 예를 들어 저질량, 중질량 및 고질량 크기의 단편을 생성할 수 있는 ETD MS2 파라미터를 측정하는 DOE 모델을 생성함으로써 각각의 서브유닛의 서열 커버리지를 최대화하기 위한 새로운 접근법을 설계하였다. 이들 실험에서 저질량은 5,000 Da 미만의 단편으로서 정의되었고, 중질량은 5,000 Da 내지 10,000 Da의 단편으로서 정의되었으며, 고질량은 10,000 Da 초과의 단편으로서 정의되었다. 저질량, 중질량 및 고질량 조건을 사용하여 수득된 RPLC-MS2 실행 결과를 조합하면 잠재적으로 서열 커버리지뿐만 아니라 단편 크기의 다양성이 증가할 수 있다. 이 접근법은 각각의 질량 영역에 대해 생성된 ETD MS2 단편의 수를 측정하는 예측 DOE 모델을 생성하였다. DOE 결과를 기반으로 3개의 서브유닛에 대해 저질량, 중질량 및 고질량 단편을 최대 다수 생성한 ETD 파라미터를 측정하였다. 도 2b는 저질량, 중질량 및 고질량 조건에 대한 DOE 모델을 나타내고, 실제와 모델-예측된 단편 수 간의 강한 상관관계뿐만 아니라 높은 모델 유의성을 입증한다. 또한, 각각의 단편 크기 카테고리에 대해 최적의 ETD MS2 파라미터를 사용할 때 실험적으로 관찰된 평균 단편 수는 각각의 모델에 의해 예측된 것과 비슷하였다.
DOE 모델을 사용하여 생산된 원시 MS2 스펙트럼의 검사는 스펙트럼 프로파일 간에 극적인 차이가 나타났다. Fc/2, LC 및 Fd의 경우, 단편의 질량 분포는 도 2c에서 나타낸 바와 같이 사용된 ETD MS2 파라미터에 따라 이동하였다. Fc/2의 경우, 저질량, 중질량 및 고질량 조건에서 하위 및 상위 사분위수뿐만 아니라 중앙 단편 질량의 증가가 관찰되었다. ETD를 사용하여 높은 Fd 서열 커버리지를 달성하는 데 있어 이전에 문서화된 어려움이 있는 경우에도 Fd에 대해 유사하지만 덜 확연한 경향이 관찰되었다. LC 서브유닛의 경우, 저질량 조건과 중질량 조건 간의 하위 및 상위 사분위수뿐만 아니라 중앙 단편 질량에서 실질적인 차이가 관찰되었지만, 중질량 조건과 고질량 조건 간에는 작은 차이만 관찰되었다. 그럼에도 불구하고 고질량 ETD MS2 파라미터는 추가의 고질량 단편을 제공하고, LC 서브유닛에 대한 서열 커버리지 정보를 추가로 증가시켰다.
본 실시예는 ETD MS2를 사용한 폴리펩티드의 상이한 크기의 단편, 예를 들어 저질량, 중질량 및 고질량 단편을 수득하기 위해 새로운 DOE 최적화 방법을 사용하여 개선된 서열 커버리지를 수득할 수 있다는 것을 입증한다.
실시예 5. 저질량, 중질량 및 고질량 조건으로부터 조합된 서열 커버리지
도 2c에서 나타낸 바와 같이 저질량, 중질량 및 고질량 조건을 사용하여 Fc/2, LC 및 Fd 서브유닛에 대해 관찰된 이동 중앙 단편 질량은 이들 상이한 조건이 상당히 상이한 이온 개체군을 생성하였다는 것을 나타내고, 이는 조합될 때 mAb 서브유닛에 대한 증가된 서열 커버리지 정보를 제공할 수 있다. 따라서, 본 발명의 방법은 저질량, 중질량 및 고질량 ETD RPLC-MS2 실행으로부터의 단편화 결과를 조합하여 각각의 서브유닛에 대한 서열 커버리지의 전반적인 증가를 측정함으로써 더욱 최적화되었다.
앞서 기재한 바와 같이 단편 질량 DOE로부터 결정된 ETD 파라미터를 사용하여 2개의 저질량, 2개의 중질량 및 2개의 고질량 RPLC-MS2 실행을 총 6개의 독립적인 실행에 대해 조합하였다. 이후 2개의 RPLC-MS2 실행으로부터 단편화 데이터를 추가할 때마다 각각의 서브유닛의 서열 커버리지가 더 증가하였다. 이 접근법은 도 3b에서 나타낸 바와 같이 Fc/2, LC 및 Fd에 대한 개선된 서열 커버리지를 야기시켰다. 비글리코실화된 Fc/2뿐만 아니라 모든 풍부한 글리코형으로부터의 단편의 추가는 Fc/2에 대한 서열 커버리지를 더 증가시켰다. ETD 단독으로 수득된 이들 서열 커버리지 결과는 다중 RPLC-MS2 실행 및 6개의 상이한 ETD 반응 시간을 사용한 이전 보고서와 비교하여 유리하다. 6개 초과의 RPLC-MS2 실행으로부터 단편화 데이터를 조합하면 기기 및 데이터 분석 시간을 희생하면서 서열 커버리지가 약간 또는 전혀 향상되지 않았다.
ETD MS2 기기 작동 파라미터를 최적화하여 단클론성 항체 서브유닛의 서열 커버리지를 최대화하기 위한 포괄적인 작업흐름을 개발하였다. 서열 커버리지를 최대화하기 위해 두 가지 뚜렷한 접근법을 이용하였다. 제1 방법은 DOE 모델을 통해 최적의 ETD MS2 파라미터를 측정하여 서열 커버리지를 최대화하였다. 제2 방법은 저질량, 중질량 및 고질량 범위에서 단편을 생산하는 ETD 조건을 결정함으로써 서열 커버리지를 개선하였다. 이 방법을 사용하고 Fc/2, LC 및 Fd 서브유닛의 서열 커버리지를 조합하면 전체 mAb에 대한 개선된 서열 커버리지가 산출되었다.
본 명세서에 기재된 DOE 접근법을 사용하여 추가의 단편화 기술을 필요로 하지 않는 상이한 질량 분광계 플랫폼에서 mAb에 대한 미들-다운 서열 커버리지를 증가시키는 예측 모델을 생성할 수 있다. 이 접근법은 EThcD, ETciD 및 UVPD를 포함하는 다른 단편화 방법으로 확장되어 아미노산 서열 커버리지를 추가로 개선하고, 단클론성 항체 또는 다른 폴리펩티드의 완전한 서열 커버리지에 훨씬 더 가깝게 달성할 수 있다.
전술한 명세서에서 본 발명은 이의 특정 구현예와 관련하여 기재되었고 많은 세부사항이 예시를 위해 제시되었지만, 본 발명은 추가의 구현예가 가능하고 본 명세서에 기재된 특정 세부사항이 본 발명의 기본 원리로부터 벗어나지 않고 변경될 수 있다는 것이 당업자에게 명백할 것이다.
SEQUENCE LISTING
<110> REGENERON PHARMACEUTICALS, INC.
<120> ELECTRON TRANSFER DISSOCIATION AND MASS SPECTROMETRY FOR IMPROVED
PROTEIN SEQUENCING OF MONOCLONAL ANTIBODIES
<130> 070816-02162
<140> PCT/US2022/017935
<141> 2022-02-25
<150> 63/153,886
<151> 2021-02-25
<160> 6
<170> KoPatentIn 3.0
<210> 1
<211> 453
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 1
Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Glu Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Gly Ser Gly Phe Thr Phe Arg Asp Tyr
20 25 30
Ala Met Thr Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Ser Ile Ser Ser Ser Gly Gly Asn Thr Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Lys Asp Arg Leu Ser Ile Thr Ile Arg Pro Arg Tyr Tyr Gly Leu
100 105 110
Asp Val Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr
115 120 125
Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser
130 135 140
Glu Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu
145 150 155 160
Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His
165 170 175
Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser
180 185 190
Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Lys Thr Tyr Thr Cys
195 200 205
Asn Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu
210 215 220
Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Phe Leu
225 230 235 240
Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu
245 250 255
Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser
260 265 270
Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu
275 280 285
Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr
290 295 300
Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn
305 310 315 320
Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser
325 330 335
Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln
340 345 350
Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val
355 360 365
Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val
370 375 380
Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Ile Thr Thr
385 390 395 400
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu
405 410 415
Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys Ser
420 425 430
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
435 440 445
Leu Ser Leu Gly Lys
450
<210> 2
<211> 219
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 2
Asp Ile Val Met Thr Gln Ser Pro Leu Ser Leu Pro Val Thr Pro Gly
1 5 10 15
Glu Pro Ala Ser Ile Ser Cys Arg Ser Ser Gln Ser Leu Leu Tyr Ser
20 25 30
Ile Gly Tyr Asn Tyr Leu Asp Trp Tyr Leu Gln Lys Ser Gly Gln Ser
35 40 45
Pro Gln Leu Leu Ile Tyr Leu Gly Ser Asn Arg Ala Ser Gly Val Pro
50 55 60
Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Thr
65 70 75 80
Ser Arg Val Glu Ala Glu Asp Val Gly Phe Tyr Tyr Cys Met Gln Ala
85 90 95
Leu Gln Thr Pro Tyr Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys
100 105 110
Arg Thr Val Ala Ala Phe Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
115 120 125
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
130 135 140
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp His Ala Leu Gln
145 150 155 160
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
165 170 175
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
180 185 190
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
195 200 205
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
210 215
<210> 3
<211> 210
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 3
Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met
1 5 10 15
Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His
20 25 30
Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val
35 40 45
His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr
50 55 60
Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly
65 70 75 80
Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile
85 90 95
Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val
100 105 110
Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser
115 120 125
Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu
130 135 140
Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro
145 150 155 160
Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val
165 170 175
Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met
180 185 190
His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser
195 200 205
Pro Gly
210
<210> 4
<211> 213
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 4
Asp Ile Gln Met Thr Gln Ser Pro Ser Thr Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Ser Ala Ser Ser Arg Val Gly Tyr Met
20 25 30
His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr
35 40 45
Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser
50 55 60
Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Asp
65 70 75 80
Asp Phe Ala Thr Tyr Tyr Cys Phe Gln Gly Ser Gly Tyr Pro Phe Thr
85 90 95
Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro
100 105 110
Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr
115 120 125
Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys
130 135 140
Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu
145 150 155 160
Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser
165 170 175
Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala
180 185 190
Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe
195 200 205
Asn Arg Gly Glu Cys
210
<210> 5
<211> 239
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 5
Gln Val Thr Leu Arg Glu Ser Gly Pro Ala Leu Val Lys Pro Thr Gln
1 5 10 15
Thr Leu Thr Leu Thr Cys Thr Phe Ser Gly Phe Ser Leu Ser Thr Ala
20 25 30
Gly Met Ser Val Gly Trp Ile Arg Gln Pro Pro Gly Lys Ala Leu Glu
35 40 45
Trp Leu Ala Asp Ile Trp Trp Asp Asp Lys Lys His Tyr Asn Pro Ser
50 55 60
Leu Lys Asp Arg Leu Thr Ile Ser Lys Asp Thr Ser Lys Asn Gln Val
65 70 75 80
Val Leu Lys Val Thr Asn Met Asp Pro Ala Asp Thr Ala Thr Tyr Tyr
85 90 95
Cys Ala Arg Asp Met Ile Phe Asn Phe Tyr Phe Asp Val Trp Gly Gln
100 105 110
Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val
115 120 125
Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala
130 135 140
Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser
145 150 155 160
Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val
165 170 175
Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro
180 185 190
Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys
195 200 205
Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp
210 215 220
Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly
225 230 235
<210> 6
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 6
Cys Pro Pro Cys
1
Claims (55)
- 하기를 포함하는, 폴리펩티드의 서열 커버리지(coverage)를 개선하는 방법:
(a) 서열 커버리지에 영향을 미치는 탠덤 질량 분광법에 대한 적어도 2개의 파라미터를 선택하는 단계; 및
(b) D-최적 실험 설계를 사용하여 각각의 상기 적어도 2개의 파라미터의 값을 결정하는 단계로서, 상기 값은 최대화 서열 커버리지에 기반하여 선택되는, 단계. - 제1항에 있어서, 상기 폴리펩티드는 항체, 이중특이성 항체, 단클론성 항체, 융합 단백질, 항체-약물 접합체, 항체 단편, 항체 서브유닛, 숙주 세포 단백질, 단백질 약제학적 생성물, 또는 그의 소화 단편인, 방법.
- 제1항에 있어서, 폴리펩티드의 2개 이상의 서브유닛에 대해 순차적으로 또는 병렬적으로 방법을 수행하는 단계를 추가로 포함하는, 방법.
- 제3항에 있어서, 상기 서브유닛은 항체의 Fc/2, Fd 또는 LC 서브유닛을 포함하는 군으로부터 선택되는, 방법.
- 제1항에 있어서, 상기 탠덤 질량 분광법은 미들-다운(middle-down) 질량 분광법인, 방법.
- 제1항에 있어서, 질량 분광계는 전기분무 이온화 질량 분광계, 나노 전기분무 이온화 질량 분광계 또는 Orbitrap 기반 질량 분광계인, 방법.
- 제1항에 있어서, 상기 탠덤 질량 분광법은 전자 이동 해리, 충돌 유도 해리, 전자 이동/충돌 유도 해리, 전자 이동/고에너지 충돌 해리, 자외선 광해리 또는 그들의 조합을 포함하는, 방법.
- 제1항에 있어서, 상기 탠덤 질량 분광법은 자동 이득 제어를 포함하는, 방법.
- 제1항에 있어서, 질량 분광계는 액체 크로마토그래피 시스템에 커플링되는, 방법.
- 제9항에 있어서, 상기 액체 크로마토그래피 시스템은 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 혼합식 크로마토그래피 또는 그들의 조합을 포함하는, 방법.
- 제1항에 있어서, 상기 적어도 2개의 파라미터는 m/z 단리 창(isolation window), ETD 반응 시간, ETD 시약 표적, MS2 AGC 표적 및 그들의 임의의 조합을 포함하는 군으로부터 선택되는, 방법.
- 하기를 포함하는, 폴리펩티드의 아미노산 서열을 결정하는 방법:
(a) D-최적 실험 설계를 사용하여 폴리펩티드에 대한 탠덤 질량 분광법에 대한 적어도 2개의 파라미터 값을 결정하는 단계로서, 상기 값은 최대 서열 커버리지를 기반으로 선택되는, 단계; 및
(b) 상기 적어도 2개의 파라미터의 상기 값을 사용하여 상기 폴리펩티드를 탠덤 질량 분광법 분석에 적용하여 상기 폴리펩티드의 아미노산 서열을 결정하는 단계. - 제12항에 있어서, 상기 폴리펩티드는 항체, 이중특이성 항체, 단클론성 항체, 융합 단백질, 항체-약물 접합체, 항체 단편, 항체 서브유닛, 숙주 세포 단백질, 단백질 약제학적 생성물, 또는 그의 소화 단편인, 방법.
- 제12항에 있어서, 폴리펩티드의 2개 이상의 서브유닛에 대해 순차적으로 또는 병렬적으로 방법을 수행하는 단계를 추가로 포함하는, 방법.
- 제14항에 있어서, 상기 서브유닛은 항체의 Fc/2, Fd 또는 LC 서브유닛을 포함하는 군으로부터 선택되는, 방법.
- 제12항에 있어서, 상기 탠덤 질량 분광법은 미들-다운 질량 분광법인, 방법.
- 제12항에 있어서, 질량 분광계는 전기분무 이온화 질량 분광계, 나노 전기분무 이온화 질량 분광계 또는 Orbitrap 기반 질량 분광계인, 방법.
- 제12항에 있어서, 상기 탠덤 질량 분광법은 전자 이동 해리, 충돌 유도 해리, 전자 이동/충돌 유도 해리, 전자 이동/고에너지 충돌 해리, 자외선 광해리 또는 그들의 조합을 포함하는, 방법.
- 제12항에 있어서, 상기 탠덤 질량 분광법은 자동 이득 제어를 포함하는, 방법.
- 제12항에 있어서, 질량 분광계는 액체 크로마토그래피 시스템에 커플링되는, 방법.
- 제20항에 있어서, 상기 액체 크로마토그래피 시스템은 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 혼합식 크로마토그래피 또는 그들의 조합을 포함하는, 방법.
- 제12항에 있어서, 상기 파라미터는 m/z 단리 창, ETD 반응 시간, ETD 시약 표적, MS2 AGC 표적 및 그들의 임의의 조합을 포함하는 군으로부터 선택되는, 방법.
- 제12항에 있어서, 탠덤 질량 분광법 분석 전에 상기 폴리펩티드를 효소 분해시키는 단계를 추가로 포함하는, 방법.
- 제23항에 있어서, 상기 효소 분해는 상기 폴리펩티드를 IdeS에 접촉시키는 단계를 포함하는, 방법.
- 제12항에 있어서, 탠덤 질량 분광법 분석 전에 상기 폴리펩티드를 환원시키는 단계를 추가로 포함하는, 방법.
- 제12항에 있어서, 방법을 독립적으로 2회 이상 수행하고 각각의 탠덤 질량 분광법 분석으로부터 확인된 단편을 조합하여 상기 폴리펩티드의 아미노산 서열을 결정하는 단계를 추가로 포함하는, 방법.
- 하기를 포함하는, 폴리펩티드의 서열 커버리지를 개선하는 방법:
(a) 상이한 단편 크기의 각각의 선택의 단편 수에 영향을 미치는 탠덤 질량 분광법에 대한 적어도 2개의 파라미터를 선택하는 단계; 및
(b) D-최적 실험 설계를 사용하여 각각의 상기 적어도 2개의 파라미터 값을 결정하는 단계로서, 상기 값은 각각의 상기 선택된 단편 크기에 대해 가장 큰 수의 단편을 생성하는 것에 기반하여 선택되는, 단계. - 제27항에 있어서, 상기 폴리펩티드는 항체, 이중특이성 항체, 단클론성 항체, 융합 단백질, 항체-약물 접합체, 항체 단편, 항체 서브유닛, 숙주 세포 단백질, 단백질 약제학적 생성물, 또는 그의 소화 단편인, 방법.
- 제27항에 있어서, 폴리펩티드의 2개 이상의 서브유닛에 대해 순차적으로 또는 병렬적으로 방법을 수행하는 단계를 추가로 포함하는, 방법.
- 제29항에 있어서, 상기 서브유닛은 항체의 Fc/2, Fd 또는 LC 서브유닛을 포함하는 군으로부터 선택되는, 방법.
- 제27항에 있어서, 상기 탠덤 질량 분광법은 미들-다운 질량 분광법인, 방법.
- 제27항에 있어서, 질량 분광계는 전기분무 이온화 질량 분광계, 나노 전기분무 이온화 질량 분광계 또는 Orbitrap 기반 질량 분광계인, 방법.
- 제27항에 있어서, 상기 탠덤 질량 분광법은 전자 이동 해리, 충돌 유도 해리, 전자 이동/충돌 유도 해리, 전자 이동/고에너지 충돌 해리, 자외선 광해리 또는 그들의 조합을 포함하는, 방법.
- 제27항에 있어서, 상기 탠덤 질량 분광법은 자동 이득 제어를 포함하는, 방법.
- 제27항에 있어서, 질량 분광계는 액체 크로마토그래피 시스템에 커플링되는, 방법.
- 제35항에 있어서, 상기 액체 크로마토그래피 시스템은 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 혼합식 크로마토그래피 또는 그들의 조합을 포함하는, 방법.
- 제27항에 있어서, 상기 적어도 2개의 파라미터는 m/z 단리 창, ETD 반응 시간, ETD 시약 표적, MS2 AGC 표적 및 그들의 임의의 조합을 포함하는 군으로부터 선택되는, 방법.
- 제27항에 있어서, 상기 단편 크기는 약 5,000 Da 미만의 단편, 약 5,000 Da 내지 약 10,000 Da의 단편 및 약 10,000 Da 초과의 단편을 포함하는 군으로부터 선택되는, 방법.
- 하기를 포함하는, 폴리펩티드의 아미노산 서열을 결정하는 방법:
(a) D-최적 실험 설계를 사용하여 폴리펩티드에 대한 탠덤 질량 분광법에 대한 적어도 2개의 파라미터 값을 결정하는 단계로서, 상기 값은 상이한 단편 크기의 각각의 선택에 대해 가장 큰 수의 단편을 생성하는 것에 기반하여 선택되는, 단계; 및
(b) 각각의 선택된 단편 크기에 대한 상기 적어도 2개의 파라미터의 상기 값을 사용하여 상기 폴리펩티드를 탠덤 질량 분광법 분석에 적용하는 단계; 및
(c) 각각의 선택된 단편 크기에 대한 상기 적어도 2개의 파라미터의 상기 값을 사용하여 상기 탠덤 질량 분광법 분석으로부터 확인된 단편을 조합하여 상기 폴리펩티드의 아미노산 서열을 결정하는 단계. - 제39항에 있어서, 상기 폴리펩티드는 항체, 이중특이성 항체, 단클론성 항체, 융합 단백질, 항체-약물 접합체, 항체 단편, 항체 서브유닛, 숙주 세포 단백질, 단백질 약제학적 생성물, 또는 그의 소화 단편인, 방법.
- 제39항에 있어서, 폴리펩티드의 2개 이상의 서브유닛에 대해 순차적으로 또는 병렬적으로 방법을 수행하는 단계를 추가로 포함하는, 방법.
- 제41항에 있어서, 상기 서브유닛은 항체의 Fc/2, Fd 또는 LC 서브유닛을 포함하는 군으로부터 선택되는, 방법.
- 제39항에 있어서, 상기 탠덤 질량 분광법은 미들-다운 질량 분광법인, 방법.
- 제39항에 있어서, 질량 분광계는 전기분무 이온화 질량 분광계, 나노 전기분무 이온화 질량 분광계 또는 Orbitrap 기반 질량 분광계인, 방법.
- 제39항에 있어서, 상기 탠덤 질량 분광법은 전자 이동 해리, 충돌 유도 해리, 전자 이동/충돌 유도 해리, 전자 이동/고에너지 충돌 해리, 자외선 광해리 또는 그들의 조합을 포함하는, 방법.
- 제39항에 있어서, 상기 탠덤 질량 분광법은 자동 이득 제어를 포함하는, 방법.
- 제39항에 있어서, 질량 분광계는 액체 크로마토그래피 시스템에 커플링되는, 방법.
- 제47항에 있어서, 상기 액체 크로마토그래피 시스템은 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 혼합식 크로마토그래피 또는 그들의 조합을 포함하는, 방법.
- 제39항에 있어서, 상기 적어도 2개의 파라미터는 m/z 단리 창, ETD 반응 시간, ETD 시약 표적, MS2 AGC 표적 및 그들의 임의의 조합을 포함하는 군으로부터 선택되는, 방법.
- 제39항에 있어서, 탠덤 질량 분광법 분석 전에 상기 폴리펩티드를 효소 분해시키는 단계를 추가로 포함하는, 방법.
- 제50항에 있어서, 상기 효소 분해는 상기 폴리펩티드를 IdeS에 접촉시키는 단계를 포함하는, 방법.
- 제39항에 있어서, 탠덤 질량 분광법 분석 전에 상기 폴리펩티드를 환원시키는 단계를 추가로 포함하는, 방법.
- 제39항에 있어서, 방법을 독립적으로 2회 이상 수행하고 각각의 탠덤 질량 분광법 분석으로부터 확인된 단편을 조합하여 상기 폴리펩티드의 아미노산 서열을 결정하는 단계를 추가로 포함하는, 방법.
- 하기를 포함하는, 항체의 아미노산 서열을 결정하는 방법:
(a) 항체의 각각의 서브유닛에 대한 서열 커버리지에 영향을 미치는 ETD-MS2에 대한 적어도 2개의 파라미터를 선택하는 단계로서, 상기 서브유닛은 Fd, Fc/2 및 LC를 포함하는, 단계;
(b) D-최적 실험 설계를 사용하여 각각의 상기 서브유닛에 대한 각각의 상기 적어도 2개의 파라미터의 값을 결정하는 단계로서, 상기 값은 상기 서브유닛의 최대화 서열 커버리지에 기반하여 선택되는, 단계;
(c) 상기 항체를 IdeS 및 환원제에 접촉시켜 상기 서브유닛을 생성하는 단계;
(d) 상기 적어도 2개의 파라미터의 상기 값을 사용하여 각각의 상기 서브유닛을 ETD-MS2 분석에 적용하여 각각의 상기 서브유닛의 단편의 아미노산 서열을 확인하는 단계;
(e) 단계 (d)를 적어도 1회 이상 독립적으로 반복하여 각각의 상기 서브유닛의 추가 단편의 아미노산 서열을 확인하는 단계; 및
(f) (d) 및 (e)의 상기 단편의 상기 아미노산 서열을 조합하여 상기 항체의 아미노산 서열을 결정하는 단계. - 하기를 포함하는, 항체의 아미노산 서열을 결정하는 방법:
(a) 항체의 각각의 서브유닛의 작은, 중간 및 큰 단편의 수에 영향을 미치는 ETD-MS2에 대한 적어도 2개의 파라미터를 선택하는 단계로서, 상기 서브유닛은 Fd, Fc/2 및 LC를 포함하고, 상기 작은 단편은 약 5,000 Da 미만의 단편으로 구성되고, 상기 중간 단편은 약 5,000 Da 내지 약 10,000 Da의 단편으로 구성되고, 상기 큰 단편은 10,000 Da 초과의 단편으로 구성되는, 단계;
(b) D-최적 실험 설계를 사용하여 각각의 상기 서브유닛에 대한 각각의 상기 단편 크기에 대한 각각의 상기 적어도 2개의 파라미터의 값을 결정하는 단계로서, 상기 값은 상기 서브유닛에 대한 상기 크기의 가장 큰 수의 단편을 생성하는 것에 기반하여 선택되는, 단계;
(c) 상기 항체를 IdeS 및 환원제에 접촉시켜 상기 서브유닛을 생성하는 단계;
(d) 각각의 상기 단편 크기에 대한 상기 적어도 2개의 파라미터의 상기 값을 사용하여 각각의 상기 서브유닛을 ETD-MS2 분석에 적용하여 각각의 상기 서브유닛의 단편의 아미노산 서열을 확인하는 단계;
(e) 단계 (d)를 적어도 1회 이상 독립적으로 반복하여 각각의 상기 서브유닛의 추가 단편의 아미노산 서열을 확인하는 단계; 및
(f) (d) 및 (e)의 상기 단편의 상기 아미노산 서열을 조합하여 상기 항체의 아미노산 서열을 결정하는 단계.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163153886P | 2021-02-25 | 2021-02-25 | |
US63/153,886 | 2021-02-25 | ||
PCT/US2022/017935 WO2022183010A1 (en) | 2021-02-25 | 2022-02-25 | Electron transfer dissociation and mass spectrometry for improved protein sequencing of monoclonal antibodies |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230148340A true KR20230148340A (ko) | 2023-10-24 |
Family
ID=80780578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237031896A KR20230148340A (ko) | 2021-02-25 | 2022-02-25 | 단클론성 항체의 개선된 단백질 시퀀싱을 위한 전자 이동 해리 및 질량 분광분석 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220326252A1 (ko) |
EP (1) | EP4298446A1 (ko) |
JP (1) | JP2024507571A (ko) |
KR (1) | KR20230148340A (ko) |
CN (1) | CN116981947A (ko) |
AU (1) | AU2022227758A1 (ko) |
CA (1) | CA3211508A1 (ko) |
IL (1) | IL305086A (ko) |
WO (1) | WO2022183010A1 (ko) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4034545A1 (en) * | 2019-09-24 | 2022-08-03 | Universiteit Gent | Anti-adsorption solution |
-
2022
- 2022-02-25 CA CA3211508A patent/CA3211508A1/en active Pending
- 2022-02-25 WO PCT/US2022/017935 patent/WO2022183010A1/en active Application Filing
- 2022-02-25 US US17/681,156 patent/US20220326252A1/en active Pending
- 2022-02-25 CN CN202280014979.0A patent/CN116981947A/zh active Pending
- 2022-02-25 KR KR1020237031896A patent/KR20230148340A/ko unknown
- 2022-02-25 AU AU2022227758A patent/AU2022227758A1/en active Pending
- 2022-02-25 EP EP22710854.5A patent/EP4298446A1/en active Pending
- 2022-02-25 IL IL305086A patent/IL305086A/en unknown
- 2022-02-25 JP JP2023551677A patent/JP2024507571A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
IL305086A (en) | 2023-10-01 |
AU2022227758A1 (en) | 2023-09-07 |
CA3211508A1 (en) | 2022-09-01 |
EP4298446A1 (en) | 2024-01-03 |
WO2022183010A1 (en) | 2022-09-01 |
JP2024507571A (ja) | 2024-02-20 |
CN116981947A (zh) | 2023-10-31 |
US20220326252A1 (en) | 2022-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210120010A (ko) | 단백질 a 크로마토그래피 - 전기분무 이온화 질량 분광계 | |
US11486864B2 (en) | Method and system of identifying and quantifying antibody fragmentation | |
JP2023512521A (ja) | 天然液体クロマトグラフィ質量分析のためのプラットフォーム | |
JP2020101538A (ja) | 液体クロマトグラフィー−質量分析を用いるタンパク質分析のシステムおよび方法 | |
US20210396764A1 (en) | Heavy peptide approach to accurately measure unprocessed c-terminal lysine | |
US20220326252A1 (en) | Electron transfer dissociation and mass spectrometry for improved protein sequencing of monoclonal antibodies | |
EP3633383B1 (en) | Fast protein sequencing | |
US20230243841A1 (en) | Methods to prevent disulfide scrambling for ms-based proteomics | |
US20230092532A1 (en) | Method to prevent sample preparation-induced disulfide scrambling in non-reduced peptide mapping | |
US20230032322A1 (en) | Mass spectrometry-based strategy for determining product-related variants of a biologic | |
US20230348533A1 (en) | Bioanalysis of therapeutic antibodies and related products using immunoprecipitation and native sec-pcd-ms detection | |
US12000811B2 (en) | Method and system of identifying and quantifying antibody fragmentation | |
US20240036056A1 (en) | Mass spectrometry-based strategy for determining product-related variants of a biologic | |
US20230375565A1 (en) | Mass spectrometry-based strategy for determining product-related variants of a biologic | |
US20240142462A1 (en) | Sequence variant analysis using heavy peptides | |
US20230243843A1 (en) | Sequence variance analysis by proteominer | |
US20230084196A1 (en) | Nmass spectrometry-based strategy for characterizing high molecular weight species of a biologic |