JP2010503852A - C末端のペプチドの識別に基づいたタンパク質の試料を分析するための方法 - Google Patents
C末端のペプチドの識別に基づいたタンパク質の試料を分析するための方法 Download PDFInfo
- Publication number
- JP2010503852A JP2010503852A JP2009527932A JP2009527932A JP2010503852A JP 2010503852 A JP2010503852 A JP 2010503852A JP 2009527932 A JP2009527932 A JP 2009527932A JP 2009527932 A JP2009527932 A JP 2009527932A JP 2010503852 A JP2010503852 A JP 2010503852A
- Authority
- JP
- Japan
- Prior art keywords
- peptide
- terminal
- peptides
- protein
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 154
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 154
- 101800001415 Bri23 peptide Proteins 0.000 title claims abstract description 131
- 101800000655 C-terminal peptide Proteins 0.000 title claims abstract description 131
- 102400000107 C-terminal peptide Human genes 0.000 title claims abstract description 131
- 238000000034 method Methods 0.000 title claims abstract description 114
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 233
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 100
- 238000002955 isolation Methods 0.000 claims abstract description 26
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 42
- 238000003776 cleavage reaction Methods 0.000 claims description 38
- 230000007017 scission Effects 0.000 claims description 38
- 239000003795 chemical substances by application Substances 0.000 claims description 33
- 238000000926 separation method Methods 0.000 claims description 33
- 238000002372 labelling Methods 0.000 claims description 25
- 230000004048 modification Effects 0.000 claims description 22
- 238000012986 modification Methods 0.000 claims description 22
- 238000000746 purification Methods 0.000 claims description 19
- 239000003153 chemical reaction reagent Substances 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 16
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 14
- 210000004899 c-terminal region Anatomy 0.000 claims description 14
- 150000001718 carbodiimides Chemical class 0.000 claims description 14
- 239000000203 mixture Substances 0.000 claims description 12
- 108090000631 Trypsin Proteins 0.000 claims description 9
- 102000004142 Trypsin Human genes 0.000 claims description 9
- 230000014759 maintenance of location Effects 0.000 claims description 9
- 239000000126 substance Substances 0.000 claims description 9
- 239000012588 trypsin Substances 0.000 claims description 9
- 229960002685 biotin Drugs 0.000 claims description 7
- 235000020958 biotin Nutrition 0.000 claims description 7
- 239000011616 biotin Substances 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000004366 reverse phase liquid chromatography Methods 0.000 claims description 7
- 230000001404 mediated effect Effects 0.000 claims description 6
- 238000010521 absorption reaction Methods 0.000 claims description 5
- 150000001615 biotins Chemical group 0.000 claims description 5
- 238000007405 data analysis Methods 0.000 claims description 5
- 125000002924 primary amino group Chemical class [H]N([H])* 0.000 claims description 5
- 235000013599 spices Nutrition 0.000 claims description 3
- 241000894007 species Species 0.000 claims description 2
- 238000004949 mass spectrometry Methods 0.000 abstract description 40
- 235000018102 proteins Nutrition 0.000 description 131
- 150000001413 amino acids Chemical class 0.000 description 31
- 235000001014 amino acid Nutrition 0.000 description 29
- 229940024606 amino acid Drugs 0.000 description 29
- 230000000875 corresponding effect Effects 0.000 description 20
- 229920001184 polypeptide Polymers 0.000 description 12
- 235000018417 cysteine Nutrition 0.000 description 11
- 150000002500 ions Chemical class 0.000 description 11
- FPQQSJJWHUJYPU-UHFFFAOYSA-N 3-(dimethylamino)propyliminomethylidene-ethylazanium;chloride Chemical compound Cl.CCN=C=NCCCN(C)C FPQQSJJWHUJYPU-UHFFFAOYSA-N 0.000 description 10
- 210000004027 cell Anatomy 0.000 description 10
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 10
- 239000012071 phase Substances 0.000 description 10
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 8
- -1 Me 2 NH Chemical compound 0.000 description 8
- 230000008901 benefit Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 239000004472 Lysine Substances 0.000 description 7
- 230000002209 hydrophobic effect Effects 0.000 description 7
- 150000003141 primary amines Chemical class 0.000 description 7
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- QUSNBJAOOMFDIB-UHFFFAOYSA-N Ethylamine Chemical compound CCN QUSNBJAOOMFDIB-UHFFFAOYSA-N 0.000 description 6
- 230000021736 acetylation Effects 0.000 description 6
- 238000004007 reversed phase HPLC Methods 0.000 description 6
- 150000003839 salts Chemical class 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 238000006640 acetylation reaction Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000004587 chromatography analysis Methods 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 238000000132 electrospray ionisation Methods 0.000 description 5
- 229940088598 enzyme Drugs 0.000 description 5
- 125000000524 functional group Chemical group 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 238000005342 ion exchange Methods 0.000 description 5
- 238000001948 isotopic labelling Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000007026 protein scission Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000012799 strong cation exchange Methods 0.000 description 5
- 238000004780 2D liquid chromatography Methods 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- 101800000597 N-terminal peptide Proteins 0.000 description 4
- 102400000108 N-terminal peptide Human genes 0.000 description 4
- 102000035195 Peptidases Human genes 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 108010026552 Proteome Proteins 0.000 description 4
- 230000029936 alkylation Effects 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 238000005251 capillar electrophoresis Methods 0.000 description 4
- 239000003599 detergent Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- 230000000155 isotopic effect Effects 0.000 description 4
- 239000003960 organic solvent Substances 0.000 description 4
- 230000004481 post-translational protein modification Effects 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000002797 proteolythic effect Effects 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 3
- 108010052285 Membrane Proteins Proteins 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 238000005804 alkylation reaction Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000005194 fractionation Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000005040 ion trap Methods 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 238000004811 liquid chromatography Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- BAVYZALUXZFZLV-UHFFFAOYSA-N mono-methylamine Natural products NC BAVYZALUXZFZLV-UHFFFAOYSA-N 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- LMDZBCPBFSXMTL-UHFFFAOYSA-N 1-ethyl-3-(3-dimethylaminopropyl)carbodiimide Chemical compound CCN=C=NCCCN(C)C LMDZBCPBFSXMTL-UHFFFAOYSA-N 0.000 description 2
- KZMAWJRXKGLWGS-UHFFFAOYSA-N 2-chloro-n-[4-(4-methoxyphenyl)-1,3-thiazol-2-yl]-n-(3-methoxypropyl)acetamide Chemical compound S1C(N(C(=O)CCl)CCCOC)=NC(C=2C=CC(OC)=CC=2)=C1 KZMAWJRXKGLWGS-UHFFFAOYSA-N 0.000 description 2
- NQUNIMFHIWQQGJ-UHFFFAOYSA-N 2-nitro-5-thiocyanatobenzoic acid Chemical compound OC(=O)C1=CC(SC#N)=CC=C1[N+]([O-])=O NQUNIMFHIWQQGJ-UHFFFAOYSA-N 0.000 description 2
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 102100031680 Beta-catenin-interacting protein 1 Human genes 0.000 description 2
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 2
- 108090000317 Chymotrypsin Proteins 0.000 description 2
- 102000005593 Endopeptidases Human genes 0.000 description 2
- 108010059378 Endopeptidases Proteins 0.000 description 2
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 2
- 101000993469 Homo sapiens Beta-catenin-interacting protein 1 Proteins 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- 239000000232 Lipid Bilayer Substances 0.000 description 2
- 101001018085 Lysobacter enzymogenes Lysyl endopeptidase Proteins 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 241000244206 Nematoda Species 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 239000007801 affinity label Substances 0.000 description 2
- 150000001412 amines Chemical group 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 150000007942 carboxylates Chemical class 0.000 description 2
- 238000005277 cation exchange chromatography Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 229960002376 chymotrypsin Drugs 0.000 description 2
- 238000001360 collision-induced dissociation Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- ZBCBWPMODOFKDW-UHFFFAOYSA-N diethanolamine Chemical group OCCNCCO ZBCBWPMODOFKDW-UHFFFAOYSA-N 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- INQOMBQAUSQDDS-UHFFFAOYSA-N iodomethane Chemical compound IC INQOMBQAUSQDDS-UHFFFAOYSA-N 0.000 description 2
- 238000004255 ion exchange chromatography Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 239000012038 nucleophile Substances 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 230000009145 protein modification Effects 0.000 description 2
- 230000020978 protein processing Effects 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000004885 tandem mass spectrometry Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- WBYWAXJHAXSJNI-VOTSOKGWSA-M .beta-Phenylacrylic acid Natural products [O-]C(=O)\C=C\C1=CC=CC=C1 WBYWAXJHAXSJNI-VOTSOKGWSA-M 0.000 description 1
- QUSNBJAOOMFDIB-ZBJDZAJPSA-N 1,1,2,2,2-pentadeuterioethanamine Chemical compound [2H]C([2H])([2H])C([2H])([2H])N QUSNBJAOOMFDIB-ZBJDZAJPSA-N 0.000 description 1
- 150000000180 1,2-diols Chemical class 0.000 description 1
- HAGRZCJZAKVSTR-UHFFFAOYSA-N 3-methyl-2-(2-nitrophenyl)sulfanyl-1h-indole Chemical compound N1C2=CC=CC=C2C(C)=C1SC1=CC=CC=C1[N+]([O-])=O HAGRZCJZAKVSTR-UHFFFAOYSA-N 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- 125000004042 4-aminobutyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])N([H])[H] 0.000 description 1
- JLLYLQLDYORLBB-UHFFFAOYSA-N 5-bromo-n-methylthiophene-2-sulfonamide Chemical compound CNS(=O)(=O)C1=CC=C(Br)S1 JLLYLQLDYORLBB-UHFFFAOYSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- BXTVQNYQYUTQAZ-UHFFFAOYSA-N BNPS-skatole Chemical compound N=1C2=CC=CC=C2C(C)(Br)C=1SC1=CC=CC=C1[N+]([O-])=O BXTVQNYQYUTQAZ-UHFFFAOYSA-N 0.000 description 1
- PXWQHFIGBQDITC-QHROSOOBSA-N CCC(/C(/N1)=C(/CC/C=C/CC(N)=O)\S)NC1=O Chemical compound CCC(/C(/N1)=C(/CC/C=C/CC(N)=O)\S)NC1=O PXWQHFIGBQDITC-QHROSOOBSA-N 0.000 description 1
- 108090000397 Caspase 3 Proteins 0.000 description 1
- 102000004018 Caspase 6 Human genes 0.000 description 1
- 108090000425 Caspase 6 Proteins 0.000 description 1
- 108090000567 Caspase 7 Proteins 0.000 description 1
- 108090000426 Caspase-1 Proteins 0.000 description 1
- 102100035904 Caspase-1 Human genes 0.000 description 1
- 102000004068 Caspase-10 Human genes 0.000 description 1
- 108090000572 Caspase-10 Proteins 0.000 description 1
- 102000004046 Caspase-2 Human genes 0.000 description 1
- 108090000552 Caspase-2 Proteins 0.000 description 1
- 102100029855 Caspase-3 Human genes 0.000 description 1
- 102100025597 Caspase-4 Human genes 0.000 description 1
- 101710090338 Caspase-4 Proteins 0.000 description 1
- 102100038916 Caspase-5 Human genes 0.000 description 1
- 101710090333 Caspase-5 Proteins 0.000 description 1
- 102100038902 Caspase-7 Human genes 0.000 description 1
- 102100026548 Caspase-8 Human genes 0.000 description 1
- 108090000538 Caspase-8 Proteins 0.000 description 1
- 102100026550 Caspase-9 Human genes 0.000 description 1
- 108090000566 Caspase-9 Proteins 0.000 description 1
- WBYWAXJHAXSJNI-SREVYHEPSA-N Cinnamic acid Chemical compound OC(=O)\C=C/C1=CC=CC=C1 WBYWAXJHAXSJNI-SREVYHEPSA-N 0.000 description 1
- YXHKONLOYHBTNS-UHFFFAOYSA-N Diazomethane Chemical compound C=[N+]=[N-] YXHKONLOYHBTNS-UHFFFAOYSA-N 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 102000004015 Exostosin-2 Human genes 0.000 description 1
- 108090000429 Exostosin-2 Proteins 0.000 description 1
- 108050001049 Extracellular proteins Proteins 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 108060005986 Granzyme Proteins 0.000 description 1
- 102000001398 Granzyme Human genes 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- 206010062016 Immunosuppression Diseases 0.000 description 1
- QUOGESRFPZDMMT-UHFFFAOYSA-N L-Homoarginine Natural products OC(=O)C(N)CCCCNC(N)=N QUOGESRFPZDMMT-UHFFFAOYSA-N 0.000 description 1
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- QUOGESRFPZDMMT-YFKPBYRVSA-N L-homoarginine Chemical compound OC(=O)[C@@H](N)CCCCNC(N)=N QUOGESRFPZDMMT-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 108010053229 Lysyl endopeptidase Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 description 1
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 description 1
- 150000007930 O-acyl isoureas Chemical class 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 108010030544 Peptidyl-Lys metalloendopeptidase Proteins 0.000 description 1
- 102000056251 Prolyl Oligopeptidases Human genes 0.000 description 1
- 108700015930 Prolyl Oligopeptidases Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- ODHCTXKNWHHXJC-GSVOUGTGSA-N Pyroglutamic acid Natural products OC(=O)[C@H]1CCC(=O)N1 ODHCTXKNWHHXJC-GSVOUGTGSA-N 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- 108090001109 Thermolysin Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- ODHCTXKNWHHXJC-UHFFFAOYSA-N acide pyroglutamique Natural products OC(=O)C1CCC(=O)N1 ODHCTXKNWHHXJC-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001350 alkyl halides Chemical class 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 125000003236 benzoyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)=O 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 229930016911 cinnamic acid Natural products 0.000 description 1
- 235000013985 cinnamic acid Nutrition 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 150000001945 cysteines Chemical class 0.000 description 1
- 229940068840 d-biotin Drugs 0.000 description 1
- 230000006240 deamidation Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003748 differential diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 239000007792 gaseous phase Substances 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- WBYWAXJHAXSJNI-UHFFFAOYSA-N methyl p-hydroxycinnamate Natural products OC(=O)C=CC1=CC=CC=C1 WBYWAXJHAXSJNI-UHFFFAOYSA-N 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- MGJXBDMLVWIYOQ-UHFFFAOYSA-N methylazanide Chemical compound [NH-]C MGJXBDMLVWIYOQ-UHFFFAOYSA-N 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- IFPHDUVGLXEIOQ-UHFFFAOYSA-N ortho-iodosylbenzoic acid Chemical compound OC(=O)C1=CC=CC=C1I=O IFPHDUVGLXEIOQ-UHFFFAOYSA-N 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 235000019624 protein content Nutrition 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 230000005892 protein maturation Effects 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 238000000575 proteomic method Methods 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- HNJBEVLQSNELDL-UHFFFAOYSA-N pyrrolidin-2-one Chemical compound O=C1CCCN1 HNJBEVLQSNELDL-UHFFFAOYSA-N 0.000 description 1
- 239000012048 reactive intermediate Substances 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- CVHZOJJKTDOEJC-UHFFFAOYSA-N saccharin Chemical group C1=CC=C2C(=O)NS(=O)(=O)C2=C1 CVHZOJJKTDOEJC-UHFFFAOYSA-N 0.000 description 1
- 238000005464 sample preparation method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- RPENMORRBUTCPR-UHFFFAOYSA-M sodium;1-hydroxy-2,5-dioxopyrrolidine-3-sulfonate Chemical compound [Na+].ON1C(=O)CC(S([O-])(=O)=O)C1=O RPENMORRBUTCPR-UHFFFAOYSA-M 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 108010059339 submandibular proteinase A Proteins 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- QQWYQAQQADNEIC-RVDMUPIBSA-N tert-butyl [(z)-[cyano(phenyl)methylidene]amino] carbonate Chemical compound CC(C)(C)OC(=O)O\N=C(/C#N)C1=CC=CC=C1 QQWYQAQQADNEIC-RVDMUPIBSA-N 0.000 description 1
- UWMFDFGRVUUNOU-UHFFFAOYSA-N tert-butyl n-[cyano(phenyl)methyl]carbamate Chemical compound CC(C)(C)OC(=O)NC(C#N)C1=CC=CC=C1 UWMFDFGRVUUNOU-UHFFFAOYSA-N 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229910052723 transition metal Inorganic materials 0.000 description 1
- 150000003624 transition metals Chemical class 0.000 description 1
- 230000032895 transmembrane transport Effects 0.000 description 1
- 238000000539 two dimensional gel electrophoresis Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 230000008016 vaporization Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
Abstract
本発明は、それらのC−末端のペプチドの単離及び分析に基づいた一つの又はより多くの試料におけるタンパク質を識別するための方法に関係する。単離されたペプチドは、質量分析法によって精製された及び分析されたものである。親のタンパク質の識別は、追加的な物理化学的なパラメーターとの組み合わせでC−末端のペプチドの質量に基づいたものである。本発明は、さらに、C末端のペプチドの質量及びそれらの一つの又はより多くの物理化学的な性質を含むコンピューター内の開裂させられたタンパク質のC−末端のペプチドの注釈が付けられたデータベースに関係する。
Description
本発明は、開裂されたタンパク質の混合物からのペプチドの選択的な単離を可能にする、質量分析を使用するタンパク質の試料の同時の分析のための方法に関係する。本発明は、さらに、質量分析のデータのペプチド及びデータ分析を精製するための技術に関係する。
質量分析(MS)を使用するタンパク質を識別するための異なる方法は、この数十年間にわたって徐々に発展してきたものである。いわゆるフィンガープリント法において、タンパク質は、単離されると共にペプチドのフラグメントへと開裂させられる。開裂させられたタンパク質のコンピューター内のデータベースと発生させられたペプチドの質量を比較することによって、さらなる配列の決定無しに親のタンパク質を識別することは、可能なことである。
しかしながら、それは、一つの単一の実験において、ショットガン・アプローチを使用することで、試料に存在する異なるタンパク質を研究することを目指す。ペプチドの試料の複雑さを低減することは、しばしば、内部のシステインを含有するペプチドを選択的に単離することによって行われる。システインが、あらゆるタンパク質に現れるものではないので、代案のストラテジーが、発生させられたペプチドの混合物からN末端又はC末端のペプチドを特異的に単離するために開発されてきたものである。この方式では、あらゆるタンパク質は、一つのペプチドによって表現される。C末端のペプチドの単離に基づいた方法の例は、例.米国特許第6,156,527号明細書(Schmidt)(特許文献1)及び米国特許出願公開第2002/0106700号明細書(Foote)(特許文献2)に記載される。このアプローチは、同じタンパク質に由来する異なるペプチドを識別することに基づいたものである、古典的なフィンガープリントを可能にするものではない。にもかかわらず、MS/MSペプチドの配列決定を行う必要があることなく、ペプチド(及びその結果としてそれの親のタンパク質)を積極的に識別することができるものであることは、好都合なものであるであろう。
米国特許第6,846,679号明細書(Schmidt)(特許文献3)は、C末端のペプチドを選択すると共にC末端のペプチドのデータベースとこれらのペプチドの質量を比較するための方法を開示する。この特許の例は、ペプチドの約45%のみについての、約1800個のC末端のLys−Cのペプチドのセットについて、質量は、疑う余地無しに、Lys−Cのペプチドのコンピューター内の発生させられたデータベースにおける単一のペプチドと相関させることができることを示す。
米国特許出願公開第2005/0092910号明細書(特許文献4)は、MSにおけるペプチドの質量が、ペプチドの別の物理化学的な性質のみならず、決定されるところの方法を開示する。この方法は、同じ質量を有するペプチド間で弁別することを可能にする。しかしながら、完全な試料が分析されるという事実を考慮に入れて、このようなペプチドを単一の親のタンパク質に帰することができないように、同じ質量及び同じ物理化学的な性質の両方を有するものである莫大な数の異なるペプチドは、なおも発生させられる。
それに応じて、残るものは、複合体のタンパク質の試料を、MS/MSにおいて発生させられたペプチドの配列決定の必要性無しにMSによって分析することができる、高いスループットの方法についてのさらなる要望である。
本発明は、タンパク質の開裂並びにそれらからのC末端のペプチドの単離及び分析に基づいた、複合体のタンパク質の混合物に存在するタンパク質を包含するものである、タンパク質を分析するための方法に関係する。本発明の方法において、単離されたC末端のペプチドは、一つの又はより多くのペプチドの精製ステップに及びMS分析にかけられる。精製の間に又は後に、それの質量以外の精製されたペプチドの物理化学的な性質は、収集される。精製されたC末端のペプチドの質量は、MSによって決定される。ペプチドは、C末端のペプチドの質量及び一つの又はより多くの物理化学的な特性の両方を組み合わせるものであるデータベースとの比較に基づいて識別される。特定の実施形態において、2、3、4、5、又は10までの追加的な物理化学的な特性は、データベースに注釈を付けるために使用される。本発明の方法は、MS/MSにおける新規の配列の決定についての必要性無しに高い確度で、C末端のペプチド(及び、それに応じて、それらの対応する親のタンパク質)の積極的な識別を可能にする。
C末端のペプチドが選択されるところの手順の利点は、各々のタンパク質が、分析されるものである試料の複雑さにおける強い低減に至るものである、タンパク分解性の開裂の後における単一のペプチドのみ、及び、これらのペプチドの情報を含有する対応するデータベース、によって表現されるというものである。
提示された手順の別の利点は、全てのタンパク質のC末端のペプチドが、(人間、マウス及びラットのような、しかし、ショウジョウバエ、線虫及び酵母のような、より低級な生体もまた)それらのゲノムが配列決定されてしまってあるところの生体について知られたものであるというものである。これらのペプチドの正確な分子量を、予言することができるが、それは、測定された質量に特異的な信号の根底にあるペプチドの識別を支持することが期待される。これは、>500,000の程度の分解能及び<1ppmの質量の確度を達成することができるものである、FT−IRと同様の現行で利用可能な高性能の質量分析の技術について特に真実である。
加えて、期待されたC末端のペプチドの本性が、ゲノムの配列のコンピューター内の分析から知られると、合成のタンパク質のライブラリーが、発生させられると共に、調製のプロセスの間における各々のペプチドの正確な特性(例.異なるクロマトグラフィーの材料における保持時間、ESI/MALDI−TOFにおける挙動)を、決定すると共に複合体のタンパク質の混合物から識別されたペプチドと比較することができる。これは、正しいタンパク質の識別における信頼性を顕著に改善する。
さらに本発明の利点は、C末端のペプチドが、(プロテオミクスにおける一般的な修飾であると共に質量分析によってタンパク質の下流の分析を乱すものではないところのアルキル化及びアセチル化は別として)当該発明の方法に修飾されない状態にとどまるというものである。従って、気体の相へとペプチドを蒸発させるためのイオン化するプロセスとの干渉は、ありそうもないことである。
与えられた方法の別の利点は、既存のスプライスバリアントの少なくとも一部分、すなわち、タンパク質のN末端の側で起こるものを、本発明のアプローチによって扱うことができるというものであるが、それにおいては、あまり可変なものではないC末端は、単離されると共に識別される。
当該発明の特定の及び好適な態様は、付随する独立の及び従属の請求項において設定される。従属の請求項の特徴は、適当なものとして及び請求項に明示的に設定されたものとしてだけでなく独立の請求項のいずれの特徴とも及び他の従属の請求項の特徴と組み合わせられることがある。
本発明の第一の態様は、タンパク質の試料におけるタンパク質を識別するための方法を提供する。これらの方法は、典型的には、
a)タンパク質の試料におけるタンパク質のカルボキシル基を修飾すること、
b)開裂剤でペプチドへとタンパク質の試料におけるタンパク質を開裂させること、
c)開裂させられたペプチドから、C末端のペプチドを単離すること、それによってN末端の及び内部のペプチドを取り除くこと、
d)精製されたC末端のペプチドを得るように、一つの又はより多くのペプチド精製ステップに単離されたC末端のペプチドをかけること、
e)精製されたC末端のペプチドの、質量以外の、少なくとも一つの物理化学的な性質を決定すること又は計算すること、
f)MSにおけるC末端のペプチドの質量を決定すること、
g)精製されたC末端のペプチドの親のタンパク質を識別するように、開裂剤によって発生させられた全てのC末端のペプチドの質量及び一つの又はより多くの物理化学的な性質を含むデータベースと精製されたC末端のペプチドの質量及び少なくとも一つの他の物理化学的な性質を比較すること、
:のステップを含む。
a)タンパク質の試料におけるタンパク質のカルボキシル基を修飾すること、
b)開裂剤でペプチドへとタンパク質の試料におけるタンパク質を開裂させること、
c)開裂させられたペプチドから、C末端のペプチドを単離すること、それによってN末端の及び内部のペプチドを取り除くこと、
d)精製されたC末端のペプチドを得るように、一つの又はより多くのペプチド精製ステップに単離されたC末端のペプチドをかけること、
e)精製されたC末端のペプチドの、質量以外の、少なくとも一つの物理化学的な性質を決定すること又は計算すること、
f)MSにおけるC末端のペプチドの質量を決定すること、
g)精製されたC末端のペプチドの親のタンパク質を識別するように、開裂剤によって発生させられた全てのC末端のペプチドの質量及び一つの又はより多くの物理化学的な性質を含むデータベースと精製されたC末端のペプチドの質量及び少なくとも一つの他の物理化学的な性質を比較すること、
:のステップを含む。
当該発明の方法の一つの実施形態に従って、ステップ(g)は、精製されたC末端のペプチドの各々について、精製されたC末端のペプチドに対応する質量を備えたデータベースにおける一つの又はより多くのC末端のペプチドを識別すること、及び、一つと比べてより多いペプチドが、一つの精製されたC末端のペプチドに対応するものとしてデータベースにおいて識別されるとき、データベースにおける対応するC末端のペプチドを積極的に識別するように、データベースにおいて識別された一つと比べてより多いペプチドのものと、精製されたC末端のペプチドの少なくとも一つの他の物理化学的なパラメーターを比較すること、を含む。
当該発明のこの態様の方法の一つの実施形態に従って、タンパク質の試料は、スピーシーズからものであると共に、データベースは、開裂剤によって発生させられたそのスピーシーズの全てのC末端のペプチドの質量及び一つの又はより多くの他の物理化学的な性質を含む。
本発明の方法の特定の実施形態は、それによってタンパク質が、二つの又はより多くの試料において同時に識別されるところの方法を包含すると共に、その方法は、それに応じて、後に続く追加的な特徴:
− 試料の各々について異なる、差異的な標識付けの試薬のセットの一つで、ステップ(a)における修飾を行うこと、
− ステップ(d)に先立ち、二つの又はより多くの試料を貯留することの追加的なステップ、
− ステップ(g)に先立ち、試料を識別するように、単離されたペプチドの標識の本性を識別すること、その試料にペプチドが由来すること、及び、
− ステップ(g)において、C末端のペプチドを識別するように、開裂剤によって発生させられた全てのC末端のペプチドの質量及びそれらの少なくとも一つの他の物理化学的な性質を含むデータベースと精製されたC末端のペプチドの質量及び少なくとも一つの他の物理化学的な性質を比較すること
を含む。
− 試料の各々について異なる、差異的な標識付けの試薬のセットの一つで、ステップ(a)における修飾を行うこと、
− ステップ(d)に先立ち、二つの又はより多くの試料を貯留することの追加的なステップ、
− ステップ(g)に先立ち、試料を識別するように、単離されたペプチドの標識の本性を識別すること、その試料にペプチドが由来すること、及び、
− ステップ(g)において、C末端のペプチドを識別するように、開裂剤によって発生させられた全てのC末端のペプチドの質量及びそれらの少なくとも一つの他の物理化学的な性質を含むデータベースと精製されたC末端のペプチドの質量及び少なくとも一つの他の物理化学的な性質を比較すること
を含む。
当該発明の方法の特定の実施形態に従って、少なくとも一つの物理化学的な性質は、一つの又はより多くのペプチド精製ステップの間に決定される。
当該発明の方法の特定の実施形態に従って、少なくとも一つの物理化学的な性質は、pI、逆相クロマトグラフィーの間における保持時間、並びに、280及び214nmにおけるUV吸収の比の群より選択される。
当該発明の方法の特定の実施形態において、ステップ(a)における修飾は、第一級アミンとのカルボジイミド反応を使用することで行われる。
ステップ(c)におけるC末端のペプチドの単離は、第一級アミン基を担持する修飾されたビオチンとのカルボジイミドで媒介された反応を介してN末端の及び内部のペプチドのカルボキシル基を反応させることのステップを含む。
本発明のさらなる態様は、
a)第一級アミンとカルボジイミドを介して試料における(無処置の)タンパク質のカルボキシル基を反応させること、
b)ペプチドへと開裂剤で(無処置の)タンパク質を開裂させること、
c)第一級アミンの基を担持するアフィニティータグとカルボジイミドを介してN末端の及び内部のペプチドのカルボキシル基を反応させること、
d)アフィニティーマトリックスへタグが付けられたペプチドを結び付けること、及び、結び付けられてないペプチド(結び付けられてないペプチドはタグが付けられてないペプチドである)を収集すること、それによって(b)の下で得られたペプチドから、N末端の及び内部のペプチドからのC末端のペプチドを単離すること
:のステップを含むタンパク質の試料からC末端のペプチドを単離するための方法を提供する。
a)第一級アミンとカルボジイミドを介して試料における(無処置の)タンパク質のカルボキシル基を反応させること、
b)ペプチドへと開裂剤で(無処置の)タンパク質を開裂させること、
c)第一級アミンの基を担持するアフィニティータグとカルボジイミドを介してN末端の及び内部のペプチドのカルボキシル基を反応させること、
d)アフィニティーマトリックスへタグが付けられたペプチドを結び付けること、及び、結び付けられてないペプチド(結び付けられてないペプチドはタグが付けられてないペプチドである)を収集すること、それによって(b)の下で得られたペプチドから、N末端の及び内部のペプチドからのC末端のペプチドを単離すること
:のステップを含むタンパク質の試料からC末端のペプチドを単離するための方法を提供する。
当該発明のこの態様の方法の特定の実施形態に従って、アフィニティータグは、ビオチンである。
本発明のなお別の態様は、開裂剤によってコンピューター内で開裂された生体のタンパク質のC末端のペプチドのデータベースに関係するが、それにおいて各々のペプチドは、タンパク質の識別子、アミノ酸組成、質量及び一つの又はより多くの他の物理化学的な性質によって特徴付けられる。
特定の実施形態において、データベースにおけるC末端のペプチドの一つの又はより多くの他の物理化学的な性質は、逆相クロマトグラフィーにおける計算された保持時間、与えられたpHにおける正味の電荷、及び、C末端のペプチドの等電点からなる群より選択される。
特定の実施形態において、データベースは、コンピューター内で開裂させられたヒトの生体のタンパク質のデータベースである。
さらなる特定の実施形態において、データベースは、トリプシンであるところの開裂剤でのタンパク質の開裂することに基づいたものである。
特定の実施形態において、データベースにおけるペプチドは、それによって一つの開裂位置がはずされるところの開裂剤での不完全な開裂から結果として生じるC末端のペプチドを包含する。
本発明のなおさらなる態様は、タンパク質の識別についての上に記載された方法におけるデータベースの使用に関係する。
本発明のなおさらなる態様は、それらのC末端のペプチドに基づいた一つの又はより多くの試料におけるタンパク質を識別するためのデバイス(100)を提供するが、そのデバイスは、それが、少なくとも一つの試料源(101)、少なくとも一つの対応する修飾する薬剤/標識源(103)を備えた、修飾/標識付けのユニット(102)、開裂ユニット(104)、C末端のペプチド単離ユニット(105)、精製されたペプチドの一つの又はより多くの物理化学的な性質を決定する及び/又は登録するための分析ユニット(107)を備えたペプチド分離ユニット(106)、質量分析計ユニット(108)、読み出しユニット(110)へ接続された制御回路部品及びデータ分析ユニット(109)を含むという点で特徴付けられるものである。より具体的に、本発明のデバイスは、C末端のペプチドの物理化学的な性質で注釈が付けられた開裂剤を使用することでコンピューター内において開裂させられたタンパク質の全てのC末端のペプチドの質量を含むデータベース(111)への接続を含む。
本発明の上記の及び他の特性、特徴、及び利点は、一例として、当該発明の原理を図示するものである、付随する図面と併せて考慮された、後に続く詳細な説明から明らかなものになることになる。この記載は、当該発明の範囲を限定することなく、例のみの目的で与えられる。以下に引用された参照図は、添付された図面を指す。
異なる図において、同じ符号は、同じ又は類似の要素を指す。
本発明を、特定の実施形態に関して、及び、ある一定の図面を参照して、記載することにするが、しかし、当該発明は、それらに限定されるものではなく、請求項によってのみ限定される。請求項におけるいずれの符号も、その範囲を限定するものとして解釈されないものとする。記載された図面は、単に概略的なものであると共に限定しないものである。図面において、要素のいくつかのサイズは、誇張されると共に図示の目的のために一定の縮尺で描かれないことがある。用語“を含む”が、本記述及び請求項において使用される場合には、それは、他の要素又はステップを排除するものではない。単数の名詞を指すとき不定冠詞又は定冠詞、例.“ある”又は“その”が使用される場合には、これは、他に何かが具体的に述べられない限り、複数のその名詞を包含する。
さらには、記述における及び請求項における用語、第一の、第二の、第三の、及び同様のものが、類似の要素の間で区別するために、及び、必ずしも順次の又は経時的な順序を記述するためにではなく、使用される。そのように使用された用語が、適当な状況の下で交換可能なものであること、及び、ここに記載された発明の実施形態が、ここに記載された又は図示されたもの以外のシーケンスにおいて動作の可能なものであることは、理解されることである。
後に続く用語又は定義は、単に当該発明の理解において援助するために提供される。指定されない限り、これらの定義は、当業者によって理解されたものと比べてより少ない範囲を有すると解釈されるべきではない。
ここに使用されたような、用語“ペプチド”又は“タンパク質”は、ペプチド結合を介して接続された複数の天然の又は修飾されたアミノ酸を指す。ポリペプチドの長さは、2個から数千個のアミノ酸まで変動することができる(このように用語は、また、一般的にオリゴペプチドと称されるものをも包含する)。この範囲内に含まれるものは、
グリコシル化、ホスホリル化、など、のような生体内の翻訳後の修飾によって修飾されるものである一つの又はより多くのアミノ酸を含む、及び/又は、タンパク質を修飾する薬剤(例.アルキル化する薬剤)で試験管内において修飾されてしまってあるものである一つの又はより多くのアミノ酸を含む、ポリペプチドである。
グリコシル化、ホスホリル化、など、のような生体内の翻訳後の修飾によって修飾されるものである一つの又はより多くのアミノ酸を含む、及び/又は、タンパク質を修飾する薬剤(例.アルキル化する薬剤)で試験管内において修飾されてしまってあるものである一つの又はより多くのアミノ酸を含む、ポリペプチドである。
ここに使用されたような用語“ポリペプチドのフラグメント”又は“ペプチド”は、タンパク質又はポリペプチドの酵素的な開裂の後で得られたアミノ酸配列を指すために使用される。ポリペプチドのフラグメント又はペプチドは、サイズ又は本性において限定されるものではない。
用語“内部の”、“N末端の”、及び“C末端の”は、ペプチドを指すとき、タンパク質又はポリペプチドにおけるペプチドの対応する場所を指すために、ここにおいて使用される。例えば、タンパク質NH2−X1−K−X2−R−X3−K−X4−COOH(それにおいてX1、X2、X3、及びX4は、リシン(K)又はアルギニン(R)無しの平凡な長さのペプチドの配列である)のトリプシンの開裂において、N末端のペプチドは、NH2−X1−K−COOHである、内部のペプチドは、NH2−X2−R−COOH及びNH2−X3−K−COOHである、と共に、C末端のペプチドは、NH2−X4−COOHである。
用語“親のタンパク質”は、開裂されたペプチドが誘導されるところの開裂されてないタンパク質を指す。
ここにおいて使用されるような用語“タンパク質の開裂”は、ポリペプチドにおける二つのアミノ酸の間に結合させられたペプチドの加水分解を指す。生理学的なプロセスの事情において、タンパク質の開裂は、“酵素的な加水分解”、“タンパク分解性のプロセシング”、及び“タンパク質の成熟”ともまた称される。それに応じて、用語“開裂剤”は、ポリペプチド又はペプチドにおける二つのアミノ酸の間におけるペプチド結合を加水分解することが可能な化合物を指す。
ここにおいて使用されたような用語“フラグメンテーション”は、一つの又はより多くの化学的な結合の切断及び例.タンデム質量分析(MS)又はMS/MS分析における衝突で誘発させられた解離(CID)によって、得られたような分子の一つの又はより多くの部分のその後の解放を指す。ある一定の実施形態において、結合は、ペプチド結合であるが、しかし、それは、それに限定されるものではない。
本発明における用語“質量”は、質量対電荷の比(m/z)を指す。略語m/zは、イオンの質量数をそれの電荷の数によって形成された無次元の量を表記するために使用される。“モノアイソトピック質量”は、最も豊富な同位体のみを含有するイオンの質量を指す。“平均の質量”は、各々の元素についての原子量を使用することで計算された与えられた経験的な式の粒子又は分子の質量を指す。
ここにおいて使用されたような用語“標識”は、化合物又は分子を指すが、それを、ペプチド又はポリペプチドへ共有結合的に連結させる又はそれの中に組み込むことができると共に、それは、それえの特定の性質に基づいて、質量分析のような、光学的な又は他の手段によって検出可能なものである。標識を、ペプチド又はポリペプチドへ共有結合的に結び付けることができる場合には、これは、標識付けの試薬に存在するものである、タンパク質/ペプチドの反応性の基によって保証される。用語標識が、当技術において一般に使用される一方で、(例.タンパク質又はペプチドへ結び付けられたもののような)このようなもののような標識と、官能基へ結び付くことが可能な、標識付けの試薬(ペプチド又はタンパク質との結び付きに先立つ標識を含む分子)との間に差別を作ることができる。本発明は、蛍光性の又は同位体の標識のような、異なるタイプの標識の使用を予見する。
ここにおいて使用されたような用語“同位体の標識”は、同じ化学式を有するが、しかし、MSでの質量における差異に帰着する、一つの又はより多くの原子の存在する同位体の数及び/又はタイプにおいて相互に異なる、標識のセットを指す。このように、異なる同位体の標識で標識付けされた同一のペプチドを、質量における差異に基づいてMSにおいてこのようなものとして差別化することができる。
ここにおいて使用されたような用語“タンパク質/ペプチドの反応性の基”(PRG)は、アミノ酸へのこのような化合物の(非共有結合的な又は共有結合的な)結び付きに帰着するタンパク質又はペプチドのアミノ酸における官能基と反応することが可能なものである化合物における化学的な機能を指す。
ここにおいて使用されたような用語“官能基”は、化合物へ結び付く(一般には、共有結合的に結び付く)ために使用することができるものであるアミノ酸における化学的な機能を指す。官能基は、アミノ酸の側鎖に又はポリペプチド若しくはペプチドのN末端若しくはC末端に存在するものであることができる。その用語は、ペプチド又はポリペプチドに天然に存在するものであるところの官能基及び例.タンパク質を修飾する薬剤を使用する化学的な反応を介して導入されたものの両方を包括する。
本発明は、対応するC末端のペプチドの質量の決定に、及び必要なものであるとすれば、このC末端のペプチドの他の物理化学的なパラメーターに、基づいて親のタンパク質を識別することの方法を記載する。
本発明の方法及びツールは、同時の分析が関心のあるものであるところの試料のセットの分析において特に関心のあるものである。試料のこのようなセットは、異なる時点で取得された患者からの試料、疾患の異なる臨床的なバージョンの試料、異なる患者の試料、などであることができるが、しかし、それらに限定されるものではない。本発明は、このように、疾患の進行のマーカーを識別するための、差異的な診断のための、及びその上、生化学的な又は生理学的なアッセイにおける多重分析のための、方法及びツールを提供する。
本発明の方法及びツールは、タンパク質の試料の分析に関係する。ここにおいて使用されたような用語‘試料’は、必然的に、当該発明の方法の行うことに先立ついずれの加工するステップをも包含する又は排除することが意図されたものではない。試料は、粗い加工されてない試料、抽出されたタンパク質のフラクション、精製されたタンパク質のフラクション、などであることができる。一つの実施形態に従って、タンパク質の試料は、豊富なタンパク質の免疫抑制によって予備処理される。
本発明の方法での分析に適切なものであるタンパク質の試料は、ウイルス性の、原核生物の、細菌性の、真核生物の、カビの、酵母の、植物性の、無脊椎動物の、脊椎動物の、ほ乳類の、及びヒトの起源の試料を包含する。試料は、線虫、ショウジョウバエ、若しくはマウスの胚のホモジェネートのような全体的な生体であることができるか、又は、生体の組織若しくは器官であることができる。試料の調製は、調査された生体、組織、又は器官に依存することで異なるが、しかし、標準的な手順は、通常、利用可能なもの及び専門家に知られたものである。ほ乳類の及びヒトのタンパク質の試料に関して、それは、培養された細胞、レーザーでマイクロ切開された細胞、体の組織、体液、又は関心のある他の関連性のある試料の単離をカバーする。試料におけるタンパク質の分画に関して、細胞の溶解は、細胞の分画及びタンパク質の精製における第一のステップである。物理的な、酵素的な、及び洗浄剤に基づいた方法を包含するものである、多数の技術は、細胞の崩壊に利用可能なものである。歴史的には、物理的な溶解は、細胞の崩壊についての選抜の方法でありつづけてきた;(均質化、浸透圧性の溶解、超音波の細胞の崩壊)しかしながら、それは、しばしば、高価な、厄介な設備を要求すると共に(窮屈な均質化の乳棒と比較された余裕のあるもののような)装置における変動性のせいで繰り返すことが時々困難なものであるプロトコルを伴う。近年において、洗浄剤に基づいた溶解は、使用の簡単さ、低い費用、及び効率的なプロトコルのおかげで非常にポピュラーになってきたものである。
ほ乳類の細胞は、原形質の膜、細胞外の環境から細胞の内容物を分離する障壁を形成するものであるタンパク質−脂質の二層、を有する。原形質の膜を含む脂質は、閉じられた二分子のシートを形成することに自発的に関連するものである親水性の及び疎水性の部位を有するものである、両親媒性のものである。膜のタンパク質は、疎水性のコアにまたがる一つの又はより多くのドメインによって適所に保持された、脂質の二層に埋め込まれたものである。加えて、周辺のタンパク質は、一体の膜のタンパク質との又は極性の脂質の頭部基との相互作用を通じて二層の内側の又は外側の表面を結び付ける。脂質及びタンパク質の内容物の本性は、細胞のタイプと共に変動する。明らかに、細胞の崩壊のために選抜された技術は、物理的な又は洗浄剤に基づいたもののいずれであっても、検査されるものである細胞又は組織の起源及びそれらの外側の層を崩壊させる際の固有の簡単さ又は困難さを考慮に入れなければならない。加えて、その方法は、加工されるものである材料の量及び意図された下流の用途と適合性のものでなければならない。
特定の実施形態において、タンパク質の抽出物は、(細胞外のタンパク質、膜のタンパク質、細胞基質のタンパク質、核のタンパク質、ミトコンドリアのタンパク質のような)異なる区画から由来された細胞のタンパク質の予備分画をもまた包含する。他の予備分画の方法は、等電点、電荷、及び分子量のような物理的な性質においてタンパク質を分離する。
特定の実施形態に従って、試料は、適当な薬剤(例.グアニジニウム=クロリド、尿素、酸(例.0.1%トリフルオロ酸)、塩基(例.50%ピリジン)、及びイオン性の又は非イオン性の洗浄剤)を使用することで、試薬又はタンパク分解酵素への最適化されたアクセスのためにタンパク質を変性させるように、修飾又は開裂に先立ち予備処理される。
本発明の方法は、このように、自由選択で、試料の予備処理を含むが、それを、上に列挙した試料の調製方法の一つの又はより多くのものを含む予備処理のステップにおいて行うことができる。それに応じて、本発明の方法に適切なデバイスは、自由選択で、試料の調製に適切な一つの又はより多くのデバイス、例.音波処理デバイス、クロマトグラフィーシステム(アフィニティー、ゲル濾過)、限外濾過ユニット、遠心分離機、緩衝剤、酵素、洗浄剤、など…のための送り出しシステムを備えた温度制御された反応バイアルを含む試料の調製ユニットを含む。
当該発明の方法を、比較の分析のための一つの単一の試料へ又は二つの若しくはより多くの試料へ適用することができるが、それによって、これらの試料におけるC末端のペプチドには、異なる試料に由来する同じペプチドを弁別することができるものである標識が提供される。二つの又はより多くの試料が、同時に分析される場合には、試料の貯留は、貯留することが個々の試料の差異的な標識付けの後で起こるとの条件で(以下に詳述することにするもののような)方法において異なる時点で起こることができる。
本発明の方法の一つのステップにおいて、それは、当該発明の方法の大部分の実施形態において第一のステップであるが、試料におけるタンパク質のC末端並びにAsp及びGluの側鎖は、修飾される。
適切なカルボキシル基を修飾する薬剤は、例えば、カルボキシルのエステル(例えば、メタノール又は他のより低級な脂肪族の又は脂環式のアルコール、ジアゾメタン、メチル=ヨージド、Me3SiCHN2、Me2C(OMe)2、CH3OCH2Cl、CH3SCH2Cl、CH3OCH2CH2OCH2Cl、PhCH2OCH2Cl、Me3SiCl、Et3SiCl、及びMe2PhSiCl)、アミド(例えば、メチルアミド、エチルアミド、Me2NH、ピロリドン、ピペリジン)、及びヒドラジド誘導体(例えば、フェニルヒドラジド)誘導体の形成に至るものである化合物である。カルボキシルのエステル誘導体の発生は、適切な求核試薬での置き換え(displacement)が後に続けられた良好な脱離基でのカルボキシラートの活性化又はハロゲン化アルキル若しくはスルホナートにおけるカルボキシラートの求核試薬の置き換えを伴うことがある。ある一定の実施形態において、修飾する試薬は、メチル=ヨージドである。他の実施形態において、カルボキシル基の修飾は、適切な保護する試薬との反応に先立つ(例.1−エチル−3−[3−ジメチルアミノ−プロピル]カルボジイミド塩酸塩(EDC)での)カルボジイミド活性化を伴う。例えば、カルボジイミドで活性化されたカルボキシル基との反応に適切な保護する試薬は、脂肪族のアミン(NH2−R)である。一つの実施形態において、脂肪族のアミンは、メチルアミン又はエチルアミンである。
特定の実施形態において、またシステインは、例.アルキル化によって、修飾される、及び/又は、リシンは、例.アセチル化によって、修飾される。リシンの修飾を、トリプシンの特異性を調整するために、又は、さらに詳細に説明されるように、リシンのアミンの基における標識付けを回避するために、することができる。
本発明の方法の別のステップにおいて、それが、一般に、上述した修飾のステップの後に続くステップであるが、試料におけるカルボキシルで修飾されたタンパク質は、開裂剤によって開裂される。
以下に詳述されるように、本発明の方法における試料の最終的な分析は、質量分析(MS)を使用することで行われる。最適な結果は、長さにおいて約50個までのアミノ酸のペプチドを使用することでMSにおいて得られる。またペプチドの分離のためにも、大部分のクロマトグラフィーシステムは、タンパク質についてのものと比べてペプチドについてより高い分解能を有する。それに応じて、本発明の方法は、開裂ステップを包含するが、それによって大きいタンパク質は、N末端の、C末端の、及び内部のペプチドまで低減される。
本発明の方法におけるタンパク質の開裂を、化学的な及び酵素的な方法の両方を使用することで行うことができる。
化学的な開裂の方法は、BNPS−スカトール[2−(2−ニトロフェニルスルフェニル)−3−メチルインドール]、CNBr、ギ酸、ヒドロキシルアミン(NH2OH)、及びヨードソ安息香酸、並びに、NTCB+Ni(2−ニトロ−5−チオシアノ安息香酸)のような、しかしそれらに限定されるものではない、開裂剤の使用を包含する。
酵素的な開裂の方法は、Asp−Nエンドペプチターゼ、Arg−Cエンドペプチターゼ、Caspase 1、2、3、4、5、6、7、8、9、又は10、キモトリプシン、クロストリペイン、エンテロキナーゼ、第Xa因子、グルタミルエンドペプチターゼ、グランザイム B、LysCリシルエンドペプチターゼ、ペプシン、プロリン−エンドペプチターゼ、プロテイナーゼK、ブドウ球菌のペプチターゼI、サーモリシン・トロンビン、トリプシンのような、しかしそれらに限定されるものではない、酵素的な開裂剤での消化を包含する。定温放置の時間、酵素/基質の比、pH、及び緩衝剤のようなパラメーターは、ある一定のプロテアーゼの特異性に影響を及ぼすことができる。
本発明の目的のために、典型的には開裂の方法及び/又は薬剤は、選抜されるが、それらは、特異的なものであると共に高い効能を有する。さらに詳細に説明されるように、本発明の方法は、典型的には、コンピューター内の開裂のデータとの経験的な開裂のデータの比較に頼る。従って、試料の理論的な開裂のパターンが、実験のデータと可能な限り多く調和することは、重要性を有することである。例えば、メチオニンのC末端で開裂させるためのCNBrの使用は、また、トリプトファンのC末端での開裂に帰着することができる。芳香族のアミノ酸のC末端で優先的に開裂させるものであるキモトリプシンは、また、定温放置の時間及び試料における酵素の濃度に依存するが、他の疎水性のアミノ酸のC末端で開裂させることになる。
また、発生させられたペプチドの平均のサイズは、重要性を持つものである。ペプチドがより短ければ短いほど、異なるタンパク質からのペプチドが同じ質量を有すると共に同じ配列さえも有することになると共に精製及び分析の方法における同一の方式で挙動することになるところの機会が、より大きい。それに応じて、試料の本性及び複雑さに依存するが;あまり一般的に起こるものではない開裂のサイトを備えた酵素は、好適なものであることがある。
特定の実施形態に従って、本発明の方法における開裂のステップは、それの高い特異性及び効率の考慮に入れて、トリプシンで行われる。あるいは、Lys及びArgの両方における開裂が、短過ぎるペプチドに帰着する場合には、エンドプロテイナーゼArg−C(アルギニンに特異的なもの)、エンドプロテイナーゼLys−C(リシンに特異的なもの)、S.aureus V8プロテアーゼ(Asp/Gluに特異的なもの)のような他の酵素を、使用することができる。あるいは、リシンの側鎖は、アルギニン残基(及びホモアルギニンへと修飾されると共にトリプシンについての基質になるものであるシステイン)にトリプシンの開裂を制限するためのアセチル化によって修飾される。
本発明の方法のさらなるステップにおいて、試料の複雑さは、C末端のペプチドを単離することによって低減される。
上に記載された開裂のステップにおけるペプチドへのタンパク質の開裂は、試料に潜在的に存在するものである高い数のタンパク質は、いっそうはるかにより高い数のペプチドに転換されるという不都合を有するが、それらは、原則として、試料に存在するものであるタンパク質の全て及びそこで起こってしまった潜在的なタンパク質のプロセシングを識別するために分析されることを全て必要とする。この方式において、同じタンパク質の多数のペプチドが、分析される際に、冗長な情報が、得られる。ペプチドの試料の複雑さを低減するための異なる方法を、記載してある。たとえば、システインを含むペプチドのみを、還元された(reduced)システインのチオール基に対して反応性のものであると共に標識付けされたシステインを含むペプチドを単離するためのタグを担持するものである標識付けの試薬を使用することで、単離することができる。しかしながら、いくつかのタンパク質は、他のものが一つと比べてより多いシステインを有する一方で、全くシステインを有するものではない。このように、システインの標識付けは、制限された程度までのみ、情報を失うことなくタンパク質当たり一つのペプチドまで試料の複雑さを低減することができる。
本発明に従って、タンパク質当たり一つのペプチドまでの一つの又はより多くの試料の複雑さの低減は、開裂されたタンパク質の混合物からC末端のペプチドを選択することによって、達成される。C末端のペプチドの選択は、ある一定の利点を有する。N末端は、C末端と比べて生体内のタンパク分解性のプロセシングをより被りがちなものであるが、それは、どのN末端のペプチドが、開裂させられたタンパク質の試料に存在するものであることになるかを予言することを困難なものとする。加えて、N末端の多数の異なる修飾は、生体内のものか又はアセチル化、ホルミル化、及びピログルタミン酸への修飾によるもののようなタンパク質の試料の操作の結果としてのものかのいずれかで存在する。N末端のメチオニンプロセシング(“N−終端規則”)についての予言の方法にもかかわらず、それは、必ずしも常に、タンパク質の本物のN末端のアミノ酸を予言するものではない。さらには、N末端は、しばしば、(経膜的な輸送配列についてのもののような)シグナル配列を含有するが、それらは、保存されると共にN末端のペプチドの配列をC末端のものと比べてあまり情報を与えるものではないものとする。また、代替のスプライシングのおかげでタンパク質の配列における差異は、C末端の部分におけるものと比べてタンパク質のN末端の部分でより頻繁に起こる。
それに応じて、本発明の方法は、試料における開裂させられたタンパク質のC末端のペプチドを選択するステップを含む。修飾されたタンパク質の開裂の際に、元来のタンパク質のカルボキシル基が、開裂に先立つ修飾ステップにおいて修飾された一方で、そのタンパク質のN末端のペプチド及び全ての内部のペプチドは、新しいカルボキシル基を得る。新しく発生させられたカルボキシル基は、カルボキシル基を通じてマトリックスへ直接的にこれらのペプチドを結び付けることによってか又はアフィニティーマトリックスにおけるアフィニティータグが付けられたペプチドの単離によって後に続けられたアフィニティー標識とカルボキシル基を反応させることによってかのいずれかで、混合物からのN末端の及び内部のペプチドの取り除きに使用される。C末端のペプチドを単離するための方法は、例えば、米国特許第6,156,527号明細書(Schmidt)、米国特許出願公開第2006/134724号明細書(Fischer)、及び米国特許出願公開第2002/0106700号明細書(Foote)において記載される。N末端のペプチド及び内部のペプチドを、修飾されたC末端のペプチドとの電荷における差異を活用するものである、イオン交換体においてカルボキシル基を介して可逆的に結び付けることができる。あるいは、N末端の及び内部のペプチドは、上に本発明のカルボキシル修飾ステップ(第一の方法のステップ)の文脈に記載したもののようなカルボキシルの反応性の基で官能化されたマトリックスへ結び付けられる。本発明の方法におけるC末端のペプチドの単離の別の代替の実施形態は、N末端の及び内部のペプチドのカルボキシル基へのアフィニティータグの共有結合的な又は非供給結合的な結び付きを伴う。適切なアフィニティータグは、d−ビオチン又は構造的に修飾されたビオチンに基づいた試薬、1,2−ジオール類、ジニトロフェニルのようなハプテン、又は、ヘキサヒスチジンのような遷移金属に結び付くものであるリガンド、又はグルタチオンを包含するが、それらに限定されるものではない。
本発明の方法の特定の実施形態において、試薬のカルボジイミドEDCは、内部の及びN末端のペプチドのカルボキシル基と(例えば図3に描かれたもののような)NH2基を含むビオチン分子を反応させるために使用される。
本発明の方法のさらなるステップにおいて、一つの試料又は二つの若しくはより多くの貯留された試料の単離されたC末端のペプチドは、一つの又はより多くのペプチドの分離技術にかけられる。
適切な分離技術は、それは、多重のフラクションへの複雑なペプチドの試料の分離を可能にするが、当業者に知られたものであると共に、等電位のフォーカシング、陰イオン又は陽イオン交換クロマトグラフィー、逆相HPLC、イオン対逆相クロマトグラフィー、アフィニティークロマトグラフィー、…などを包含するが、しかし、それらに限定されるものではない。原則として適切なものであるとはいえ、SDS PAGE、2次元のゲル電気泳動、サイズ排除クロマトグラフィーのような技術は、本発明の方法において単離されたものであると、一般に限定された長さのC末端のペプチドの分離にあまり適当なものではない。
逆走(RP)−HPLC及び2次元液体クロマトグラフィーを包含する、液体クロマトグラフィーによってペプチド消化物を分離するための数個の技術を記載してきた。タンパク分解性の消化から得られたペプチド試料について、2D−LCアプローチは、自動化及びスループットに関してまた顕著な利点を提供するものである、分離に特に適切なものである。また毛細管の電気泳動(CE)は、ペプチドの分離に適切な方法である。
2D−LCは、一般に、一連のサイクルで動作させられた、逆相カラムと直結で結合させられたイオン交換カラム(通常では、強い陽イオン交換,SCX)を使用する。各々のサイクルにおいて、塩の濃度は、逆相システムへとそれらのイオンの電荷に従ってペプチドを溶出させる為には、イオン交換カラムにおいて増加させられる。ここにおいて、ペプチドは、例.CH3CNでの勾配によって、疎水性に分離される。
多数のパラメーターは、分解能に、及び、その後に、LC−MSによって表示することができるものであるタンパク質の数に、影響する。通常では、一次元目の分離技術(SCX)と二次元目のRP−HPLC分離のアプローチの間の‘直結の’構成は、試料の分画のためにセットアップされる。イオン交換クロマトグラフィーを、塩の濃度を増加させると共に階段状の溶出によって、又は、塩の勾配によって、行うことができる。典型的には、SCXは、SCXクロマトグラフィーの間における疎水性の相互作用を最小にするために、例.30%までのアセトニトリル、の存在下で行われる。例.C18カラムにおける、逆相クロマトグラフィーに先立ち、アセトニトリルのような有機溶媒は、取り除かれるか、又は、例.蒸発によって、強く低減される。
上に詳述したように、本発明の方法を、個々の試料のいずれかで行うことができるか、又は、異なるプロセシングステップによって、より詳しくは、上に記載されたペプチドの分離の方法によって、導入された変動性を回避するための二つの若しくはより多くのタンパク質の試料の同時の分析において使用することができる。異なる試料に由来する同一のペプチドの間で弁別するために、異なる選択肢は、予見される。
本発明の方法の第一の実施形態に従って、当該発明の第一のステップにおける無処置のタンパク質のカルボキシル基の修飾は、検出可能な標識とタンパク質のカルボキシ末端を反応させることによって、差異的な標識付けのステップとして使用される。一度異なる試料のタンパク質の差異的な標識付けが行われると、試料を、貯留することができると共に、さらなるプロセシングが、貯留された試料で起こる。あるいは、試料を、個々に加工すると共に分析に先立ち貯留することができる。しかしながら、二つの又はより多くの開裂させられた差異的な標識付けされたタンパク質の試料の比較のプロテオーム解析において、試料は、理想的には、ペプチド分離技術によって導入された試料の間の変動性を制限するための手順において可能な限り早く貯留される。その次に、同じペプチドの差異的に標識付けされたバージョンは、異なる試料の間の個々のペプチドの濃度を正確に比較するためにMSにおいて一緒に分析される。
異なる標識を、同じアミノ酸配列を備えたペプチドを弁別するために使用することができる。しかしながら、分離及びMS分析の後で対応するペプチドの識別を容易にする為に及び複雑なデータベースを発生させる必要があることを回避する為には、差異的に標識付けられたペプチドが、MSにおいて差異的な信号を発生させる一方で、クロマトグラフィーの分離システムにおいて類似して挙動することになるように、化学的な構造において同一なものである標識を使用することは、関心のあることである。
本発明の方法の特定の実施形態において、異なるタンパク質の試料は、同位体の標識で標識付けされる。同位体の標識は、同位体で標識付けされた同一のペプチドが、タンパク質の精製システムにおいて本質的に同一に挙動するが、しかし、MSにおいて差異的に挙動するように、同一の化学的な構造を有する。
適切な同位体の標識付けの薬剤の例は、Cygi et al.(1999)Nat.Biotechnol.17,994−999及び米国特許第6,852,544号明細書に記載されたようないわゆるICAT試薬の標識を包含する。現在では、二つの異なる標識付けの試薬は、商業的に入手可能なものであるが、それらは、SHに反応性のものであると共にビオチンアフィニティータグを含有する。米国特許第6,852,544号明細書は、同位体の標識付けする基に連結された、COOHに反応性の基の組み合わせを開示するが、それらは、COOH末端において開裂させられてないタンパク質を標識付けすることに適切なものである。ビオチンタグのようなアフィニティータグは、本発明において必要とされるものではない。ペプチドの選択は、N末端の及び内部のペプチドのカルボキシル基で行われる。
あるいは、タンパク質の試料の差異的な標識付けを、修飾ステップと付随して保証することができる。この実施形態に従って、2H、13C、15N、17O、18O、又は34Sのような一つの又はより多くの同位体を含む、上に記載されたようなカルボキシル基の修飾に使用された試薬は、また、同位体の標識付けに適切なものである。例は、メチルアミン及びメチルアミン−(d3)又はエチルアミン及びエチルアミン−(d5)を包含する。
さらなる実施形態に従って、本発明の方法におけるタンパク質の試料の差異的な標識付けは、開裂の際に発生させられたC末端のペプチドの新しく発生させられたアミノ末端における標識付けとして行われる。(内部の)リシンにおける同時の標識付けを回避するために、タンパク質を、例.開裂に先立ち無水酢酸のようなアルキル化剤で、修飾することができる。この実施形態に従って、試料の差異的な標識付けは、開裂のステップの後で、及び、自由選択でC末端のペプチドの単離の後で、行われる。
N末端の標識付けに適切なものである標識付けの基は、2−tert−ブチルオキシ−カルボニルアミノ−2−フェニルアセトニトリル[BOC−ON]−(d0)若しくは−(d9)、アセチル=クロリド−(d0)若しくは−(d3)、ベンゾイル=クロリド−(d0)若しくは(d5)、又は無水酢酸−(d0)若しくは−(d6)を包含する。
米国特許第6,852,544号明細書に開示された等しく全てのNH2に反応性のICAT標識付け試薬は、アフィニティー標識と共に、しかし通常では、それ無しに、いずれかであるが、本発明において単離されたC末端のペプチドの同位体の標識付けに適切なものである。
C末端のペプチドのN末端の標識付けを、それが、N末端の及び内部のペプチドのC末端に基づいたものである、精製と干渉するものではないので、C末端のペプチドの単離の前に又は後に行うことができる。しかしながら、標識付けが、単離に先立ち行われるとき、カルボキシル基は、標識付けの試薬に存在するものではないことがある。
本発明の方法は、ペプチドのデータベースのものとペプチドの物理化学的な特性についてのデータを比較することに基づいたものである識別ステップを含む。
それに応じて、本発明の方法の一つの又はより多くの分離ステップで得られた各々のペプチドのフラクションについて、例.クロマトグラフィーの間における、一つの又はより多くの分離ステップにおけるペプチドの挙動に関係する、データは、収集されると共に記憶される。このようなデータは、たとえば、精製が行われたところのpH、ペプチドが逆相カラムから溶出するところの有機溶媒の百分率、ペプチドがイオン交換マトリックスから溶出するところの与えられたpHでの塩の濃度、与えられたpHでのある一定の樹脂へのペプチドの結び付き(又は結び付き無し)、などを包含する。
加えて又は代わりに、さらなるデータを、本発明の方法においてペプチドの分離及び精製のステップから必ずしも直接的に得られないものである、各々のペプチドについて収集することができる。それに応じて、各々のペプチドについて、単離されたペプチドのフラクションを、精製の間に決定されないものである性質を決定するためのアッセイを行うために記憶することができる。このようなアッセイは、例えば、溶解度の決定、水/有機溶媒のシステムにおける分配係数、特異的なアミノ酸の側基(例.−OH、−SH、−NH2)の検出を包含するが、しかし、それらに限定されるものではない。
本発明のさらなるステップにおいて、上に記載したように単離されてしまったものであるC末端のペプチドのフラクションは、質量分析によって分析される。二つの又はより多くの試料が、同時に分析される場合には、ペプチドのフラクションは、差異的に標識付けされるものである、同一のC末端のペプチドを潜在的に含有することになる。あるいは、関連性のあるタンパク質が、試料の一つのもの又はより多くのものにおいてタンパク分解性の生体内のプロセシングをうけてしまってある場合には、同じ親のタンパク質に対応するC末端のペプチドは、MSにおいて別個に分析されるものである異なるフラクションにおいて溶出することがある。
MSのスペクトルにおける試料に存在するものである親のタンパク質に対応するC末端のペプチドの識別は、高分解能の質量分析計の高い質量の確度によって達成される。分光法による質量の測定は、気相への分析物のイオン化によって行われる。イオン化された分子の質量対電荷比(m/z)は、決定されると共に、各々の個々のm/zの値についてのイオンの数は、計数される。このように、MSスペクトルにおける各々の特徴は、二つの値、m/z及び検出されたイオンの数についての尺度、によって定義される。
本発明の方法のさらなるステップにおいて、C末端のペプチドの実験的な決定された質量は、データベースにおいてコンピューター内で発生させられたペプチドの質量と比較される。
ペプチドの質量は、それのアミノ酸組成物と相関させられる。しかしながら質量だけに基づいて、ペプチドを積極的に識別することは、必ずしも常に可能なことではない。たとえば、質量だけは、同じアミノ酸組成物をしかし異なる配列(A1−A2−A3−A4−A5対A5−A1−A2−A3−A4)を有するペプチドの間で弁別することを可能にするものではないことになる。さらには、ある一定の質量は、異なる配列を有するペプチドのセットに対応することができる。例えば、より長い側鎖を備えたアミノ酸を備えた短いペプチドは、より短い側鎖を備えたアミノ酸を有するものであるより長いペプチドと同じ質量を有することができる。
選択が、開裂させられたタンパク質のペプチドについて行われないとき、トリプシンのペプチドの質量は、ある一定の生体のプロテオームのコンピューター内の消化物の質量の全てと相関させられる。
本発明において記載されたようなC末端のペプチドの単離を使用することで、タンパク質の試料から得られたペプチドの数は、強く低減される。それに応じて、コンピューター内のトリプシンのペプチドのデータベースは、C末端のペプチド(いわゆるC末端のデータベース)のみを含有することを必要とする。
既存のタンパク質及び配列のデータベースを、いずれの生体のプロテオームにも対応するデータベースを発生させるための基礎として使用することができる。生体の今まで増加するリストについて、完全なゲノム、及びそれから推論されたプロテオームは、知られたものである(www.ncbi.nlm.nih.gov/genomes)。このように、コンピューター内のペプチドのデータベースを、発生させることができるが、それにおいては、タンパク質の開裂及びペプチドの単離は、シミュレーションされる。開裂剤の効率に依存するものであるが、データベースは、ペプチドを含有することができるが、それにおいては、開裂は、不完全なものである。
本発明の事情に適切なC末端のデータベースにおいて、各々の項目は、親のタンパク質の名前及び対応するC末端のペプチドの質量を包含する。各々の項目について、またアミノ酸組成物は、天然の翻訳後の修飾(例.セリン、スレオニン、及びチロシンにおけるホスホリル化)、試料の処理(例.アスパラギン及びグルタミンのアミド分解)、又は、タンパク質の修飾/標識付け及びC末端のペプチドの単離の間に導入された修飾によって引き起こされた質量の差異を計算するために、重要なものである。各々のタンパク分解性の酵素について、修飾されてないC末端のペプチドの質量を含む単一の主たるデータベースは、開裂の前に及び後に導入された修飾のタイプに依存するものであるが、質量を再計算するために使用される。加えて、潜在的な翻訳後の修飾は、それが、存在するものであることがあること又は存在しないものであることがあるが、データベースにおいてペプチドの質量を計算することによって、また考慮に入れられる。加えて、標識の使用が、予見される場合には、ペプチドの各々の質量における標識の影響を、組み込むことができる。
にもかかわらず、インフルエンザのタンパク質の小さいセットについて米国特許第6,846,679号明細書に示されたように、実験的なC末端のペプチドの質量は、対応するC末端のデータベースにおける異なるペプチドに対応することができる。このように、このようなデータベースは、そのペプチドの質量についてのみC末端のペプチドの親のタンパク質を識別するために必ずしも十分に情報を与えるものではない。それに応じて、本発明は、m/zの比のだけでなく長さ(アミノ酸の数)、アミノ酸配列、重量、疎水性、等電点、などのような追加的な特性を包含するものに基づいたC末端のペプチドの識別を提供する。
当該発明の特定の実施形態に従って、C末端のペプチドのデータベースは、特異的な開裂剤のプロテオームに対応すると共に、これは、与えられたスピーシーズについて、試料の起源に対応するものである。このようなペプチドのデータベースは、また、注釈が付けられたスプライスの変異体を包含する。本発明の方法に使用されたコンピューター内のペプチドのデータベースは、アミノ酸における長さ、アミノ酸配列、分子量、疎水性、等電点、などと同様のC末端のペプチドの計算された特性を包含する。
上に示唆したように、生体内の源から来るタンパク質が、しばしば、例.アセチル基、ホルミル基、又はピログルタミン酸残基を通じて、翻訳後に修飾されることは、考慮に入れられる必要があるが、それらの全ては、質量スペクトルにおける決定されたm/zにおいて影響を有することになる。それに応じて、本発明の一つの実施形態において、合成のC末端のペプチドは、コンピューター内の計算されたペプチドの特性を有効にするための参照標準として使用される。
合成のペプチドのライブラリーからの情報は、質量分析のペプチドのピークの本性の識別を容易にするために使用されるが、それによって自由選択で新規の配列決定を未然に防ぐものである。識別は、コンピューター内のペプチドのライブラリーに記憶された利用可能な情報と比較されたHPLCの保持時間、等電点、及び質量の特異的なm/zの値と同様に測定された特性に基づいたものであることになる。
C末端のペプチドのm/zのデータとの組み合わせで親のタンパク質の積極的な識別を可能にするものである、異なるタイプの物理化学的なデータは、考慮される。
予見されたデータの一つのタイプは、等電点、異なるpHの値における正味の電荷、RP HPLCにおける保持時間、214及び280nmにおけるUV吸収、与えられたpH及び塩の濃度、疎水性、並びに親水性でイオン交換カラムから溶出する傾向のような、配列の情報から予言されるものである及び/又はペプチド精製ステップ及びMSの間に測定することができるものであるデータである。
疎水性を、例えば、Bull and Breese(1974)Arch.Biochem.Biophys.161,665−670のアルゴリズムによって計算することができる。等電点を、例えば、www.expasy.ch/tools/pi_tool.htmlについて計算することができる。逆相カラムにおける保持時間は、例えば、Krohkin et al.(2004)Mol.Cell.Proteomics 3,908−919の方法に従って予言される。
上に示唆したように、本発明の事情において使用されたデータベースは、加えて又は代わりに、溶解度、水/有機溶媒の二相の系にわたる分配、タンパク質に反応性の基(OH、NH2、SH)の検出のためのアッセイ[イオン化ポテンシャル、双極子モーメント、水素結合する能力、及び気相におけるイオンの移動度]についてのデータのような、しかし、それらに限定されるものではない、追加的な実験で得られた及びペプチドの精製から必ずしも直接的に誘導されたものではないデータを含む。
それに応じて、注釈が付けられたC末端のデータベースとの比較に基づいた識別を提供するものである本発明の方法は、増加させられた確度を備えた対応する親のタンパク質の識別を可能にする。
自由選択で、本発明の事情において使用されたC末端のペプチドのデータベースは、親のタンパク質を識別することをさらに助けるものである、親のタンパク質の表現のパターンについての情報などをさらに含む。親のタンパク質が、それらの末端のペプチドからのものを除いてアミノ酸配列において異なる場合には、注釈が付けられたC末端のペプチドのデータベースにおける対応する項目は、同一の質量及び同一の物理化学的な性質を備えたC末端のペプチドを示唆することになる。にもかかわらず、生体の発達の間における親のタンパク質の可能性のある差異的な表現又は組織の特異的な表現における詳細を伴ったものの項目のさらなる注釈付けは、単離されたC末端のペプチドへの正しい親のタンパク質の帰属を可能にすることができる。実に、タンパク質の試料の源に依存することで、異なる可能性のある親のタンパク質、その表現が試料のものと調和するもの、から選択することは、可能性のあるものであることがある。
本発明の方法において、各々のペプチドについて、注釈が付けられたC末端のペプチドのデータベースと比較された質量は、計算される。それに応じて、単離されたペプチドの測定された質量に対応するものである計算された質量を有するものであるそれらの項目は、選択される。MS装置及び試料のタイプに依存するものであるが、モノアイソトピック質量との又は平均の質量との比較は、行われる。
モノアイソトピック質量が、使用されるとき、典型的には0.1質量単位の測定の誤差は、データベースから項目を選択するために包含される。平均の質量が、使用されるとき、典型的には1Daの測定の誤差は、データベースから項目を選択するために包含される。測定された質量が、データベースにおけるただ一つの項目と対応するとき、親のタンパク質は、直ちに識別される。
測定された質量が、データベースにおいて一つと比べてより多い項目に対応するとき、全てのこれらの項目は、部分集合として選択される。さらなる識別は、データベースにおける項目の部分集合についてのものとの単離されたペプチドの物理化学的なパラメーターの比較に基づいて行われる。典型的には、ペプチドの精製ステップから直接的に誘導することができるものであるそれらの物理化学的なパラメーターは、最初に考慮される。特定の実施形態に従って、少なくとも三つの物理化学的な特性は、考慮されると共に識別は、“最良適合”分析に基づいて行われる。一つの追加的なパラメーターが考慮されるとき、たいてい選抜されるものであるパラメーターは、同じ質量を備えたC末端のペプチドのデータベースにおけるペプチドのセット内のそのパラメーターのパワーを弁別することに依存する。例えば、C末端のペプチドのデータベースにおけるペプチドが、異なる量の芳香族のアミノ酸を有するとすれば、214及び280nmにおけるUV吸収を、選択の判定基準として使用することができる。別の例において、同じm/zの比を備えたデータベースにおける3個のペプチドのセットにおいて、これらの全てが、同じ正味の電荷を有するが、しかし、電荷の分布が、異なるものである(例.一つのペプチドが、帯電したアミノ酸を有するものではないが、別のものが、一つのArg及び一つのAspを有すると共に別のものが二つのArg及び二つのAspを有する)とすれば、イオン交換における挙動を、データベースの部分集合における一つの具体的なペプチドと単離されたペプチドを相関させるための判定基準として使用することができる。
本発明のさらなる態様は、本発明の方法を実行することに適切なデバイス及び機器を提供する。
MS分析に先立ち、本発明の方法は、多くのタンパク質のプロセシングのステップ(タンパク質の修飾、タンパク質の開裂)並びに単離及び精製のステップ(C末端のペプチドの単離、単離されたペプチドの分離)を含む。それに応じて、本発明の方法を実行することに適切なデバイスは、試薬(修飾剤、開裂剤)の対応する源並びに分離及び単離ユニット(典型的には、クロマトグラフィーユニット)を備えた、適当な反応チャンバーを含む。個々のC末端のペプチドの適当な分離が、しばしば、配列の分離技術を要求すると、本発明の方法を行うことに適切なデバイスは、自由選択で、毛細管電気泳動(CE)の機器、逆相(RP)−HPLCの機器、及び/又は、2次元の液体クロマトグラフィー機器、…などのような、しかし、それらに限定されるものではない、電気泳動の機器、クロマトグラフィーの機器のような、二つの又はより多くの適切な分離機器を含有する又はそれらに接続される。
本発明の方法の本質的な特徴は、単離されたC末端のペプチドの質量の決定である。それに応じて、本発明の方法を行うためのデバイスは、質量分析の機器を含む。典型的な質量分析の機器は、3つの構成部品、関心のある分子を気化させる為のイオン源、イオン化された分子の質量対電荷の比(m/z)の尺度を決定するものである、質量分析器、及び、各々の個々のm/zの値についてイオンの数を登録すると共に計数するものであるセンサーからなる。MSスペクトルにおける各々の特徴は、機器の検出器に到達したものである、二つの値、m/z及びイオンの数についての尺度、によって定義される。
分光計における質量分析のためのタンパク質又はペプチドのイオン化は、通常では、エレクトロスプレーイオン化(ESI)又はマトリックスで補助されたレーザー脱離/イオン化(MALDI)によって行われる。ESIプロセスの間に、分析物は、溶液の外で直接的にイオン化されると共に、従って、ESIは、しばしば直接的に、液体クロマトグラフィーの分離ツール(例.逆相HPLC)へ結合させられる。MALDIは、プロセスをより有効なものとするために桂皮酸と同様の、レーザーエネルギーを吸収するものである小さい有機分子と混合させられた乾燥した試料を、レーザーパルスを介して、気化させる。
質量分析器は、質量分析計の鍵となる構成部品である;重要なパラメーターは、感度、分解能、及び質量の確度である。あるものは、プロテオミクスにおいて現行で使用された五つの基本的なタイプの質量分析計である。これらは、イオントラップ、タイムオブフライト(TOF)、四重極子、Orbitrap、及び、フーリエ変換イオンサイクロトロン(FTIR−MS)分析器を包含する。タンデムMS又はMS/MSを、(例.LTQ−FTICR、LTQ−Orbitrap、Q−TOF、TOF−TOF、トリプル四重極型の及びハイブリッドトリプルの四重極子/線形のイオントラップ(QTRAP)のような全てのハイブリッド機器で)時間内に(イオントラップ)及び適所で行うことができる。
当該発明の特定の実施形態は、少なくとも二つの試料の源(101)、対応する修飾剤/標識源(103)を備えた、修飾/標識付けユニット(102)、開裂ユニット(104)、C末端のペプチドの単離ユニット(105)、ペプチド分離ユニット(106)、質量分析計ユニット(108)、並びに、読み出しユニット(110)に接続された、制御回路及びデータ分析ユニット(109)、を含む、C末端のペプチドのタンパク質の試料を単離すると共に分析するためのデバイス(100)に関係する。デバイスを、開裂させるステップに先立ち(貯留された試料は、開裂ユニットに入る)又は開裂させるステップの後で(試料は、個々に開裂ユニットを通過する)試料の貯留を保証するように構成することができる。特定の実施形態において、分離ユニット(106)は、二つの連続的に連結された分離システム(1106)及び(2106)を含むが、それにおいては、第一の分離システム(1106)は、例.陽イオン交換クロマトグラフィーシステム及び分離システムであると共に、第二の分離システム(2106)は、典型的には、HPLC逆相システムである。質量分析計の素子(108)は、ペプチドの同位体の形態を分離するものである、ユニットからなる。
当該発明のデバイスの特定の実施形態は、分析ユニット(107)をさらに含むが、それにおいては、精製されたペプチドの一つの又はより多くの物理化学的な性質は、決定される及び/又は登録される。ペプチドの実験的な質量並びに精製の間に得られた及び分析ユニットにおいて自由選択で得られたそれの物理化学的な性質におけるデータは、(図4において点線によって示唆された)C末端のペプチドの注釈が付けられたデータベース(111)と比較される。
例
例1:C末端のペプチドの単離
C末端のペプチドの単離のフリーチャートは、図1に概略が描かれる。
例1:C末端のペプチドの単離
C末端のペプチドの単離のフリーチャートは、図1に概略が描かれる。
タンパク質の抽出物は、標準的な方法を使用することで組織から単離される。システインの側鎖は、アルキル化されると共に、N末端におけるアミン及びリシンの側鎖は、アセチル化される。次のステップにおいて、(グルタミン酸及びアスパラギン酸における反応性のカルボキシル基のみならず)C末端のアミノ酸の遊離のカルボキシル基は、Grabarek&Gergely(1990)Anal Biochem.185,131−135に記載されたような方法に従った1−エチル−3−[3−ジメチルアミノ−プロピル]カルボジイミド塩酸塩(EDC)又は1−エチル−3−(3−ジメチル−アミノプロピル)−カルボジイミド(EDAC)によって活性化される。
EDCは、アミンに反応性のO−アシルイソウレアの中間体を形成するものである、タンパク質(図2における分子1)におけるカルボキシル基と反応する。この中間体は、安定なアミン結合によって結ばれた二つの分子の共役体を生ずるものである、NH−R(図2における分子2)におけるアミンと反応することがある。しかしながら、中間体は、また、それを水性の溶液において不安定なもの及び短寿命のものとするものである、加水分解を受けやすいものである。スルホ−NHS(5mM)の追加は、それをアミンに反応性のスルホ−NHSエステルへと転換することによってアミンに反応性の中間体を安定化させるが、このようにEDCに媒介されたカップリング反応の効率を増加させるものである。アミンに反応性のスルホ−NHSエステルの中間体は、二つのステップの架橋する手順を許容するために十分な安定性を有するが、それは、一つのタンパク質におけるカルボキシル基が変えられてないままであることを可能にする。EDCで活性化されたCOOH基は、アミノ基を含有する分子,NH2−Rにカップリングさせられる。NH2−Rは、分子であることができるが、それは、この点順の間に正の電荷を簡単に引き寄せることによってC末端のペプチドのイオン化のプロセスを改善する。他方においては、反応性の分子は、いずれのさらなるカルボキシル基をも含有するものであってはならない。本例においては、NH2−Rは、同位体で標識付けすることができるものであるエチルアミンである。
その後、タンパク質の試料は、ペプチドの混合物を発生させるためにトリプシンで酵素的に消化される。
C末端のペプチドが、上述した反応によって、修飾されたカルボキシル基を有する一方、消化物におけるN末端の及び内部のペプチドは、遊離のC末端のアミノ酸を含有する。
内部の及びN末端のペプチドの遊離のC末端のカルボキシル基は、ビオチンのアフィニティークロマトグラフィーを介して単離される。このステップは、内部の及びN末端のペプチドの分離に至ると共に、溶液にC末端のペプチドを放置する。反応は、上に記載されたカルボジイミドで媒介された反応によって行われるが、それにおいては、R−NH2は、図3に示されたような修飾されたビオチンである。
ペプチドの消化物のC末端のペプチドを除く全てのペプチドは、これらのペプチドの選択的なアフィニティーの欠乏によって溶液から取り除かれる。溶液にあるものである非常にC末端のペプチドは、質量分析法の分析が後に続けられた(多)次元の液体クロマトグラフィーによってさらに分取される。
例2:類似の質量でのペプチドの識別
本例は、追加的なパラメーターを備えたペプチドの質量データを補充することの必要性を示す。Prosite(www.expasy.org/prositeにおけるScan Prosite)におけるモチーフサーチから、可能性のある臨床的な関連性のあるヒトのタンパク質の8個のアミノ酸のC末端のトリプシンのペプチド、すなわち、Exostosin 2の配列SFPNIGSL[SEQ ID.NO:1]を、選抜した。
本例は、追加的なパラメーターを備えたペプチドの質量データを補充することの必要性を示す。Prosite(www.expasy.org/prositeにおけるScan Prosite)におけるモチーフサーチから、可能性のある臨床的な関連性のあるヒトのタンパク質の8個のアミノ酸のC末端のトリプシンのペプチド、すなわち、Exostosin 2の配列SFPNIGSL[SEQ ID.NO:1]を、選抜した。
SEQ ID.NO:1(833.94)の計算された平均の質量を、理論的な値の1Daにおけるものの内で計算された質量を備えたProfound(prowl.rockefeller.edu)のペプチドで識別するために使用した。これを、部分的な開裂の無いことを可能にするものであるヒトのタンパク質のコンピューター内のトリプシンの消化を行うこと及びC末端のものであるところの多くのペプチドを選択することによってした(表1を参照のこと)。
表1:関係付けられた質量を備えたC末端のペプチドの質量及び物理化学的なパラメーター
4)芳香族のアミノ酸の数
5)疎水性のアミノ酸の数
6)親水性のアミノ酸の数
7)逆相におけるペプチドの保持時間は、(パラメーターa=10及びB=0.48を備えた)http://hs2.proteome.ca/SSRCalc/SSRCalc.htmlに計算される
典型的には、ペプチドは、イオン交換クロマトグラフィー及び逆相HPLCの組み合わせによって分離される。塩の濃度が増加させられるところのイオン交換カラムを使用することで、ペプチドは、それらの等電点に従って溶出する。上記のペプチドのpIに基づいて、それらは、三つのフラクション(SEQ ID.NO:1及びSEQ ID.NO:2、SEQ ID.NO:3及びSEQ ID.NO:4及びEQ ID.NO:5)として溶出することになるが、それにおいては、緩衝剤のpHに最も近いpIを備えたペプチドは、最初に溶出することになる。逆相クロマトグラフィーの際に、SEQ ID.NO:1及びSEQ ID.NO:2は、それらが、異なる量の親水性の及び疎水性のアミノ酸を有するので、異なる位置で溶出することになる。RP−HPLCにおけるタンパク質の検出に典型的には使用されるものである280nm及び214nmにおけるUV吸収に基づいてSEQ ID.NO:2からSEQ ID.NO:1及びSEQ ID.NO:4からSEQ ID.NO:3を弁別することは、また非常に簡単なことである。SEQ ID.NO:2及び3を備えたペプチドは、それらが、280nmでUV光をほとんど吸収するものではないことになると、簡単に認識される。
Claims (17)
- タンパク質の試料におけるタンパク質を識別するための方法であって、
a)前記タンパク質の試料における前記タンパク質のカルボキシル基を修飾すること、
b)開裂剤で前記タンパク質の試料における前記タンパク質をペプチドへと開裂させること、
c)前記ペプチドから、N末端の及び内部のペプチドからのC末端のペプチドを単離すること、
d)精製されたC末端のペプチドを得るように、一つの又はより多くのペプチドの精製ステップに前記単離されたC末端のペプチドをかけること、
e)前記精製されたC末端のペプチドの、質量以外の、少なくとも一つの物理化学的な性質を決定すること又は計算すること、
f)MSにおいて精製されたC末端のペプチドの質量を決定すること、
g)前記精製されたC末端のペプチドの親のタンパク質を識別するように、前記開裂剤によって発生させられた全てのC末端のペプチドの質量及び一つの又はより多くの物理化学的な性質を含むデータベースと前記精製されたC末端のペプチドの前記質量及び前記少なくとも一つの他の物理化学的な性質を比較すること
:のステップを含む、方法。 - 請求項1に記載の方法において、
ステップ(g)は、前記精製されたC末端のペプチドの各々について、前記精製されたC末端のペプチドに対応する質量を備えたデータベースにおいて一つの又はより多くのC末端のペプチドを識別すること、及び、
一つと比べてより多いペプチドが、一つの精製されたC末端のペプチドについて識別されるとき、前記データベースにおいて識別された前記一つと比べてより多いペプチドと前記精製されたC末端のペプチドの物理化学的なパラメーターを比較すること
を含む、方法。 - 請求項1に記載の方法において、
前記タンパク質の試料は、スピーシーズからのものであると共に、
前記データベースは、前記開裂剤によって発生させられたそのスピーシーズの全てのC末端のペプチドの質量及び物理化学的な性質を含む、方法。 - 請求項1に記載の方法において、
前記タンパク質は、二つの又はより多くの試料において同時に識別されると共に、
前記方法は、
− ステップ(a)において、差異的な標識付けの試薬のセットで修飾を行うこと
− ステップ(d)に先立ち、二つの又はより多くの試料を貯留することの追加的なステップ、
− ステップ(f)に先立ち、前記試料を識別するように標識の本性を識別すること、前記ペプチドが、前記試料に由来すること、
− ステップ(g)において、前記C末端のペプチドを識別するように、前記開裂剤によって発生させられた全てのC末端のペプチドの質量及び物理化学的な性質を含むデータベースと前記精製されたC末端のペプチドの前記質量及び前記少なくとも一つの他の物理化学的な性質を比較すること
を含む、方法。 - 請求項1に記載の方法において、
前記少なくとも一つの物理化学的な性質は、前記一つの又はより多くのペプチドの精製ステップの間に決定される、方法。 - 請求項1に記載の方法において、
前記少なくとも一つの物理化学的な性質は、pI、逆相クロマトグラフィーの間の保持時間、並びに、280nm及び214nmにおけるUV吸収の比の群より選択される、方法。 - 請求項1に記載の方法において、
ステップ(a)における修飾は、第一級アミンとのカルボジイミド反応を使用することで行われる、方法。 - 請求項1に記載の方法において、
ステップ(c)におけるC末端のペプチドの単離は、第一級アミンの基を担持する修飾されたビオチンとのカルボジイミドで媒介された反応を介してN末端の及び内部のペプチドのカルボキシル基を反応させることのステップを含む、方法。 - タンパク質の試料からC末端のペプチドを単離するための方法であって、
a)第一級アミンとカルボジイミドを介して無処置のタンパク質のカルボキシル基を反応させること、
b)開裂剤で前記無処置のタンパク質をペプチドへと開裂させること、
c)第一級アミンの基を担持するアフィニティータグとカルボジイミドを介してN末端の及び内部のペプチドのカルボキシル基を反応させること、
d)親和性マトリックスへ前記タグが付けられたペプチドを結び付けること及び結び付けられてないペプチドを収集すること、前記結び付けられてないペプチドが、タグが付けられてないペプチドであること、それによって(b)の下で得られた前記ペプチドから、前記N末端の及び内部のペプチドからの前記C末端のペプチドを単離すること
:のステップを含む、方法。 - 請求項9に記載の方法において、
前記アフィニティータグは、ビオチンである、方法。 - 開裂剤によってコンピューター内で開裂させられた、生体のタンパク質のC末端のペプチドのデータベースにおいて、
各々のペプチドは、
− タンパク質の識別子、
− アミノ酸組成、
− 質量、及び
− 一つの又はより多くの物理化学的な性質
によって特徴付けられる、データベース。 - 請求項11に記載のデータベースにおいて、
の前記C末端のペプチドの前記一つの又はより多くの物理化学的な性質は、逆相クロマトグラフィーにおける計算された保持時間、与えられたpHにおける正味の電荷、及び前記C末端のペプチドの等電点からなる群より選択される、データベース。 - 請求項11に記載のデータベースにおいて、
前記生体は、ヒトである、データベース。 - 請求項11に記載のデータベースにおいて、
前記開裂剤は、トリプシンである、データベース。 - 請求項11に記載のデータベースにおいて、
前記タンパク質は、前記開裂剤での不完全な開裂から結果として生じるC末端のペプチドを含むと共に、それによって一つの開裂位置が、はずされる、
データベース。 - タンパク質の識別のための請求項11に記載のデータベースの使用。
- 一つの又はより多くの試料におけるタンパク質をそれらのC末端のペプチドに基づいて識別するためのデバイスであって、
前記デバイスは、少なくとも一つの試料源、少なくとも一つの対応する修飾する薬剤/標識源を備えた、修飾/標識付けのユニット、開裂ユニット、C末端のペプチドの単離ユニット、ペプチドの分離ユニット、精製されたペプチドの一つの又はより多くの物理化学的な性質を決定する及び/又は登録するための分析ユニット、質量分析計ユニット、制御回路部品及びデータ分析ユニット、及び、前記C末端のペプチドの物理化学的な性質で注釈が付けられた開裂剤を使用することでコンピューター内において開裂されたタンパク質の全てのC末端のペプチドの質量を含むデータベースへの接続を含む、デバイス。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP06120659 | 2006-09-14 | ||
PCT/IB2007/053541 WO2008032235A2 (en) | 2006-09-14 | 2007-09-03 | Methods for analysing protein samples based on the identification of c-terminal peptides |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010503852A true JP2010503852A (ja) | 2010-02-04 |
Family
ID=39144502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009527932A Pending JP2010503852A (ja) | 2006-09-14 | 2007-09-03 | C末端のペプチドの識別に基づいたタンパク質の試料を分析するための方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20100298153A1 (ja) |
EP (1) | EP2069797A2 (ja) |
JP (1) | JP2010503852A (ja) |
CN (1) | CN101517416A (ja) |
BR (1) | BRPI0716767A2 (ja) |
RU (1) | RU2009113801A (ja) |
WO (1) | WO2008032235A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013154208A1 (ja) * | 2012-04-10 | 2013-10-17 | 国立大学法人岐阜大学 | 獣毛の種類を特定し定量する方法 |
JP2014238343A (ja) * | 2013-06-07 | 2014-12-18 | 株式会社島津製作所 | 質量分析装置を用いたプログラニュリンおよびグラニュリンペプチドの定量分析方法、および分析用プログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK2274030T4 (da) * | 2008-05-02 | 2020-06-08 | Sanofi Aventis Deutschland | Lægemiddelafgivelsesanordning |
CN105651852A (zh) * | 2016-01-11 | 2016-06-08 | 南昌大学 | 一种利用质谱数据分析蛋白交联位点的方法 |
EP3816630A1 (en) * | 2019-10-30 | 2021-05-05 | Christian-Albrechts-Universität zu Kiel | Analysis of protein termini |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69817211T2 (de) * | 1997-01-23 | 2004-06-03 | Xzillion Gmbh & Co. Kg | Charakterisierung von polypeptiden |
US20020106700A1 (en) * | 2001-02-05 | 2002-08-08 | Foote Robert S. | Method for analyzing proteins |
CA2465297C (en) * | 2001-12-08 | 2011-02-15 | Micromass Uk Limited | Method of mass spectrometry |
-
2007
- 2007-09-03 BR BRPI0716767-9A2A patent/BRPI0716767A2/pt not_active Application Discontinuation
- 2007-09-03 EP EP07826241A patent/EP2069797A2/en not_active Withdrawn
- 2007-09-03 JP JP2009527932A patent/JP2010503852A/ja active Pending
- 2007-09-03 CN CNA2007800341019A patent/CN101517416A/zh active Pending
- 2007-09-03 RU RU2009113801/15A patent/RU2009113801A/ru unknown
- 2007-09-03 US US12/439,259 patent/US20100298153A1/en not_active Abandoned
- 2007-09-03 WO PCT/IB2007/053541 patent/WO2008032235A2/en active Application Filing
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013154208A1 (ja) * | 2012-04-10 | 2013-10-17 | 国立大学法人岐阜大学 | 獣毛の種類を特定し定量する方法 |
JPWO2013154208A1 (ja) * | 2012-04-10 | 2015-12-21 | 国立大学法人岐阜大学 | 獣毛の種類を特定し定量する方法 |
JP2014238343A (ja) * | 2013-06-07 | 2014-12-18 | 株式会社島津製作所 | 質量分析装置を用いたプログラニュリンおよびグラニュリンペプチドの定量分析方法、および分析用プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2008032235A2 (en) | 2008-03-20 |
WO2008032235A3 (en) | 2008-05-29 |
CN101517416A (zh) | 2009-08-26 |
US20100298153A1 (en) | 2010-11-25 |
EP2069797A2 (en) | 2009-06-17 |
RU2009113801A (ru) | 2010-10-20 |
BRPI0716767A2 (pt) | 2013-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guerrera et al. | Application of mass spectrometry in proteomics | |
Leitner et al. | Chemistry meets proteomics: The use of chemical tagging reactions for MS‐based proteomics | |
Hansen et al. | Mass spectrometric analysis of protein mixtures at low levels using cleavable 13C-isotope-coded affinity tag and multidimensional chromatography | |
Seidler et al. | De novo sequencing of peptides by MS/MS | |
EP1918714A1 (en) | Compounds and methods for double labelling of polypeptides to allow multiplexing in mass spectrometric analysis | |
IL152620A (en) | Affinity selected signature peptides for protein identification and quantification | |
JP2006317468A (ja) | 迅速かつ定量的なプロテオーム解析および関連した方法 | |
EP1617223A2 (en) | Serial derivatization of peptides for "de Novo" sequencing using tandem mass spectrometry | |
JP2010503852A (ja) | C末端のペプチドの識別に基づいたタンパク質の試料を分析するための方法 | |
Bakhtiar et al. | Mass spectrometry of the proteome | |
Leitner et al. | Chemical tagging strategies for mass spectrometry-based phospho-proteomics | |
WO2002059144A2 (en) | Differential labeling for quantitative analysis of complex protein mixtures | |
JP2003529605A (ja) | 高分子検出 | |
García-Murria et al. | Simple chemical tools to expand the range of proteomics applications | |
EP1916526A1 (en) | Method for diagnostic and therapeutic target discovery by combining isotopic and isobaric labels | |
Whiteaker et al. | Complete sequences of small acid‐soluble proteins from Bacillus globigii | |
US8097463B2 (en) | Use of arylboronic acids in protein labelling | |
US20080138909A1 (en) | Mass Spectrometry of Arginine-Containing Peptides | |
Goodlett et al. | Stable isotopic labeling and mass spectrometry as a means to determine differences in protein expression | |
Hansen et al. | Mass spectrometric analysis of protein mixtures at low levels using cleavable 13C-ICAT and multi-dimensional chromatography | |
Podtelejnikov et al. | Identification of yeast proteins by mass spectrometry | |
Dass | Recent developments in mass spectrometry analysis of phosphoproteomes | |
Speers et al. | Bottom-up mass spectrometry analysis of integral membrane protein structure and topology | |
Cagney et al. | Mass-coded abundance tagging for protein identification and relative abundance determination in proteomic experiments | |
Chakraborty | Comparative proteomics based on global internal standard labeling technology |