CN115004023A - 一种用于分析体液蛋白质组的方法 - Google Patents
一种用于分析体液蛋白质组的方法 Download PDFInfo
- Publication number
- CN115004023A CN115004023A CN202180009343.2A CN202180009343A CN115004023A CN 115004023 A CN115004023 A CN 115004023A CN 202180009343 A CN202180009343 A CN 202180009343A CN 115004023 A CN115004023 A CN 115004023A
- Authority
- CN
- China
- Prior art keywords
- data set
- sample
- proteome
- protein
- proteome data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010026552 Proteome Proteins 0.000 title claims abstract description 114
- 238000000034 method Methods 0.000 title claims abstract description 87
- 210000001124 body fluid Anatomy 0.000 title claims abstract description 34
- 239000010839 body fluid Substances 0.000 title claims abstract description 24
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 147
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 147
- 238000005516 engineering process Methods 0.000 claims abstract description 25
- 238000004458 analytical method Methods 0.000 claims abstract description 24
- 238000009388 chemical precipitation Methods 0.000 claims abstract description 18
- 102000007079 Peptide Fragments Human genes 0.000 claims description 44
- 108010033276 Peptide Fragments Proteins 0.000 claims description 44
- 210000002381 plasma Anatomy 0.000 claims description 28
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 claims description 24
- 238000000575 proteomic method Methods 0.000 claims description 14
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 claims description 13
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 claims description 12
- 239000012530 fluid Substances 0.000 claims description 8
- 230000001376 precipitating effect Effects 0.000 claims description 8
- 239000011347 resin Substances 0.000 claims description 8
- 229920005989 resin Polymers 0.000 claims description 8
- 210000001519 tissue Anatomy 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 claims description 6
- 239000003795 chemical substances by application Substances 0.000 claims description 6
- 239000007787 solid Substances 0.000 claims description 6
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 claims description 6
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 claims description 5
- 239000003960 organic solvent Substances 0.000 claims description 5
- 102100027211 Albumin Human genes 0.000 claims description 4
- 108010088751 Albumins Proteins 0.000 claims description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 claims description 4
- 108010049003 Fibrinogen Proteins 0.000 claims description 4
- 102000008946 Fibrinogen Human genes 0.000 claims description 4
- 102000014702 Haptoglobin Human genes 0.000 claims description 4
- 108050005077 Haptoglobin Proteins 0.000 claims description 4
- 102000004338 Transferrin Human genes 0.000 claims description 4
- 108090000901 Transferrin Proteins 0.000 claims description 4
- 229940012952 fibrinogen Drugs 0.000 claims description 4
- -1 polyethylene Polymers 0.000 claims description 4
- 238000011002 quantification Methods 0.000 claims description 4
- 210000002966 serum Anatomy 0.000 claims description 4
- 239000012581 transferrin Substances 0.000 claims description 4
- 102100022524 Alpha-1-antichymotrypsin Human genes 0.000 claims description 3
- 102100033312 Alpha-2-macroglobulin Human genes 0.000 claims description 3
- 108010059886 Apolipoprotein A-I Proteins 0.000 claims description 3
- 102000005666 Apolipoprotein A-I Human genes 0.000 claims description 3
- 108010087614 Apolipoprotein A-II Proteins 0.000 claims description 3
- 102000009081 Apolipoprotein A-II Human genes 0.000 claims description 3
- 108010056301 Apolipoprotein C-III Proteins 0.000 claims description 3
- 102000030169 Apolipoprotein C-III Human genes 0.000 claims description 3
- 108010075016 Ceruloplasmin Proteins 0.000 claims description 3
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 3
- 102000055157 Complement C1 Inhibitor Human genes 0.000 claims description 3
- 102000014447 Complement C1q Human genes 0.000 claims description 3
- 108010078043 Complement C1q Proteins 0.000 claims description 3
- 108010028780 Complement C3 Proteins 0.000 claims description 3
- 102000016918 Complement C3 Human genes 0.000 claims description 3
- 102100033772 Complement C4-A Human genes 0.000 claims description 3
- 108010077773 Complement C4a Proteins 0.000 claims description 3
- 102000006912 Complement C4b-Binding Protein Human genes 0.000 claims description 3
- 108010047548 Complement C4b-Binding Protein Proteins 0.000 claims description 3
- 108010053085 Complement Factor H Proteins 0.000 claims description 3
- 102000016550 Complement Factor H Human genes 0.000 claims description 3
- 102100037362 Fibronectin Human genes 0.000 claims description 3
- 108010067306 Fibronectins Proteins 0.000 claims description 3
- 101710154606 Hemagglutinin Proteins 0.000 claims description 3
- 102100027619 Histidine-rich glycoprotein Human genes 0.000 claims description 3
- 101710111227 Kininogen-1 Proteins 0.000 claims description 3
- 102100035792 Kininogen-1 Human genes 0.000 claims description 3
- 108010061952 Orosomucoid Proteins 0.000 claims description 3
- 102000012404 Orosomucoid Human genes 0.000 claims description 3
- 101710093908 Outer capsid protein VP4 Proteins 0.000 claims description 3
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 claims description 3
- 108050007539 Plasma protease C1 inhibitor Proteins 0.000 claims description 3
- 108010015078 Pregnancy-Associated alpha 2-Macroglobulins Proteins 0.000 claims description 3
- 101710176177 Protein A56 Proteins 0.000 claims description 3
- 102000050760 Vitamin D-binding protein Human genes 0.000 claims description 3
- 101710179590 Vitamin D-binding protein Proteins 0.000 claims description 3
- 108010031318 Vitronectin Proteins 0.000 claims description 3
- 102100035140 Vitronectin Human genes 0.000 claims description 3
- 108010091628 alpha 1-Antichymotrypsin Proteins 0.000 claims description 3
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 claims description 3
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 claims description 3
- 229940024142 alpha 1-antitrypsin Drugs 0.000 claims description 3
- 108010075843 alpha-2-HS-Glycoprotein Proteins 0.000 claims description 3
- 102000012005 alpha-2-HS-Glycoprotein Human genes 0.000 claims description 3
- 239000004202 carbamide Substances 0.000 claims description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 239000000185 hemagglutinin Substances 0.000 claims description 3
- 108010044853 histidine-rich proteins Proteins 0.000 claims description 3
- 239000003446 ligand Substances 0.000 claims description 3
- 238000002542 parent ion scan Methods 0.000 claims description 3
- 108060008004 synaptotagmin Proteins 0.000 claims description 3
- 102000003137 synaptotagmin Human genes 0.000 claims description 3
- 239000004698 Polyethylene Substances 0.000 claims description 2
- 239000004743 Polypropylene Substances 0.000 claims description 2
- 239000004793 Polystyrene Substances 0.000 claims description 2
- 229920005654 Sephadex Polymers 0.000 claims description 2
- 239000012507 Sephadex™ Substances 0.000 claims description 2
- 229920002684 Sepharose Polymers 0.000 claims description 2
- 229920002678 cellulose Polymers 0.000 claims description 2
- 239000001913 cellulose Substances 0.000 claims description 2
- 239000003398 denaturant Substances 0.000 claims description 2
- 239000011521 glass Substances 0.000 claims description 2
- 229960000789 guanidine hydrochloride Drugs 0.000 claims description 2
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 claims description 2
- 210000003200 peritoneal cavity Anatomy 0.000 claims description 2
- 210000003281 pleural cavity Anatomy 0.000 claims description 2
- 229920002401 polyacrylamide Polymers 0.000 claims description 2
- 229920000573 polyethylene Polymers 0.000 claims description 2
- 229920001155 polypropylene Polymers 0.000 claims description 2
- 229920002223 polystyrene Polymers 0.000 claims description 2
- 210000000582 semen Anatomy 0.000 claims description 2
- 229920002379 silicone rubber Polymers 0.000 claims description 2
- 239000004945 silicone rubber Substances 0.000 claims description 2
- 210000002700 urine Anatomy 0.000 claims description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 30
- 229920001184 polypeptide Polymers 0.000 description 25
- 102000004196 processed proteins & peptides Human genes 0.000 description 25
- 150000002500 ions Chemical class 0.000 description 16
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 16
- 238000002955 isolation Methods 0.000 description 14
- 239000000243 solution Substances 0.000 description 14
- 238000009826 distribution Methods 0.000 description 9
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 8
- 235000019253 formic acid Nutrition 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 239000000090 biomarker Substances 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 241000533867 Fordia Species 0.000 description 5
- 238000001976 enzyme digestion Methods 0.000 description 5
- 238000004885 tandem mass spectrometry Methods 0.000 description 5
- 102000004506 Blood Proteins Human genes 0.000 description 4
- 108010017384 Blood Proteins Proteins 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 238000001819 mass spectrum Methods 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 3
- 102000004142 Trypsin Human genes 0.000 description 3
- 108090000631 Trypsin Proteins 0.000 description 3
- 210000005013 brain tissue Anatomy 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 238000005468 ion implantation Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000001488 sodium phosphate Substances 0.000 description 3
- 229910000162 sodium phosphate Inorganic materials 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 3
- 239000012588 trypsin Substances 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 102000003839 Human Proteins Human genes 0.000 description 2
- 108090000144 Human Proteins Proteins 0.000 description 2
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 210000005228 liver tissue Anatomy 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000002414 normal-phase solid-phase extraction Methods 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 101710081722 Antitrypsin Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 230000001475 anti-trypsic effect Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 101150026046 iga gene Proteins 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000002386 leaching Methods 0.000 description 1
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- 239000012487 rinsing solution Substances 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- WROMPOXWARCANT-UHFFFAOYSA-N tfa trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.OC(=O)C(F)(F)F WROMPOXWARCANT-UHFFFAOYSA-N 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6842—Proteomic analysis of subsets of protein mixtures with reduced complexity, e.g. membrane proteins, phosphoproteins, organelle proteins
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/04—Preparation or injection of sample to be analysed
- G01N30/06—Preparation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8624—Detection of slopes or peaks; baseline correction
- G01N30/8631—Peaks
- G01N30/8634—Peak quality criteria
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2570/00—Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Cell Biology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Quality & Reliability (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Peptides Or Proteins (AREA)
Abstract
一种用于分析体液蛋白质组的方法,该方法包括:采用亲和技术去除初始样品A中的高丰度蛋白,获得低丰度蛋白富集的待测样品I;采用化学沉淀法去除初始样品B中的高丰度蛋白,获得低丰度蛋白富集的待测样品II,其中初始样品A和初始样品B来自同一受试者的同一份体液样品;对待测样品I进行蛋白质组学分析,获得蛋白质组数据集I;对待测样品II进行蛋白质组学分析,获得蛋白质组数据集II;基于所述蛋白质组数据集I和所述蛋白质组数据集II,确定体液中最终定量的蛋白质组数据集。
Description
技术领域
本发明属于生化检测领域,特别涉及一种分析体液蛋白质组的方法。
背景技术
体液中的血浆和血清因其丰富且易于获取,通常用于临床诊断和预后分析。血浆蛋白质可以用作个体健康状况的指标和临床检测的生物标志物,越来越多的研究集中在血浆蛋白质上。血浆蛋白质组学可以高通量地对临床队列中的多种蛋白质进行鉴定和定量分析,是血浆蛋白质研究的强有力的工具。
临床研究中往往需要对成百上千数量的样品进行定量蛋白质组分析,同时为了开发更多的血浆生物标志物,还需要提高蛋白质组的覆盖度。但现有技术中的各种技术难点(例如无法有效率的去除会造成干扰的高丰度蛋白),往往限制了样品分析通量。目前文献报道的血浆蛋白质组覆盖度为500-1000个蛋白,限制了血浆蛋白标志物的开发。因此,需要开放新的方法和系统,提高蛋白质组分析的通量和效率。
发明内容
在一些实施例中,用于分析体液蛋白质组的方法包括:
采用亲和技术去除初始样品A中的高丰度蛋白,获得低丰度蛋白富集的待测样品I;
采用化学沉淀法去除初始样品B中的高丰度蛋白,获得低丰度蛋白富集的待测样品II,其中所述初始样品A和所述初始样品B来自同一受试者的同一份体液样品;
对所述待测样品I采用经优化的数据非依赖性采集技术进行蛋白质组学分析,获得蛋白质组数据集I;
对所述待测样品II采用经优化的数据非依赖性采集技术进行蛋白质组学分析,获得蛋白质组数据集II;
基于所述蛋白质组数据集I和所述蛋白质组数据集II,确定所述体液样品最终定量的蛋白质组数据集。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例结合附图进行详细描述。这些实施例并非限制性的,其中:
图1示出了根据本发明的一些实施例的用于分析体液蛋白质组的方法的流程图。
图2A-图2F示出了根据本发明的一些实施例的采用数据非依赖性采集(dataindependent acquisition,DIA)技术进行血浆蛋白质组分析的结果,其中,图2A和图2B分别为15cm、25cm和50cm色谱柱和90min的梯度条件下DIA鉴定的多肽数量和蛋白数量;图2C和图2D分别为25cm色谱柱和90min、120min和150min的梯度鉴定的多肽数量和蛋白数量;图2E和图2F分别为50cm色谱柱和90min、120min和150min的梯度鉴定的多肽数量和蛋白数量。
图3A-图3D示出了根据本发明的一些实施例的采用DIA技术进行血浆蛋白质组分析的结果,其中,图3A和图3B分别是40个、50个和60个隔离窗口下鉴定的多肽数量和蛋白数量;图3C和图3D分别是40个、50个和60个隔离窗口下鉴定的蛋白强度的变异系数(CV)分布和多肽强度的CV分布。
图4A和图4B示出了根据本发明的一些实施例的采用优化的DIA技术进行蛋白质组分析得到的多肽数量统计图(图4A)和蛋白数量统计图(图4B);其中,undepleted代表采用未去除高丰度蛋白的原始血浆样品的酶切肽段;样品①代表采用肽段集合I;样品②代表采用肽段集合II。
图5A和图5B示出了根据本发明的一些实施例的采用优化的DIA技术进行蛋白质组分析得到的蛋白的韦恩图(图5A)和蛋白分子量的分布图(图5B);其中,undepleted代表采用未去除高丰度蛋白的原始血浆样品的酶切肽段;样品①代表采用肽段集合I;样品②代表采用肽段集合II。
图6示出了根据本发明的一些实施例的采用优化的DIA技术进行蛋白质组分析得到的蛋白强度的变异系数分布图;其中,“样品①所有”代表采用肽段集合I-优化的DIA鉴定到的所有蛋白质的蛋白强度的变异系数分布;“样品②所有”代表采用肽段集合II-优化的DIA鉴定到的所有蛋白质的蛋白强度的变异系数分布;“样品①间”代表肽段集合I-优化的DIA与肽段集合II-优化的DIA共同鉴定到的蛋白质在肽段集合I-优化的DIA中的蛋白强度的变异系数分布;“样品②间”代表采用肽段集合I-优化的DIA与肽段集合II-优化的DIA共同鉴定到的蛋白质在采用肽段集合II-优化的DIA中的蛋白强度的变异系数分布;“样品②独有”代表采用肽段集合II-优化的DIA鉴定到的独有蛋白质的蛋白强度的变异系数分布;“样品①所有+样品②独有”代表采用肽段集合I-优化的DIA鉴定到的所有蛋白质加上采用肽段集合II-优化的DIA鉴定到的独有蛋白质的蛋白强度的变异系数分布。
图7A-图7C示出了根据本发明的一些实施例的用于分析体液蛋白质组的方法最终定量的蛋白质组数据集的覆盖度;其中,图7A示出了最终定量的蛋白质组数据集覆盖的FDA批准的生物标志物;图7B示出了最终定量的蛋白质组数据集覆盖的脑组织特异性蛋白质;图7C示出了最终定量的蛋白质组数据集覆盖的肝脏特异性蛋白质。
具体实施方式
血清、血浆、脑脊液等典型体液是基于质谱平台的蛋白质组学研究领域中的常用样本。这类样本含有种类丰富的蛋白质,其中高丰度蛋白(high-abundantproteins,HAP)比例达到97%~99%,包括白蛋白、IgG、IgA、纤维蛋白原、转铁蛋白、触珠蛋白、抗胰蛋白酶等。而低丰度蛋白(low-abundant proteins,LAP)才往往是疾病的特异性生物标记或者药物作用的靶蛋白分子。因此去除掉干扰检测的高丰度蛋白,尽可能富集更多低丰度蛋白,成为质谱鉴定数量多少的关键因素之一。
针对这一问题,目前常用的去除高丰度蛋白的方法有亲和技术、沉淀法、超滤离心法、金磁微粒法、等电捕获法、液相色谱法等。亲和技术是通过固定化的配基与靶蛋白质特异性亲和而达到将靶蛋白质从样品中分离或去除的目的。化学沉淀法是利用加入沉淀剂使蛋白质发生沉淀而去除样品中HAP,沉淀剂可以是有机溶剂,也可以是铵盐等物质。液相色谱法更多是用于蛋白质分离,常用的离子交换色谱法和尺寸排阻色谱法利用蛋白质分子尺寸大小和所带的电荷不同进行蛋白质去除。
数据非依赖性采集(data independent acquisition,DIA)技术是近年来发展起来的一种新的质谱技术,属于非标记蛋白质组学方法。采用数据非依赖性扫描模式:将质谱整个全扫描范围分为若干个窗口,然后对每个窗口中的所有离子进行检测、碎裂,从而无遗漏、无差异地获得样本中所有离子的信息。DIA技术可以降低样本检测的缺失值,同时提高定量准确性和重复性,实现大样本队列中高稳定、高精准的蛋白质组定量分析。DIA技术的上述优点,使它越来越多地应用于血浆蛋白质组学中。
本发明的目的之一是提供一种用于分析体液蛋白质组的方法。
在一些实施例中,如图1所示,用于分析体液蛋白质组的方法包括:
采用亲和技术去除初始样品A中的高丰度蛋白,获得低丰度蛋白富集的待测样品I;
采用化学沉淀法去除初始样品B中的高丰度蛋白,获得低丰度蛋白富集的待测样品II,其中所述初始样品A和所述初始样品B来自同一受试者的同一份体液样品;
对所述待测样品I进行蛋白质组学分析,获得蛋白质组数据集I;对所述待测样品II进行蛋白质组学分析,获得蛋白质组数据集II;
基于所述蛋白质组数据集I和所述蛋白质组数据集II,确定所述体液样品最终定量的蛋白质组数据集。
在一些实施例中,对所述待测样品I进行蛋白质组学分析包括:使用DIA技术对所述待测样品I进行定量蛋白质组学分析。在一些实施例中,对所述待测样品II进行蛋白质组学分析包括:使用DIA技术对所述待测样品II进行定量蛋白质组学分析。
在一些实施例中,所述待测样品I经还原、烷基化、酶切和脱盐后,获得用于使用DIA技术进行蛋白质组学分析的肽段集合I。在一些实施例中,所述待测样品II经脱盐、还原、烷基化和酶切后,获得用于使用DIA技术进行蛋白质组学分析的肽段集合II。
在一些实施例中,所述DIA技术是经优化的DIA技术;所述经优化的DIA技术采用50cm的色谱柱长度和90min的色谱柱梯度。在一些实施例中,所述经优化的DIA技术采用50cm的色谱柱长度和150min的色谱柱梯度。在一些实施例中,所述经优化的DIA技术采用50cm的色谱柱长度和120min的色谱柱梯度。在一些实施例中,所述经优化的DIA技术中MS1分辨率设为60K,MS2分辨率设为30K,母离子扫描范围设为m/z 350-1200并分割为50个窗口。
在一些实施例中,所述采用亲和技术去除初始样品A中的高丰度蛋白包括:利用所述高丰度蛋白的抗体作为亲和配体去除所述高丰度蛋白。在一些实施例中,所述高丰度蛋白包括白蛋白、IgA、IgD、IgE、IgG、IgM、α1-酸性糖蛋白、α1-抗胰蛋白酶、α2-巨球蛋白、载脂蛋白A1、纤维蛋白原、触珠蛋白、转铁蛋白、补体C3、载脂蛋白A-II、α-2-HS-糖蛋白、载脂蛋白C-III、α-1-抗胰凝乳蛋白酶、维生素D结合蛋白、铜蓝蛋白、补体C4-A、补体C1q、血凝素、激肽原-1、突触结合蛋白5、富含组氨酸的糖蛋白、玻连蛋白、补体因子H、血浆蛋白酶C1抑制剂、C4b结合蛋白和纤连蛋白中的一种或多种。
在一些实施例中,所述高丰度蛋白的抗体被固定化至固相载体上。在一些实施例中,所述固相载体包括纤维素、聚丙稀酰胺、聚苯乙烯、聚乙烯、聚丙烯、交联葡聚糖、玻璃、硅橡胶、琼脂糖凝胶和凝胶树脂中的一种或多种。在一些实施例中,所述固相载体为凝胶树脂。在一些实施例中,通过固定化有多种高丰度蛋白的抗体的固相载体,一次能去除多种高丰度蛋白。在一些实施例中,通过固定化有31种高丰度蛋白的抗体的固相载体,一次能去除31种高丰度蛋白,不仅提高了效率还降低了成本。
在一些实施例中,所述采用亲和技术去除初始样品A中的高丰度蛋白在多腔体容器中进行。在一些实施例中,采用化学沉淀法去除初始样品B中的高丰度蛋白在多腔体容器中进行。在一些实施例中,所述多腔体容器为多孔板,例如96孔、48孔或24孔板。基于多孔板的去除高丰度蛋白的方法,一次可以处理多个样品,例如2×96个样品,从而提高了分析蛋白质组的通量。
在一些实施例中,所述体液包括血浆、血清、尿液、组织液、胸膜腔内液体、腹腔内的液体、脑脊液、精液和阴道液体中的一种或多种。
在一些实施例中,所述采用化学沉淀法去除初始样品B中的高丰度蛋白包括:利用有机溶剂作为沉淀剂使所述高丰度蛋白沉淀。在一些实施例中,所述有机溶剂包括甲醇、乙醇、异丙醇、乙腈、氯仿、三氯乙酸、三氟乙酸中的一种或多种。
在一些实施例中,所述采用化学沉淀法去除初始样品B中的高丰度蛋白还包括:在利用所述沉淀剂使所述高丰度蛋白沉淀之前,使用变性剂使所述高丰度蛋白质变性。在一些实施例中,所述变性剂包括盐酸胍、尿素中的一种或多种。
在一些实施例中,基于所述蛋白质组数据集I和所述蛋白质组数据集II,确定所述体液样品最终定量的蛋白质组数据集包括从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据,获得蛋白质组数据集III;以及将所述蛋白质组数据集I与所述蛋白质组数据集III作为所述体液样品中最终定量的蛋白质组数据集。在一些实施例中,从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据包括:通过韦恩图对所述蛋白质组数据集I与所述蛋白质组数据集II进行比较,从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据,获得蛋白质组数据集III。在一些实施例中,所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据是所述蛋白质组数据集II与所述蛋白质组数据集I蛋白质重叠的数据。
在一些实施例中,本发明所涉及的方法只被用于非诊断类的应用。
在一些实施例中,所述受试者包括人和非人哺乳动物中的至少之一。
在一些实施例中提供的用于分析体液蛋白质组的方法,具有很好的重现性并且具有较高的血浆蛋白质组的覆盖度,其定量到了一千七百种以上的蛋白。
实施例
血浆收集
收集健康受试者血样,柠檬酸盐/血液混合物(1:9,v/v)在10℃下离心(3000rpm)10min,储存在-80℃备用。
基于抗体亲和去除高丰度蛋白
(1)制备凝胶树脂
将150mg干燥PierceTM NHS-Activated凝胶树脂(购自美国赛默飞公司)置于空离心柱中,向离心柱中加入抗体含量为1mg/mL的如下蛋白的抗体的溶液各2mL:白蛋白、IgA、IgD、IgE、IgG、IgM、α1-酸性糖蛋白、α1-抗胰蛋白酶、α2-巨球蛋白、载脂蛋白A1、纤维蛋白原、触珠蛋白、转铁蛋白、补体C3、载脂蛋白A-II、α-2-HS-糖蛋白、载脂蛋白C-III、α-1-抗胰凝乳蛋白酶、维生素D结合蛋白、铜蓝蛋白、补体C4-A、补体C1q、血凝素、激肽原-1、突触结合蛋白5、富含组氨酸的糖蛋白、玻连蛋白、补体因子H、血浆蛋白酶C1抑制剂、C4b结合蛋白和纤连蛋白;颠倒混合反应2小时;将离心柱放入收集管中以1000g离心1min;加入pH 7.2的2mL 0.1M磷酸钠和0.15M NaCl的混合液至离心柱中;1000g离心1min,重复一次;加入pH7.4的终止缓冲液1mL 1M Tris,室温颠倒混合15-20min;1000g离心1min;加入pH 7.2的2mL0.1M磷酸钠、0.15M NaCl的混合液至离心柱中;1000g离心1min;加入pH 7.2的500μL 0.1M磷酸钠、0.15M NaCl、0.05wt%叠氮化钠的混合液保存凝胶树脂。
(2)去除血浆高丰度蛋白
混匀制备好的凝胶树脂,分别取40μL加入至0.45μm的96孔板的各孔中;每孔加入6μL稀释6倍的血浆样本;震荡孵育30min;4000g离心2min,收集各孔的洗脱液。
(3)制备用于DIA的肽段集合I
向各孔的洗脱液中加入70μl含有1wt%SDC、100mM Tris-HCl,pH 8.5的蛋白裂解液;加入2μl 0.5M三(2-羧乙基)膦(TCEP)和8μL 0.5M三氯乙酸(TCA)溶液,70℃反应10min;冷却至室温;然后加入1μg Lys C/Trypsin混合酶试剂,37℃反应2小时,获得酶切溶液。向各孔的酶切溶液中加入100μL异丙醇(IPA)的1%三氟乙酸(TFA)溶液,用于SCX脱盐。96孔SCX固相萃取板的各孔中加入200μl酶切溶液,1000g,离心2min;加入400μL IPA的1%TFA溶液进行淋洗,1000g离心2min,弃去淋洗液;加入400μL 0.2%TFA,1000g离心2min进行淋洗,弃去淋洗液;加入200μL 1%氨与80%乙腈(ACN)的混合液,1000g离心2min,收集各孔的洗脱液。洗脱液在冷冻浓缩仪中浓缩抽干,加入20μL 0.1%甲酸(FA)溶液重溶,得到用于DIA的肽段集合I。
化学沉淀法去除高丰度蛋白
(1)去除血浆高丰度蛋白
分别取50μL血浆与50μL裂解液(8M尿素,100mM Tris,pH8.0)加入到96孔板的各孔中,室温孵育5min;加入100μl 20%TCA溶液,4℃,1500RPM震荡放置60min沉淀蛋白;4000g离心,取各孔中150μl上清液。
(2)制备用于DIA的肽段集合II
将上清液加入96孔HLB固相萃取板各孔中,1000g,离心2min,弃上清液;向各孔中加入400μl 0.2%TFA溶液,1000g离心2min,弃上清液;向各孔中加入400μL 0.2%TFA与80%ACN溶液的混合液,1000g离心2min收集洗脱液。洗脱液在冷冻浓缩仪中浓缩抽干,加入100μL 50mM NH4CO3复溶;加入2μl 0.5M TCEP,8μl 0.5M TCA,70℃,反应10min;加入1μgLys C/Trypsin混合酶试剂,37℃反应2小时。酶切液在冷冻浓缩仪中浓缩抽干,加入20μL0.1%FA溶液重溶,得到用于DIA的肽段集合II。
DIA技术
DIA是在一级质谱高分辨全扫描后,将特定质荷比(m/z)范围的多肽母离子全部无区别地进行MS/MS碎裂。在DIA数据采集中,高分辨MS2谱图用于肽段的鉴定,高分辨的MS1和MS2都可以用来进行多肽/蛋白定量。一般需要考虑以下仪器参数:(i)DIA隔离窗口的数量以及每个隔离窗口的大小。DIA在给定母离子隔离窗口内将所有的母离子进行共隔离和共碎裂,因此,隔离窗口的大小直接影响DIA分析的选择性、动态范围和灵敏度。使用宽的隔离窗口可以提高二级谱图的累计时间,提高分析的灵敏度,用于非常低丰度样品的分析;使用窄的隔离窗口可减少共碎裂的母离子数量,降低干扰,用于复杂程度较高的样品;(ii)DIA循环时间和色谱峰宽。循环时间在DIA中,对应于为MS1和MS2扫描时间之和。通过平均的色谱峰宽之和进行精确的定量分析需要平均7-10个采集的数据点拟合提取离子流色谱图,计算出最佳的DIA循环时间。例如在平均峰宽为30s,循环时间可以设置为3-4s。在DIA数据分析中,需要建立DIA定量的谱图库,谱图库中包含了蛋白质及其肽段的信息,例如保留时间、母离子m/z、碎片离子m/z、碎片离子相对丰度等信息。依据谱图库中的肽段信息对DIA数据进行峰抽提,以碎片离子峰面积的加和表征多肽的强度。
为了获得蛋白质组深度和通量之间的良好平衡以及蛋白质定性性能和定量性能之间的平衡,对DIA技术的参数进行优化。采用未去除高丰度蛋白的原始血浆样品的酶切肽段(undepleted)作为用于DIA技术优化过程中的样品。
在DIA技术的纳升色谱中,色谱柱长度和梯度长度会影响峰容量,从而影响单针DIA的蛋白质组深度。如图2A、图2B所示,图2A和图2B分别为15cm、25cm和50cm色谱柱和90min的梯度条件下DIA鉴定的多肽数量和蛋白数量,其中,多肽和蛋白的鉴定数量在色谱柱长度为50cm时最多,此时具有最小的峰宽和最大的峰容量。如图2C、图2D所示,图2C和图2D分别为25cm色谱柱和90min、120min和150min的梯度鉴定的多肽数量和蛋白数量,使用150min梯度与使用120min或90min梯度时鉴定到的多肽和蛋白数量相当,为了使检测通量更大,选用90min梯度进行血浆蛋白质组分析。如图2E、图2F所示,图2E和图2F分别为50cm色谱柱和90min、120min和150min的梯度鉴定的多肽数量和蛋白数量。据此,50cm色谱柱和90min梯度对于血浆蛋白质组学是最佳组合,在蛋白质组深度和通量之间呈现出良好的平衡。
在DIA技术的质谱中,较窄的DIA隔离窗口可提高灵敏度,但是延长了循环时间(cycle time)会导致更少的峰点和较差的定量重现性;相反,较宽的隔离窗口缩短了循环时间会导致更多的峰点数,获得更好的重现性,但是会降低灵敏度,因此合适的DIA隔离窗口数量使得定性性能和定量性能达到平衡。将MS1分辨率固定设为60K、MS2分辨率设为30K,将母离子扫描范围设为m/z 350-1200。鉴于优化的纳升色谱的平均峰宽为0.21min(色谱柱为50cm与梯度为90min的组合),将一个DIA循环时间的DIA窗口数量设置为40、50或60。如图3A-D所示,使用40个DIA隔离窗口且循环时间最短的DIA方法给出的多肽和蛋白鉴定数量最少,但定量重现性最佳;使用具有最长循环时间的60个DIA隔离窗口的方法给出的多肽和蛋白鉴定数量最多,但定量重现性最差。因此,使用50个DIA隔离窗口的方法在蛋白鉴定数量和定量重现性上达到平衡。
肽段集合I和肽段集合II采用优化的DIA技术进行质谱分析,分别得到蛋白质组数据集I和蛋白质组数据集II。
DIA色谱:4μL重溶的肽段上样到纳升色谱柱上,内径为75μm,长度50cm,填料为1.9μm Reprosil-Pur C18。Ultimate 3000RSLC nano流动相A是0.1%甲酸/H2O,流动相B是80%ACN/0.1%甲酸。梯度为0-4min,3-6%B;4-83min,6-30%B;83-87min,30%-90%;87-90min,90%-90%;总梯度90min。调整6-30%B段的时间,设置总梯度为120min或者150min。
DIA质谱采集通过Orbitrap系列质谱完成。每个质谱循环时间内包含一个完整的全扫描MS(R 60,000@m/z 200、AGC为2e5、最大离子注入时间为20ms以及质量范围350-1,200)和50个DIA扫描(R 30,000@m/z 200、AGC为5E5、最大离子注入时间为55ms、归一化能量NCE为32以及质量范围200-2,000),循环时间为3.4s。
深度覆盖血浆谱图库的建立:用50μL 10mM NH3·H2O分别溶解200μg肽段集合I和肽段集合II,然后分别使用Ultimate 3000HPLC,以100μL/min的流速上样到XbridgeBEH300 C18柱上并进行色谱分离。缓冲液A为10mM NH3·H2O;缓冲液B为90%ACN的10mMNH3·H2O。梯度为0-4min,2-2%B;4-50min,2-30%B;50-58min,30%-90%B;58-60min,90%-90%B;60-65min,2%-2%B。以1min的间隔手动收集4-58min的馏分。在真空冷冻浓缩仪中冻干,溶解于10μL 0.1%FA中以进行LC-MS/MS分析。将5μL多肽上样到实验室自制色谱柱上,内径为75μm,长度30cm,填料为3μm Reprosil-Pur C18。流动相A是0.1%甲酸/H2O,流动相B是80%ACN/0.1%甲酸。梯度为0-4min,3-6%B;4-83min,6-30%B;83-87min,30%-90%;87-90min,90%-90%;总梯度90min。使用Orbitrap Fusion Lumos Tribrid MS的数据依赖扫描模式DDA采集质谱数据,其参数如下:喷雾电压2kV;S-lens RF为30;毛细管温度为300℃;全扫描分辨率为60 000@m/z 200和自动增益控制AGC为4e5,最大离子注入时间为30ms;质量范围350-1500;扫描分辨率为15000@m/z 200;二级扫描的最长离子注入时间为30ms和AGC为5e4;二级扫描的起始m/z 110;HCD碎裂归一化碰撞能量NCE为30;MIPS为“肽”;选择电荷数为2-7的母离子进行二级质谱采集;动态排除时间为40s;DDA循环时间为3s。使用MaxQuant软件包(V.1.5.6.0)进行DDA数据库检索,蛋白质和多肽的FDR设置为1%。对于多肽鉴定,需要最小长度的6个氨基酸和最大质量为10 000Da;Andromeda搜索引擎进行检索;数据库为Swiss-Prot人类数据库(V.201502;20,534个蛋白质序列)和262种常见污染蛋白序列;酶特异性设置为精氨酸和赖氨酸的C末端酶切,最多2个漏切位点;Carbamidomethylation(C)设置为固定修饰,oxidation(M)设定为可变修饰;启用了“matchbetween run(MBR)”和“second peptide”功能。将MaxQuant的DDA结果导入到Biognosys公司Spectronaut V13,对于每个母离子,选择最少3个和最多6个碎片离子;m/z设置为350-1800。
分别分析肽段集合I和肽段集合II构建的深度覆盖血浆谱图,其中包含了蛋白质及其多肽的信息,例如保留时间、母离子质核比、碎片离子质核比、碎片离子相对丰度等。
表1.肽段集合I和肽段集合II的血浆蛋白质组谱图库
样品 | 母离子数量 | 多肽 | 蛋白质 |
肽段集合I | 77,840 | 52,986 | 5,106 |
肽段集合II | 19,436 | 15,708 | 1,325 |
肽段集合I和肽段集合II的DIA数据用Biognosys公司Spectronaut V13进行目标峰的抽提,分别使用肽段集合I和肽段集合II构建的深度覆盖的血浆蛋白质组谱图库,设置Carbamidomethylation为固定修饰,蛋氨酸Oxidation为可变修饰,采用Trypsin进行酶切并允许最多2个漏切位点,控制多肽和蛋白质水平的FDR为1%。取强度最高的3个多肽的平均值以计算蛋白强度。
数据分析
1)鉴定结果比较
比较采用肽段集合I-优化的DIA的结果(蛋白质组数据集I)、肽段集合II-优化的DIA的结果(蛋白质组数据集II)以及undepleted-优化的DIA的结果(三次重复)鉴定到的多肽和蛋白数量。
鉴定结果如图4A和图4B所示,蛋白质组数据集I鉴定到了最多的多肽数量和蛋白数量,每个重复平均鉴定到14,000条多肽和1,400个蛋白。蛋白质组数据集II鉴定到700条多肽和770个蛋白。Undepleted-优化的DIA的结果鉴定到7700条多肽和740个蛋白。
如图5A所示,蛋白质组数据集I和蛋白质组数据集II基本上包含了undepleted-优化的DIA的结果中的所有蛋白质,表明亲和技术去除法和化学沉淀法去除法有很强的互补性,因此考虑方法的简便性以及分析的通量,在后续的分析中舍弃undepleted-优化的DIA的结果。如图5B所示,化学沉淀法(蛋白质组数据集II)覆盖了很多1-20kD之间的低分子量的蛋白质,进一步显示出亲和技术去除法和化学沉淀去除法的互补性。
2)高丰度蛋白去除定量重现性和蛋白质组覆盖度分析
去除高丰度蛋白的重现性是评价本申请的用于分析体液蛋白质组的方法用于血浆蛋白质组深度覆盖可行性的重要因素。进行5次技术重复,考察本申请的用于分析体液蛋白质组的方法的重现性。
如图6所示,进行5次技术重复,蛋白质组数据集I中定量到了1,510个蛋白,定量蛋白强度RSD的中位数为13%,显示出亲和技术去除法具有很好的重现性。蛋白质组数据集II中定量到了802个蛋白,定量蛋白强度的RSD的中位数为20%,显示出化学沉淀去除法也具有较好的定量重现性。蛋白质组数据集I中独有地定量到了992个蛋白,这些蛋白只能归于亲和技术去除法;蛋白质组数据集II中独有地定量到了284个蛋白,这些蛋白只能归于化学沉淀去除法。
接着比较蛋白质组数据集I和蛋白质组数据集II中共同定量到的518个蛋白的重现性,其在亲和技术去除法中的重现性较在化学沉淀去除法中好,因此将这518个蛋白归在蛋白质组数据集I中定量。
因此,将蛋白质组数据集I中定量到的所有蛋白质的数据集与蛋白质组数据集II中独有地定量到的蛋白质的数据集的合集作为本申请的用于分析体液蛋白质组的方法获得的最终定量的蛋白质组数据集。该数据集一共含有1,794个蛋白,其蛋白强度的RSD中位数为14%,显示出本申请的用于分析体液蛋白质组的方法具有很好的重现性。
3)对最终定量的蛋白质组数据集进行覆盖度分析。
定量到的1794个蛋白实现了血浆蛋白质组的深度覆盖。这1794个蛋白横跨8个数量级的动态范围,包含了很多临床意义的蛋白:覆盖了FDA已经批准的222个生物标志物中的114个(FDA批准的生物标志物下载于http://mrmassaydb.proteincentre.com/)(图7A,表2);16个蛋白为Human Tissue Proteome Atlas中的脑组织特异性蛋白(https://www.proteinatlas.org/humanproteome/tissue)(图7B,表3);124个蛋白为Human TissueProteome Atlas中的肝组织特异性蛋白(https://www.proteinatlas.org/humanproteome/tissue)(图7C,表4)。
表2体液中最终定量蛋白质组数据集覆盖FDA已经批准的生物标志物
表3体液中最终定量蛋白质组数据集覆盖Human Tissue Proteome Atlas中的脑组织特异性蛋白
表4体液中最终定量蛋白质组数据集覆盖Human Tissue Proteome Atlas中的肝组织特异性蛋白
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
Claims (21)
1.一种用于分析体液蛋白质组的方法,包括:
采用亲和技术去除初始样品A中的高丰度蛋白,获得低丰度蛋白富集的待测样品I;
采用化学沉淀法去除初始样品B中的高丰度蛋白,获得低丰度蛋白富集的待测样品II,其中所述初始样品A和所述初始样品B来自同一受试者的同一份体液样品;
对所述待测样品I进行蛋白质组学分析,获得蛋白质组数据集I;
对所述待测样品II进行蛋白质组学分析,获得蛋白质组数据集II;
基于所述蛋白质组数据集I和所述蛋白质组数据集II,确定所述体液样品最终定量的蛋白质组数据集。
2.根据权利要求1所述的方法,其中,对所述待测样品I进行蛋白质组学分析包括:使用数据非依赖性采集技术对所述待测样品I进行定量蛋白质组学分析。
3.根据权利要求1所述的方法,其中,对所述待测样品II进行蛋白质组学分析包括:使用数据非依赖性采集技术对所述待测样品II进行定量蛋白质组学分析。
4.根据权利要求1所述的方法,其中,所述体液包括血浆、血清、尿液、组织液、胸膜腔内液体、腹腔内的液体、脑脊液、精液和阴道液体中的一种或多种。
5.根据权利要求1所述的方法,其中,所述采用亲和技术去除初始样品A中的高丰度蛋白包括:利用所述高丰度蛋白的抗体作为亲和配体去除所述高丰度蛋白。
6.根据权利要求1-5中任一项所述的方法,其中,所述高丰度蛋白包括白蛋白、IgA、IgD、IgE、IgG、IgM、α1-酸性糖蛋白、α1-抗胰蛋白酶、α2-巨球蛋白、载脂蛋白A1、纤维蛋白原、触珠蛋白、转铁蛋白、补体C3、载脂蛋白A-II、α-2-HS-糖蛋白、载脂蛋白C-III、α-1-抗胰凝乳蛋白酶、维生素D结合蛋白、铜蓝蛋白、补体C4-A、补体C1q、血凝素、激肽原-1、突触结合蛋白5、富含组氨酸的糖蛋白、玻连蛋白、补体因子H、血浆蛋白酶C1抑制剂、C4b结合蛋白、纤连蛋白中的一种或多种。
7.根据权利要求5所述的方法,其中,所述高丰度蛋白的抗体被固定化至固相载体上。
8.根据权利要求7所述的方法,其中,所述固相载体包括纤维素、聚丙稀酰胺、聚苯乙烯、聚乙烯、聚丙烯、交联葡聚糖、玻璃、硅橡胶、琼脂糖凝胶和凝胶树脂中的一种或多种。
9.根据权利要求1-5中任一项所述的方法,其中,所述采用亲和技术去除初始样品A中的高丰度蛋白和/或所述采用化学沉淀法去除初始样品B中的高丰度蛋白在多腔体容器中进行。
10.根据权利要求1所述的方法,其中,所述采用化学沉淀法去除初始样品B中的高丰度蛋白包括:利用有机溶剂作为沉淀剂使所述高丰度蛋白沉淀。
11.根据权利要求10所述的方法,其中,所述有机溶剂包括甲醇、乙醇、异丙醇、乙腈、氯仿、三氯乙酸、三氟乙酸中的一种或多种。
12.根据权利要求10所述的方法,其中,所述采用化学沉淀法去除初始样品B中的高丰度蛋白还包括:在利用所述沉淀剂使所述高丰度蛋白沉淀之前,使用变性剂使所述高丰度蛋白质变性。
13.根据权利要求12所述的方法,其中,所述变性剂包括盐酸胍、尿素中的一种或多种。
14.根据权利要求2所述的方法,其中,所述待测样品I经还原、烷基化、酶切和脱盐后,获得用于使用数据非依赖性采集技术进行蛋白质组学分析的肽段集合I。
15.根据权利要求2所述的方法,其中,所述待测样品II经脱盐、还原、烷基化和酶切后,获得用于使用数据非依赖性采集技术进行蛋白质组学分析的肽段集合II。
16.根据权利要求2所述的方法,其中,所述数据非依赖性采集技术是经优化的数据非依赖性采集技术;所述经优化的数据非依赖性采集技术采用50cm的色谱柱长度和90min的色谱柱梯度。
17.根据权利要求16所述的方法,其中,所述经优化的数据非依赖性采集技术中MS1分辨率设为60K,MS2分辨率设为30K,母离子扫描范围设为m/z350-1200并分割为50个窗口。
18.根据权利要求1所述的方法,其中,基于所述蛋白质组数据集I和所述蛋白质组数据集II,确定所述体液样品最终定量的蛋白质组数据集包括从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据,获得蛋白质组数据集III;以及将所述蛋白质组数据集I与所述蛋白质组数据集III作为所述体液样品中最终定量的蛋白质组数据集。
19.根据权利要求18所述的方法,其中,从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据包括:通过韦恩图对所述蛋白质组数据集I与所述蛋白质组数据集II进行比较,从所述蛋白质组数据集II中去除所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据,获得蛋白质组数据集III。
20.根据权利要求18所述的方法,其中,所述蛋白质组数据集II与所述蛋白质组数据集I重叠的数据是所述蛋白质组数据集II与所述蛋白质组数据集I蛋白质重叠的数据。
21.根据权利要求1所述的方法,其中,所述受试者包括人和非人哺乳动物中的至少之一。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2021/129619 WO2023082057A1 (zh) | 2021-11-09 | 2021-11-09 | 一种用于分析体液蛋白质组的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115004023A true CN115004023A (zh) | 2022-09-02 |
Family
ID=83018659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180009343.2A Pending CN115004023A (zh) | 2021-11-09 | 2021-11-09 | 一种用于分析体液蛋白质组的方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US12099066B2 (zh) |
CN (1) | CN115004023A (zh) |
WO (1) | WO2023082057A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115856112A (zh) * | 2022-11-08 | 2023-03-28 | 吉林大学 | 基于dia技术探究和分析不同民族人乳中差异蛋白的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104974218A (zh) * | 2015-07-10 | 2015-10-14 | 深圳市贝沃德克生物技术研究院有限公司 | 低丰度差异蛋白的分离方法及其应用 |
WO2018090652A1 (zh) * | 2016-11-21 | 2018-05-24 | 中国科学院大连化学物理研究所 | 一种高通量体液蛋白质样品预处理装置及其应用 |
CN111537658A (zh) * | 2020-04-16 | 2020-08-14 | 深圳华大临床检验中心 | 一种血清或血浆蛋白的数据非依赖性采集检测方法及应用 |
CN112710755A (zh) * | 2020-12-22 | 2021-04-27 | 中国人民解放军军事科学院军事医学研究院 | 一种血清/血浆蛋白质组分析新方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU707444B2 (en) * | 1995-04-25 | 1999-07-08 | Irori | Remotely programmable matrices with memories and uses thereof |
US20030211483A1 (en) * | 2002-05-09 | 2003-11-13 | Schroeder Benjamin G. | Methods for the enrichment of low-abundance polynucleotides |
US20040209380A1 (en) * | 2003-04-15 | 2004-10-21 | Bente H. Bryan | Method for detecting a low abundance protein in a test sample |
CN101694485B (zh) | 2009-09-27 | 2013-01-16 | 上海交通大学 | 利用亲和柱分析全蛋白的方法 |
CN104880546B (zh) | 2015-04-28 | 2017-12-12 | 中国科学院近代物理研究所 | 小鼠脑组织蛋白质组分析的样品制备方法 |
CN111902720A (zh) * | 2018-03-21 | 2020-11-06 | 沃特世科技公司 | 基于非抗体高亲和力的样品制备、吸附剂、装置和方法 |
CN112014198B (zh) * | 2020-06-09 | 2021-11-09 | 中国科学院生物物理研究所 | 一种用于富集内源性低分子量蛋白和多肽的试剂盒及方法 |
CN111896646A (zh) * | 2020-07-21 | 2020-11-06 | 南京品生医疗科技有限公司 | 一种超高效液相色谱串联质谱技术检测血浆中3种脂质的试剂盒 |
-
2021
- 2021-11-09 WO PCT/CN2021/129619 patent/WO2023082057A1/zh unknown
- 2021-11-09 CN CN202180009343.2A patent/CN115004023A/zh active Pending
-
2023
- 2023-04-17 US US18/301,279 patent/US12099066B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104974218A (zh) * | 2015-07-10 | 2015-10-14 | 深圳市贝沃德克生物技术研究院有限公司 | 低丰度差异蛋白的分离方法及其应用 |
WO2018090652A1 (zh) * | 2016-11-21 | 2018-05-24 | 中国科学院大连化学物理研究所 | 一种高通量体液蛋白质样品预处理装置及其应用 |
CN111537658A (zh) * | 2020-04-16 | 2020-08-14 | 深圳华大临床检验中心 | 一种血清或血浆蛋白的数据非依赖性采集检测方法及应用 |
CN112710755A (zh) * | 2020-12-22 | 2021-04-27 | 中国人民解放军军事科学院军事医学研究院 | 一种血清/血浆蛋白质组分析新方法 |
Non-Patent Citations (8)
Title |
---|
TANXI CAI 等: "Chapter five Strategies for Characterization of Low-Abundant Intact or Trucated Low-Molecular-Weight Proteins From Human Plasma", THE ENZYMES, vol. 42, 12 October 2017 (2017-10-12), pages 105 - 123 * |
YUE ZHOU 等: "High-throughput, in-depth and estimated absolute quantification of plasma proteome using data-independent acquisition/mass spectrometry ("HIAP-DIA")", PROTEOMICS, pages 1 - 12 * |
YUE ZHOU 等: "High-throughput, in-depth and estimated absolute quantification of plasma proteome using data-independent acquisition/mass spectrometry("HIAP-DIA")", PROTEOMICS, 18 January 2021 (2021-01-18), pages 1 - 12 * |
张彬 等: "大鼠血清的4种处理方法对2-DE效果的影响", 中国实验诊断学, vol. 16, no. 9, 30 September 2012 (2012-09-30), pages 1544 - 1547 * |
张彬 等: "大鼠血清的4种处理方法对2-DE效果的影响", 中国实验诊断学, vol. 16, no. 9, pages 1544 - 1547 * |
王俊 等: "改良TCA/丙酮沉淀法去除肥胖人群血浆中的高丰度蛋白质", 卫生研究, vol. 42, no. 5, pages 741 - 747 * |
胡蝶飞 等: "去除血清中高、中丰度蛋白方法的优化", 广西医科大学学报, vol. 28, no. 2, pages 250 - 252 * |
马梅兰 等: "两种方法去除肺癌患者血清高丰度蛋白的研究", 甘肃医药, vol. 35, no. 1, pages 4 - 6 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115856112A (zh) * | 2022-11-08 | 2023-03-28 | 吉林大学 | 基于dia技术探究和分析不同民族人乳中差异蛋白的方法 |
CN115856112B (zh) * | 2022-11-08 | 2024-05-24 | 吉林大学 | 基于dia技术探究和分析不同民族人乳中差异蛋白的方法 |
Also Published As
Publication number | Publication date |
---|---|
US20230258654A1 (en) | 2023-08-17 |
US12099066B2 (en) | 2024-09-24 |
WO2023082057A1 (zh) | 2023-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10345293B2 (en) | High sensitivity quantitation of peptides by mass spectrometry | |
EP1556478B1 (en) | High sensitivity quantitation of peptides by mass spectrometry | |
Callesen et al. | Serum protein profiling by solid phase extraction and mass spectrometry: a future diagnostics tool? | |
Ekström et al. | On‐chip microextraction for proteomic sample preparation of in‐gel digests | |
JP2004347604A (ja) | 生物学的状態の情報を同定するための生体液および他の流体の複合混合物を分析するシステム | |
US20160377635A1 (en) | Measurement of Oxytocin and Vasopressin | |
CN110678756B (zh) | 使用质谱法对低丰度多肽进行绝对定量的方法 | |
CN113777178A (zh) | 基于混合谱图库的蛋白质组学背景库、其构建方法及应用 | |
CN115004023A (zh) | 一种用于分析体液蛋白质组的方法 | |
US20030032017A1 (en) | Quantification of low molecular weight and low abundance proteins using high resolution two-dimensional electrophoresis and mass spectrometry | |
EP2820425A1 (en) | Selector based recognition and quantification system and method for multiple analytes in a single analysis | |
US20050196789A1 (en) | Preparation of biologically derived fluids for biomarker determination by mass spectrometry | |
Diamandis | Biomarker validation is still the bottleneck in biomarker research | |
CN114839253A (zh) | 血清或血浆中低分子量蛋白定量分析方法及应用 | |
Cheon et al. | Low-molecular-weight plasma proteome analysis using top-down mass spectrometry | |
CN116893215A (zh) | 一种用于监测car-t治疗之后crs进程的临床标志物及其应用 | |
CN117129550A (zh) | 一种区分car-t治疗之后crs重轻症的临床标志物及其应用 | |
AU2012200087A1 (en) | High Sensitivity Quantitation of Peptides by mass Spectrometry | |
CN111707748A (zh) | 一种筛选检测少弱精症相关蛋白标志物的方法及其应用 | |
Mousseau et al. | Ultra Low-cost DNA Miniprep Spin-Columns for Rapid Filter-Trapped Proteomics Sample Preparation | |
Hatano et al. | Data for proteomic analysis of in situ digestion of alcohol-fixed cells for quantitative proteomics | |
Coelho Graça et al. | Ultrahigh Performance Mass Spectrometry in Clinical Chemistry: A Taste of the Future? | |
Calvo et al. | Unraveling biomarkers of abdominal aortic aneurisms by iTRAQ analysis of depleted plasma | |
KR101114446B1 (ko) | 프로테오믹스기법을 이용한 임신중독 특이 표지 단백질 및 진단방법 | |
An et al. | Enrichment of Serum Peptides and Analysis by MALDI-TOF Mass Spectrometry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40083992 Country of ref document: HK |