JP4051400B2 - プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 - Google Patents
プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 Download PDFInfo
- Publication number
- JP4051400B2 JP4051400B2 JP2007518865A JP2007518865A JP4051400B2 JP 4051400 B2 JP4051400 B2 JP 4051400B2 JP 2007518865 A JP2007518865 A JP 2007518865A JP 2007518865 A JP2007518865 A JP 2007518865A JP 4051400 B2 JP4051400 B2 JP 4051400B2
- Authority
- JP
- Japan
- Prior art keywords
- protein
- list
- sample
- obtaining
- specific
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 108090000623 proteins and genes Proteins 0.000 title claims description 232
- 102000004169 proteins and genes Human genes 0.000 title claims description 231
- 238000000034 method Methods 0.000 title claims description 50
- 238000004458 analytical method Methods 0.000 title claims description 29
- 238000012216 screening Methods 0.000 title claims description 29
- 108010026552 Proteome Proteins 0.000 title claims description 16
- 238000004949 mass spectrometry Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 description 20
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 102000004142 Trypsin Human genes 0.000 description 4
- 108090000631 Trypsin Proteins 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 239000012588 trypsin Substances 0.000 description 4
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 238000000018 DNA microarray Methods 0.000 description 3
- 102000018899 Glutamate Receptors Human genes 0.000 description 3
- 108010027915 Glutamate Receptors Proteins 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 102000007079 Peptide Fragments Human genes 0.000 description 3
- 108010033276 Peptide Fragments Proteins 0.000 description 3
- 101710100170 Unknown protein Proteins 0.000 description 3
- 229940098773 bovine serum albumin Drugs 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 102000015694 estrogen receptors Human genes 0.000 description 3
- 108010038795 estrogen receptors Proteins 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 102000029816 Collagenase Human genes 0.000 description 2
- 108060005980 Collagenase Proteins 0.000 description 2
- 102100037840 Dehydrogenase/reductase SDR family member 2, mitochondrial Human genes 0.000 description 2
- 238000004252 FT/ICR mass spectrometry Methods 0.000 description 2
- 101710188053 Protein D Proteins 0.000 description 2
- 101710132893 Resolvase Proteins 0.000 description 2
- 229960002424 collagenase Drugs 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000000539 two dimensional gel electrophoresis Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000005040 ion trap Methods 0.000 description 1
- 238000000534 ion trap mass spectrometry Methods 0.000 description 1
- 238000000752 ionisation method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000000816 matrix-assisted laser desorption--ionisation Methods 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 230000013777 protein digestion Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Urology & Nephrology (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Hematology (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Food Science & Technology (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Description
一般に、蛋白質の研究において、分離精製には電気泳動や特異的吸着を利用するカラムクロマトグラフィーを用い、分析にはプロテインシーケンサー、NMR、X線解析を用いる(ゲノミクス・プロテオミクスの新展開,今中忠行監修,2004年,株式会社エヌ・ティー・エスおよびタンパク質実験ノート(上・下),改訂第3版,岡田雅人および宮崎香編,2004年,羊土社)。これらの手法は、コストがかかること、再現性のあるデータの取得が困難であること、分析時間が長いことなどの問題があった。近年、質量分析計の著しい発展に伴い、質量分析計を用いたプロテオミクスが行われている。蛋白質分離後の測定方法としては、ESI、MALDIなどのイオン化方法を用いた質量分析計を用いる。
現在使用されている蛋白質混合物の分離方法として、蛋白質の等電点および大きさの違いに基づいて分離する2次元電気泳動がある。また、酵素消化後のペプチドを分離する方法として、イオン交換カラムと逆相カラムとを組み合わせた2次元HPLCもある(S.P.Gygiら,J.Proteome Research,2003年,43巻,pp.43−50)。このような2次元電気泳動あるいは2次元HPLC(2DLC)と質量分析計とを組み合わせることによって、蛋白質の分離精製の必要がないプロテオーム解析方法が開発されている(S.P.Gygiら,J.Proteome Research,2003年,43巻,pp.43−50およびS.P.Gygiら,J.Mass Spectrom.,2001年,36巻,pp.1083−1091)。最近の測定方法では、蛋白質をそのまま質量分析計に注入する、ECD−FTICRMSnやETD/LTQMSnのトップダウンシーケンスの手法もある(R.A.Zubarevら,J.Am.Chem.Soc.,1998年,120巻,pp.3265−3266;R.A.Zubarevら,Curr.Opin.Biotechnol.,2004年,15巻,pp.12−16;J.E.Sykaら,Proc.Natl.Acad.Sci.U.S.A.,2004年,101巻,pp.9528−9533;およびJ.J.Coonら,Int.J.Mass Spectrom.,2004年,236巻,pp.33−42)。
一般的に、特異的蛋白質をスクリーニングする場合、目的蛋白質を含む細胞または組織、および目的蛋白質を含まない細胞または組織の2種類を用意し、この2種類の細胞または組織から抽出された各試料について蛋白質の同定を行い、その同定結果を比較する。プロテオーム解析の場合は、各細胞または組織から蛋白質を分画・精製し、得られた蛋白質混合物を、蛋白質分解酵素によりペプチドフラグメントに分解し、ペプチドフラグメントを測定する。測定結果と蛋白質分解酵素の情報とを組み合わせて、ゲノムのデータベースと照合し、蛋白質を同定する。これらの質量分析によって得られたデータについてのデータベース検索ソフトが市販されている。
上述のように、プロテオーム解析方法については、様々な方法がある。しかし、いずれの方法においても、例えば以下の理由から、種類の異なる蛋白質検索結果を比較して、効率的に特異的蛋白質をスクリーニングする方法は確立されていない。
(1)検索結果から得られる蛋白質の種類が非常に多く、データが膨大であること;
(2)蛋白質の多くは発現量の多い蛋白質であり(S.P.Gygiら,Mol.Cell Biol.,1999年,19巻,p.1720およびS.P.Gygiら,Proc.Natl.Acad.Sci.U.S.A.,2000年,97巻,pp.9390−9395)、発現量の少ない蛋白質は、その発現量の変化を見つけることが非常に困難であること;
(3)溶解性の悪い蛋白質では細胞からの抽出による再現性が要求されること;
(4)細胞分画や蛋白質の粗精製・濃縮操作による再現性が要求されること;
(5)酵素消化処理での再現性が要求されること;
(6)上記(3)〜(5)の問題を解消するために、内部標準物質を加える方法があるが、適切な内部標準物質が必要であり、多量の内部標準物質と発現量の少ない蛋白質とが重なると、その蛋白質を検出することが困難となること;および
(7)上記(3)〜(5)の問題を解消するために、ICAT(isotope−coded affinity tag;同位体標識アフィニティータグ)の試薬を蛋白質のシステイン残基に結合させる方法があり、これは微量な蛋白質の発現を比較するために有効な手段であるが、ICAT試薬を必要とすること(S.P.Gygiら,Nat.Biotechnol.,1999年,17巻,pp.994−999)。
上記のような膨大なデータを解析するためのデータ処理方法も検討されている(特開2005−031021号公報)。しかし、処理して得られたデータが、実際に特異的蛋白質のスクリーニングに有効であるかどうかについては十分に検討されていない。
本発明は、膨大な蛋白質のハイスループットな機能解析が求められるプロテオーム解析において、特異的蛋白質を効率よくハイスループットにスクリーニングするための新規な方法を提供することを目的とする。
本発明は、プロテオーム解析における特異的蛋白質のスクリーニング方法を提供し、該方法は、
(a1)特異群の細胞または組織から、蛋白質または蛋白質消化物を含む試料を得る工程;
(a2)対照群の細胞または組織から、蛋白質または蛋白質消化物を含む試料を得る工程;
(b1)該工程(a1)で得られた試料を質量分析計で分析して、質量分析データを得る工程;
(b2)該工程(a2)で得られた試料を質量分析計で分析して、質量分析データを得る工程;
(c1)該工程(b1)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
(c2)該工程(b2)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
(d1)該工程(c1)で取得したすべての蛋白質リストにおいて、該要素ごとに該指標の値を平均化し、該指標の平均値を含む特異群の蛋白質リストモデルを取得する工程;
(d2)該工程(c2)で取得したすべての蛋白質リストにおいて、該要素ごとに該指標の値を平均化し、該指標の平均値を含む対照群の蛋白質リストモデルを取得する工程;
(e)該工程(d1)で得られた特異群の蛋白質リストモデルと該工程(d2)で得られた対照群の蛋白質リストモデルとの間で該要素ごとに該平均値の差を算出して、該要素を該平均値の差の順に並べ替えた1つの蛋白質リストを取得する工程;および
(f)該工程(e)で取得した蛋白質リストから、該平均値の差が大きい蛋白質を選択する工程;
を含む。
好適な実施態様では、上記蛋白質を同定するための指標は、スコア、Coverage、またはランキングである。
より好適な実施態様では、上記蛋白質を同定するための指標は、スコアである。
好適な実施態様では、上記蛋白質を特定する要素は、Accession numberまたは蛋白質名である。
好適な実施態様では、上記工程(d1)、(d2)、および(e)は、任意のコンピュータプログラムによって実行される。
本発明の方法によれば、多量の未知の蛋白質混合物を包括的に分析した際の膨大なデータを解析するための手法が提供され、実験誤差および擬陽性データを取り除いて、特異的蛋白質の候補を効率よく絞り込むことができる。本発明の方法では、従来のプロテオーム解析と比較して、スクリーニングの結果の再現性および正確性が向上している。また、本発明の方法は、比較的低コストかつハイスループットでのスクリーニングが可能である。さらに、本発明のスクリーニング方法によって選択された特異的蛋白質についての半定量的な判定も可能である。
図2は、ヒト由来肝細胞のエストロゲンレセプター(A)およびグルタミン酸レセプター(B)についてのスコア値を示すグラフである。
図3は、各症例別のスコアの分布を示すグラフである。
図4は、特異的な3種類の蛋白質(A〜C)についての、各試料のスコア値を示すグラフである。
図5は、特異的な3種類の蛋白質(D〜F)についての、各試料のスコア値を示すグラフである。
図6は、種々の範囲のモデルスコア値に対応する蛋白質名およびAccession numberの数を示すグラフである。
図7は、各試料のスコア35以上のAccession numberの数および蛋白質の濃度を示すグラフである。
一般的に、プロテオーム解析における特異的蛋白質のスクリーニングにおいては、特異的蛋白質が発現していると予想される場合であっても、蛋白質が存在するか否かは不明であり、特異的と判断するための基準も、蛋白質の種類、処理方法、試料濃度、個体差などのため一定ではない。これに対しては、n数を増やすことにより、スクリーニング結果の信頼性を高めることができる。しかし、n数の増加に伴って、リストアップされる蛋白質の数が増え、処理すべきデータが膨大になる。これらを個々について検討することは、非常に大きな労力および時間を必要とする(図1の従来のスクリーニング方法の概念図を参照のこと)。
そこで、本発明者らは、蛋白質を特異的と判断する基準が曖昧であること、試料間で再現性の問題があること、ならびに個体差が各検索結果に反映されていることに注目した。試料を、例えば、特異的蛋白質の変動があると予想される群とそれに対する対照群とに群分けし、各群内で個々の試料の質量分析データの解析によって得られる蛋白質を特定する要素(蛋白質名、Accession numberなど)ごとに、蛋白質の同定をするための指標(スコア、Coverage、ランキングなど)の平均値を算出することにより、各群の各蛋白質のモデル的な指標値を求めることができる。図1の本発明のスクリーニング方法の概念図に基づいて説明すると、A群の各試料A1〜A3についての蛋白質リストモデルAおよびB群の各試料B1〜B3についての蛋白質リストモデルBをそれぞれ作成し、このモデル間で比較を行う。比較とは、具体的には、各要素の指標の差を求めることである。次いで、その差に基づいて蛋白質リストを整理する。こうして得られた蛋白質リストを用いると、特異的蛋白質を絞り込むことが容易である。例えば、整理された蛋白質リストの蛋白質Xという要素のモデル指標値をXAおよびXBとすると、XA−XB値が大きい場合はXがA群に特異的な蛋白質であり、小さい場合はB群に特異的な蛋白質であると容易に判断できる。
したがって、本発明のプロテオーム解析における特異的蛋白質のスクリーニング方法は、以下の工程:
(a1)特異群の細胞または組織から、蛋白質または蛋白質消化物を含む試料を得る工程;
(a2)対照群の細胞または組織から、蛋白質または蛋白質消化物を含む試料を得る工程;
(b1)該工程(a1)で得られた試料を質量分析計で分析して、質量分析データを得る工程;
(b2)該工程(a2)で得られた試料を質量分析計で分析して、質量分析データを得る工程;
(c1)該工程(b1)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
(c2)該工程(b2)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
(d1)該工程(c1)で取得したすべての蛋白質リストにおいて、該要素ごとに該指標の値を平均化し、該指標の平均値を含む特異群の蛋白質リストモデルを取得する工程;
(d2)該工程(c2)で取得したすべての蛋白質リストにおいて、該要素ごとに該指標の値を平均化し、該指標の平均値を含む対照群の蛋白質リストモデルを取得する工程;
(e)該工程(d1)で得られた特異群の蛋白質リストモデルと(d2)で得られた対照群の蛋白質リストモデルとの間で該要素ごとに該平均値の差を算出して、該要素を該平均値の差の順に並べ替えた1つの蛋白質リストを取得する工程;および
(f)該工程(e)で取得した蛋白質リストから、該平均値の差が大きい蛋白質を選択する工程;
を含む。
以下、本発明を工程の順に詳細に説明する。
工程(a1)および(a2):
本発明の方法では、まず、工程(a1)および(a2)において、特異群および対照群の細胞または組織から、それぞれ蛋白質または蛋白質消化物を含む試料を得る。
「特異群」とは、スクリーニングの対象となる群をいい、発現量が特異的に変動している蛋白質の存在が予想される群をいう。例えば、特定の病態群;化学物質、光、温度などの特定の条件への曝露群が挙げられる。「対照群」とは、上記特異群と比較するための群であり、例えば、特定の病態ではない群(例えば、正常群);種々の条件の曝露などを受けていない群が挙げられる。「細胞または組織」とは、上記の特異群および対照群に由来する、単離された細胞または組織をいう。例えば、培養細胞、血液細胞、バイオプシーにより体内から取り出された組織または細胞などが挙げられる。
まず、組織を用いる場合は、蛋白質分解酵素処理、例えば、コラゲナーゼ処理などの当業者が通常用いる手段によって細胞を分離する。細胞または組織から分離した細胞は、適切な緩衝液中で、例えば、ホモジナイザーなどの当業者が通常用いる手段を用いて破砕される。蛋白質を含む試料は、この破砕によって得られた懸濁液自体であってもよく、あるいは必要に応じてさらに分画して得られた画分であってもよい。蛋白質を含む試料は、必要に応じて、さらにトリプシンなどの蛋白質消化酵素で消化してもよく、この消化処理によって、蛋白質消化物を含む試料を得ることができる。
これらの工程(a1)および(a2)において、各群の試料のn数は、特に限定されないが、試料の個体差の影響を除くことができる点で、n数が多い方が好ましい。
工程(b1)および(b2):
この工程(b1)および(b2)では、上記工程(a1)および(a2)で得られた各群の試料を質量分析計で分析して、試料ごとの質量分析データを得る。
「質量分析」(MS)とは、分析する試料をイオン化させて導入し、電気力や磁気力により質量ごとの差をつくり、イオンの質量を分析することである。MSの測定原理としては、イオントラップ型MS法、フーリエ変換イオンサイクロトロン共鳴質量分析(FT−ICR/MS)法、イオンスキャン法、Q−TOF型MS法などが挙げられ、それぞれの原理に基づく質量分析計が存在する。本発明の方法においては、1方法だけ(すなわち、1つの質量分析計のみ)で分析してもよく、あるいは複数の質量分析計を連結させて分析(以下MS/MS解析)してもよい。
工程(c1)および(c2):
これらの工程(c1)および(c2)では、上記工程(b1)および(b2)で得られた各試料の質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する。
「データベース検索ソフトウェア」は、MSデータから分子量が合致するペプチドフラグメントの候補の検出、さらにこのフラグメントから、任意のデータベースを検索して蛋白質全体を予測する解析ソフトウェアであればよい。市販されているソフトウェアとしては、Mascot(Matrix Science社)、Turbo Sequest(サーモエレクトロン社)などが挙げられる。利用可能なデータベースとしては、例えば、BLAST、Swiss−Protが挙げられる。このようなデータベース検索ソフトウェアは、MSデータを出力するために質量分析計とともに備えられているコンピュータ部に、予め組み込まれていることが好ましい。
上記データベース検索ソフトウェアによる解析の結果、蛋白質を特定する要素および該特定された蛋白質の同定をするための指標などを含む、試料ごとの蛋白質リストが得られる。蛋白質を特定する要素としては、Accession number、蛋白質名などが挙げられる。また、蛋白質の同定をするための指標としては、スコア(Score)、Coverage、ランキングなどが挙げられる。
工程(d1)および(d2):
これらの工程(d1)および(d2)では、上記工程(c1)および(c2)で取得した各群のすべての蛋白質リストにおいて、要素ごとに指標の値を平均化し、指標の平均値を含む特異群および対照群のそれぞれの蛋白質リストモデルを取得する。言い換えると、各群について、蛋白質リストに挙げられたすべての蛋白質を特定する要素と、該要素に対応する指標の平均値とを、1つのリストに統合することによって、各群のモデル的な蛋白質リストを得ることができる。
これらの工程において、平均化する指標は、スコア、Coverage、ランキングなどのいずれか1つであり、好ましくはスコアである。
工程(e):
工程(e)では、上記工程(d1)および(d2)で得られた特異群および対照群の2つの蛋白質リストモデル間で、要素ごとに指標の平均値の差を算出して、要素を平均値の差の順に並べ替えた1つの蛋白質リストを取得する。平均値の差は、(特異群の値)−(対照群の値)で表され得る。したがって、平均値の差は、正の値から負の値まで種々であり得る。差の順は、昇順であっても降順であってもよい。並べ替えることによって、特異的蛋白質の情報として有用なものの順に蛋白質を整理することができるため、以下の工程(f)において、差の大きな蛋白質の選択が容易になる。
ここで、工程(d1)および(d2)ならびに(e)では、これらの工程を実行するようにプログラムされたコンピュータソフトウェアを用いてデータ処理され得る。例えば、上記のデータベース検索ソフトウェアとともに、質量分析計のコンピュータ部に組み込まれていてもよい。あるいは、上記の工程(c1)および(c2)でデータベース検索ソフトウェアによって得られた蛋白質リストは、サーバーやパーソナルコンピュータ(PC)などにエクスポートされ得る。例えば、Turbo Sequestで得られたデータを、PC用の表計算ソフトウェアであるマイクロソフト社のMicrosoft Excel登録商標にエクスポートするためのソフトウェアがある。データがエクスポートされ得るソフトウェアにおいて、上記工程(d1)および(d2)ならびに(e)を実行するためのマクロプログラムを組むことが可能である。したがって、PCなどにおいてこのプログラムを実行することによって、平均値の差の順に並べ替えた1つの蛋白質リストを取得することも可能である。
工程(f):
工程(f)では、上記工程(e)において得られた平均値の差の順に並べ替えた1つの蛋白質リストから、平均値の差が大きい蛋白質を選択する。ここで、平均値の差が大きいとは、その絶対値が大きいことをいう。これによって、蛋白質リストに挙げられた膨大な数の蛋白質から、特異的蛋白質の候補を効率よく絞り込むことができる。
この工程で選択した蛋白質は、必ずしも特異的蛋白質ではない。なぜなら、例えば、n数が小さい場合には、特異群および対照群のいずれにおいても非常に発現量の多い蛋白質において、差の値が大きくなる場合があり、その差が発現量の変動の範囲内であることがある。したがって、候補として選択された蛋白質について、特異的蛋白質であるかどうかを個々に検証する必要がある。
検証の手段は、特に限定されない。例えば、上記のスクリーニング方法で使用した特異群および対照群に属する別の複数の試料について、質量分析データを解析し、候補蛋白質の各試料における指標値を蛋白質リストモデル中の候補蛋白質の指標値と比較することによって、変動の範囲内の可能性が高いかどうか、あるいは特異的蛋白質であると同定し得るかどうかを検証し得る。本発明の方法によれば、この検証の作業はやや煩雑なように見える。しかし、1つの試料から数万の蛋白質がリストアップされ、それらを個々に比較検討/検証しなければならない従来のスクリーニング作業を比較すると、本発明の方法では、検証すべき蛋白質が数種から数十種に絞り込まれ得るため、非常に効率よく特異的蛋白質を同定できる。
さらに、本発明の方法によって同定された特異的蛋白質については、未知試料の質量分析データの解析によって得られた蛋白質リスト中のスコアなどの要素の値から、蛋白質リストモデル中の平均値との比較によって、特異群であるか否かの半定量的判定を行うことも可能である。
上記システムによる解析結果として、各蛋白質のスコア値を含む個々の試料についての蛋白質リストが得られる。試料群についての平均のスコア値を求める場合は、各試料群内において蛋白質ごとにスコア値の平均値を算出する。算出した平均値について、蛋白質ごとに群間で平均スコア値の差を算出し、その順に蛋白質リストを並べ替える。以下の実施例においては、上記データベース検索ソフトウェアから得られた解析結果を、マイクロソフト社のMicrosoft Excel登録商標にエクスポートし、各試料群において蛋白質ごとの平均スコア値を含む蛋白質リストモデルを取得し、群間で蛋白質の平均スコア値の差を求めて、その差が大きい順に並べ替えた蛋白質リストを作成するようにマクロプログラムを組み、これを実行することによって、整理された蛋白質リストを得た。
(実施例1)
ウシ血清アルブミン(BSA)を、以下の表1に記載の種々の濃度の水溶液に調製し、トリプシン消化した後、質量分析計でそれぞれ2回分析し、質量分析データをデータベース検索ソフトウェアで解析して、蛋白質リストを得た。各濃度におけるBSAと同定された蛋白質のスコア値を表1に示す。
(実施例2)
以下の表2に示すヒト由来の肝細胞を洗浄後、緩衝液を加えて、氷冷下にて破砕した。得られた懸濁液をトリプシン消化し、質量分析計で測定を行い、質量分析データをデータベース検索ソフトウェアで解析して、蛋白質リストを得た。
エストロゲンレセプター(A)については、女性のスコア値の平均値は約90であり、男性では約30であった。エストロゲンは女性ホルモンであるため、その受容体が女性群でスコア値が大きいのは妥当な結果である。グルタミン酸レセプター(B)では、試料番号3(64歳女性)のスコア値が大きく、これが老化に関与する蛋白質である可能性が示唆された。なお、本実施例においては、各試料の蛋白質リストの蛋白質数は5〜6万個であり、そのうちの約3割に相当する2万個が全ての試料で見られた蛋白質であった。
(実施例3)
ヒトにおけるある疾患において異なる病態を示す症例から採取した組織を用いた。一方の病態を示す6症例を対照群(試料番号1〜6)、および他方の病態を示す13症例を特異群(試料番号7〜19)とした。得られた組織をそれぞれコラゲナーゼ処理して、細胞を分離した。細胞を洗浄後、氷冷下にて破砕した。得られた懸濁液を1,000×gで遠心分離し、上清を回収して細胞質画分を得た。上清をトリプシン消化し、質量分析計で測定を行い、質量分析データをデータベース検索ソフトウェアで解析して、それぞれの症例に由来する試料についての蛋白質リストを得た。
各試料においてスコア>2.0を満たすAccession numberは、平均で56,050個であった。スコアの範囲は、2.0〜2000強であった。各試料別のスコアの分布を図3に示す。1症例あたりのAccession number数は平均で、スコア2.0以上3.5未満が50677、スコア3.0以上100.0未満が4942、およびスコア100以上が431であった。
上記の解析結果、すなわち各試料の蛋白質リストを、Microsoft Excel登録商標にエクスポートし、Accession numberでスコアの平均値を求めて整理するマクロプログラムを実行した。対照群については、試料番号1〜6のすべての試料についてマクロプログラムを実行し、対照群モデルスコア値を得た。特異群については、試料番号7〜19のすべてについて蛋白質リストをAccession numberごとに整理させたが、蛋白質リストモデルの作成については、特に病態の著しい試料番号7、10、11、および12のみを用いて実行し、特異群モデルスコア値を得た。
特異群モデルスコア値と対照群モデルスコア値との差(Score of difference number)の大きい順に並べ替えたところ、19症例由来の試料の163780の総Accession number数のうち、Score of difference numberの上位20番以内で、6種類の特異的蛋白質A〜Fを同定した。これらの蛋白質についての各試料のスコアを、図4および5に示す。これらの蛋白質は、対照群よりも特異群でスコア値が高い傾向にあるため、この病態の指標になり得ることがわかる。
例えば、特異的な蛋白質の一例である蛋白質D(図5)を検証してみると、特異群では、115〜5587までのランキング値であり、対照群では、該当なしならびに6354〜25515であった(データは示さず)。このように、蛋白質Dは、蛋白質の発現量が非常に少ないため、本発明の方法では特異的蛋白質であると同定可能であったが、従来のスクリーニング方法では見出すことができなかったと考えられる。
スクリーニング方法の信頼性を確保するために、蛋白質を特定する要素として、Accession numberの代わりに蛋白質名を用いて上記と同様に蛋白質リストモデルを作成し、モデルスコア値の差(特異群モデルスコア値−対照群モデルスコア値)を算出した。種々の範囲のモデルスコア値の差に対応する蛋白質名およびAccession numberの数を、図6に示す。
19試料の総蛋白質数は、蛋白質名で検索した場合は75195個であり、Accession numberで検索した場合は163780個であった。Accession numberの方が88585個多いが、これは総蛋白質数の集計ではUnnamed proteinが含まれていないこと、ならびに異なるAccession numberでも同じ蛋白質名であるものは、蛋白質数の集計に含まれていないためである。
特異群モデルスコア−対照群モデルスコア値は、ほとんどが±5以内にあり、特異的な蛋白質の検索にはどちらを用いても、大差はなかった。また、スコア値の差が10以上の蛋白質は、いずれの場合も総蛋白質の量と比較するとごく僅かとなっていることが確認できる。特異的蛋白質は、スコア値の差が10以上の枠にあると考えられ、蛋白質名およびAccession numberのいずれで検索した場合も、選択された特異的蛋白質な同じであった(データは示さず)。
さらに、蛋白質の濃度の違いによるスコア値への影響についても確認した。ここでは、スクリーニング結果より、スコア35以上のAccession numberの数と蛋白質の濃度とを比較した結果を図7に示す。蛋白質の濃度に依存して、スコア値が変動していることがわかる。また試料番号3および9のように、濃度が高いにもかかわらず、スコア値35以上のAccession numberの数が少ないものもあった。この原因として、質量分析測定での噴霧状態が悪くイオン化効率が悪かったこと、酵素消化での消化効率が悪かったことなどが考えられる。この結果からも、各試料を全く同条件で測定することが困難であることがわかる。したがって、このようなばらつきのある試料の場合でも、本発明のスクリーニング方法が有効に利用できることがわかる。
したがって、本発明のスクリーニング方法によって種々の病態時や薬物などの曝露によって発現する特異的蛋白質を同定できる。そのため、この蛋白質が関連する疾患などの診断、治療、または予防、あるいはそのための薬剤の開発に非常に有用である。
Claims (3)
- プロテオーム解析における特異的蛋白質のスクリーニング方法であって:
(a1)特異群の細胞または組織から、蛋白質または蛋白質消化物を含む各試料を得る工程;
(a2)対照群の細胞または組織から、蛋白質または蛋白質消化物を含む各試料を得る工程;
(b1)該工程(a1)で得られた各試料を質量分析計で分析して、質量分析データを得る工程;
(b2)該工程(a2)で得られた各試料を質量分析計で分析して、質量分析データを得る工程;
(c1)該工程(b1)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
(c2)該工程(b2)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
(d1)該工程(c1)で取得したすべての蛋白質リストにおいて、該すべてのタンパク質リストの該指標の値を該要素ごとに平均化し、1つの蛋白質リストに統合することによって、該指標の平均値を含む特異群の蛋白質リストモデルを取得する工程;
(d2)該工程(c2)で取得したすべての蛋白質リストにおいて、該すべてのタンパク質リストの該指標の値を該要素ごとに平均化し、1つの蛋白質リストに統合することによって、該指標の平均値を含む対照群の蛋白質リストモデルを取得する工程;
(e)該工程(d1)で得られた特異群の蛋白質リストモデルと該工程(d2)で得られた対照群の蛋白質リストモデルとの間で該要素ごとに該平均値の差を算出して、該要素を該平均値の差の順に並べ替えた1つの蛋白質リストを取得する工程;および
(f)該工程(e)で取得した蛋白質リストから、該平均値の差が大きい蛋白質を選択する工程;
を含み、
該蛋白質を同定するための指標が、スコア、 Coverage 、またはランキングであり、そして
該蛋白質を特定する要素が、 Accession number または蛋白質名である、
方法。 - 前記蛋白質を同定するための指標が、スコアである、請求項1に記載の方法。
- 前記工程(d1)、(d2)、および(e)が、任意のコンピュータプログラムによって実行される、請求項1または2に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005159562 | 2005-05-31 | ||
JP2005159562 | 2005-05-31 | ||
PCT/JP2006/302594 WO2006129401A1 (ja) | 2005-05-31 | 2006-02-08 | プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4051400B2 true JP4051400B2 (ja) | 2008-02-20 |
JPWO2006129401A1 JPWO2006129401A1 (ja) | 2008-12-25 |
Family
ID=37481334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007518865A Expired - Fee Related JP4051400B2 (ja) | 2005-05-31 | 2006-02-08 | プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20090132171A1 (ja) |
EP (1) | EP1887351A4 (ja) |
JP (1) | JP4051400B2 (ja) |
WO (1) | WO2006129401A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109891523A (zh) * | 2016-11-16 | 2019-06-14 | 东京Cosmos电机株式会社 | 可变电阻器用开关装置 |
CN109906492A (zh) * | 2016-11-16 | 2019-06-18 | 东京Cosmos电机株式会社 | 可变电阻器用开关装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011146521A2 (en) | 2010-05-17 | 2011-11-24 | The Uab Research Foundation | A general mass spectrometry assay using continuously eluting co-fractionating reporters of mass spectrometry detection efficiency |
CN103501859B (zh) * | 2011-03-02 | 2017-08-25 | 博格有限责任公司 | 基于细胞的探询式分析及其应用 |
EA038600B1 (ru) * | 2012-04-02 | 2021-09-21 | Берг Ллк | Основанные на клетках перекрестные анализы и их применение |
WO2016040725A1 (en) | 2014-09-11 | 2016-03-17 | Berg Llc | Bayesian causal relationship network models for healthcare diagnosis and treatment based on patient data |
CN115116539A (zh) * | 2022-05-09 | 2022-09-27 | 腾讯科技(深圳)有限公司 | 对象确定方法、装置、计算机设备和存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6446010B1 (en) * | 1999-06-15 | 2002-09-03 | The Rockefeller University | Method for assessing significance of protein identification |
US7045296B2 (en) * | 2001-05-08 | 2006-05-16 | Applera Corporation | Process for analyzing protein samples |
EP1446495A4 (en) * | 2001-10-01 | 2006-06-07 | Diversa Corp | ENTIRE CELL ENGINEERING USING REAL-TIME METABOLIC FLOW ANALYSIS |
JP2005536714A (ja) * | 2001-11-13 | 2005-12-02 | カプリオン ファーマシューティカルズ インコーポレーティッド | 質量強度プロファイリングシステムおよびその使用法 |
JP2003279578A (ja) * | 2002-03-26 | 2003-10-02 | National Shikoku Cancer Center | 癌の診断支援方法及びそのキット |
US20030065451A1 (en) * | 2002-08-22 | 2003-04-03 | Pineda Fernando J. | Method and system for microorganism identification by mass spectrometry-based proteome database searching |
ATE418729T1 (de) * | 2002-08-22 | 2009-01-15 | Applera Corp | Verfahren zur charakterisierung von biomolekülen mittels resultat-gesteuerter strategie |
EP1641821A2 (en) * | 2003-06-30 | 2006-04-05 | Genova Ltd. | Human secreted proteins |
-
2006
- 2006-02-08 JP JP2007518865A patent/JP4051400B2/ja not_active Expired - Fee Related
- 2006-02-08 WO PCT/JP2006/302594 patent/WO2006129401A1/ja active Application Filing
- 2006-02-08 EP EP06713735A patent/EP1887351A4/en not_active Withdrawn
- 2006-02-08 US US11/915,981 patent/US20090132171A1/en not_active Abandoned
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109891523A (zh) * | 2016-11-16 | 2019-06-14 | 东京Cosmos电机株式会社 | 可变电阻器用开关装置 |
CN109906492A (zh) * | 2016-11-16 | 2019-06-18 | 东京Cosmos电机株式会社 | 可变电阻器用开关装置 |
CN109906492B (zh) * | 2016-11-16 | 2021-03-16 | 东京Cosmos电机株式会社 | 可变电阻器用开关装置 |
Also Published As
Publication number | Publication date |
---|---|
EP1887351A1 (en) | 2008-02-13 |
WO2006129401A1 (ja) | 2006-12-07 |
US20090132171A1 (en) | 2009-05-21 |
EP1887351A4 (en) | 2009-04-08 |
JPWO2006129401A1 (ja) | 2008-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Patterson et al. | Proteomics: the first decade and beyond | |
Hüttenhain et al. | Perspectives of targeted mass spectrometry for protein biomarker verification | |
US8909481B2 (en) | Method of mass spectrometry for identifying polypeptides | |
JP4768189B2 (ja) | 非標的化複雑試料分析の方法 | |
Panchaud et al. | Experimental and computational approaches to quantitative proteomics: status quo and outlook | |
JP4654230B2 (ja) | マススペクトル測定方法 | |
JP4672614B2 (ja) | 迅速かつ定量的なプロテオーム解析および関連した方法 | |
Blueggel et al. | Bioinformatics in proteomics | |
US20060269944A1 (en) | Mass Intensity profiling system and uses thereof | |
US20100137151A1 (en) | Protein Expression Profile Database | |
Bowler et al. | Proteomics in pulmonary medicine | |
JP4051400B2 (ja) | プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 | |
BRPI0711967A2 (pt) | ensaio de biomarcador de espectrometria de massa | |
JP2011521215A (ja) | 前立腺癌の診断及び治療のためのバイオマーカー及び薬剤標的発見法、並びにそれを用いて決定されるバイオマーカーアッセイ | |
JP2007531874A (ja) | 新規データベース探索様式を用いるタンパク質の特定及び特徴付け | |
JP2006510875A (ja) | コンステレーションマッピングおよびそれらの使用 | |
US20060292631A1 (en) | Elastin peptide fingerprints and analysis methods for mmp12 related to copd | |
Vaezzadeh et al. | Proteomics and opportunities for clinical translation in urological disease | |
Reisdorph et al. | Proteomics methods and applications for the practicing clinician | |
Henry et al. | Introduction to sample preparation for proteomics and mass spectrometry | |
WO2002021428A1 (en) | Reference database | |
Patankar | Critical Analysis of the Computational Methods used to Discover Biomarkers to assist in the Early Detection of Disease | |
Duan | Proteomics and Functional Proteomics | |
US20100203565A1 (en) | Peptide Fingerprint from the Degradation of Elastin by HNE | |
AU2002363690A1 (en) | Mass intensity profiling system and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071203 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101207 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101207 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111207 Year of fee payment: 4 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
LAPS | Cancellation because of no payment of annual fees |