JP4051400B2 - プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 - Google Patents

プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 Download PDF

Info

Publication number
JP4051400B2
JP4051400B2 JP2007518865A JP2007518865A JP4051400B2 JP 4051400 B2 JP4051400 B2 JP 4051400B2 JP 2007518865 A JP2007518865 A JP 2007518865A JP 2007518865 A JP2007518865 A JP 2007518865A JP 4051400 B2 JP4051400 B2 JP 4051400B2
Authority
JP
Japan
Prior art keywords
protein
list
sample
obtaining
specific
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007518865A
Other languages
English (en)
Other versions
JPWO2006129401A1 (ja
Inventor
理恵子 後藤
昇平 塩山
善三郎 戸塚
邦男 籾山
靖司 中村
健一 覚道
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JCL Bioassay Corp
Original Assignee
JCL Bioassay Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JCL Bioassay Corp filed Critical JCL Bioassay Corp
Application granted granted Critical
Publication of JP4051400B2 publication Critical patent/JP4051400B2/ja
Publication of JPWO2006129401A1 publication Critical patent/JPWO2006129401A1/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Food Science & Technology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

本発明は、プロテオーム網羅的解析における特異的蛋白質のハイスループットスクリーニング方法に関する。
創薬や医療診断の基礎研究としてゲノミクスやプロテオミクスがある。ゲノミクスは、DNAマイクロアレイ、DNAチップなどの有効な分析ツールの開発およびこれらの実用化により、ヒト遺伝子が全て解明されるなどの成果を修めている。プロテオームの網羅的解析(プロテオミクス)も、蛋白質の構造および量の異常で起こる病気に対して、その蛋白質を特定し、診断方法、治療方法、および治療薬を開発するために盛んに行われている。しかし、プロテオミクスは1980年代にスタートしたにもかかわらず、サンプルの倫理的問題やゲノミクスにおけるDNAチップのような包括的に解析できるツールが開発されていないことなどのため、未だ大きな成果を挙げていない(ゲノミクス・プロテオミクスの新展開,今中忠行監修,2004年,株式会社エヌ・ティー・エス)。
一般に、蛋白質の研究において、分離精製には電気泳動や特異的吸着を利用するカラムクロマトグラフィーを用い、分析にはプロテインシーケンサー、NMR、X線解析を用いる(ゲノミクス・プロテオミクスの新展開,今中忠行監修,2004年,株式会社エヌ・ティー・エスおよびタンパク質実験ノート(上・下),改訂第3版,岡田雅人および宮崎香編,2004年,羊土社)。これらの手法は、コストがかかること、再現性のあるデータの取得が困難であること、分析時間が長いことなどの問題があった。近年、質量分析計の著しい発展に伴い、質量分析計を用いたプロテオミクスが行われている。蛋白質分離後の測定方法としては、ESI、MALDIなどのイオン化方法を用いた質量分析計を用いる。
現在使用されている蛋白質混合物の分離方法として、蛋白質の等電点および大きさの違いに基づいて分離する2次元電気泳動がある。また、酵素消化後のペプチドを分離する方法として、イオン交換カラムと逆相カラムとを組み合わせた2次元HPLCもある(S.P.Gygiら,J.Proteome Research,2003年,43巻,pp.43−50)。このような2次元電気泳動あるいは2次元HPLC(2DLC)と質量分析計とを組み合わせることによって、蛋白質の分離精製の必要がないプロテオーム解析方法が開発されている(S.P.Gygiら,J.Proteome Research,2003年,43巻,pp.43−50およびS.P.Gygiら,J.Mass Spectrom.,2001年,36巻,pp.1083−1091)。最近の測定方法では、蛋白質をそのまま質量分析計に注入する、ECD−FTICRMSやETD/LTQMSのトップダウンシーケンスの手法もある(R.A.Zubarevら,J.Am.Chem.Soc.,1998年,120巻,pp.3265−3266;R.A.Zubarevら,Curr.Opin.Biotechnol.,2004年,15巻,pp.12−16;J.E.Sykaら,Proc.Natl.Acad.Sci.U.S.A.,2004年,101巻,pp.9528−9533;およびJ.J.Coonら,Int.J.Mass Spectrom.,2004年,236巻,pp.33−42)。
一般的に、特異的蛋白質をスクリーニングする場合、目的蛋白質を含む細胞または組織、および目的蛋白質を含まない細胞または組織の2種類を用意し、この2種類の細胞または組織から抽出された各試料について蛋白質の同定を行い、その同定結果を比較する。プロテオーム解析の場合は、各細胞または組織から蛋白質を分画・精製し、得られた蛋白質混合物を、蛋白質分解酵素によりペプチドフラグメントに分解し、ペプチドフラグメントを測定する。測定結果と蛋白質分解酵素の情報とを組み合わせて、ゲノムのデータベースと照合し、蛋白質を同定する。これらの質量分析によって得られたデータについてのデータベース検索ソフトが市販されている。
上述のように、プロテオーム解析方法については、様々な方法がある。しかし、いずれの方法においても、例えば以下の理由から、種類の異なる蛋白質検索結果を比較して、効率的に特異的蛋白質をスクリーニングする方法は確立されていない。
(1)検索結果から得られる蛋白質の種類が非常に多く、データが膨大であること;
(2)蛋白質の多くは発現量の多い蛋白質であり(S.P.Gygiら,Mol.Cell Biol.,1999年,19巻,p.1720およびS.P.Gygiら,Proc.Natl.Acad.Sci.U.S.A.,2000年,97巻,pp.9390−9395)、発現量の少ない蛋白質は、その発現量の変化を見つけることが非常に困難であること;
(3)溶解性の悪い蛋白質では細胞からの抽出による再現性が要求されること;
(4)細胞分画や蛋白質の粗精製・濃縮操作による再現性が要求されること;
(5)酵素消化処理での再現性が要求されること;
(6)上記(3)〜(5)の問題を解消するために、内部標準物質を加える方法があるが、適切な内部標準物質が必要であり、多量の内部標準物質と発現量の少ない蛋白質とが重なると、その蛋白質を検出することが困難となること;および
(7)上記(3)〜(5)の問題を解消するために、ICAT(isotope−coded affinity tag;同位体標識アフィニティータグ)の試薬を蛋白質のシステイン残基に結合させる方法があり、これは微量な蛋白質の発現を比較するために有効な手段であるが、ICAT試薬を必要とすること(S.P.Gygiら,Nat.Biotechnol.,1999年,17巻,pp.994−999)。
上記のような膨大なデータを解析するためのデータ処理方法も検討されている(特開2005−031021号公報)。しかし、処理して得られたデータが、実際に特異的蛋白質のスクリーニングに有効であるかどうかについては十分に検討されていない。
上述のプロテオミクスの手法は、コスト面や分析時間、データの再現性の問題をある程度解消し、多量の未知の蛋白質混合物を包括的に分析できる手法として将来的に医療診断に応用が期待されている。しかし、包括的な分析を行うには非常に膨大なデータ処理が必要であること、さらに質量分析計を用いたプロテオミクス特有の擬陽性データを排除しきれないこと、定量的な考察が困難であることなどの問題点があり、実用化は非常に困難な状況にある。
本発明は、膨大な蛋白質のハイスループットな機能解析が求められるプロテオーム解析において、特異的蛋白質を効率よくハイスループットにスクリーニングするための新規な方法を提供することを目的とする。
本発明は、プロテオーム解析における特異的蛋白質のスクリーニング方法を提供し、該方法は、
(a1)特異群の細胞または組織から、蛋白質または蛋白質消化物を含む試料を得る工程;
(a2)対照群の細胞または組織から、蛋白質または蛋白質消化物を含む試料を得る工程;
(b1)該工程(a1)で得られた試料を質量分析計で分析して、質量分析データを得る工程;
(b2)該工程(a2)で得られた試料を質量分析計で分析して、質量分析データを得る工程;
(c1)該工程(b1)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
(c2)該工程(b2)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
(d1)該工程(c1)で取得したすべての蛋白質リストにおいて、該要素ごとに該指標の値を平均化し、該指標の平均値を含む特異群の蛋白質リストモデルを取得する工程;
(d2)該工程(c2)で取得したすべての蛋白質リストにおいて、該要素ごとに該指標の値を平均化し、該指標の平均値を含む対照群の蛋白質リストモデルを取得する工程;
(e)該工程(d1)で得られた特異群の蛋白質リストモデルと該工程(d2)で得られた対照群の蛋白質リストモデルとの間で該要素ごとに該平均値の差を算出して、該要素を該平均値の差の順に並べ替えた1つの蛋白質リストを取得する工程;および
(f)該工程(e)で取得した蛋白質リストから、該平均値の差が大きい蛋白質を選択する工程;
を含む。
好適な実施態様では、上記蛋白質を同定するための指標は、スコア、Coverage、またはランキングである。
より好適な実施態様では、上記蛋白質を同定するための指標は、スコアである。
好適な実施態様では、上記蛋白質を特定する要素は、Accession numberまたは蛋白質名である。
好適な実施態様では、上記工程(d1)、(d2)、および(e)は、任意のコンピュータプログラムによって実行される。
本発明の方法によれば、多量の未知の蛋白質混合物を包括的に分析した際の膨大なデータを解析するための手法が提供され、実験誤差および擬陽性データを取り除いて、特異的蛋白質の候補を効率よく絞り込むことができる。本発明の方法では、従来のプロテオーム解析と比較して、スクリーニングの結果の再現性および正確性が向上している。また、本発明の方法は、比較的低コストかつハイスループットでのスクリーニングが可能である。さらに、本発明のスクリーニング方法によって選択された特異的蛋白質についての半定量的な判定も可能である。
図1は、従来のスクリーニング方法および本発明のスクリーニング方法の原理を説明するための概念図である。
図2は、ヒト由来肝細胞のエストロゲンレセプター(A)およびグルタミン酸レセプター(B)についてのスコア値を示すグラフである。
図3は、各症例別のスコアの分布を示すグラフである。
図4は、特異的な3種類の蛋白質(A〜C)についての、各試料のスコア値を示すグラフである。
図5は、特異的な3種類の蛋白質(D〜F)についての、各試料のスコア値を示すグラフである。
図6は、種々の範囲のモデルスコア値に対応する蛋白質名およびAccession numberの数を示すグラフである。
図7は、各試料のスコア35以上のAccession numberの数および蛋白質の濃度を示すグラフである。
本発明のプロテオーム解析における特異的蛋白質のスクリーニング方法は、種々の要因(例えば、病態、薬物への曝露など)によって発現量が特異的に変動する蛋白質を特定するために特に有用な方法である。
一般的に、プロテオーム解析における特異的蛋白質のスクリーニングにおいては、特異的蛋白質が発現していると予想される場合であっても、蛋白質が存在するか否かは不明であり、特異的と判断するための基準も、蛋白質の種類、処理方法、試料濃度、個体差などのため一定ではない。これに対しては、n数を増やすことにより、スクリーニング結果の信頼性を高めることができる。しかし、n数の増加に伴って、リストアップされる蛋白質の数が増え、処理すべきデータが膨大になる。これらを個々について検討することは、非常に大きな労力および時間を必要とする(図1の従来のスクリーニング方法の概念図を参照のこと)。
そこで、本発明者らは、蛋白質を特異的と判断する基準が曖昧であること、試料間で再現性の問題があること、ならびに個体差が各検索結果に反映されていることに注目した。試料を、例えば、特異的蛋白質の変動があると予想される群とそれに対する対照群とに群分けし、各群内で個々の試料の質量分析データの解析によって得られる蛋白質を特定する要素(蛋白質名、Accession numberなど)ごとに、蛋白質の同定をするための指標(スコア、Coverage、ランキングなど)の平均値を算出することにより、各群の各蛋白質のモデル的な指標値を求めることができる。図1の本発明のスクリーニング方法の概念図に基づいて説明すると、A群の各試料A1〜A3についての蛋白質リストモデルAおよびB群の各試料B1〜B3についての蛋白質リストモデルBをそれぞれ作成し、このモデル間で比較を行う。比較とは、具体的には、各要素の指標の差を求めることである。次いで、その差に基づいて蛋白質リストを整理する。こうして得られた蛋白質リストを用いると、特異的蛋白質を絞り込むことが容易である。例えば、整理された蛋白質リストの蛋白質Xという要素のモデル指標値をXおよびXとすると、X−X値が大きい場合はXがA群に特異的な蛋白質であり、小さい場合はB群に特異的な蛋白質であると容易に判断できる。
したがって、本発明のプロテオーム解析における特異的蛋白質のスクリーニング方法は、以下の工程:
(a1)特異群の細胞または組織から、蛋白質または蛋白質消化物を含む試料を得る工程;
(a2)対照群の細胞または組織から、蛋白質または蛋白質消化物を含む試料を得る工程;
(b1)該工程(a1)で得られた試料を質量分析計で分析して、質量分析データを得る工程;
(b2)該工程(a2)で得られた試料を質量分析計で分析して、質量分析データを得る工程;
(c1)該工程(b1)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
(c2)該工程(b2)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
(d1)該工程(c1)で取得したすべての蛋白質リストにおいて、該要素ごとに該指標の値を平均化し、該指標の平均値を含む特異群の蛋白質リストモデルを取得する工程;
(d2)該工程(c2)で取得したすべての蛋白質リストにおいて、該要素ごとに該指標の値を平均化し、該指標の平均値を含む対照群の蛋白質リストモデルを取得する工程;
(e)該工程(d1)で得られた特異群の蛋白質リストモデルと(d2)で得られた対照群の蛋白質リストモデルとの間で該要素ごとに該平均値の差を算出して、該要素を該平均値の差の順に並べ替えた1つの蛋白質リストを取得する工程;および
(f)該工程(e)で取得した蛋白質リストから、該平均値の差が大きい蛋白質を選択する工程;
を含む。
以下、本発明を工程の順に詳細に説明する。
工程(a1)および(a2):
本発明の方法では、まず、工程(a1)および(a2)において、特異群および対照群の細胞または組織から、それぞれ蛋白質または蛋白質消化物を含む試料を得る。
「特異群」とは、スクリーニングの対象となる群をいい、発現量が特異的に変動している蛋白質の存在が予想される群をいう。例えば、特定の病態群;化学物質、光、温度などの特定の条件への曝露群が挙げられる。「対照群」とは、上記特異群と比較するための群であり、例えば、特定の病態ではない群(例えば、正常群);種々の条件の曝露などを受けていない群が挙げられる。「細胞または組織」とは、上記の特異群および対照群に由来する、単離された細胞または組織をいう。例えば、培養細胞、血液細胞、バイオプシーにより体内から取り出された組織または細胞などが挙げられる。
まず、組織を用いる場合は、蛋白質分解酵素処理、例えば、コラゲナーゼ処理などの当業者が通常用いる手段によって細胞を分離する。細胞または組織から分離した細胞は、適切な緩衝液中で、例えば、ホモジナイザーなどの当業者が通常用いる手段を用いて破砕される。蛋白質を含む試料は、この破砕によって得られた懸濁液自体であってもよく、あるいは必要に応じてさらに分画して得られた画分であってもよい。蛋白質を含む試料は、必要に応じて、さらにトリプシンなどの蛋白質消化酵素で消化してもよく、この消化処理によって、蛋白質消化物を含む試料を得ることができる。
これらの工程(a1)および(a2)において、各群の試料のn数は、特に限定されないが、試料の個体差の影響を除くことができる点で、n数が多い方が好ましい。
工程(b1)および(b2):
この工程(b1)および(b2)では、上記工程(a1)および(a2)で得られた各群の試料を質量分析計で分析して、試料ごとの質量分析データを得る。
「質量分析」(MS)とは、分析する試料をイオン化させて導入し、電気力や磁気力により質量ごとの差をつくり、イオンの質量を分析することである。MSの測定原理としては、イオントラップ型MS法、フーリエ変換イオンサイクロトロン共鳴質量分析(FT−ICR/MS)法、イオンスキャン法、Q−TOF型MS法などが挙げられ、それぞれの原理に基づく質量分析計が存在する。本発明の方法においては、1方法だけ(すなわち、1つの質量分析計のみ)で分析してもよく、あるいは複数の質量分析計を連結させて分析(以下MS/MS解析)してもよい。
工程(c1)および(c2):
これらの工程(c1)および(c2)では、上記工程(b1)および(b2)で得られた各試料の質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する。
「データベース検索ソフトウェア」は、MSデータから分子量が合致するペプチドフラグメントの候補の検出、さらにこのフラグメントから、任意のデータベースを検索して蛋白質全体を予測する解析ソフトウェアであればよい。市販されているソフトウェアとしては、Mascot(Matrix Science社)、Turbo Sequest(サーモエレクトロン社)などが挙げられる。利用可能なデータベースとしては、例えば、BLAST、Swiss−Protが挙げられる。このようなデータベース検索ソフトウェアは、MSデータを出力するために質量分析計とともに備えられているコンピュータ部に、予め組み込まれていることが好ましい。
上記データベース検索ソフトウェアによる解析の結果、蛋白質を特定する要素および該特定された蛋白質の同定をするための指標などを含む、試料ごとの蛋白質リストが得られる。蛋白質を特定する要素としては、Accession number、蛋白質名などが挙げられる。また、蛋白質の同定をするための指標としては、スコア(Score)、Coverage、ランキングなどが挙げられる。
工程(d1)および(d2):
これらの工程(d1)および(d2)では、上記工程(c1)および(c2)で取得した各群のすべての蛋白質リストにおいて、要素ごとに指標の値を平均化し、指標の平均値を含む特異群および対照群のそれぞれの蛋白質リストモデルを取得する。言い換えると、各群について、蛋白質リストに挙げられたすべての蛋白質を特定する要素と、該要素に対応する指標の平均値とを、1つのリストに統合することによって、各群のモデル的な蛋白質リストを得ることができる。
これらの工程において、平均化する指標は、スコア、Coverage、ランキングなどのいずれか1つであり、好ましくはスコアである。
工程(e):
工程(e)では、上記工程(d1)および(d2)で得られた特異群および対照群の2つの蛋白質リストモデル間で、要素ごとに指標の平均値の差を算出して、要素を平均値の差の順に並べ替えた1つの蛋白質リストを取得する。平均値の差は、(特異群の値)−(対照群の値)で表され得る。したがって、平均値の差は、正の値から負の値まで種々であり得る。差の順は、昇順であっても降順であってもよい。並べ替えることによって、特異的蛋白質の情報として有用なものの順に蛋白質を整理することができるため、以下の工程(f)において、差の大きな蛋白質の選択が容易になる。
ここで、工程(d1)および(d2)ならびに(e)では、これらの工程を実行するようにプログラムされたコンピュータソフトウェアを用いてデータ処理され得る。例えば、上記のデータベース検索ソフトウェアとともに、質量分析計のコンピュータ部に組み込まれていてもよい。あるいは、上記の工程(c1)および(c2)でデータベース検索ソフトウェアによって得られた蛋白質リストは、サーバーやパーソナルコンピュータ(PC)などにエクスポートされ得る。例えば、Turbo Sequestで得られたデータを、PC用の表計算ソフトウェアであるマイクロソフト社のMicrosoft Excel登録商標にエクスポートするためのソフトウェアがある。データがエクスポートされ得るソフトウェアにおいて、上記工程(d1)および(d2)ならびに(e)を実行するためのマクロプログラムを組むことが可能である。したがって、PCなどにおいてこのプログラムを実行することによって、平均値の差の順に並べ替えた1つの蛋白質リストを取得することも可能である。
工程(f):
工程(f)では、上記工程(e)において得られた平均値の差の順に並べ替えた1つの蛋白質リストから、平均値の差が大きい蛋白質を選択する。ここで、平均値の差が大きいとは、その絶対値が大きいことをいう。これによって、蛋白質リストに挙げられた膨大な数の蛋白質から、特異的蛋白質の候補を効率よく絞り込むことができる。
この工程で選択した蛋白質は、必ずしも特異的蛋白質ではない。なぜなら、例えば、n数が小さい場合には、特異群および対照群のいずれにおいても非常に発現量の多い蛋白質において、差の値が大きくなる場合があり、その差が発現量の変動の範囲内であることがある。したがって、候補として選択された蛋白質について、特異的蛋白質であるかどうかを個々に検証する必要がある。
検証の手段は、特に限定されない。例えば、上記のスクリーニング方法で使用した特異群および対照群に属する別の複数の試料について、質量分析データを解析し、候補蛋白質の各試料における指標値を蛋白質リストモデル中の候補蛋白質の指標値と比較することによって、変動の範囲内の可能性が高いかどうか、あるいは特異的蛋白質であると同定し得るかどうかを検証し得る。本発明の方法によれば、この検証の作業はやや煩雑なように見える。しかし、1つの試料から数万の蛋白質がリストアップされ、それらを個々に比較検討/検証しなければならない従来のスクリーニング作業を比較すると、本発明の方法では、検証すべき蛋白質が数種から数十種に絞り込まれ得るため、非常に効率よく特異的蛋白質を同定できる。
さらに、本発明の方法によって同定された特異的蛋白質については、未知試料の質量分析データの解析によって得られた蛋白質リスト中のスコアなどの要素の値から、蛋白質リストモデル中の平均値との比較によって、特異群であるか否かの半定量的判定を行うことも可能である。
以下の実施例において、蛋白質試料またはペプチド試料の質量分析には、nano2DLC−MSLTQ MSシステム(サーモエレクトロン社)を用いた。このシステムは、質量分析計として2DLC/ESI/リニアイオントラップ/MS/MS(サーモエレクトロン社)が採用され、得られた質量分析データはデータベース検索ソフトウェアであるTurbo Sequest(サーモエレクトロン社)によって解析される。
上記システムによる解析結果として、各蛋白質のスコア値を含む個々の試料についての蛋白質リストが得られる。試料群についての平均のスコア値を求める場合は、各試料群内において蛋白質ごとにスコア値の平均値を算出する。算出した平均値について、蛋白質ごとに群間で平均スコア値の差を算出し、その順に蛋白質リストを並べ替える。以下の実施例においては、上記データベース検索ソフトウェアから得られた解析結果を、マイクロソフト社のMicrosoft Excel登録商標にエクスポートし、各試料群において蛋白質ごとの平均スコア値を含む蛋白質リストモデルを取得し、群間で蛋白質の平均スコア値の差を求めて、その差が大きい順に並べ替えた蛋白質リストを作成するようにマクロプログラムを組み、これを実行することによって、整理された蛋白質リストを得た。
(実施例1)
ウシ血清アルブミン(BSA)を、以下の表1に記載の種々の濃度の水溶液に調製し、トリプシン消化した後、質量分析計でそれぞれ2回分析し、質量分析データをデータベース検索ソフトウェアで解析して、蛋白質リストを得た。各濃度におけるBSAと同定された蛋白質のスコア値を表1に示す。
表1からわかるように、得られたスコア値と蛋白質濃度との間に相関関係が見られた。
(実施例2)
以下の表2に示すヒト由来の肝細胞を洗浄後、緩衝液を加えて、氷冷下にて破砕した。得られた懸濁液をトリプシン消化し、質量分析計で測定を行い、質量分析データをデータベース検索ソフトウェアで解析して、蛋白質リストを得た。
エストロゲンレセプターおよびグルタミン酸レセプターについてのスコア値を、それぞれ図2AおよびBに示す。
エストロゲンレセプター(A)については、女性のスコア値の平均値は約90であり、男性では約30であった。エストロゲンは女性ホルモンであるため、その受容体が女性群でスコア値が大きいのは妥当な結果である。グルタミン酸レセプター(B)では、試料番号3(64歳女性)のスコア値が大きく、これが老化に関与する蛋白質である可能性が示唆された。なお、本実施例においては、各試料の蛋白質リストの蛋白質数は5〜6万個であり、そのうちの約3割に相当する2万個が全ての試料で見られた蛋白質であった。
(実施例3)
ヒトにおけるある疾患において異なる病態を示す症例から採取した組織を用いた。一方の病態を示す6症例を対照群(試料番号1〜6)、および他方の病態を示す13症例を特異群(試料番号7〜19)とした。得られた組織をそれぞれコラゲナーゼ処理して、細胞を分離した。細胞を洗浄後、氷冷下にて破砕した。得られた懸濁液を1,000×gで遠心分離し、上清を回収して細胞質画分を得た。上清をトリプシン消化し、質量分析計で測定を行い、質量分析データをデータベース検索ソフトウェアで解析して、それぞれの症例に由来する試料についての蛋白質リストを得た。
各試料においてスコア>2.0を満たすAccession numberは、平均で56,050個であった。スコアの範囲は、2.0〜2000強であった。各試料別のスコアの分布を図3に示す。1症例あたりのAccession number数は平均で、スコア2.0以上3.5未満が50677、スコア3.0以上100.0未満が4942、およびスコア100以上が431であった。
上記の解析結果、すなわち各試料の蛋白質リストを、Microsoft Excel登録商標にエクスポートし、Accession numberでスコアの平均値を求めて整理するマクロプログラムを実行した。対照群については、試料番号1〜6のすべての試料についてマクロプログラムを実行し、対照群モデルスコア値を得た。特異群については、試料番号7〜19のすべてについて蛋白質リストをAccession numberごとに整理させたが、蛋白質リストモデルの作成については、特に病態の著しい試料番号7、10、11、および12のみを用いて実行し、特異群モデルスコア値を得た。
特異群モデルスコア値と対照群モデルスコア値との差(Score of difference number)の大きい順に並べ替えたところ、19症例由来の試料の163780の総Accession number数のうち、Score of difference numberの上位20番以内で、6種類の特異的蛋白質A〜Fを同定した。これらの蛋白質についての各試料のスコアを、図4および5に示す。これらの蛋白質は、対照群よりも特異群でスコア値が高い傾向にあるため、この病態の指標になり得ることがわかる。
例えば、特異的な蛋白質の一例である蛋白質D(図5)を検証してみると、特異群では、115〜5587までのランキング値であり、対照群では、該当なしならびに6354〜25515であった(データは示さず)。このように、蛋白質Dは、蛋白質の発現量が非常に少ないため、本発明の方法では特異的蛋白質であると同定可能であったが、従来のスクリーニング方法では見出すことができなかったと考えられる。
スクリーニング方法の信頼性を確保するために、蛋白質を特定する要素として、Accession numberの代わりに蛋白質名を用いて上記と同様に蛋白質リストモデルを作成し、モデルスコア値の差(特異群モデルスコア値−対照群モデルスコア値)を算出した。種々の範囲のモデルスコア値の差に対応する蛋白質名およびAccession numberの数を、図6に示す。
19試料の総蛋白質数は、蛋白質名で検索した場合は75195個であり、Accession numberで検索した場合は163780個であった。Accession numberの方が88585個多いが、これは総蛋白質数の集計ではUnnamed proteinが含まれていないこと、ならびに異なるAccession numberでも同じ蛋白質名であるものは、蛋白質数の集計に含まれていないためである。
特異群モデルスコア−対照群モデルスコア値は、ほとんどが±5以内にあり、特異的な蛋白質の検索にはどちらを用いても、大差はなかった。また、スコア値の差が10以上の蛋白質は、いずれの場合も総蛋白質の量と比較するとごく僅かとなっていることが確認できる。特異的蛋白質は、スコア値の差が10以上の枠にあると考えられ、蛋白質名およびAccession numberのいずれで検索した場合も、選択された特異的蛋白質な同じであった(データは示さず)。
さらに、蛋白質の濃度の違いによるスコア値への影響についても確認した。ここでは、スクリーニング結果より、スコア35以上のAccession numberの数と蛋白質の濃度とを比較した結果を図7に示す。蛋白質の濃度に依存して、スコア値が変動していることがわかる。また試料番号3および9のように、濃度が高いにもかかわらず、スコア値35以上のAccession numberの数が少ないものもあった。この原因として、質量分析測定での噴霧状態が悪くイオン化効率が悪かったこと、酵素消化での消化効率が悪かったことなどが考えられる。この結果からも、各試料を全く同条件で測定することが困難であることがわかる。したがって、このようなばらつきのある試料の場合でも、本発明のスクリーニング方法が有効に利用できることがわかる。
本発明の方法によれば、多量の未知の蛋白質混合物を包括的に分析した際の膨大なデータを解析するための手法が提供され、実験誤差および擬陽性データを統計的に取り除いて、特異的蛋白質の候補を効率よく絞り込むことができる。本発明の方法では、従来のプロテオーム解析と比較して、スクリーニングの結果の再現性および正確性が向上している。また、本発明の方法は、比較的低コストかつハイスループットでのスクリーニングが可能である。さらに、本発明のスクリーニング方法によって選択された特異的蛋白質についての半定量的な判定も可能である。
したがって、本発明のスクリーニング方法によって種々の病態時や薬物などの曝露によって発現する特異的蛋白質を同定できる。そのため、この蛋白質が関連する疾患などの診断、治療、または予防、あるいはそのための薬剤の開発に非常に有用である。

Claims (3)

  1. プロテオーム解析における特異的蛋白質のスクリーニング方法であって:
    (a1)特異群の細胞または組織から、蛋白質または蛋白質消化物を含む試料を得る工程;
    (a2)対照群の細胞または組織から、蛋白質または蛋白質消化物を含む試料を得る工程;
    (b1)該工程(a1)で得られた試料を質量分析計で分析して、質量分析データを得る工程;
    (b2)該工程(a2)で得られた試料を質量分析計で分析して、質量分析データを得る工程;
    (c1)該工程(b1)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
    (c2)該工程(b2)により得られた質量分析データを、任意のデータベース検索ソフトウェアを用いて解析し、該試料ごとに、蛋白質を特定する要素および蛋白質を同定するための指標を含む蛋白質リストを取得する工程;
    (d1)該工程(c1)で取得したすべての蛋白質リストにおいて、該すべてのタンパク質リストの該指標の値を該要素ごとに平均化し、1つの蛋白質リストに統合することによって、該指標の平均値を含む特異群の蛋白質リストモデルを取得する工程;
    (d2)該工程(c2)で取得したすべての蛋白質リストにおいて、該すべてのタンパク質リストの該指標の値を該要素ごとに平均化し、1つの蛋白質リストに統合することによって、該指標の平均値を含む対照群の蛋白質リストモデルを取得する工程;
    (e)該工程(d1)で得られた特異群の蛋白質リストモデルと該工程(d2)で得られた対照群の蛋白質リストモデルとの間で該要素ごとに該平均値の差を算出して、該要素を該平均値の差の順に並べ替えた1つの蛋白質リストを取得する工程;および
    (f)該工程(e)で取得した蛋白質リストから、該平均値の差が大きい蛋白質を選択する工程;
    を含
    該蛋白質を同定するための指標が、スコア、 Coverage 、またはランキングであり、そして
    該蛋白質を特定する要素が、 Accession number または蛋白質名である、
    方法。
  2. 前記蛋白質を同定するための指標が、スコアである、請求項に記載の方法。
  3. 前記工程(d1)、(d2)、および(e)が、任意のコンピュータプログラムによって実行される、請求項1または2に記載の方法。
JP2007518865A 2005-05-31 2006-02-08 プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 Expired - Fee Related JP4051400B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005159562 2005-05-31
JP2005159562 2005-05-31
PCT/JP2006/302594 WO2006129401A1 (ja) 2005-05-31 2006-02-08 プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法

Publications (2)

Publication Number Publication Date
JP4051400B2 true JP4051400B2 (ja) 2008-02-20
JPWO2006129401A1 JPWO2006129401A1 (ja) 2008-12-25

Family

ID=37481334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007518865A Expired - Fee Related JP4051400B2 (ja) 2005-05-31 2006-02-08 プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法

Country Status (4)

Country Link
US (1) US20090132171A1 (ja)
EP (1) EP1887351A4 (ja)
JP (1) JP4051400B2 (ja)
WO (1) WO2006129401A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109891523A (zh) * 2016-11-16 2019-06-14 东京Cosmos电机株式会社 可变电阻器用开关装置
CN109906492A (zh) * 2016-11-16 2019-06-18 东京Cosmos电机株式会社 可变电阻器用开关装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011146521A2 (en) 2010-05-17 2011-11-24 The Uab Research Foundation A general mass spectrometry assay using continuously eluting co-fractionating reporters of mass spectrometry detection efficiency
CN103501859B (zh) * 2011-03-02 2017-08-25 博格有限责任公司 基于细胞的探询式分析及其应用
EA038600B1 (ru) * 2012-04-02 2021-09-21 Берг Ллк Основанные на клетках перекрестные анализы и их применение
WO2016040725A1 (en) 2014-09-11 2016-03-17 Berg Llc Bayesian causal relationship network models for healthcare diagnosis and treatment based on patient data
CN115116539A (zh) * 2022-05-09 2022-09-27 腾讯科技(深圳)有限公司 对象确定方法、装置、计算机设备和存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6446010B1 (en) * 1999-06-15 2002-09-03 The Rockefeller University Method for assessing significance of protein identification
US7045296B2 (en) * 2001-05-08 2006-05-16 Applera Corporation Process for analyzing protein samples
EP1446495A4 (en) * 2001-10-01 2006-06-07 Diversa Corp ENTIRE CELL ENGINEERING USING REAL-TIME METABOLIC FLOW ANALYSIS
JP2005536714A (ja) * 2001-11-13 2005-12-02 カプリオン ファーマシューティカルズ インコーポレーティッド 質量強度プロファイリングシステムおよびその使用法
JP2003279578A (ja) * 2002-03-26 2003-10-02 National Shikoku Cancer Center 癌の診断支援方法及びそのキット
US20030065451A1 (en) * 2002-08-22 2003-04-03 Pineda Fernando J. Method and system for microorganism identification by mass spectrometry-based proteome database searching
ATE418729T1 (de) * 2002-08-22 2009-01-15 Applera Corp Verfahren zur charakterisierung von biomolekülen mittels resultat-gesteuerter strategie
EP1641821A2 (en) * 2003-06-30 2006-04-05 Genova Ltd. Human secreted proteins

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109891523A (zh) * 2016-11-16 2019-06-14 东京Cosmos电机株式会社 可变电阻器用开关装置
CN109906492A (zh) * 2016-11-16 2019-06-18 东京Cosmos电机株式会社 可变电阻器用开关装置
CN109906492B (zh) * 2016-11-16 2021-03-16 东京Cosmos电机株式会社 可变电阻器用开关装置

Also Published As

Publication number Publication date
EP1887351A1 (en) 2008-02-13
WO2006129401A1 (ja) 2006-12-07
US20090132171A1 (en) 2009-05-21
EP1887351A4 (en) 2009-04-08
JPWO2006129401A1 (ja) 2008-12-25

Similar Documents

Publication Publication Date Title
Patterson et al. Proteomics: the first decade and beyond
Hüttenhain et al. Perspectives of targeted mass spectrometry for protein biomarker verification
US8909481B2 (en) Method of mass spectrometry for identifying polypeptides
JP4768189B2 (ja) 非標的化複雑試料分析の方法
Panchaud et al. Experimental and computational approaches to quantitative proteomics: status quo and outlook
JP4654230B2 (ja) マススペクトル測定方法
JP4672614B2 (ja) 迅速かつ定量的なプロテオーム解析および関連した方法
Blueggel et al. Bioinformatics in proteomics
US20060269944A1 (en) Mass Intensity profiling system and uses thereof
US20100137151A1 (en) Protein Expression Profile Database
Bowler et al. Proteomics in pulmonary medicine
JP4051400B2 (ja) プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法
BRPI0711967A2 (pt) ensaio de biomarcador de espectrometria de massa
JP2011521215A (ja) 前立腺癌の診断及び治療のためのバイオマーカー及び薬剤標的発見法、並びにそれを用いて決定されるバイオマーカーアッセイ
JP2007531874A (ja) 新規データベース探索様式を用いるタンパク質の特定及び特徴付け
JP2006510875A (ja) コンステレーションマッピングおよびそれらの使用
US20060292631A1 (en) Elastin peptide fingerprints and analysis methods for mmp12 related to copd
Vaezzadeh et al. Proteomics and opportunities for clinical translation in urological disease
Reisdorph et al. Proteomics methods and applications for the practicing clinician
Henry et al. Introduction to sample preparation for proteomics and mass spectrometry
WO2002021428A1 (en) Reference database
Patankar Critical Analysis of the Computational Methods used to Discover Biomarkers to assist in the Early Detection of Disease
Duan Proteomics and Functional Proteomics
US20100203565A1 (en) Peptide Fingerprint from the Degradation of Elastin by HNE
AU2002363690A1 (en) Mass intensity profiling system and uses thereof

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071203

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111207

Year of fee payment: 4

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

LAPS Cancellation because of no payment of annual fees