JP7218019B2 - 質量スペクトルからの存在物の同定の方法 - Google Patents
質量スペクトルからの存在物の同定の方法 Download PDFInfo
- Publication number
- JP7218019B2 JP7218019B2 JP2021503069A JP2021503069A JP7218019B2 JP 7218019 B2 JP7218019 B2 JP 7218019B2 JP 2021503069 A JP2021503069 A JP 2021503069A JP 2021503069 A JP2021503069 A JP 2021503069A JP 7218019 B2 JP7218019 B2 JP 7218019B2
- Authority
- JP
- Japan
- Prior art keywords
- entity
- prior
- uniqueness
- probability
- peptides
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Theoretical Computer Science (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Hematology (AREA)
- Medical Informatics (AREA)
- Urology & Nephrology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Evolutionary Biology (AREA)
- Analytical Chemistry (AREA)
- Bioethics (AREA)
- Food Science & Technology (AREA)
- Pathology (AREA)
- General Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Biochemistry (AREA)
- Databases & Information Systems (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Genetics & Genomics (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Description
本発明は、質量スペクトルからの存在物の独自性の決定の方法に関する。前記方法は、プロテオミクス、メタボロミクス、ならびにプロテオミクス、メタボロミクス、ゲノミクスおよびトランスクリプトミクスにおけるその応用において有用である。
ディスカバリプロテオミクスは、信頼できる解釈をしばしば妨害する大量の希少な情報を含んでいる。ショットガンプロテオミクス、ボトムアッププロテオミクスのうち、発見に指向されているサブフィールドでは、タンパク質は、ペプチドに酵素的に切断され、消化されたサンプルは、分析器、最も一般的に液体クロマトグラフィーを用いた質量分析計に、徐々に導入される。質量分析では、典型的に各サイクルにおいて、完全な分子の質量が分析され、さらに関心のある分子の質量が、単離され、断片化され、第2の質量分析が断片に対して実施され、MS/MSスペクトルを生じる。同定の目的は、観察されたMS/MSスペクトルを生成するペプチドであり、ペプチドのタンパク質へのマッピングは、タンパク質同定タスクを完結させる。
本発明は、少なくとも1つの存在物の質量スペクトル、および任意に当該少なくとも1つの存在物の化学的、物理的、生化学的または生物学的な分析からの追加のデータからの、当該少なくとも1つの存在物の独自性の、各存在物についての、決定のための方法であって、a)前記存在物の質量スペクトルから分析データを収集すること、および任意に前記存在物の化学的、物理的、生化学的または生物学的な分析から追加の分析データを収集すること、b)より高い出現率を有しているすべての独自性候補が複数の独自性候補に含まれていることは、独自性候補のそれぞれについて当てはまるので、前記存在物の複数の独自性候補を取得すること、および当該存在物の当該複数の独自性候補の出現率を取得すること;c)少なくとも存在物の出現率、または少なくとも、存在物の出現率および質量スペクトルとの一致に関する、存在物の独自性候補のそれぞれについての、独自性候補のスコアの計算、d)存在物の独自性を、前記存在物の真の独自性におそらく対応するスコアに最も近いスコアを有している独自性候補として、決定することのステップを含んでいる、方法に関する。
b.a)初期出現率を有する初期独自性候補を選択すること;
b.b)前記初期独自性候補を、基本の独自性候補に送ること;
b.c)前記基本の独自性候補に対する事象の適用によって新たな独自性候補を生成すること、および前記新たな独自性候補を前記基本の独自性候補に取り込むこと、および制限条件が満たされる限り、前記生成することを継続すること;
b.d)ステップb.c)において取得された基本の独自性候補を、関連する出現率を有する独自性候補に変換することを含んでいる。
方法、またはそのステップおよびサブステップを概略的に表す図面において、矢印ありの線は、個々のユニット間の直接的または間接的な接続を指す。矢印ありの点線は、一般に、代替的な実施形態に対応する。代替的な実施形態は、特定の代替的な実施形態をグループ化するアルファベット文字の追加によってさらに示される。ユニット内のサブユニットの参照番号は、主たるユニットの参照番号と、ピリオド、およびサブユニットの参照番号との連結として整列されている。図面に描かれているユニットは、単独、又はいくつかの大きなユニットの一部のいずれかであると仮定されている。点線のブロックはステップに対応する。
本明細書における「存在物」は、分子、物質または細胞小器官などの化学的または生物学的な存在物を指す。特に、存在物は、物質、化合物、脂質、代謝産物、ペプチド、タンパク質および核酸から選択され得る。
同定されたバリアントの実数である同定されたバリアントの予想数:
(実施例1-存在物の独自性の決定)
分析データの収集
本実施例は、ショットガンプロテオミクスにおける未知のペプチドについて収集された分析データの断片質量スペクトルを示す。MS/MSスペクトルの具体例は、図9に示され、存在物の決定工程は図9にさらに説明されている。
図9におけるスペクトルに関する独自性候補は、その説明が以下の通りである計数によって得られる。特定のアミノ酸(修飾されていても)の後における切断の確率は、図6bに指定されている。いくつかの修飾の確率は、図6(c)のように設定された。残りの修飾(置換ではない)は、0.001の事前類似確率に設定された。アミノ酸置換の事前類似確率は、所定のコドンのヌクレオチド置換の数に少なくとも依存するように設定された。置換が1つのヌクレオチド変化において(コドンの任意の組合せについて)生じ得るなら、それは0.0002=qであり、そうでなければ、その累乗であり;したがって、nがヌクレオチド置換の最小数であるなら、そのときの事前類似確率はnqである。コードされているアミノ酸および末端の事前類似確率は、アミノ酸およびその全修飾の事前類似確率の和が1に等しくなるように設定された。アミノ酸の修飾の小部分リストを、それらの事前類似確率と共に、以下の表に示す。
一致
この項目は、ペプチドの理論上のスペクトル、および実験理論上の(測定された)スペクトルの一致を説明する。(実験上のスペクトルおよび理論上のスペクトルの)マッチングピークの数は、特定の一致モデルとして使用される(図10)。この例では、一価イオン(b、y)のみが理論上のスペクトルの予測に使用される。図10における一致は、上下にわけて置かれている2つのペプチド(前のステップで計数されたものから)について示されている。プレフィックス(b)イオンは、MS/MSスペクトルのより近く示され、サフィックス(y)イオンはより遠くに示されている(上および下の両方において)。実験上のスペクトルにマッチするイオン(0.3Daの断片許容範囲)は、より濃い部分である。一致は、マッチングピークの総数に対応する。個々のペプチドの一致は、以下の表(最初の数個のペプチドは、最も高いスペクトルマッチングから順に並べられている)に示されている。
以下の表は、一致および事前類似確率から計算された、独自性候補の最大確率(Pmax列)を用いた独自性の決定を示しいる。
以下の記載は、ベイズの定理を用いた正確さ確率(P)の関連付けを説明する。本目的のために、真の一致およびランダムな一致のモデルを明確にする。
分析データに対応する一連のもの(トリプシン処理した基準ヒトペプチド、5ppm 前駆体質量差、0.1の統計的有意さ)を、さきに説明されているような真の解釈の選択に、使用した。
図13は、真の解釈のための前駆体質量差の分布を示す。
図14は、予測される特定の理論上の時間およびその付近に対する、実験上の時間の分布(理論上の時間と明らかにずれている)を示している。対称差を仮定して、図15は、分布の両端付近(<5%)の解釈、および中心付近(>95%)の解釈の抽出を示す。
前駆体質量差と同様に、図16は、理論および実験同位体分布の間における差の分布を示す。
タンパク質証拠の場合、仮定された真の解釈の8.129%は、同じタンパク質からの他のペプチドの存在なしであった。
図17は、裏付ける証拠の組み合わせを示し、類似する結果(≦5%)および類似しない結果(≧95%)について分けている。例えば、類似する結果の場合に、保持時間が分布の中心に近づく(pが1に近づく)につれて、前駆体質量の差は、より大きくなり、95%を超える確率を依然として達成し得ることが分かる。したがって、図は、これらの支持基準と、結果として生じる確率との間の数的な関係を捉えている。
最大確率
この実施例における独自性の決定は、最大の一致でありかつPmax=1を有する解釈を、選択することに基づいている。このような解釈は、せいぜい1つであり得り、所定の一致モデリングおよび出現率モデリングにとって最良の候補であり;それは、先の表における第1の解釈である。
この実施例における独自性の決定は、0.5より高い確率を有する解釈の選択に基づいており;このような解釈は、せいぜい1つであり得り、最も有望な解釈である。この実施例では、それは第1の解釈であり、決定される独自性はPmaxおよび最大の一致を用いる先の例と同じである。
システム概要(図19)は、バリアントペプチドの同定用のショットガンプロテオミクスにおける、出現率モデル(図1)の組み込みの例102を表す。本実施例では、独自性候補は、最初にデータベース検索において採点され、出現率の使用によってさらに再評価されて、それらの正しさの最大確率を得る。
>ID-00000000 なし
NEIPIR (配列番号19)
>ID-00000001 なし
AAVAAITQALVGR (配列番号20)
>ID-00000002 なし
SPPLPGDLGGPSK (配列番号21)
>ID-00000003 なし
LSAAQTNGGGSAGMEGIMNPYTALPTPQQLLAIEQSVYSSDPFR (配列番号22)
>ID-00000004 なし
NTEILTGSWSDQTYPEGTHAIYK (配列番号23)。
処理は、結腸直腸癌細胞株HCT116について評価された、サンプルにおけるバリアントペプチドの同定について、段階的に示される。複数のステップは、3つの段階:i)データベース検索を使用するスペクトルマッチ、ii)追加情報の割り当て、iii)追加の独自性候補の取得に分けられ得る。
解釈の最大確率が明らかにされる。この手順の結果を以下の表に示す。
ここで用いられている独自性の決定ための基準は、最大スペクトル一致およびPmax=1であった。
同定されたバリアント
方法を、人の家族構成員(図21)におけるバリアントの同定のために使用した。以下の表は、同定されたバリアントペプチドの数およびそれらの配列決定による裏付け(エキソーム配列決定に対して評価される)を、各家族構成員について分けて含んでいる。
先の表はまた、エキソーム配列決定の知識を使用して全てのバリアントを有するプロテオームを作製したときの、同定されたバリアントの数の比較を示す。このような場合、生殖系列バリアントは、以下の状態(バリアントが少なくとも1人の親および1人の子に認められた)において、エキソーム配列決定に基づいていた。結果は、サンプルの配列決定が利用可能であっても、生殖系列バリアントの約80%がグローバルヌクレオチドデータベースの使用によって、(約95%の配列決定との一致において)同定されるので、その利点が制限されることを示唆する。
配列決定による裏付けが評価されるいくつかの場合において、結果は、配列決定によって裏付けられていないが、正しいいくつかの解釈を含み得る。これは、いくつかのバリアントが、図20に示されるような周囲領域の低い配列決定カバレッジのために、配列決定によってほとんど裏付けられないためである。そのため、事前の比較において、10リードカバレッジを有している領域が、比較から排除された。
本実施例は、細胞株の同定のための請求されている方法の利用を示す。分析は、NCI60パネル(Gholamiら(2013)Cell Reports,4(3):609-620)の一般に入手可能なデータによって実施される。バリアントは、先の実施例(図19のシステムアーキテクチャ)と同様に同定した。遺伝的起源の確立のために、高い集団内頻度(dbSNPにおいて特定されるときの1%以上)のバリアントのみが考慮された;この種のバリアントは、ほとんど生殖細胞系バリアントであり、同定が容易であり(より有望な解釈が経験的に少なく、E値<0.1の統計的有意さがしばしば十分である)、起源の同定に適している。
起源の同定は、NCI60エキソームデータベース(Shankavaram et al.(2009)BMC Genomics、10(1):277)に対して行われ、真の起源は、考慮される起源の範囲内(したがって、NCI60エキソームデータベース内)にあると仮定された。
本実施例は、人の同定のための方法の利用を示す。分析は、特定の構成を有している家族の内部データ(図21)に対して行われる。
本実施例は、細胞株のマッチングに類似している。起源のデータベースは、家族構成員の配列決定データベースに対応する。同じ方法が割り当てに使用される。
同定結果を以下の表に示す。
本実施例は、遺伝的関連性の決定のための、同定されたバリアントの利用を示す。この目的のために、家族構成員(図21)の血中リンパ球におけるバリアントを、プロテオミクスデータにおいて同定した(バリアント同定のアーキテクチャは、独自性候補内の最大の一致としての独自性の決定、およびPmax=1を用いて、図19のように行われた)。
マッチの有意さの計算が、さらにここで説明される。遺伝的起源の同定と同様に、1%(dbSNPにおける集団内頻度としての)を超える出現率のバリアントのみが、マッチ(これらのバリアントはほぼ生殖細胞バリアントである)の算出のために用いられた。
方法は、すべての家族構成員(図21)に対してペアワイズにさらに適用され、ヒートマップ(図23)は、少なくとも良好な、それらの間のマッチである結果を示す。関心は、ランダムに少なくとも良好なマッチである確率(43)の算出にあり、当該確率はヒートマップ上の色として可視化されている。
本実施例は、血清にある腫瘍特異的な循環タンパク質の同定のための実施形態を示す。本実施例において、PRIDE上にあるアクセス可能な、一般に利用可能なデータ(識別子:PXD004624、PXD004625、PXD004626)を、変異タンパク質の同定のために使用した。バリアントの同定のために、図19に対応する同じ方法を使用した。
腫瘍に起因する変異の選択
本実施例では、腫瘍に起因する変異は、すべて体細胞変異と同定されると仮定された。
結果(図24)は、メラノーマがん患者における変異ペプチドの存在を示しており、進行した悪液質の患者により多く存在し、あまり進行していない非悪液質の患者により少なく存在し、コントロールにはほとんどない。本実施例では、変異ペプチドは、腫瘍の存在およびがんの程度/段階と大まかに関連し得る。
本実施例では、ヒトの基準タンパク質およびバリアントタンパク質は、マウス異種移植から得られた血清中で同定される。実験の構成は図19に基づいており、独自性候補の計数における差が、さらに説明される。
候補の計数において、ペプチドは、両方の生物(ここではマウスおよびヒト)について、4・10-6の事前類似確率である条件を限定して、計数された。ヒトについて計数されたペプチドの事前類似確率は、マウスに対するヒトの出現率の相対的な差によって乗算される(ここでは、実際に、線型的に縮尺される)。数は、特定の実験環境について導出される。
p=0.25の、本実施例における割合は、相同ペプチド、および異種タンパク質証拠から推定され、先に説明されている。相同ペプチドおよびそれらの異種タンパク質証拠に対応する表構造をここに示す。
Pmax=1および最大のスペクトル一致を有しているペプチドが、維持される。
同定方法は、マウスに移植された広範ながん組織にわたるヒトタンパク質バイオマーカーの同定のために使用された。結果(図25)は、免疫不全のSCIDマウスにおける、ヒトペプチドの存在およびそのようなペプチドの全体的な欠如を示し、結果の信頼性を示している。
本実施例は、宿主生物におけるマイコプラズマの診断のための、出現率の利用を示す。この場合、非宿主生物の出現率は、未知と仮定されるため、上述のときより、複雑な状況を指す。
特定の質量スペクトルのために、基準マイコプラズマペプチドに対して(全生物のなかから)、およびすべてのヒトペプチドに対して((4・10-6の事前類似確率))、排他的にマッピングするペプチドを、取得した。以前に記載されたように、マイコプラズマペプチドは、計数された任意のヒトペプチドより非常に低い出現率と規定された。
最大の一致およびPmax=1のマイコプラズマペプチドのみが維持された。
この同定アプローチは、PRIDE集積における一部の計画に適用され、マイコプラズマの診断の結果は、図26(配列番号96~131)に示されている。
以下の実施例は、サンプルの細胞培養におけるアミノ酸による安定同位体標識(SILAC)を用いた軽同位体および重同位体形態の両方の存在の、バリアントの同定のための有用性を示す。バリアントの同定は、先の実施例(図19)と同様に行った。
この場合における追加の基準は、目的のペプチドの、軽い形態および重い形態の両方の同定である。
SILAC対形成、およびバリアントの配列決定による裏付けに対するその影響の分析を、2つの基準(最初の有意性:E値≦0.1)および排斥後(Pmax=1)について解析した。以下の表の結果は、対で同定されたペプチドが、非常に高度な配列決定による裏付け(マッチングサンプルの配列決定に対して評価されるとき)を有することを示す。
独自性候補の取得、独自性候補の計数
スキーム(図27)は、代替的にスプライスされたタンパク質(およびそれらの出現率)が基準エキソンに基づくタンパク質モデルから構成される、計数を指す。このスキーマは、一般的な計数(図5)と、構成単位の直接的な対応関係にある。
この実施例は、腫瘍サイズおよび対応する疾患段階の同定のための実施形態を示す。ここでは、Clinical Proteomic Tumor Analysis Consortiumの一般に利用可能なデータ、特にTCGA Colorectal Cancerは、図19に対応する同じ方法を用いた変異タンパク質の同定のために使用された。
体細胞バリアントおよび生殖系列バリアントの決定パラメータは以下の通りである。生殖系列バリアントは、以下のようにみなされる:バリアントはdbSNP(v.147)またはExAC(TCGAなしのExAC編集のバージョン)に存在し、好ましくは1.10-4より高い集団内頻度(dbSNPまたはExACのいずれにおいても)のバリアントである。
Claims (13)
- 少なくとも1つの存在物の質量スペクトル、および任意に当該少なくとも1つの存在物の化学的、物理的、生化学的または生物学的な分析からの追加のデータから、当該少なくとも1つの存在物の独自性を決定するための方法であって、
前記存在物は、ペプチド、タンパク質、脂質、核酸、代謝産物、および2000mol/g以下の分子量を有する分子から選択され、
a)前記存在物の質量スペクトルから分析データを収集し、任意に、前記存在物の化学的、物理的、生化学的または生物学的な分析から追加の分析データを収集するステップと、
b)前記存在物の複数の独自性候補を取得するとともに、当該存在物の当該複数の独自性候補の事前確率もしくは事前類似確率を取得するステップであって、各独自性候補に関しては、該複数の独自性候補に含まれた独自性候補の事前確率もしくは事前類似確率よりも高い事前確率もしくは事前類似確率の独自性候補があればその全てが当該複数の独自性候補に含まれるようにする、ステップと、
c)少なくとも存在物の事前確率もしくは事前類似確率、または少なくとも、存在物の事前確率もしくは事前類似確率および質量スペクトルとの一致に関する、存在物の独自性候補のそれぞれについての、独自性候補のスコアの計算を行うステップと、
d)存在物の独自性を、当該存在物の真の独自性におそらく対応するスコアに最も近いスコアを有している独自性候補として決定するステップと、
を含んでいる、方法。 - 前記ステップc)において、前記計算は、任意にベイズの定理を用いて、独自性候補の最大確率を計算すること、または独自性候補の確率を計算することを含んでいる、請求項1に記載の方法。
- 前記ステップb)において、事前確率もしくは事前類似確率の値は、前記存在物の集団内頻度、環境における前記存在物の修飾の確率、および、前記分析における前記存在物の修飾の確率のうちの少なくとも1つに基づいて計算される、請求項1または2に記載の方法。
- 前記ステップb)において、独自性候補を取得することおよび/または独自性候補の事前確率もしくは事前類似確率の取得は計数を含んでおり、当該計数が、
b.a)初期事前確率もしくは事前類似確率を有する初期独自性候補を選択するステップと;
b.b)前記初期独自性候補を、独自性候補のベースに送るステップと;
b.c)前記独自性候補のベースに対する事象の適用によって新たな独自性候補を生成して、前記新たな独自性候補を前記独自性候補のベースに取り込み、制限条件が満たされる限り前記生成を継続するステップと;
b.d)ステップb.c)において取得された前記独自性候補のベースを、関連する事前確率もしくは事前類似確率を有する独自性候補に変換するステップと;
を含んでいる、請求項1~3のいずれか1項に記載の方法。 - 前記独自性候補がペプチドであり;事前類似確率が用いられ;前記初期独自性候補が、基準タンパク質の、N末端で切断されている直鎖状の部分配列であり;前記適用可能な事象が、修飾、置換および切断を含んでおり;前記制限条件が、所定の形態のペプチドの、最小事前類似確率である;または、
前記独自性候補がタンパク質であり;前記事前類似確率が用いられ;前記初期独自性候補が、基準エキソンに基づくタンパク質モデルであり;前記適用可能な事象がエキソン排除およびエキソンインクルージョンを含んでおり;前記制限条件がエキソンに基づくモデルの最小の事前類似確率であり;存在物の前記変換がタンパク質コード配列へのエキソンの連結およびインシリコにおける翻訳である、請求項4に記載の方法。 - 前記存在物がタンパク質であり、前記ステップb)において存在物の前記独自性候補を取得するステップには、ヌクレオチドレベルで既知の変異を含むペプチドバリアントのデータベースにおけるデータベース検索を含んでおり、前記方法は、変異体で多形性を有するタンパク質の、プロテオームの質量スペクトルからの、同定のために使用される、請求項1~5のいずれか1項に記載の方法。
- 前記存在物がペプチドであり、
e)多型ペプチドまたは生殖系列ペプチドとして決定されている存在物を、由来物のデータベースとマッチングさせるステップ
をさらに含んでおり、
前記方法は、プロテオームの質量スペクトルからの、細胞株の鑑定または個人の同定のために使用される、請求項1~6のいずれか1項に記載の方法。 - 前記存在物が非宿主ペプチドであり、前記ステップb)において、非宿主ペプチドの事前確率もしくは事前類似確率が、非宿主生物の事前確率もしくは事前類似確率にしたがって、縮小されており、
前記方法は、事前確率もしくは事前類似確率が既知の非宿主生物の、宿主生物のプロテオームの質量スペクトルからの同定のために、例えば宿主の微生物感染または宿主の微生物によるコロニー形成を同定するために、使用される、請求項1~7のいずれか1項に記載の方法。 - 前記存在物が非宿主ペプチドであり、前記独自性候補を取得することにおける前記ステップb)において、非宿主生物に対して一意にマッピングするペプチドが、宿主生物の計数されたペプチドに加えられ、非宿主ペプチドの事前確率もしくは事前類似確率が任意の宿主ペプチドより低く、
前記方法が、宿主生物のプロテオームの質量スペクトルからの、事前確率もしくは事前類似確率が未知の非宿主生物の同定のために使用される、請求項4~6のいずれか1項に記載の方法。 - 前記存在物がドナーペプチドであり、前記ステップb)において、ドナーペプチドの事前確率もしくは事前類似確率が、レシピエントペプチドの間におけるそれらの事前確率もしくは事前類似確率にしたがって、倍率をかけられており、
前記方法が、レシピエントにおける移植された組織に由来するタンパク質の同定のために使用される、請求項1~9のいずれか1項に記載の方法。 - 前記存在物がペプチドであり、前記方法が、
e)腫瘍に起因する体細胞変異体バリアントペプチドを選択するステップ
をさらに含んでおり、
前記方法が、循環するタンパク質の質量スペクトルからの、腫瘍の存在の同定、または体細胞変異の数の増加を介した、腫瘍生物学的特性の評価のために使用される、請求項1~10のいずれか1項に記載の方法。 - 前記存在物がペプチドであり、前記方法が、
e)ドナーに起因する多型ペプチドの選択および定量を行うステップ
をさらに含んでおり、
前記方法が、レシピエントの生物材料の質量スペクトルから、移植する組織もしくは器官の監視、および移植片拒絶の早期検出のために使用される、請求項1~11のいずれか1項に記載の方法。 - 前記存在物がペプチドであり、前記方法が、
e)多型ペプチドに基づく2個体間の一致の有意さを見積もるステップ
をさらに含んでおり、
前記方法が、プロテオームの測定された質量スペクトルからの、2以上の個体間の遺伝的関係の存在の同定のために使用される、請求項1~12のいずれか1項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18184710.4A EP3598135A1 (en) | 2018-07-20 | 2018-07-20 | Method of identification of entities from mass spectra |
EP18184710.4 | 2018-07-20 | ||
PCT/EP2019/069552 WO2020016428A1 (en) | 2018-07-20 | 2019-07-19 | Method of identification of entities from mass spectra |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021531586A JP2021531586A (ja) | 2021-11-18 |
JP7218019B2 true JP7218019B2 (ja) | 2023-02-06 |
Family
ID=63144797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021503069A Active JP7218019B2 (ja) | 2018-07-20 | 2019-07-19 | 質量スペクトルからの存在物の同定の方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210241851A1 (ja) |
EP (2) | EP3598135A1 (ja) |
JP (1) | JP7218019B2 (ja) |
CA (1) | CA3106053A1 (ja) |
WO (1) | WO2020016428A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112415208A (zh) * | 2020-11-17 | 2021-02-26 | 北京航空航天大学 | 一种评价蛋白组学质谱数据质量的方法 |
CN115436347A (zh) | 2021-06-02 | 2022-12-06 | 布鲁克科学有限公司 | 用于离子光谱中的结构识别的理化性质评分 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005057208A1 (en) | 2003-12-03 | 2005-06-23 | Prolexys Pharmaceuticals, Inc. | Methods of identifying peptides and proteins |
US20080300795A1 (en) | 2007-06-01 | 2008-12-04 | Rovshan Goumbatoglu Sadygov | Evaluating the probability that MS/MS spectral data matches candidate sequence data |
WO2008151140A2 (en) | 2007-05-31 | 2008-12-11 | The Regents Of The University Of California | Method for identifying peptides using tandem mass spectra by dynamically determining the number of peptide reconstructions required |
WO2017114943A1 (en) | 2015-12-30 | 2017-07-06 | Vito Nv | Methods for mass spectrometry-based structure determination of biomacromolecules |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60026452T2 (de) * | 1999-04-06 | 2006-08-10 | Micromass Uk Ltd. | Verfahren zur Identifizierung von Peptidensequenzen und Proteinensequenzen mittels Massenspektromterie |
US9354236B2 (en) * | 2009-07-01 | 2016-05-31 | Consejo Superior De Investigaciones Cientificas | Method for identifying peptides and proteins from mass spectrometry data |
-
2018
- 2018-07-20 EP EP18184710.4A patent/EP3598135A1/en not_active Withdrawn
-
2019
- 2019-07-19 WO PCT/EP2019/069552 patent/WO2020016428A1/en unknown
- 2019-07-19 US US17/261,114 patent/US20210241851A1/en active Pending
- 2019-07-19 CA CA3106053A patent/CA3106053A1/en active Pending
- 2019-07-19 JP JP2021503069A patent/JP7218019B2/ja active Active
- 2019-07-19 EP EP19746050.4A patent/EP3824292A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005057208A1 (en) | 2003-12-03 | 2005-06-23 | Prolexys Pharmaceuticals, Inc. | Methods of identifying peptides and proteins |
WO2008151140A2 (en) | 2007-05-31 | 2008-12-11 | The Regents Of The University Of California | Method for identifying peptides using tandem mass spectra by dynamically determining the number of peptide reconstructions required |
US20080300795A1 (en) | 2007-06-01 | 2008-12-04 | Rovshan Goumbatoglu Sadygov | Evaluating the probability that MS/MS spectral data matches candidate sequence data |
WO2017114943A1 (en) | 2015-12-30 | 2017-07-06 | Vito Nv | Methods for mass spectrometry-based structure determination of biomacromolecules |
Non-Patent Citations (1)
Title |
---|
Peter Mortensen, et al.,MSQuant, an Open Source Platform for Mass Spectrometry-Based Quantitative Proteomics,Journal of proteome[online],2009年11月04日,[検索日:2022年5月30日], <URL:https://pubs.acs.org/doi/10.2021/pr900721e> |
Also Published As
Publication number | Publication date |
---|---|
EP3598135A1 (en) | 2020-01-22 |
WO2020016428A1 (en) | 2020-01-23 |
EP3824292A1 (en) | 2021-05-26 |
JP2021531586A (ja) | 2021-11-18 |
CA3106053A1 (en) | 2020-01-23 |
US20210241851A1 (en) | 2021-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shi et al. | Reliability of whole-exome sequencing for assessing intratumor genetic heterogeneity | |
Bielow et al. | Proteomics quality control: quality control software for MaxQuant results | |
Fusaro et al. | Prediction of high-responding peptides for targeted protein assays by mass spectrometry | |
US9354236B2 (en) | Method for identifying peptides and proteins from mass spectrometry data | |
Tabb et al. | DirecTag: accurate sequence tags from peptide MS/MS through statistical scoring | |
DK2209893T3 (en) | The use of aptamers in proteomics | |
Higdon et al. | Randomized sequence databases for tandem mass spectrometry peptide and protein identification | |
Hill et al. | A statistical model for iTRAQ data analysis | |
Colaert et al. | Analysis of the resolution limitations of peptide identification algorithms | |
Ning et al. | Computational analysis of unassigned high‐quality MS/MS spectra in proteomic data sets | |
US20200240996A1 (en) | Identification and use of biological parameters for diagnosis and treatment monitoring | |
US20040153249A1 (en) | System, software and methods for biomarker identification | |
Higdon et al. | A predictive model for identifying proteins by a single peptide match | |
JP7218019B2 (ja) | 質量スペクトルからの存在物の同定の方法 | |
Welker | Elucidation of cross-species proteomic effects in human and hominin bone proteome identification through a bioinformatics experiment | |
JP2006510875A (ja) | コンステレーションマッピングおよびそれらの使用 | |
Barbieri et al. | Proteogenomics: key driver for clinical discovery and personalized medicine | |
Zhu et al. | Chi-square comparison of tryptic peptide-to-protein distributions of tandem mass spectrometry from blood with those of random expectation | |
Ryu et al. | Detecting differential protein expression in large-scale population proteomics | |
Mallikarjun et al. | BayesENproteomics: Bayesian elastic nets for quantification of peptidoforms in complex samples | |
EP2674758A1 (en) | A computational method for mapping peptides to proteins using sequencing data | |
Touil et al. | A structured evaluation of cryopreservation in generating single-cell transcriptomes from cerebrospinal fluid | |
JP4286075B2 (ja) | タンパク質同定処理方法 | |
CN117051102B (zh) | 生物标志物组合在制备预测帕金森病的产品中的应用 | |
Hughes et al. | Using Public Data for Comparative Proteome Analysis in Precision Medicine Programs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7218019 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |