JP5009784B2 - 質量分析計 - Google Patents

質量分析計 Download PDF

Info

Publication number
JP5009784B2
JP5009784B2 JP2007510124A JP2007510124A JP5009784B2 JP 5009784 B2 JP5009784 B2 JP 5009784B2 JP 2007510124 A JP2007510124 A JP 2007510124A JP 2007510124 A JP2007510124 A JP 2007510124A JP 5009784 B2 JP5009784 B2 JP 5009784B2
Authority
JP
Japan
Prior art keywords
sample
analyte
molecule
component
probability distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007510124A
Other languages
English (en)
Other versions
JP2007535673A (ja
Inventor
デニー、リチャード
リチャードソン、キース
スキリング、ジョン
Original Assignee
マイクロマス ユーケー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB0409677A external-priority patent/GB0409677D0/en
Application filed by マイクロマス ユーケー リミテッド filed Critical マイクロマス ユーケー リミテッド
Publication of JP2007535673A publication Critical patent/JP2007535673A/ja
Application granted granted Critical
Publication of JP5009784B2 publication Critical patent/JP5009784B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/02Details
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/11Automated chemical analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/24Nuclear magnetic resonance, electron spin resonance or other spin effects or mass spectrometry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/25Chemistry: analytical and immunological testing including sample preparation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Description

本発明は、質量分析方法および質量分析計に関する。好ましい実施形態は、特に不完全な測定やノイズが含まれる測定を行った場合に、分析化合物の相対的定量化を可能にする方法に関する。特に、好ましい実施形態は、ペプチド消化物または娘化合物存在量の測定および定量化に適用可能である。好ましい実施形態は、分析物/娘集団の相対的ベイジアン定量化に関する。
以下に詳細に説明するように、好ましい実施形態は、2つ以上のサンプルに存在する成分、分子または分析物の相対的定量化決定に対する確率的またはベイジアンアプローチに関する。背景として、ベイジアンの確率定理は命題の確率を扱う。確率は、ある命題がどれくらい真であるかを表す。例えば、確率1は、絶対に確実であることを意味する。また、確率0は、絶対に確実であるが、命題が偽であることが絶対に確実であることを意味する。確率0.5は、命題が真であるか偽であるかの不確実性が最大であることを意味する。
新しい情報を得た際に確率を変更することはベイジアン推論の重要な側面である。いわゆるベイズ規則は、合理的エージェントが新しい情報(証拠)を得たときにその信頼をどのように変更するかを定義する。
ベイジアン確率または確実性は常に条件付きである。これは、確率が背景条件に基づいて推定されることを意味する。条件付き確率は、通常P(事象|条件)という表記を使用して記載される。確率は、条件が真であると信じられる場合に事象が真であることはどれくらい確実であるかを示す、0と1の間の数である。条件付き確率は、Mを依存モデル、DをデータとしてP(D|M)またはP(M|D)という形で記載されることが多い。したがって、P(D|M)は、モデルMが真のモデルであると信じられる場合にデータDを得る確率を意味する。同様に、P(M|D)は、データDが与えられた際にモデルMが真のモデルである確率を意味する。確率は単にP(M)またはP(D)として与えられる場合があるが、これらは一般に不正確なベイジアン表記法であると考えられる。なぜなら、すべての確率は実際には条件付きだからである。しかし、すべての項が同じ背景条件を有する場合はそれを繰り返さなくてもよいことがある。理論上は、Uを背景条件の集合として、確率はP(D|M,U)、P(M|D,U)、P(M|U)およびP(D|U)の形で記載する。
エキスパートシステムは、各親の事象に重みを与えることによって相互依存事象の確率を計算することがよくある。ベイジアンネットワークは、数学的に正しく、したがって、事象のお互いへの影響を測定するより正確な方法を提供すると考えられる。数学を取り入れることによって双方向の計算が可能になる。したがって、例えば、どの事象が別の事象の最も可能性の高い原因であるかを見出すことが可能である。
以下の独立事象に対する確率の生成規則は周知である。
Figure 0005009784
ここでp(AB)はAおよびBが起こる確率を意味する。
これは、以下の従属事象に対する生成規則の特別な場合であり、p(A|B)はBがすでに起きた場合のAの確率を意味する。
Figure 0005009784
つまり、以下の式が成り立つ。
Figure 0005009784
その結果、以下の式が成り立つ。
Figure 0005009784
上記の式はベイズの定理を単純化したものである。この式は、既知の他の確率に関して計算された、Bが起きた場合にAが起きる確率を与える。
ベイズの定理は以下のように要約される。
Figure 0005009784
0は、初めから(ab initio)得られるかまたは事前の観測集合から誘導される前提条件であるが、新しい観測または証拠Eの前の前提条件とすることができる。項P(H0)はH0の事前確率と呼ばれる。項P(E|H0)は、前提条件H0が真である場合に観測Eを見込む条件付き確率(Eが与えられたH0の関数)であり、尤度関数と呼ばれる。項P(E)はEの周辺確率と呼ばれ、正規化定数であり、相互排除的なすべての前提条件の和として計算され得る。
Figure 0005009784
項P(H0|E)はEが与えられたH0の事後確率と呼ばれる。スケーリングファクタP(E|H0)/P(E)は、観測が有する前提条件への信頼性の影響の尺度が得られる。考えられている特定の前提条件が真でない場合に観測がなされる可能性が低いならば、このスケーリングファクタは大きくなる。正確な前提条件の事前確率によってこのスケーリングファクタを乗算すると、観察が与える正確な前提条件の事前確率の尺度が得られる。
推定作業を行うための鍵は、前提条件を与えられた事前確率および可能な代替の割当て、並びに異なる前提条件のもとでの観測の条件付き確率の計算である。
複数の生物学的サンプルまたは生物学的サンプルの複合混合物の分析においては、成分化合物の相対的な濃度を比較することが望ましいことがある。例えば、2つ以上の異なるサンプルにおけるタンパク質またはペプチドの発現量が異なっているかどうかを判断することが望ましいことがある。例えば、一方のサンプルは健常な生体からのサンプルを含み、他方のサンプルは患者からのサンプルを含んでもよい。患者のサンプルにおいて特定のタンパク質またはペプチドが、健常な生体から採取されたサンプル(コントロールサンプル)と比較して著しく多くまたは少なく発現されているならば、疾病状態を示している可能性がある。
生物学的サンプルの複合混合物は、質量分析計を使用し、好ましくは液体クロマトグラフを併用して分析され得る。
質量分析計によって記録されるイオン強度またはイオン数率を各ペプチドの濃度の尺度として使用することが知られている。しかし、各サンプルに関連するデータは、注入体積誤差などの種々の系統誤差およびカウント統計などの種々の非系統的な影響を受けやすい。
サンプルが複雑であったり、場合によっては、サンプル中の種々の成分、分子または分析物の濃度が低いことにより、データはときどきまたはしばしば不完全になる。また、データは干渉を含むことがある。その結果、データを成分、分子若しくは分析物に割当てること、または、成分、分子若しくは分析物を同定することが不確実になることがある。
従来のアプローチによれば、これらの要因がアウトプットを異常に見えさせ、その結果棄却されることなり得る。結果として、2つ以上のサンプル中に存在するいくつかの成分、分子または分析物について必ずしも常に定量化できるとは限らず、および/または実際には異常でないかもしれないが手に負えず棄却してしまうデータがあり得る。
したがって、2つ以上の異なるサンプルの測定がノイズを含みかつ不完全である場合においても、サンプル中に存在する成分、分子または分析物を定量できる改善された方法を提供することが望まれる。
本発明の一局面によれば、
成分、分子または分析物の第1の混合物を含む第1のサンプルを準備すること、
成分、分子または分析物の第2の混合物を含む第2の異なるサンプルを準備すること、および、
第2のサンプル中の成分、分子または分析物の強度、濃度または発現レベルに対する第1のサンプル中の成分、分子または分析物の相対的な強度、濃度または発現レベルを確率的に決定または定量化することを含む質量分析方法が提供される。
好ましい実施形態は2つの別々のサンプルに関するが、特に好ましい実施形態によると、成分、分子または分析物の混合物をそれぞれ含む複数のさらなるサンプルを準備されてもよい。好ましくは、成分、分子または分析物はタンパク質、タンパク質消化物、ペプチドまたはペプチドの断片を含む。
好ましくは、第1の混合物中の成分、分子または分析物は、第2の混合物中の成分、分子または分析物および/またはさらなる混合物中の成分、分子または分析物と同じ種である。しかし、あるいは、第1の混合物中の成分、分子または分析物は、第2の混合物中の成分、分子または分析物および/またはさらなる混合物中の成分、分子または分析物と異なる種であってもよい。
好ましくは、上記方法は、成分、分子または分析物の第1の混合物を消化すること、および/または成分、分子または分析物の第2の混合物を消化すること、および/または成分、分子または分析物のさらなる混合物を消化することをさらに含む。好ましくは、成分、分子または分析物の第1の混合物は消化されて第1の複合混合物を形成し、および/または成分、分子または分析物の第2の混合物は消化されて第2の複合混合物を形成し、および/または成分、分子または分析物のさらなる混合物は消化されてさらなる複合混合物を形成する。
好ましくは、複合混合物は、ペプチドまたはタンパク質消化物の複合混合物を含む。
上記好ましい実施形態によれば、上記方法は、第1のサンプルを1つ以上の第1の複製サンプルに分割すること、および/または第2のサンプルを1つ以上の第2の複製サンプルに分割すること、および/またはさらなるサンプルを1つ以上のさらなる複製サンプルに分割すること、および/または第1の複合混合物を1つ以上の第1の複製サンプルに分割すること、および/または第2の複合混合物を1つ以上の第2の複製サンプルに分割すること、および/またはさらなる複合混合物を1つ以上のさらなる複製サンプルに分割することをさらに含む。
一実施形態によれば、上記方法は、第1のサンプル中の成分、分析物または分子を分離処理手段によって分離すること、および/または第2のサンプル中の成分、分析物または分子を分離処理手段によって分離すること、および/またはさらなるサンプル中の成分、分析物または分子を分離処理手段によって分離すること、および/または第1の複製サンプル中の成分、分析物または分子を分離処理手段によって分離すること、および/または第2の複製サンプル中の成分、分析物または分子を分離処理手段によって分離すること、および/またはさらなる複製サンプル中の成分、分析物または分子を分離処理手段によって分離することをさらに含む。
上記分離処理は液体クロマトグラフィを含む。一実施形態によれば、上記分離処理は、(i)高速液体クロマトグラフィ(「HPLC」)、(ii)陰イオン交換、(iii)陰イオン交換クロマトグラフィ、(iv)陽イオン交換、(v)陽イオン交換クロマトグラフィ、(vi)イオン対逆相クロマトグラフィ、(vii)クロマトグラフィ、(viii)一次元電気泳動、(ix)多次元電気泳動、(x)サイズ排除、(xi)アフィニティ、(xii)逆相クロマトグラフィ、(xiii)キャピラリ電気泳動クロマトグラフィ(「CEC」)、(xiv)電気泳動、(xv)イオン移動分離、(xvi)電界非対称イオン移動分離またはスペクトロメトリ(「FAIMS」)または(xvi)キャピラリ電気泳動を含む。
好ましくは、上記方法は、第1のサンプル中の成分、分析物または分子をイオン化すること、および/または第2のサンプル中の成分、分析物または分子をイオン化すること、および/またはさらなるサンプル中の成分、分析物または分子をイオン化すること、および/または第1の複製サンプル中の成分、分析物または分子をイオン化すること、および/または第2の複製サンプル中の成分、分析物または分子をイオン化すること、および/またはさらなる複製サンプル中の成分、分析物または分子をイオン化することをさらに含む。
好ましくは、上記方法は、第1のサンプル中の成分、分析物または分子を質量分析すること、および/または第2のサンプル中の成分、分析物または分子を質量分析すること、および/またはさらなるサンプル中の成分、分析物または分子を質量分析すること、および/または第1の複製サンプル中の成分、分析物または分子を質量分析すること、および/または第2の複製サンプル中の成分、分析物または分子を質量分析すること、および/またはさらなる複製サンプル中の成分、分析物または分子を質量分析することをさらに含む。
好ましくは、成分、分析物または分子を質量分析する工程は、複数の質量ピークを含む質量スペクトルデータを生成することをさらに含む。好ましくは、上記方法は、1つ以上の質量ピークの質量または質量電荷比を決定することをさらに含む。好ましくは、上記方法は、1つ以上の質量ピークに対して、信号強度または積分信号を決定することをさらに含む。
上記好ましい実施形態によれば、上記方法は、1つ以上の質量ピークに対して保持時間を決定することをさらに含む。
好ましくは、上記方法は、第1のサンプルおよび/または第2のサンプルおよび/またはさらなるサンプルからの質量ピークをクラスタリングすることをさらに含む。好ましくは、上記方法は第1の複製サンプルおよび/または第2の複製サンプルおよび/またはさらなる複製サンプルからの質量ピークをクラスタリングすることを含む。
一実施形態によれば、上記方法は、第1のサンプル中の成分、分析物または分子を認識または同定すること、および/または第2のサンプル中の成分、分析物または分子を認識または同定すること、および/またはさらなるサンプル中の成分、分析物または分子を認識または同定すること、および/または第1の複製サンプル中の成分、分析物または分子を認識または同定すること、および/または第2の複製サンプル中の成分、分析物または分子を認識または同定すること、および/またはさらなる複製サンプル中の成分、分析物または分子を認識または同定することをさらに含む。
好ましくは、成分、分析物または分子は、質量または質量電荷比もしくは正確な質量または正確な質量電荷比に基づいて認識または同定される。成分、分析物または分子の正確な質量または質量電荷比は、20ppm、19ppm、18ppm、17ppm、16ppm、15ppm、14ppm、13ppm、12ppm、11ppm、10ppm、9ppm、8ppm、7ppm、6ppm、5ppm、4ppm、3ppm、2ppm、1ppm以内または<1ppmである。
好ましくは、成分、分析物または分子の質量電荷比は、0.01質量単位、0.009質量単位、0.008質量単位、0.007質量単位、0.006質量単位、0.005質量単位、0.004質量単位、0.003質量単位、0.002質量単位、0.001質量単位以内または<0.001質量単位である。
好ましくは、成分、分析物または分子は、クロマトグラフィ保持時間または別の物理化学特性に基づいて認識または同定される。
一実施形態によれば、上記方法は、成分、分析物または分子を衝突または断片化セルにおいて断片化して複数の断片、娘または生成イオンを形成、作成または生成することをさらに含む。好ましくは、断片、娘または生成イオンは質量分析される。
一実施形態によれば、上記方法は、断片、娘または生成イオンに基づいて第1のサンプル中の成分、分子または分析物を同定または認識すること、および/または断片、娘または生成イオンに基づいて第2のサンプル中の成分、分子または分析物を同定または認識すること、および/または断片、娘または生成イオンに基づいてさらなるサンプル中の成分、分子または分析物を同定または認識することをさらに含む。
一実施形態によれば、上記方法は、質量ピークの正確な同定のために確率を得ることまたは割当てることをさらに含む。好ましくは、上記方法は、タンパク質検索手順から確率を得ることまたは導き出すことをさらに含む。
好ましくは、上記方法は、タンパク質検索手順から確率が得られない場合または導かれない場合に正確な同定の一定の確率を割当てることをさらに含む。好ましくは、上記方法は、正確な同定の確率を値x%として割当てることをさらに含む。ここで、xは、(i)<5%、(ii)5〜10%、(iii)10〜15%、(iv)15〜20%、(v)20〜25%、(vi)25〜30%、(vii)30〜35%、(viii)35〜40%、(ix)40〜45%、(x)45〜50%、(xi)50〜55%、(xii)55〜60%、(xiii)60〜65%、(xiv)65〜70%、(xv)70〜75%、(xvi)75〜80%、(xvii)80〜85%、(xviii)85〜90%、(xix)90〜95%、および(xx)>95%からなる群から選択される。
一実施形態によれば、上記方法は、タンパク質検索手順が行われない場合に正確な同定の一定の確率を割当てることをさらに含む。好ましくは、上記方法は、正確な同定の確率を値x%として割当てることをさらに含む。ここで、xは、(i)<5%、(ii)5〜10%、(iii)10〜15%、(iv)15〜20%、(v)20〜25%、(vi)25〜30%、(vii)30〜35%、(viii)35〜40%、(ix)40〜45%、(x)45〜50%、(xi)50〜55%、(xii)55〜60%、(xiii)60〜65%、(xiv)65〜70%、(xv)70〜75%、(xvi)75〜80%、(xvii)80〜85%、(xviii)85〜90%、(xix)90〜95%および(xx)>95%からなる群から選択される。
一実施形態によれば、上記方法は、各サンプル中に存在する成分、分子または分析物の相対量または濃度Lについての事前確率分布関数Pr(L)を決定、定式化または割当てることをさらに含む。好ましくは、事前確率分布関数Pr(L)はexp(−L/Λ)に比例する。ここで、Λは質量ピークに対して記録された最大信号強度に一致する。好ましくは、Λは質量ピークに対して記録された平均信号強度に一致する。
一実施形態によれば、事前確率分布関数Pr(L)はガンマ、ポアソン、ガウシアン、指数、正規または対数正規分布を有する。好ましくは、事前確率分布関数Pr(L)は1に等しい積分値をともなった分布を有する。
一実施形態によれば、上記方法は、サンプル中の各成分、分子または分析物の全応答ファクタkについての事前確率分布関数Pr(k)を決定、定式化または割当てることをさらに含む。好ましくは、kは、(i)消化効率、(ii)相対生成量、(iii)送達における損失、(iv)イオン化効率、(v)伝播効率、および(vi)検出効率の1つ以上を含む。一実施形態によれば、事前確率分布関数Pr(k)はexp(−k/k0)に比例し、ここでk0は定数である。好ましくは、k0=1である。
一実施形態によれば、事前確率分布関数Pr(k)は、ガンマ、ポアソン、ガウシアン、指数、正規または対数正規分布を有する。好ましくは、事前確率分布関数Pr(k)は、1に等しい積分値をともなう分布を有する。
一実施形態によれば、上記方法は、分析において使用される各サンプル中の各成分、分子または分析物のサンプルhの相対量についての事前確率分布関数Pr(h)を決定、定式化または割当てることをさらに含む。好ましくは、hは、(i)添加された溶媒の量、および(ii)注入された物質の量の1つ以上を含む。
一実施形態によれば、事前確率分布関数Pr(h)はexp(−h/h0)に比例し、ここでh0は定数である。好ましくは、h0=1である。
一実施形態によれば、事前確率分布関数Pr(h)は、ガンマ、ポアソン、ガウシアン、指数、正規または対数正規分布を有する。好ましくは、事前確率分布関数Pr(h)は、1に等しい積分値をともなう分布を有する。
一実施形態によれば、上記方法は、観測される信号強度に対して想定される、および/または予測される信号強度に適用されるノイズ寄与ファクタGについての事前確率分布関数Pr(G)を決定、定式化または割当てることをさらに含む。好ましくは、Gは、(i)イオン統計ショットノイズおよび(ii)エレクトロスプレーイオン化飛沫統計ショットノイズのうち1つ以上を含む。
好ましくは、事前確率分布関数Pr(G)はexp(−G/G0)に比例し、ここでG0は定数である。好ましくは、G0=1である。
一実施形態によれば、事前確率分布関数Pr(G)は、ガンマ、ポアソン、ガウシアン、指数、正規または対数正規分布を有する。好ましくは、事前確率分布関数Pr(G)は、1に等しい積分値をともなう分布を有する。
一実施形態によれば、上記方法は、1つ以上の内部標準または基準を検索、決定、同定または選択することをさらに含む。好ましくは、1つ以上の内部標準または基準は、サンプルのすべてにおいて実質的に同じ強度、濃度または発現レベルを有する1つ以上の成分、分子または分析物を含む。
1つ以上の内部標準または基準は、各サンプルに対して添加される1つ以上の成分、分子または分析物を含んでもよい。1つ以上の内部標準または基準は、第1のサンプルおよび/または第2のサンプルおよび/またはさらなるサンプルに対して内因性または外因性であってもよい。
好ましくは、上記方法は、マルコフ連鎖モンテカルロアルゴリズムを使用してマルコフ連鎖モンテカルロ予測手順または探索を繰返し適用または使用して、サンプルの各々における各成分、分子または分析物の相対濃度Lに対するもっともらしい値を決定することをさらに含む。好ましくは、マルコフ連鎖モンテカルロ予測手順またはアルゴリズムは、(i)メトロポリス−ヘイスティングアルゴリズム、(ii)ギブスサンプリングアルゴリズム、(iii)ハミルトニアンモンテカルロアルゴリズム、および(iv)スライスサンプリングアルゴリズムからなる群から選択される。
一実施形態によれば、マルコフ連鎖モンテカルロ予測手順またはアルゴリズムは、シミュレーテッドアニーリングおよび/または入れ子サンプリングを併用して使用される。
一実施形態によれば、上記方法は、確率分布関数Pr(L)および/またはPr(k)および/またはPr(h)および/またはPr(G)を与える、および/または、正確な同定の確率pを与える各質量ピーク強度を観測され得ることを予測することをさらに含む。
一実施形態によれば、上記方法は、予測されるピーク強度と観測されるピーク強度とを比較することをさらに含む。
一実施形態によれば、上記方法は、Lの値または確率分布関数Pr(L)を調整することをさらに含む。
一実施形態によれば、上記方法は、kの値または確率分布関数Pr(k)を調整することをさらに含む。
一実施形態によれば、上記方法は、hの値または確率分布関数Pr(h)を調整することをさらに含む。
一実施形態によれば、上記方法は、Gの値または確率分布関数Pr(G)を調整することをさらに含む。
一実施形態によれば、上記方法は、調整された確率分布関数Pr(L)および/またはPr(k)および/またはPr(h)および/またはPr(G)を与える、および/または正確な同定の確率pを与える各質量ピーク強度を観測され得ることを予測することをさらに含む。
好ましくは、上記方法は、予測されるピーク強度と観測されるピーク強度とを比較することをさらに含む。
一実施形態によれば、上記方法は、調整された確率分布関数を受け入れるかまたは不採用とすることをさらに含む。好ましくは、上記方法は、確率分布関数を調整する、および/または強度を予測する、および/または予測される強度と観測される強度を比較するサイクルを繰り返すか、または終了することをさらに含む。
好ましくは、上記方法は、サンプルの各ペアi,jに対するサンプルの各々における各成分、分子または分析物の相対濃度Lの比Lijを決定することをさらに含む。
一実施形態によれば、上記方法は、マルコフ連鎖モンテカルロ予測手順を継続して、サンプルの各々における各成分、分子または分析物の相対濃度Lおよび相対濃度Lの比Lijに対するよりもっともらしい値を決定することをさらに含む。
好ましくは、相対濃度Lの比Lijの決定回数は、平均値の要求された正確度にしたがって予め規定される。
上記方法は、サンプルの各ペアi,jに対するサンプルの各々における各成分、分子または分析物の相対濃度Lの比Lijに対する平均値を計算することをさらに含む。
一実施形態によれば、上記方法は、サンプルの各ペアi,jに対するサンプルの各々における各成分、分子または分析物の相対濃度Lの比Lijに対する標準偏差および/または相対標準偏差を計算することをさらに含む。
一実施形態によれば、第1のサンプルおよび/または第2のサンプルおよび/またはさらなるサンプルは、複数の異なるバイオポリマー、タンパク質、ペプチド、ポリペプチド、オリゴヌクレオチド、オリゴヌクレオシド、アミノ酸、炭水化物、糖、脂質、脂肪酸、ビタミン、ホルモン、DNAの部分若しくは断片、cDNAの部分若しくは断片、RNAの部分若しくは断片、mRNAの部分若しくは断片、tRNAの部分若しくは断片、ポリクローナル抗体、モノクローナル抗体、リボヌクレアーゼ、酵素、代謝産物、多糖類、リン酸化ペプチド、リン酸化タンパク質、糖ぺプチド、糖タンパク質またはステロイドを含む。
第1のサンプルおよび/または第2のサンプルおよび/またはさらなるサンプルは、少なくとも2、5、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500または5000の異なる同一性を有するかまたは異なる種である成分、分子または分析物を含んでもよい。
第1のサンプルおよび/または第2のサンプルおよび/またはさらなるサンプルは、モル濃度の等しくない異種複合混合物であってもよい。好ましくは、(i)第1のサンプルは罹患生体から採取され、かつ、第2のサンプルは非罹患生体から採取される、(ii)第1のサンプルは処置生体から採取され、かつ、第2のサンプルは非処置生体から採取される、または(iii)第1のサンプルは変異生体から採取され、かつ、第2のサンプルは野生型生体から採取される、のいずれかである。
一実施形態によれば、上記方法は、第1のサンプルおよび/または第2のサンプルおよび/またはさらなるサンプル中の成分、分子または分析物を同定することをさらに含む。
好ましくは、第1のサンプルおよび/または第2のサンプルおよび/またはさらなるサンプル中の成分、分子または分析物は、第1のサンプルの成分、分子または分析物の強度が第2のサンプルおよび/またはさらなるサンプル中の成分、分子または分析物の強度との違いが所定量より大きくなる場合にのみ同定される。
第1のサンプルおよび/または第2のサンプルおよび/またはさらなるサンプル中の成分、分子または分析物は、第1のサンプルの複数の成分、分子または分析物の平均強度が第2のサンプルおよび/またはさらなるサンプル中の複数の成分、分子または分析物の平均強度との違いが所定量より大きくなる場合にのみ同定されてもよい。
好ましくは、所定量は、(i)1%、(ii)2%、(iii)5%、(iv)10%、(v)20%、(vi)50%、(vii)100%、(viii)150%、(ix)200%、(x)250%、(xi)300%、(xii)350%、(xiii)400%、(xiv)450%、(xv)500%、(xvi)1000%、(xvii)5000%および(xviii)10000%からなる群から選択される。
好ましくは、成分、分子または分析物および/またはペプチド消化物および/または断片、娘または生成イオンの質量または質量電荷比は、(i)フーリエ変換(「FT」)質量分析計、(ii)フーリエ変換イオンサイクロトロン(「FTICR」)質量分析計、(iii)飛行時間(「TOF」)質量分析計、(iv)直交加速飛行時間(「oaTOF」)質量分析計、(v)扇形磁場質量分析計、(vi)四重極質量分析器、(vii)イオントラップ質量分析器または(viii)フーリエ変換オービトラップ、静電イオンサイクロトロン共鳴質量分析計または静電フーリエ変換質量分析計のいずれかによって質量分析される。
好ましくは、第1のサンプルおよび/または第2のサンプルおよび/またはさらなるサンプルを、(i)エレクトロスプレーイオン化(「ESI」)イオン源、(ii)大気圧光イオン化(「APPI」)イオン源、(iii)大気圧化学イオン化(「APCI」)イオン源、(iv)マトリックス支援レーザ脱離イオン化(「MALDI」)イオン源、(v)レーザ脱離イオン化(「LDI」)イオン源、(vi)大気圧イオン化(「API」)イオン源、(vii)シリコンを用いた脱離イオン化(「DIOS」)イオン源、(viii)電子衝突(「EI」)イオン源、(ix)化学イオン化(「CI」)イオン源、(x)電界イオン化(「FI」)イオン源、(xi)電界脱離(「FD」)イオン源、(xii)誘導結合プラズマ(「ICP」)イオン源、(xiii)高速原子衝撃(「FAB」)イオン源、(xiv)液体二次イオン質量分析(「LSIMS」)イオン源、(xv)脱離エレクトロスプレーイオン化(「DESI」)イオン源および(xvi)ニッケル−63放射性イオン源からなる群から選択されるイオン源を使用してイオン化される。
本発明の一実施形態によれば、第1のサンプル中の成分、分子または分析物の相対的な強度、濃度または発現レベルを、第2のサンプル中の成分、分子または分析物の強度、濃度または発現レベルに対して、確率的に決定または定量化するように構成された手段を備える質量分析計が提供される。
好ましくは、上記質量分析計は、液体クロマトグラフをさらに備える。
一実施形態によれば、上記質量分析計は、1つ以上の質量フィルタおよび/または1つ以上の質量分析部をさらに備える。好ましくは、1つ以上の質量フィルタおよび1つ以上の質量分析部は、(i)直交加速飛行時間質量分析部、(ii)軸方向加速飛行時間質量分析部、(iii)ポール3D四重極イオントラップ質量分析部、(iv)2Dまたは線形四重極イオントラップ質量分析部、(v)フーリエ変換イオンサイクロトロン共鳴質量分析部、(vi)扇形磁場質量分析部、(vii)四重極質量分析部および(viii)ペニングトラップ質量分析部からなる群から選択される。
好ましくは、上記質量分析計はイオン源をさらに備える。イオン源はパルス化イオン源または連続イオン源を備えてもよい。イオン源は、(i)エレクトロスプレーイオン化(「ESI」)イオン源、(ii)大気圧光イオン化(「APPI」)イオン源、(iii)大気圧化学イオン化(「APCI」)イオン源、(iv)マトリックス支援レーザ脱離イオン化(「MALDI」)イオン源、(v)レーザ脱離イオン化(「LDI」)イオン源、(vi)大気圧イオン化(「API」)イオン源、(vii)シリコンを用いた脱離イオン化(「DIOS」)イオン源、(viii)電子衝突(「EI」)イオン源、(ix)化学イオン化(「CI」)イオン源、(x)電界イオン化(「FI」)イオン源、(xi)電界脱離(「FD」)イオン源、(xii)誘導結合プラズマ(「ICP」)イオン源、(xiii)高速原子衝撃(「FAB」)イオン源、(xiv)液体二次イオン質量分析(「LSIMS」)イオン源、(xv)脱離エレクトロスプレーイオン化(「DESI」)イオン源および(xvi)ニッケル−63放射性イオン源からなる群から選択される。
本発明の一局面によれば、数個のサンプルの中で1つ以上の分子種を相対的に定量化する方法であって、
各サンプルを複数の複製サンプルに分割すること、
複製サンプルの各々に関する、該分子種の数個の暫定的に同定された消化物の各々の信号であって、ランダムノイズの影響を受けやすい親種の濃度に比例する信号を得ることであって、
各暫定同定が正しいという確率を得るか、または割当てること、
各サンプル中の各分子種の相対量Lについての事前確率分布を割当てること、
各分子種から生成される消化物の相対量kについての事前確率分布を割当てること、
各複製サンプルに対するサンプルの相対量hについての事前確率分布を割当てること、
各サンプル中のノイズレベルGについての事前確率分布を割当てること、
濃度が複製サンプルのすべてにおいて同じであることが既知である内部標準を選択すること、
各サンプル中の各分子種の相対量Lに対する確率分布を更新すること、
複製サンプルの各異なるペアi,jに対する比率L_i対L_jの単調関数の各サンプルにおける各分子種の相対量Lに対する確率分布にしたがってサンプルを得ること、および、
ペアの各々に対する関数の平均値および標準偏差を計算することを含む方法が提供される。
本発明の一局面によれば、
成分、分子または分析物の第1の混合物を含む第1のサンプルを準備すること、
成分、分子または分析物の第2の混合物を含む第2の異なるサンプルを準備すること、および、
第2のサンプル中の成分、分子または分析物の強度、濃度または発現レベルに対する第1のサンプル中の成分、分子または分析物の相対的な強度、濃度または発現レベルを決定または定量化することを含む質量分析方法が提供される。
本発明の一局面によれば、第1のサンプル中の成分、分子または分析物の相対的な強度、濃度または発現レベルを、第2のサンプル中の成分、分子または分析物の強度、濃度または発現レベルに対して、決定または定量化するように構成された手段を備える質量分析計が提供される。
好ましい実施形態は、順方向モデリングアルゴリズムを使用して、測定されたイオン数に対する未知のイオン化および消化効率の寄与の平均をとることが好ましい。測定されたペプチドのイオン数は、元のサンプル中における生成物の濃度およびそのイオン化および消化効率に関するファクタに比例するとして表現すことができる。好ましくは、濃度および消化/イオン化効率の値は各ぺプチドに対して探索され、好ましくは、尤度は各結果に対して、サンプル中に存在する化合物の与えられる確率を使用して、計算される。好ましくは、尤度計算は、欠落データを補間または別の方法で埋める必要がないという格別の効果がある。これは従来のアプローチとは対照的である。
好ましい実施形態の探索のさらなる特徴は、外れ値または範囲外のデータの存在を調べ得るようにデータへの割当てのオンオフを切り替えられ得ることである。次いで各サンプル中のタンパク質またはペプチドの相対濃度が計算でき、パーセンテージ信頼度間隔が確率的探索結果を使用して与えられる。
質量スペクトルデータおよびマイクロアレイデータには異なる問題がある。特に、好ましい実施形態は、内在するポアソンノイズ(カウント統計)を示すデータに関係する。特に、これは、分析器が娘化合物(例えば、ペプチドまたはペプチド消化物)の存在量を決定し、多くの事象(例えば、強度)を報告する場合に適切である。例えば、事象は、四重極飛行時間質量分析計におけるイオン到達数に関連する。しかし、これはマイクロアレイスポットの色/輝度などの連続量に対しては適切でない。
最も単純な形態では、本発明の方法および装置において実施されるような好ましい実施形態は、2つの未知の数AおよびBがあり、B/Aの比を決定することが望まれる場合の問題を解決することに関すると考えられ得る。A(A1,A2...AN)およびB(B1,B2...BM)のサンプルが与えられる。一般に、NおよびMは等しくないが、N=1かつM=1の場合も許される。AおよびBのサンプルは「良い」または「悪い」のいずれかであると考えられることができ、各サンプルはPr(A3は良い)などの確率を伴うと考えてもよい。Aの「良い」サンプルは、ある数学的に十分に定義された意味においてAに近い。Aの「悪い」サンプルはほとんどいかなるものであってもよい。Bについても同様である。
好ましい実施形態によると、この情報のみが与えられた場合の比B/Aを推測し、またその比の不確実性の推定を与えることが望ましい。好ましい実施形態において、数AおよびBは質量分析計によって測定されるように溶液中のペプチドの濃度に比例する。以下の例を考えてもよい。
Figure 0005009784
上記データから、Aの最後のサンプルとBの3番目のサンプルが「悪い」と考えられ、外れ値として棄却されるならば、Aは100に等しく、Bが500に等しいことがもっともらしいと考えてもよい。しかし、好ましい実施形態は、最初は偽りに見えるデータを直ちには棄却しない。
好ましい実施形態によって決定されるように比B/Aおよび対応する不確実性の推定は、5.1±0.1であると決定される。
好ましい実施形態は異なる観点から考えることができ、第2の関連する問題に対応すると考えることができる。この問題は、2+K個の未知数A、B、k1、k2...kKがあり、2*K個の可能な積の一部が与えられるか、または既知であると考えられる。
Figure 0005009784
これらの積のいずれかの任意の数のサンプルが与えられると考えることができる。サンプルは上記と同じ意味において「良い」または「悪い」のいずれかであると考えることができ、各サンプルは対応付けられた確率を伴う。問題はやはりB/Aを推定し、不確実性の推定を与えることである。
好ましい実施形態によると、数AおよびBは、消化前の溶液中の完全な状態のタンパク質の濃度に比例し、その他の未知数kiは、そのタンパク質トリプシンペプチドの消化およびイオン化特性に関連する。係数kiには特に重要性がないので実際に計算する必要はない。
好ましい実施形態は、分析物またはその生成物および少なくとも1つの内部標準化合物を含むいくつかの物理サンプルに対して分析化合物の存在量における変化を定量化するように設計されたアルゴリズムを含む方法および装置に関する。各サンプルからいくつもの反復された測定値を得てもよく、データはノイズを含んでもよいし、また概ね不完全であってもよい。データの不適当な割当ての確率が存在し、ある割当ては他の割当てよりも正しい傾向がついよいことは最初から知られている。
好ましい実施形態は、データの新規な数学モデルのアプリケーションに関し、マルコフ連鎖モンテカルロ手法を使用して、関連する不確実性を有する存在量の変化を測定し、決定できるようにモデルパラメータの空間を探索することに関する。
ペアごとのt−検定およびANOVAなどの標準の統計手法は、各サンプルの測定値の数が異なる場合、測定値が欠落する場合、データの割当てがあいまいな場合、測定値が実験的に相関する場合または測定値の数が非常に少ない場合において適用できない。
当業者によって理解されるように、現実においては、実験データはノイズを含み、不完全であることが多いので、従来の公知技術はノイズを含み不完全な実験データを処理および分析する能力に使用限度があることが明らかである。
好ましい実施形態の特に有利な局面は、2つ以上の別々のサンプル中に存在する特定の分析物の相対濃度を決定するために標準化工程を独立した工程として行う必要がないことである。
好ましくは、複数の実験を行い、すべての実験において濃度が同じである分析物が内部標準として使用される。好ましい実施形態は、親(例えば、タンパク質)に確率的に対応付けられた娘化合物(例えば、ペプチド)を考慮に入れる。娘がタンパク質の酵素消化物であり、ペプチド同定情報がタンデム質量分析から得られる場合に特に有用である。
また、好ましい実施形態は、欠落データをトランスペアレントに(ユーザに意識されずに)扱う。これに対して、従来のアプローチでは、データ欠落があると特に問題があり、エラーを起こしやすくなる。
好ましい実施形態は、複数の異なるサンプル中に存在する特定の分析物の相対濃度における違いを測定する確率的またはベイジアン方法に関する。
好ましい実施形態は、実験データが完全でないとしてもサンプル中に存在する分析物を正確に定量化できるという特に格別の効果を有する。例えば、データは未知のゲインの影響を受ける場合、および/または全体的なまたはあまり理解されていないノイズ源がある場合がある。オリジナルのサンプル中における各分析物の濃度は1つ以上の化合物によるデータで表され得る。好ましくは、これらの化合物は、消化物/断片(以下、娘と称す)を含む。
各サンプルに対して、好ましくは、複製実験が行われる。すなわち、サンプルは多くのサブサンプルに分割され、各サブサンプルを別々に分析してもよい。複数の複製サンプルに対して好ましい手順を行うことは、好ましい実施形態の定量化ステップの正確度を向上するのに役立つことが分かる。しかし、サンプルが複数の複製サンプルに分割され、各複製サンプルが独立に分析されることは本質な特徴ではない。
各複製実験において異なる(および未知の)量のサンプルを用いて、複製実験間でデータに著しい変化をつけることが考えられる。
各ペプチドの同一性が問題となることがあるが、好ましい実施形態によると、確率pij=Pr(タンパク質が、ペプチドiに関連付けられた分析物jが与える値である)が得られうるか、またはある一様な値に設定されるかのいずれかである。この情報は、例えば、タンデム質量分析(MSMS)によるペプチドの断片の分析から得られる。ここで、ペプチド断片消化物は衝突または断片化セルにおいて断片化され、その結果の断片、娘または生成物が質量分析される。
低濃度以外の理由によって、いくらかのペプチドはすべての実験において完全にカバーできるとは限らない。そのような理由は実際に検討する事項であるかもしれない。例えば、類似した質量電荷比を有する多くのペプチドが同様の時間で液体クロマトグラフから溶出し得るので、同定が困難となる。
好ましい実施形態は、関連する不確実性を有する条件のペア間の各分析物に対する濃度比、各比が1を超える確率、各比に対する完全な事後確率分布または他の所望の統計を含む結果が生成されることを可能にする。
好ましい方法は、質量スペクトルデータにおける各ペプチドの理想測定強度が対応する親タンパク質の濃度に比例すること、測定強度が少なくともポアソンノイズ(カウント統計)に本質的に影響を受けやすいこと、各サンプルに対する各実験において同じ濃度であると仮定できる少なくとも1つの測定ペプチドが存在すること(以下、これを「内部標準」と称す)を仮定する。
好ましい方法は、上記の問題および要件を考慮してデータのモデルを構築することによって決まる。
各ぺプチドに対する基礎データDU(ノイズおよびゲインの前)は以下によって与えられると仮定される。
Figure 0005009784
ここで、Lはサンプル中に存在するタンパク質の濃度、hはどれくらいのサンプル(サンプルのどの部分)が特定の複製実験において使用されたかを示し、kはペプチドが対応するタンパク質イオンからどれくらいの効率で生成されるか、かつまた質量分析計がペプチドイオンをどれくらいの効率で観測するかを示す係数である。
実際に観測されるデータD0は、ノイズレベルの全体的なスケーリングを考慮するために、ポアソンノイズおよび未知のゲインGの影響を受けやすいと仮定される。特定のペプチドイオンに対して、特定のひと組のモデルパラメータL、kおよびhを仮定したD0を観測する確率を以下に示す。
Figure 0005009784
ここで、下記式が成り立つ。
Figure 0005009784
式(3)は、予測された理論データが実際に実験で観測されたデータと一致する度合いをとらえる変形ポアソン分布である。
以下、式(2)の量は尤度と称す。上記式(2)および(3)を参照すると、ガンマ関数Γ(x)は一般に使用される特殊な関数であり、pは親分析物が正しく割当てられる確率であり、およびPr(D0|B)は不適当な親割当ての場合の特定データD0を観測する背景確率である。好ましい実施形態によると、以下の通りである。
Figure 0005009784
式(4)は、不適当な割当てに付されたデータがデータΛのスケール全体にほぼ一致するほとんど何であってもよいという事実を反映する。ある好ましい実施形態において、Λは最大基準サイズである。やや好ましい実施形態において、Λはすべてのデータの確率重み付け平均である。式(4)において詳細が記載されるように確率関数の結果がより大きく、すなわち、尤度の計算(式(2))において式(3)の結果よりもより有意である場合は、割当ては正しくないと考えられる。
問題の確率的定式化を完成させるために、パラメータL、h、kおよびGの各々についての事前確率分布を特定する必要がある。事前確率分布はPr(L)、Pr(h)などと表記される。事前確率分布は、データが調べられる前に何がパラメータについて知られている化を要約し、非現実的な値を調べないようにすることを確かにする。好ましい実施形態において、好ましくは、パラメータL、h、kおよびGについての事前確率分布のために指数形態が使用される。例えば、以下の通りである。
Figure 0005009784
式(5)におけるL0を選択するために種々の異なる規定が考えられる。好ましい実施形態によると、L0はΛに設定され、k0は1に設定され、h0は1に設定され、G0も1に設定される。
これらの定義されたパラメータを用いて、事前確率分布の特定の選択をL、hおよびkの任意の値に対して計算された尤度と関連付けて、同時確率分布を与えることができる。この同時確率分布を以下に示す。
Figure 0005009784
ここで、L、hおよびkは、上記式のLHS上のベクトルである。ベクトルLの次元は、サンプル数×分析物の数である。ベクトルhの次元は実験回数である。ベクトルkの次元は、娘(例えば、ペプチド)の数である。したがって、モデルパラメータ(ゲインを含み、内部標準を無視する)の総数は、(サンプル数×分析物の数)+(実験回数)+(娘数)+1に等しい。
したがって、式(6)示すように同時確率分布は高次元関数である。しかし、好ましくは、所定量が、一組のベクトルLの要素の比と対応する一組の不確実性であり、複数のサンプル中の単一タンパク質またはペプチドに関する。同時確率を最大にする単一ベクトルLを検索するのではなく、Lの要素の比に対する確率分布を得ることが好ましい。例えば、Pr(L2/L1,データ)である。このような確率分布は非対称であることが多く、関連する不確実性を表すことが難しい。このように、Lの要素の比の単調関数(例えば、Lの要素の比の自然対数)に対する確率分布を表すことが好ましい。これらの分布により、比率の推定を、関連する不確実性またはその他の所望の統計を用いて見積もることができる。
この探索を行うための適切な方法が当業者に知られている。例えば、この種の問題を解くための一般的なツールが存在し、例えば、一般に広く利用可能な推測エンジンBayeSys(登録商標)などがある。
好ましくは、探索の速度を上げるために上記式(6)において詳細に記載したような完全な同時確率を近似してもよい。各ペプチドに対して、各実験からの同時確率(式(6))における積への寄与は(たかだか)1つある。これらの寄与はそれぞれ2つの項を有する。好ましくは、近似は、完全に拡張された同時確率において1タンパク質当たり4つの項だけを保持する。これらの4つの項は、(i)すべての実験において正しく割当てられたペプチド、(ii)最も確からしくない実験(pの値が最低)以外のすべての実験において正しく割当てられたペプチド、(iii)最も強い実験(pの値が最も高い)以外のすべての実験において正しく割当てられなかったペプチドおよび(iv)すべての実験において正しく割当てられなかったペプチドに対応する。
しかし、実際には、マルコフ連鎖モンテカルロアルゴリズムおよびシミュレーテッドアニーリングの適用などの効果的な手法を使用しても、多くの分析物が関与する場合はこれらの問題の解決はやはり非常に遅くなり得る。
好ましい実施形態は、周辺化として知られる手順において、好ましくは、ベクトルkのすべての成分を除くことによって事後確率分布(式(6))の次元を分析的に低減する、すなわち、探索すべきパラメータを1つ少なくし、計算パワーを節約することによってより効率的に探索を行うことが可能になる。これが可能であるのは、ベクトルkの大きさを記録する必要がないからである。
周辺化は、同時確率関数(式(6))の両辺が1つのベクトルに対して積分されるような処理である。ある好ましい実施形態において、周辺化はkに対して同時確率関数を積分することによって行われる。やや好ましい実施形態において、周辺化はhに対して同時確率関数を積分することによって行われてもよい。
やや好ましい実施形態において、kおよびhの両方が同時確率関数から除かれるようにさらに積分を行ってもよい。しかし、そのような方法の第2の積分は、第1の積分値が真の関数でないことがあるので、困難なことが多い(不可能な場合もある)。
本発明の種々の実施形態を、ほんの一例として、添付の図面を参照して以下に説明する。
図1は、いくつかの分析物に対する測定が得られない場合のノイズのあるシュミレーションデータを示す。
図2は、サンプル量と分析物の発現量との間の実際の関係および好ましい実施形態にしたがって決定されるような関係を示す。
以下に、本発明の好ましい実施形態を説明する。図1は、乱数生成器を使用して生成された数を用いてシミュレーションしたデータを示す。4つのサンプルを検討した。各サンプルについて同じ実験を2回繰り返した。したがって、合計8回の実験を行った。サンプル量h1〜h8の間および分析物の発現量L1〜L4の間の実際の関係、基礎の関係または真の関係または比率を図2に示す。また、図2は、好ましい実施形態にしたがって図1に示すようにノイズのある不完全なデータから再構成される実験的に決定された関係または比率を示す。
図1から明らかなように、6番目の実験において、いかなるデータも内部標準または不変イオンに対して存在するか、または得られるものとしてモデル化されていない。しかし、図2から分かるように、比率h6/h1は、好ましい実施形態の方法によるこの実験において内部標準がないにもかかわらずうまく回復されている。
なお、サンプル比率はすべてうまく回復され、図2で示すところでは、報告された不確実さの範囲内で一貫している。これは従来技術では可能でない。
好ましい実施形態のさらなる変形が多く考えられる。一変形によると、上記式(3)において与えられるポアソン分布は、ポアソン分布のガウス近似によって置き換えてもよい。
別の実施形態によると、上記式(4)に表すように指数事前確率分布関数は、パラメータG、L、hまたはkのいずれかについてのガンマ分布によって置き換えてもよい。例えば、一実施形態によると、下記式(7)である。
Figure 0005009784
さらなる実施形態によると、上記式(3)に示すように指数事前確率分布関数を、パラメータG、L、hまたはkのいずれかについての正規分布によって置き換えてもよい。例えば、下記式(8)である。
Figure 0005009784
別の実施形態によると、上記式(3)に示すように指数事前確率分布関数を、パラメータG、L、hまたはkのいずれかについての対数正規分布によって置き換えてもよい。例えば、以下の通りである。
Figure 0005009784
一実施形態によると、上記式(3)における値L0は平均データサイズに設定される。
1つの次元をモデルから削除することが考えられる。そのような実施形態によると、尤度を変更せずにLは定数と乗算され、kは同じ定数で割り算され得る(式(2))。以下のような拘束条件が付加され得、hへの依存性が双曲線座標において計算し直される。
Figure 0005009784
これは、確率分布を周辺化へと単純化する別の方法を説明する。周辺化の場合、式から出る値を積分するのではなく、代わりに可能な値を制限し、アルゴリズムが探索する「空間」を減らし得る。「空間」の概念を理解するために、h1軸に対するh2軸のグラフが考えられ得る。hの値に制限がないとすれば、アルゴリズムはh1および同様にh2に対してすべての正の値−ゼロから無限大−(すなわち、グラフの正の全領域)を探索しなければいけない。h12の積をh12=1と宣言することによって、アルゴリズムが探索する必要のある空間がこのグラフ上の単一の双曲線に制限される(h2=1/h1、y=1/x)。これにより、hの値にはある程度の自由度が残されるので、単にh1=1とするよりはより良い近似となる。このように制限できるのは、それに応じてkの値が変更されても尤度は同じままだからである。
別の実施形態によると、周辺化はkの代わりにhに対して積分することによって行われてもよい。
上記のように、好ましい実施形態によるとLおよびDataの値だけが特に注目されるので、同時確率分布(上記式(6)を参照)におけるすべての他の値(すなわち、G、h、k)は、攪乱母数、すなわち、計算のために必要であるが結果には不必要なパラメータであると考えることができる。これらの値の1つは、この値について両辺を積分することによって同時確率関数から除くことができる。例えば、kを除くために、以下のようにkについて積分する必要がある。
Figure 0005009784
このようにアルゴリズムが探索すべきパラメータが1つ少なくなるので、計算時間が節約される。このような積分結果は関数でない可能性があるので、さらなる積分はできない可能性がある。通常、Gについて上記関数を積分することはできないが、プログラムは通常hまたはkについて積分する。
一実施形態によると、分析物は、一度に全データをモデル化するのではなく、内部標準に従って一度にひとつだけ処理され得る。
一実施形態によると、好ましい実施形態は2点で問題を対処してもよい。まず、hが推測され、次いでhの推測が与えられた状態でLが推測されてもよい。
一実施形態によると、娘(例えば、ペプチド)がなくてもよい。すなわち、分析物について直接定量化できてもよいし、上記の割当てができず、各娘を独立の分析物として処理できなくてもよい。
上記式(6)に示す同時確率分布に対して異なる近似を行ってもよいというさらなる実施形態が考えられる。例えば、6項または8項まで維持されてもよいし、または全項が保持されてもよい。また、同時確率分布を周辺化せずに探索することも考えられる。
以上、本発明の好ましい実施形態を参照して説明してきたが、特許請求の範囲に記載の本発明の範囲を逸脱することなく形態および詳細において種々の変更が可能であることが当業者に理解されるであろう。
図1は、いくつかの分析物に対する測定が得られない場合のノイズのあるシュミレーションデータを示す。 図2は、サンプル量と分析物の発現量との間の実際の関係および好ましい実施形態にしたがって決定されるような関係を示す。

Claims (22)

  1. 成分、分子または分析物の第1の混合物を含む第1のサンプルを準備すること、
    前記第1のサンプル中の成分、分子または分析物を質量分析して複数の質量ピークを含む質量スペクトルデータを生成すること、
    成分、分子または分析物の第2の混合物を含む第2の異なるサンプルを準備すること、
    前記第2のサンプル中の成分、分子または分析物を質量分析して複数の質量ピークを含む質量スペクトルデータを生成すること、
    前記第2のサンプル中の成分、分子または分析物の強度、濃度または発現レベルに対する前記第1のサンプル中の成分、分子または分析物の相対的な強度、濃度または発現レベルを確率的に決定することを含み、
    前記確率的に決定することは、
    各サンプル中に存在する成分、分子または分析物の相対量または濃度Lについての事前確率分布関数Pr(L)を割当てること、
    確率分布関数Pr(L)を与える各質量ピーク強度が観測され得ることを予測すること、
    予測される質量ピーク強度と観測される質量ピーク強度とを比較すること、
    前記確率分布関数Pr(L)を調整すること、
    前記調整された確率分布関数Pr(L)を与える各質量ピーク強度が観測され得ることを予測すること、及び
    前記調整された確率分布関数を受け入れるか、または却下することを含む、
    質量分析方法。
  2. 前記成分、分子または分析物の第1の混合物を消化すること、および/または、
    前記成分、分子または分析物の第2の混合物を消化すること、をさらに含む請求項1に記載の方法。
  3. 前記第1のサンプルを1つ以上の第1の複製サンプルに分割すること、および/または、
    前記第2のサンプルを1つ以上の第2の複製サンプルに分割すること、をさらに含む請求項1または2に記載の方法。
  4. 前記第1のサンプル中の成分、分析物または分子を分離処理手段によって分離すること、および/または、
    前記第2のサンプル中の成分、分析物または分子を分離処理手段によって分離すること、をさらに含む請求項1から3のいずれかに記載の方法。
  5. 前記分離処理手段が、液体クロマトグラフィを含む請求項4に記載の方法。
  6. 前記第1のサンプルおよび/または前記第2のサンプルからの質量ピークをクラスタリングすることをさらに含む請求項1から5のいずれかに記載の方法。
  7. 断片、またはプロダクトイオンに基づいて前記第1のサンプル中の成分、分子または分析物を同定または認識すること、および/または、
    断片、またはプロダクトイオンに基づいて前記第2のサンプル中の成分、分子または分析物を同定または認識すること、をさらに含む請求項6に記載の方法。
  8. 前記確率的に決定することは、前記サンプル中の各成分、分子または分析物の全応答ファクタkについての事前確率分布関数Pr(k)を割当てることをさらに含み、kは消化効率を含む、請求項1から7のいずれかに記載の方法。
  9. 前記確率的に決定することは、前記サンプル中の各成分、分子または分析物の全応答ファクタkについての事前確率分布関数Pr(k)を割当てることをさらに含む請求項1から7のいずれかに記載の方法。
  10. kが、(i)イオン化効率、(ii)伝播効率および(iii)検出効率の1つ以上を含む請求項9に記載の方法。
  11. 前記確率的に決定することは、分析において使用される各サンプル中のサンプルhについての各成分、分子または分析物の相対量についての事前確率分布関数Pr(h)を割当てることをさらに含む請求項1から10のいずれかに記載の方法。
  12. 前記確率的に決定することは、観測される信号強度に対して仮定される、および/または、予測される信号強度に適用されるノイズ寄与ファクタGについての事前確率分布関数Pr(G)を割当てることをさらに含む請求項1から11のいずれかに記載の方法。
  13. 1つ以上の内部標準または基準を検索、決定、同定または選択することをさらに含む請求項1から12のいずれかに記載の方法。
  14. 確率分布関数Pr(k)を与える各質量ピーク強度が観測され得ることを予測することをさらに含む請求項8、9又は10に記載の方法。
  15. 前記kの値または前記確率分布関数Pr(k)を調整することをさらに含む請求項14に記載の方法。
  16. 前記調整された確率分布関数Pr(k)を与える各質量ピーク強度が観測され得ることを予測することをさらに含む請求項15に記載の方法。
  17. 前記調整された確率分布関数を受け入れるかまたは却下することをさらに含む請求項16に記載の方法。
  18. 前記第1のサンプルおよび/または前記第2のサンプルが、複数の異なるバイオポリマー、タンパク質、タンパク質消化物、ペプチド、ペプチドの断片、ポリペプチド、オリゴヌクレオチド、オリゴヌクレオシド、アミノ酸、炭水化物、糖、脂質、脂肪酸、ビタミン、ホルモン、DNAの部分若しくは断片、cDNAの部分若しくは断片、RNAの部分若しくは断片、mRNAの部分若しくは断片、tRNAの部分若しくは断片、ポリクローナル抗体、モノクローナル抗体、リボヌクレアーゼ、酵素、代謝産物、多糖類、リン酸化ペプチド、リン酸化タンパク質、糖ぺプチド、糖タンパク質またはステロイドを含む請求項1から17のいずれかに記載の方法。
  19. (i)前記第1のサンプルが罹患生体から採取され、かつ、前記第2のサンプルが非罹患生体から採取される、(ii)前記第1のサンプルが処置生体から採取され、かつ、前記第2のサンプルが非処置生体から採取される、または(iii)前記第1のサンプルが変異型生体から採取され、かつ、前記第2のサンプルが野生型生体から採取される、のいずれかである請求項1から18のいずれかに記載の方法。
  20. 前記第1のサンプルおよび/または前記第2のサンプル中の成分、分子または分析物を同定することをさらに含む請求項1から19のいずれかに記載の方法。
  21. 前記第1のサンプルおよび/または前記第2のサンプル中の前記成分、分子または分析物が、前記第1のサンプル中の前記成分、分子または分析物の強度が前記第2のサンプル中の前記成分、分子または分析物の強度との違いが所定量より大きくなる場合にのみ同定される請求項1から20のいずれかに記載の方法。
  22. 前記第1のサンプルおよび/または前記第2のサンプル中の前記成分、分子または分析物が、前記第1のサンプル中の複数の異なる成分、分子または分析物の平均強度が前記第2のサンプル中の複数の異なる成分、分子または分析物の平均強度との違いが所定量より大きくなる場合にのみ同定される請求項1から21のいずれかに記載の方法。
JP2007510124A 2004-04-30 2005-05-03 質量分析計 Expired - Fee Related JP5009784B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB0409677A GB0409677D0 (en) 2004-04-30 2004-04-30 Mass spectrometer
GB0409677.2 2004-04-30
GB0411248A GB0411248D0 (en) 2004-04-30 2004-05-20 Mass spectrometer
GB0411248.8 2004-05-20
PCT/GB2005/001679 WO2005106453A2 (en) 2004-04-30 2005-05-03 Mass spectrometer

Publications (2)

Publication Number Publication Date
JP2007535673A JP2007535673A (ja) 2007-12-06
JP5009784B2 true JP5009784B2 (ja) 2012-08-22

Family

ID=34680447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007510124A Expired - Fee Related JP5009784B2 (ja) 2004-04-30 2005-05-03 質量分析計

Country Status (6)

Country Link
US (1) US8012764B2 (ja)
EP (1) EP1745500B1 (ja)
JP (1) JP5009784B2 (ja)
CA (1) CA2564279C (ja)
GB (1) GB2413695B (ja)
WO (1) WO2005106453A2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0409676D0 (en) * 2004-04-30 2004-06-02 Micromass Ltd Mass spectrometer
GB0514553D0 (en) 2005-07-15 2005-08-24 Nonlinear Dynamics Ltd A method of analysing a representation of a separation pattern
GB0514555D0 (en) 2005-07-15 2005-08-24 Nonlinear Dynamics Ltd A method of analysing separation patterns
US8095345B2 (en) * 2009-01-20 2012-01-10 Chevron U.S.A. Inc Stochastic inversion of geophysical data for estimating earth model parameters
EP2558979B1 (en) 2010-04-15 2021-01-13 Micromass UK Limited Method and system of identifying a sample by analyising a mass spectrum by the use of a bayesian inference technique
CA2819181C (en) * 2010-11-29 2020-03-10 Dako Denmark A/S Methods and systems for analyzing images of specimens processed by a programmable quantitative assay
GB201100302D0 (en) * 2011-01-10 2011-02-23 Micromass Ltd A method of correction of data impaired by hardware limitions in mass spectrometry
GB201205720D0 (en) 2012-03-30 2012-05-16 Micromass Ltd A method for the investigation of differences in analytical data and an apparatus adapted to perform such a method
EP3268746A1 (en) 2015-03-12 2018-01-17 Mars, Incorporated Ultra high resolution mass spectrometry and methods of using the same
WO2017114943A1 (en) * 2015-12-30 2017-07-06 Vito Nv Methods for mass spectrometry-based structure determination of biomacromolecules
US11182688B2 (en) * 2019-01-30 2021-11-23 International Business Machines Corporation Producing a formulation based on prior distributions of a number of ingredients used in the formulation
US20210215651A1 (en) * 2020-01-15 2021-07-15 Chevron U.S.A. Inc. Estimating unknown proportions of a plurality of end-members in an unknown mixture

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5087815A (en) * 1989-11-08 1992-02-11 Schultz J Albert High resolution mass spectrometry of recoiled ions for isotopic and trace elemental analysis
JP3509267B2 (ja) * 1995-04-03 2004-03-22 株式会社日立製作所 イオントラップ質量分析方法および装置
US5545894A (en) * 1995-05-04 1996-08-13 The Regents Of The University Of California Compact hydrogen/helium isotope mass spectrometer
GB2308917B (en) * 1996-01-05 2000-04-12 Maxent Solutions Ltd Reducing interferences in elemental mass spectrometers
CA2303761C (en) * 1999-04-06 2005-12-20 Micromass Limited A method of determining peptide sequences by mass spectrometry
US6391649B1 (en) 1999-05-04 2002-05-21 The Rockefeller University Method for the comparative quantitative analysis of proteins and other biological material by isotopic labeling and mass spectroscopy
US6489609B1 (en) * 1999-05-21 2002-12-03 Hitachi, Ltd. Ion trap mass spectrometry and apparatus
US6446010B1 (en) * 1999-06-15 2002-09-03 The Rockefeller University Method for assessing significance of protein identification
US6393367B1 (en) * 2000-02-19 2002-05-21 Proteometrics, Llc Method for evaluating the quality of comparisons between experimental and theoretical mass data
NL1016034C2 (nl) 2000-08-03 2002-02-08 Tno Werkwijze en systeem voor het identificeren en kwantificeren van chemische componenten van een te onderzoeken mengsel van materialen.
JP3975663B2 (ja) * 2000-09-05 2007-09-12 株式会社日立製作所 遺伝子多型解析方法
US20030077616A1 (en) 2001-04-19 2003-04-24 Ciphergen Biosystems, Inc. Biomolecule characterization using mass spectrometry and affinity tags
US7045296B2 (en) 2001-05-08 2006-05-16 Applera Corporation Process for analyzing protein samples
US6835927B2 (en) 2001-10-15 2004-12-28 Surromed, Inc. Mass spectrometric quantification of chemical mixture components
GB2394545B (en) * 2001-12-08 2005-03-16 Micromass Ltd Method of mass spectrometry
EP1319954A1 (en) 2001-12-12 2003-06-18 Centre National de Genotypage Methods for protein analysis using protein capture arrays
US6556651B1 (en) * 2002-01-25 2003-04-29 Photoelectron Corporation Array of miniature radiation sources
AU2003233330A1 (en) 2002-05-15 2003-12-02 Proteosys Ag Method for quantifying molecules
GB0305796D0 (en) 2002-07-24 2003-04-16 Micromass Ltd Method of mass spectrometry and a mass spectrometer
CA2495378C (en) * 2002-08-22 2011-03-01 Applera Corporation Method for characterizing biomolecules utilizing a result driven strategy
AU2003212580A1 (en) * 2003-03-25 2004-10-18 Institut Suisse De Bioinformatique Method for comparing proteomes
US7425700B2 (en) * 2003-05-22 2008-09-16 Stults John T Systems and methods for discovery and analysis of markers
US20050048499A1 (en) * 2003-08-29 2005-03-03 Perkin Elmer Life Sciences, Inc. Tandem mass spectrometry method for the genetic screening of inborn errors of metabolism in newborns
TW200535417A (en) * 2003-12-08 2005-11-01 Oxford Gene Tech Ip Ltd Mass spectrometry of arginine-containing peptides
JP4275545B2 (ja) * 2004-02-17 2009-06-10 株式会社日立ハイテクノロジーズ 質量分析装置

Also Published As

Publication number Publication date
EP1745500B1 (en) 2017-03-15
GB2413695B (en) 2009-01-21
WO2005106453A2 (en) 2005-11-10
CA2564279C (en) 2013-09-24
US8012764B2 (en) 2011-09-06
CA2564279A1 (en) 2005-11-10
EP1745500A2 (en) 2007-01-24
WO2005106453A3 (en) 2006-09-21
GB0508935D0 (en) 2005-06-08
JP2007535673A (ja) 2007-12-06
GB2413695A (en) 2005-11-02
US20080076186A1 (en) 2008-03-27

Similar Documents

Publication Publication Date Title
JP5009784B2 (ja) 質量分析計
US11646185B2 (en) System and method of data-dependent acquisition by mass spectrometry
EP1756852B1 (en) Method and apparatus for identifying proteins in mixtures
US8975577B2 (en) System and method for grouping precursor and fragment ions using selected ion chromatograms
US8841606B2 (en) Mass spectrometry
JP4848454B2 (ja) 質量分析計
JP4857000B2 (ja) 質量分析システム
JP4950029B2 (ja) 質量分析計
Zhong et al. Data‐Processing Workflow for Relative Quantification from Label‐Free and Isobaric Labeling‐Based Untargeted Shotgun Proteomics: From Database Search to Differential Expression Analysis
Jain Novel computational methods for mass spectrometry based protein identification
JP2021025946A (ja) 糖ペプチド解析装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110510

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110803

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110810

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110831

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110907

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110930

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120529

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120531

R150 Certificate of patent or registration of utility model

Ref document number: 5009784

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees