本明細書で使用するとき、以下の用語は概して指示される意味を指す。
「クロマトグラフィ」は、化合物の分離で使用される装置及び/又は方法を指す。クロマトグラフィ装置は、一般的に、流体及びサンプル検体を、圧力及び/又は電気力及び/又は磁力下で移動させる。「クロマトグラム」という語は、文脈に応じて、本明細書では、クロマトグラフィ手段によって得られるデータ又はデータ表現を指す。クロマトグラムは、2つ以上の値でそれぞれ構成される一連のデータ点を含むことができ、これらの値の1つは、スキャン時間又は対応するクロマトグラフィ保持時間であってもよく、残りの値は、一般的に強度又は大きさの値と関連付けられ、それらはサンプルの溶出成分の量又は濃度に対応する。本明細書の技術と関連して、サンプル検体は、1つ又は2つ以上の化合物、分子、又は対象の成分を含んでもよい。
サンプル検体は、組成物、混合物、溶液、物質、固体、組織、又はより一般的には、分析される任意の物質を指してもよい。本明細書の技術と関連して、サンプルは、1つ又は2つ以上の化合物、分子、又は対象の成分を含んでもよい。サンプル又は対象の成分は、一般に、例えば、有機化合物、代謝物、及び有機化合物などの小分子、並びにタンパク質又はペプチドなどの大分子を含む、任意の分子であってもよく、あるいはそれらを含んでもよい。
保持時間は、文脈においては、溶出成分がその最大強度に達する、クロマトグラフィプロファイルにおける時間を指す。
イオンは、文脈においては、質量分析計(MS)を使用して検出され、LC/MSシステムでの実験を行った結果として発生する、サンプル検体のイオン化分子である。そのため、イオンは、その保持時間、m/z(質量電荷比)、及び強度測定値によって特徴付けられる。
LE(衝突セルの低エネルギー状態)は、プリカーサーイオンデータを指し、獲得方法とは独立している。LEデータは、データ依存型及び独立型両方の獲得モードを利用して獲得することができる。
HE(衝突セルの高エネルギー状態)は、プロダクト/フラグメントイオンデータであり、獲得方法とは独立している。HEデータは、データ依存型及び独立型両方の獲得モードを利用して獲得することができる。高エネルギーモードはまた、上昇エネルギー(EE)モードと呼ばれることもある。
ドリフトは、文脈においては、ガス相におけるイオンモビリティーの測定値を指す。質量分析計内に蓄積した更なる実験セルが、ドリフト並びにm/zによって、ガス相イオンをそれらのモビリティーにしたがって分離して、イオン分離の更なる次元を提供する。イオンモビリティーは、ドリフト時間の適切な校正及び変換によって、衝突断面積(CCSA)として表現される、イオン化分子の構造上のサイズに関係する。この技術は、イオンモビリティースペクトロメトリー(IMS)と呼ばれる。
イオン指紋は、検証に使用される全ての実験データにわたる各プロダクトイオンの相対強度のばらつきにおける基準を含む、分子全体の検証されたプロダクトイオンスペクトルを指す。
本明細書の技術による一実施形態では、イオンの強度値は、その測定強度に対応するピークを表すその曲線下面積(AUC)に基づいてもよい。各強度値は、記録されたパルスのガウス分布によって形成されるものなど、曲線下面積として決定されてもよい。このように、本明細書に記載されるような様々な強度比は、面積比として特徴付けられてもよい。
一般に、LC/MSシステムが、サンプル分析を行うのに使用されてもよく、例えば、タンパク質又はペプチド、並びに医薬品又は除草剤などの小分子を、その質量、電荷、保持(溶出)時間、及び強度の観点で経験的に説明してもよい。分子がクロマトグラフィカラムから溶出すると、その強度プロファイル又はピーク形状が特定の時限にわたって出現し、その保持時間にその最大又はピーク信号に達する。質量分析と関連するものなどのイオン化及び(場合によっては)フラグメンテーションの後、化合物が関連するイオンのセットとして出現する。
LC/MS分離では、イオン化分子は、単一又は複数の帯電状態で存在してもよい。MS/MSはまた、LC分離と組み合わせて行うことができるタンデム型質量分析と呼ばれることもある(例えば、LC/MS/MSと表される)。
次に、技術及び実施形態について、LC/MS実験を行うことによってサンプルを分析するシステムにおけるサンプル分析向けなどであってもよい、サンプルを分析する例示的な方法及び装置を参照して記載する。本明細書に記載される技術は、他の実施形態と関連して使用されてもよく、例証及び例示の目的で本明細書に提供され列挙され得るようなものよりも広範な用途を有してもよいことが認識されるであろう。
図1は、本明細書の技術にしたがって使用されてもよいシステムの概略図である。サンプル102は、インジェクタ106を通して、液体クロマトグラフィシステム104の流体流に注入される。ポンプ108は、移動相溶媒をインジェクタに供給し、カラム110を通してサンプルを給送して、サンプル検体混合物を、カラムから出てそれらの保持時間によって観察される溶出成分へと分離する。
カラムからの出力は、質量分析計112に導入されて分析される。一実施形態で使用される質量分析計112に含まれる特定の構成要素は、利用される質量分析計の特定のタイプに伴って変わってもよいことが注目されるべきである。要素112の説明に続いて、いくつかの構成要素が質量分析計112に含まれてもよいが、それらは単純にするために図1には示されない。最初に、サンプルが、質量分析計の脱溶媒和/イオン化デバイスによって脱溶媒和されイオン化される。脱溶媒和は、例えば、ヒータ、ガス、ガスと組み合わせたヒータ、又は他の脱溶媒和技術を含む、任意の技術であることができる。イオン化は、例えば、電気スプレー電離(ESI)、大気圧化学電離(APCI)、マトリックス支援レーザー脱離(MALDI)、又は他のイオン化技術を含む、任意のイオン化技術によるものであることができる。イオン化によって得られるイオンは、イオンガイドに適用される電圧勾配を伴って、質量分析計の衝突セルに供給される。衝突セルは、(低エネルギーモードで)プリカーサーイオンを通すのに、又は(高エネルギーモードで)プリカーサーイオンをフラグメンテーションするのに使用することができる。
本明細書の他の箇所で更に詳細に記載されるように、参照により本明細書に組み込まれるBatemanらへの米国特許第6,717,130号(「Bateman」)に記載されているものを含む、交流電圧を衝突セルに印加してフラグメンテーションを行うことができる、異なる技術が使用されてもよい。スペクトルは、低エネルギーではプリカーサー(衝突なし)に、高エネルギーではフラグメント(衝突の結果)に集中する。
分離技術としては、m/z、m/zと強度、m/zと強度とイオンモビリティードリフトなどの基準によって、又はm/z、m/zと強度、m/zと強度とドリフトのいずれかを含む、標的化合物のリストを包含若しくは除外することによって、プリカーサーイオンが選択される、質量選択ウィンドウの連続適用が挙げられる。ここでは、m/z値が選択され、第1の質量分析部、一般的には四重極が質量分離ウィンドウに設定され、質量分離ウィンドウ内にあるプリカーサーイオンのみが衝突セルへと移送されてフラグメンテーションが起こる。スペクトルは、選択されたプリカーサー(衝突なし)及びそれらのフラグメント(衝突の結果)に集中する。
質量分析計112では、衝突セルの出力は質量分析部に向けられる。質量分析部は、四重極、飛行時間(TOF)、イオントラップ、磁気セクター質量分析部、並びにそれらの組み合わせを含む、任意の質量分析部であることができる。質量分析計の検出器は、質量分析部から発するイオンを検出する。検出器は質量分析部と一体であることができる。例えば、TOF質量分析部の場合、検出器は、イオンの強度を計数する、即ち衝突するイオンの数を計数する、マイクロチャネルプレート検出器であることができる。
記憶媒体124は、分析用にイオン検出(m/z、保持時間、モビリティードリフト、強度計数など)を記憶する、恒久的記憶装置を提供してもよい。例えば、記憶媒体124は、ディスク、フラッシュベースの記憶装置など、内部又は外部コンピュータデータ記憶デバイスであることができる。分析用コンピュータ126は記憶データを分析する。データはまた、記憶媒体124に記憶する必要なしに、リアルタイムで分析することができる。リアルタイム分析では、質量分析計の検出器は、分析されるデータを最初に恒久的記憶装置に記憶することなく、コンピュータ126に直接渡す。
質量分析計112の衝突セルは、プリカーサーイオンのフラグメンテーションを行う。フラグメンテーションは、ペプチドの一次配列を決定するのに使用し、続いて元のタンパク質の識別情報をもたらすことができる。衝突セルは、ヘリウム、アルゴン、窒素、空気、又はメタンなどのガスを含む。帯電プリカーサーがガス原子と相互作用すると、結果として得られる衝突により、プリカーサーが壊れてフラグメントイオン又はプロダクトイオンになることによって、プリカーサーをフラグメンテーションすることができる。かかるフラグメンテーションは、ペプチドプリカーサーのMSスペクトルが得られる低電圧状態(例えば、低エネルギー、<5V)と、衝突によって誘発されるプリカーサーのフラグメントのMSスペクトルが得られる高電圧状態(例えば、高エネルギー若しくは上昇エネルギー、>15V)との間で衝突セルの電圧を切り替えることによって、Batemanに記載されている技術を使用して遂行することができる。高電圧及び低電圧は、それぞれイオンに運動エネルギーを付与するのに使用されるので、高エネルギー及び低エネルギーと呼ばれることがある。
かかるMS/MSの獲得に関して電圧をいつどのように切り替えるかを判断する、様々なプロトコルを使用することができる。例えば、従来の方法は、標的又はデータ依存モード(データ依存型の獲得、DDA)のどちらかで、電圧を生じさせる。これらの方法はまた、標的プリカーサーの結合されたガス相分離(又は事前選択)を含む。低エネルギースペクトルは、リアルタイムでソフトウェアによって取得され検査される。所望の質量が低エネルギースペクトルで指定の強度値に達すると、衝突セルの電圧は高エネルギー状態に切り替えられる。高エネルギースペクトルが、次に、事前選択されたプリカーサーイオンに対して得られる。これらのスペクトルは、低エネルギーで見られるプリカーサーペプチドのフラグメントを含む。十分な高エネルギースペクトルが収集された後、データ獲得は、高エネルギー衝突分析に適した強度の他のプリカーサー質量を継続して検索するのに、低エネルギーに復帰する。
分析されたサンプルの質量分析と関連して、プリカーサーイオン及びプロダクトイオンなどのイオン情報を取得するのに、本明細書に記載されるようなシステムと共に異なる適切な方法が使用されてもよいことが注目されるべきである。従来の切替え技術を用いることができるが、実施形態はまた、電圧が単純な交番サイクルで切り替えられるフラグメンテーションプロトコルとして特徴付けられてもよい、Batemanに記載されている技術も使用してもよい。この切替えは、十分な高頻度で行われるので、複数の高エネルギー及び低エネルギースペクトルが単一のクロマトグラフィピーク内で得られる。従来の切替えプロトコルとは異なり、サイクルはデータの内容(m/z)とは独立している。Batemanに記載されているかかる切替え技術は、プリカーサーイオン及びプロダクトイオン両方の質量分析を有効に同時に行う。Batemanでは、高エネルギー及び低エネルギー切替えプロトコルは、ペプチド混合物の単一注入におけるLC/MS分析の一部として適用されてもよい。単一の注入又は実験行程から獲得されるデータにおいて、低エネルギースペクトルは、主に未フラグメンテーションプリカーサーからのイオンを含み、高エネルギースペクトルは、主にフラグメンテーションプリカーサーからのイオン(例えば、プロダクトフラグメントイオン)を含む。例えば、プリカーサーイオンの一部分がフラグメンテーションされてプロダクトイオンを形成してもよく、同時間に、又は例えば、低電圧(例えば、主にプリカーサーを通す)と高電圧又は上昇電圧(例えば、主にプリカーサーフラグメントを発生させる)との間でMSモジュールの衝突セルに、高速切替え又は交流電圧を適用してフラグメンテーションを調整することによる高速遷移で、プリカーサーイオン及びプロダクトイオンが同時に分析される。高(又は上昇)エネルギーと低エネルギーとの間での交番の高速遷移による、Batemanの上記技術にしたがったMSの動作はまた、本明細書では、Bateman技術及び高−低プロトコルと呼ばれることがある。
概して、Bateman技術を使用してシステムを動作させるときなど、サンプル102はLC/MSシステムに注入される。LC/MSシステムは、低エネルギースペクトルのセットと高エネルギースペクトルのセットとの、2組のスペクトルを生成する。低エネルギースペクトルのセットは、主にプリカーサーと関連付けられるイオンを含む。高エネルギースペクトルのセットは、主にプリカーサーフラグメントと関連付けられるイオンを含む。これらのスペクトルは記憶媒体124に記憶される。データ獲得の後、これらのスペクトルを、記憶媒体から抽出し、分析用コンピュータ126のアルゴリズムによって、獲得後に表示し処理することができる。
高−低プロトコルによって獲得したデータによって、低エネルギー及び高エネルギー両方のモードで収集された全てのイオンの保持時間、質量電荷比、及び強度を正確に決定することが可能になる。一般に、異なるイオンが2つの異なるモードで見られ、そこで、各モードで獲得されるスペクトルが、別個に又は組み合わせて更に分析されてもよい。
一方又は両方のモードで見られるような共通のプリカーサーからのイオンは、本質的に、同じ保持時間を共有し(またしたがってほぼ同じスキャン時間を有し)、同じLCピーク形状を共有するようになる。高−低プロトコルによって、単一のモード内及びモード間におけるイオンの異なる特性の意味がある比較が可能になる。この比較は、次に、低エネルギー及び高エネルギー両方のスペクトルで見られるイオンをグループ化するのに使用することができる。低エネルギースペクトルのプリカーサーイオンを、プリカーサーイオンから発する高エネルギースペクトルのフラグメントイオンとグループ化するか又は関連付ける、様々な技術が本明細書に記載される。
図2は、本明細書の技術を用いる一実施形態による、低エネルギー及び高エネルギーモードを交互に適用することによって得られるピークの溶出中に、スペクトルが取得される時間を示している。図2は、溶出プリカーサーと関連付けられるクロマトグラフィプロファイルを、複数のスペクトルスキャンにわたって、その高エネルギー及び低エネルギー両方のスペクトルデータから再構築できることを示している。
ピーク202は、単一のプリカーサーのLC溶出ピークプロファイルを表している。水平軸は時間であり、例えば、サンプル溶出中のMSスキャン時間又は対応する保持時間などである。垂直軸は、プリカーサーがクロマトグラフィカラムから溶出する際の、クロマトグラフィプロファイルの時間で変動する濃度の任意表現である。
したがって、LCピーク202の第1のグラフは、低エネルギースペクトル(即ち、未フラグメンテーションプリカーサーからのスペクトル、「MS」と表示)及び上昇エネルギースペクトル(即ち、フラグメンテーションプリカーサー、つまりプロダクトイオンからのスペクトル、「MSE」と表示)の、時間に伴う交互の収集を示している。第2及び第3のグラフ204a及び204bはそれぞれ、MS及びMSEスペクトル収集スキャンと、Bateman技術を使用して生成されてもよいような、プリカーサーと関連付けられるピーク202の再構築とを示している。図2のプロット204a(低エネルギー)及び204b(高エネルギー)は、水平軸が時間を表し、垂直軸がイオンの強度を表す、同じクロマトグラフィピーク202を示している。
質量分析計の質量分解能が高く、本質的に発生する同位体の存在が遍在的であることにより、質量分析計に入る分子は、グループ化して一連の同位体質量ピークとなり、本明細書ではそれを同位体クラスタと呼ぶ。これらのピークの存在及びその異なる強度は、特定の分子の基本的組成の特徴である。したがって、質量分析計によってイオン化された分子は、一連の同位体電荷クラスタを生成し、それにより、分子を表す固有の同位体クラスタは電荷状態の分布を呈する。したがって、特定の同位体分布及び電荷状態zを有するイオン化分子は、質量スペクトルにおいて、その電荷状態の逆数(l/z)によってそれぞれ分離された一連のm/zピークとして観察される。また、イオン化分子の電荷分布に応じて、各同位体クラスタが特定のm/z空間で観察され、電荷が大きいほどm/zが小さく、またピーク間隔が小さい。
低エネルギーモードで生成されるイオンは主にプリカーサーイオンのものなので、それらの質量スペクトルは(前述したように)同位体電荷クラスタとして現れる。高エネルギーモードでは、イオンは主にプリカーサーのプロダクトフラグメントイオンである。そのため、フラグメントイオンの同位体電荷クラスタ分布は、プリカーサーの結果として得られるフラグメント質量及び低減された電荷状態に応じて決まる。
ピーク202のプロットでは、異なる密度の交互の棒は、図示されるLCピークの溶出中に低エネルギー及び高エネルギー電圧を用いてスペクトルが収集された時間を表す。棒は均一な時間で交番する。プロット204aは、低エネルギー電圧が衝突セルで印加されて、低エネルギースペクトルをもたらした時間を例示的に示している。プロット204bは、高エネルギー電圧が衝突セルで印加されて、高エネルギースペクトルをもたらした時間を示している。204a及び204bに示されるように、クロマトグラフィピークは、高エネルギー及び低エネルギーモードによって複数回サンプリングされる。このように、サンプルは、低エネルギー及び上昇エネルギー両方のモードで同位体電荷クラスタを生成する。
したがって、単一の実験行程又はサンプル注入に対して、Batemanに記載されているような高−低プロトコルを使用してMS機器を動作させたとき、分析によって、主にプリカーサーイオンデータを含む、204aによって表される低エネルギー質量スペクトルデータの第1のセットと、主にフラグメントイオンデータを含む、204bによって表される高エネルギー又は上昇エネルギー質量スペクトルデータの第2のセットとが取得されてもよい。
更に詳細に後述されるように、質量スペクトル分析の結果として生成されるかかるデータは、一般に、スキャン時間又は獲得時間を含む。
いくつかの実施形態では、図1のシステムは、分離の更なる次元としてイオンモビリティースペクトロメトリー(IMS)を更に行うため、質量分析部の構成要素(又は別個の構成要素若しくは機器として)を更に含んでもよい。かかる実施形態では、質量スペクトルデータの更なる処理は、結果として得られる第1の形態の質量スペクトルデータスキャン時間を、対応する保持時間に、また対応するイオンモビリティードリフト時間に変換してもよい。本明細書の他の箇所で更に詳細に記載されるように、本明細書の技術は、スキャン時間を用いた第1の形態の質量スペクトル分析データに対する処理を行ってもよい。
図1に戻ると、動作の際、サンプル102は、インジェクタ106を介してLC 104に注入される。ポンプ108は、カラム110を通してサンプルを給送し、サンプルは、カラム110から出る保持時間によって特徴付けられる溶出構成要素内へと分離される。インジェクタ106を通してポンプ108によって提供される高圧の溶媒流によって、サンプル102が、液体クロマトグラフィシステム104のクロマトグラフィカラム110を通して移行させられる。カラム110は、一般的に、表面が結合分子を含む、シリカビーズのパッキングを備える。カラム110からの出力流体流は、分析のためにMS 112に方向付けられる。一実施形態では、LC 104は、マサチューセッツ州ミルフォード(Milford,Massachusetts)のWaters CorporationによるACQUITY UPLC(登録商標)システムなど、超高性能液体クロマトグラフィ(UPLC)システムであってもよい。
MS 112の質量分析部は、例えば、四重極飛行時間(Q−TOF)質量分析部を含む、様々な構成において縦列で配置することができる。縦列構成によって、既に質量分析された分子のオンラインでの衝突修正及び分析が可能になる。例えば、三連四重極型質量分析部(Q1−Q2−Q3又はQ1−Q2−TOF質量分析部など)では、第2の四重極(Q2)が、第1の四重極(Q1)によって分離されたイオンに加速電圧を付与する。これらのイオンは、Q2に明確に導入されるガスと衝突する。イオンはこれらの衝突の結果としてフラグメンテーションする。これらのフラグメントは、第3の四重極(Q3)によって、又はTOFによって更に分析される。一実施形態では、MS 112は、例えば、マサチューセッツ州ミルフォード(Milford,Massachusetts)のWaters CorporationによるSYNAPT G2(商標)Mass Spectrometerなどの、QTOF質量分析計であってもよい。
出力として、MS 112は、時間に伴って収集される一連のスペクトル又はスキャンを発生させる。質量電荷スペクトルは、m/zの関数としてプロットされる強度である。要素ごとに、スペクトルの単一の質量電荷比はチャネルと呼ばれることがある。時間に伴って単一の質量チャネルを検査することによって、対応する質量電荷比に対するクロマトグラムが得られる。獲得された質量電荷スペクトル又はスキャンは、コンピュータ126にアクセス可能である、要素124によって表されるハードディスクドライブ又は他の記憶媒体などの、記憶媒体に記録することができる。一般的に、スペクトル又はクロマトグラムは、値の配列として記録され、記憶装置124に記憶される。124に記憶されたスペクトルは、分析などに続いて、表示などのために、コンピュータ126を使用してアクセスされてもよい。制御手段(図示なし)は、MS 112など、システム100の構成要素に対して必要な動作電位をそれぞれ提供する、様々な電力源(図示なし)に対する制御信号を提供する。これらの制御信号は機器の動作パラメータを決定する。制御手段は、一般的に、コンピュータ126など、コンピュータ又はプロセッサからの信号によって制御される。
分子がカラム106から溶出すると、MS 112に搬送することができる。保持時間は特性的な時間である。つまり、保持時間tにカラムから溶出する分子は、実際には、時間tを本質的に中心とする時限にわたって溶出する。時限にわたる溶出プロファイルは、クロマトグラフィピーク又はLCピークと呼ばれる。クロマトグラフィピークの溶出プロファイルは、一般的に、鐘形又はガウス曲線によって特徴付けられる。ピークの鐘形は、一般的に、その半値幅(FWHM)によって説明される幅を有する。分子の保持時間は、ピークの溶出プロファイルの頂点の時間である。質量分析計によって生成されたスペクトルに現れるスペクトルピークは、同様の形状を有し、同様の形で特徴付けることができる。
記憶装置124は、任意の1つ又は2つ以上のタイプのコンピュータ記憶媒体及び/又はデバイスであってもよい。当業者には認識されるように、記憶装置124は、コンピュータ可読命令、データ構造、プログラムモジュール、又は他のデータなどの情報を記憶するのに、任意の方法又は技術で実装される、揮発性及び不揮発性、取外し可能及び取外し不能の媒体を含む、様々な異なる形態のうち任意の1つを有する、任意のタイプのコンピュータ可読媒体であってもよい。コンピュータ記憶媒体としては、RAM、ROM、EEPROM、フラッシュメモリ若しくは他のメモリ技術、CD−ROM、(DVD)、又は他の光記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置若しくは他の磁気記憶デバイス、あるいはコンピュータプロセッサ、又はより一般的にはコンピュータ若しくは他の構成要素の任意のプロセッサによってアクセスすることができる、所望のコード、データなどを記憶するのに使用することができる他の任意の媒体が挙げられるが、それらに限定されない。
コンピュータ126は、任意の市販の若しくは専有のコンピュータシステム、プロセッサボード、ASIC(特定用途向け集積回路)、又はコンピュータ可読媒体に記憶されたコードを実行するように構成されたコンピュータプロセッサを含む他の構成要素であってもよい。プロセッサは、コードを実行する際、コンピュータシステム126に、記憶装置124に記憶されたデータにアクセスしてそれを分析するなど、処理ステップを行わせてもよい。コンピュータシステム、プロセッサボードなどは、より一般的には、コンピューティングデバイスと呼ばれることがある。コンピューティングデバイスはまた、コンピュータプロセッサに処理ステップを行わせる実行可能コードが記憶されている、124によって表されるものなどのコンピュータ可読媒体を含むか、あるいは別の方法でそれにアクセスするように構成されてもよい。
システム100は、LC/MS実験を行ってサンプルを分析し、サンプル中の少なくとも1つの化合物又は分子のプリカーサーイオン及びプロダクト又はフラグメントイオンに対する質量スペクトルを発生させるのに使用されてもよい。発生した質量スペクトルは、異なる用途に対する様々な技術のいずれかと関連して使用するため、更に分析及び/又は処理されてもよい。本明細書の技術と関連して、質量スペクトルデータは、関連付けられたプロダクトイオンを有するプリカーサー分子を同定し定量化するために分析されてもよい。
システム100を使用する任意の好適な方法は、サンプル注入からプリカーサーイオン及びプロダクトイオンの両方を取得するのに使用されてもよい。Batemanに記載されているような高−低プロトコルにしたがってMS機器を動作させるなど、いくつかの方法は、プリカーサーイオン及びプロダクトイオン両方の有効な同時の質量分析を提供する。例えば、溶出されたプリカーサーの時間の一部分がフラグメンテーションされてプロダクトイオンを形成し、プリカーサーイオン及びプロダクトイオンは、同時間に、又は例えば高速遷移で、実質的に同時に分析される。したがって、一実施形態は、Batemanに記載されている技術又は他の好適な技術を使用して、MS機器を動作させてもよい。一実施形態は、本明細書の他の箇所に記載されている技術を使用して、どのプロダクトイオンが特定のプリカーサーから得られるかを判断してもよく、それにより、かかるプロダクトイオンが、溶出プリカーサーの乗算と関連付けられるか、又はそれに関係するものとして特徴付けられてもよい。
本明細書の他の箇所に記載される技術にしたがって、プリカーサーイオン及びプロダクトイオンと関連付けられるピークのピーク形状、幅、及びスキャン時間が比較されて、どのプロダクトイオンが特定のプリカーサーイオンと関連付けられるかが判断されてもよい。共通の元の分子から得られるイオン(プリカーサー及びフラグメント)は、それらの相対強度など、同様の特性を有する。分子がLCから溶出するにしたがって、その強度が最大まで増加し、次に検出限界(LOD)を下回るまで強度が減少する。そのプリカーサーのプロダクトイオンは、プロダクトイオンとその親プリカーサーの強度比が一定のままである点で同じように挙動するが、それぞれ絶対強度が一貫して変化する。したがって、プリカーサーイオン及びそれらの関連付けられたプロダクトのスキャン内及びスキャン間の相対強度は、一貫していなければならず、本明細書の他の箇所に記載されるように、共通のピーク形状又はプロファイルを示している。
上述したようなLC/MS実験では、イオンは、そのスキャン時間、質量電荷比又は質量、電荷状態、及び強度によって説明及び/又は参照することができる。元の分子は複数のイオンを生じさせることができ、それにより、かかるイオンはそれぞれ、プリカーサー又はフラグメントのどちらかである。これらのフラグメントは、元の分子を分解するプロセスから生じる。これらのプロセスは、イオン化源で、又はMS 112の衝突セルで行うことができる。フラグメントイオンは、共通の溶出する元の分子から得られるので、それらは定義上、そのクロマトグラフィピークプロファイルにわたる各スキャンに対するフラグメンテーション効率(プロダクトイオン面積/プリカーサーイオン面積)を反映する強度比で存在する。イオン形成、フラグメンテーション、及びイオン検出の時間は、一般に、元の分子のピーク幅よりもはるかに短い。例えば、半値幅(FWHM)で測定される一般的なクロマトグラフィピーク幅は、5〜30秒である。イオン形成、フラグメンテーション、及び検出の時間は、一般的にミリ秒未満である。
クロマトグラフィ時間スケールにおいて、図2に示されるものなど、交互のLE及びHEスキャンを得るデータ獲得に対して、Bateman技術又は高−低プロトコルを使用する一実施形態では、イオン形成、フラグメンテーション、及び検出の時間は、一態様では、本質的に瞬間のプロセスとして特徴付けられてもよい。要するに、元の分子から得られる、かかる実施形態において観察されるイオンのスキャン時間の差は、事実上ゼロである。つまり、元の分子から得られたイオン間のミリ秒未満の保持時間差は、クロマトグラフィピーク幅と比べて小さい。
無処置のプリカーサーイオンの衝突によって誘発される解離から発生するイオンに関して、フラグメント又はプロダクトイオンはそれらの親プリカーサーイオンと関連付けられる。質量分析計を、Batemanの130号特許に記載されているような高−低データ獲得モード(本明細書では、上昇−低データ獲得モードとも呼ばれる)で使用することによって、それらの関連付けは、後に続くフラグメンテーションのために機器が単一のプリカーサーを事前選択するのを必要とすることなく遂行される。より具体的には、関連付けられたイオンは、複数のプリカーサーが本質的に同じスキャン時間で同時にフラグメンテーションしているとき、適切にグループ化される。
連続質量分離によって獲得されるデータに関して、フラグメンテーションのためにイオンが選択される時間、及びフラグメンテーションされる時間は、プロダクトイオン/プリカーサーイオンの適正な強度比を計算するために、それ自体は実質的に異なることができ、プリカーサーイオンの強度をその実際のフラグメンテーション時間において外挿することが必要である。これは、後及び前のLEスキャンからプリカーサーイオンの強度値間で線形回帰を生成し、関連する時間間隔を適用することによって達成される。
カラム110などのクロマトグラフィ支持マトリックスから溶出する分子の溶出時間及びクロマトグラフィピークプロファイルは、支持マトリックスと移動相との間における分子の物理的相互作用の関数である。分子が支持マトリックスと移動相との間で有する相互作用の程度は、その分子のクロマトグラフィプロファイル及び溶出時間を表す。複雑な混合物では、各分子は化学的に異なる。その結果、各分子は、クロマトグラフィマトリックス及び移動相に対して異なる親和性を有することができる。結論として、各分子は固有のクロマトグラフィプロファイルを呈することができる。
一般に、特定の分子のクロマトグラフィプロファイルは固有であり、その分子の物理化学的性質を説明する。所与の分子のクロマトグラフィピークプロファイルを特徴付けるのに任意に使用されるパラメータとしては、中でも特に、最初の検出(リフトオフ)の時間、正規化された傾斜、ピーク頂点の時間に対する反曲点の時間、最大応答(ピーク頂点)の時間、反曲点におけるピーク幅、半値幅(FWHM)、ピーク形状の非対称性、最後の検出(タッチダウン)の時間が挙げられる。
更に詳細に後述するように、より一般的には、本明細書の技術は、同じ又は異なる実験から得られる、本明細書の他の箇所に記載されるような第1の形態の1つ又は2つ以上のMSデータセットの処理と関連して使用されてもよい。MSデータセットは、Batemanに記載されている高−低プロトコル又は他の任意の好適な方法にしたがって、MS機器を動作させることによって得られてもよい。
図3を参照すると、本明細書の技術による一実施形態で使用されてもよい構成要素を例証する一例が示されている。例300は、図1のシステム100に示されるものなどのサンプル分析を行う、LC及びMS機器などの機器を表す機器システム100を含む。この例では、単一のプリカーサー、プリカーサーのm/z範囲、又はLE及びHEデータセットの集合間の非常に狭い時間ウィンドウ内におけるプリカーサーの全体のm/zスケールに対して、MS(LE)及びMS/MS(HE)データが獲得される、サンプルを分析する実験が行われてもよい。一例として、LE及びHEデータは、Batemanの高−低プロファイルにしたがって獲得されて、単一のサンプル分析に対するMSスキャンデータ301が生成される。上述したように、また本明細書の他の箇所に示されるように、単一の実験行程又は注入に対するかかるMSスキャンデータ301のセットは、低エネルギー(LE)スキャンデータセット302及び高エネルギー(HE)スキャンデータセット304の2つのデータセットを含んでもよい。要素302は、MS機器を低エネルギーモードで動作させたときに獲得されるMSスキャンデータを表してもよく、要素304は、MS機器を高エネルギーモードで動作させたときに獲得されるMSスキャンデータを表してもよい。この例では、データセット302及び304は、質量フィルタ処理をしていない全ての検出イオンに対する全スキャンデータを含んでもよい。
MSスキャンデータ301は、データ処理(DP)エンジン310に対する入力として提供されてもよい。DPエンジン310は、MSスキャンデータ301を処理する1つ又は2つ以上のソフトウェアモジュールとして具体化されてもよく、それにより、かかる処理は、プリカーサー電荷クラスタ(PCC)形成312、各OCCに対するスキャンごとのピーク検出314、及びPCC又はプリカーサー−フラグメントイオンの関連付け及びフィルタ処理320を行うことを含む。DPエンジン310はまた、1つ又は2つ以上の他のモジュール322を含んでもよい。出力として、DPエンジン310は、1つ又は2つ以上のSSPPIS(単一スキャンプリカーサー−プロダクトイオンスペクトル)350を生成してもよい。SSPPISは、単一のPCCと、それに関連する、単一スキャンを反映するプロダクト又はフラグメントイオンを表す。DPエンジン310の上記モジュールのそれぞれによって行われる処理は、PCC、SSPPISなどと共に、本明細書の他の箇所に更に詳細に記載される。やはり以下のパラグラフで更に詳細に記載されるように、1つ又は2つ以上のSSPPISは、特定の分子を一意に同定する質量指紋を得るのに使用されてもよい。いくつかの実施形態では、関連又は関係するSSPPISは、本明細書の他の箇所で更に詳細に記載されるような、1つ又は2つ以上のCPPIS(複合プリカーサー−プロダクトイオンスペクトル)352へと更に組み合わされてもよい。
それに加えて、DPエンジン310はまた、アンマッチしたイオンの残留セット354を出力してもよい。本明細書の他の箇所で更に詳細に記載されるように、残留セット354は、任意のアンマッチしたPCC及び/又はアンマッチしたフラグメントイオンを含んでもよい。
DPエンジン310は、本明細書では教師なしクラスタリングと呼ばれる第1の処理モードで動作してもよく、それにより、単一のPCCの強度、及びLCピーク溶出プロファイルにわたる周囲のSSPPISのそれぞれに含まれるそのプロダクトイオンの強度を追跡することによって、CPPISの形成が一連のSSPPISから行われる。追跡されたプリカーサー電荷クラスタ、又はその同位体の1つ又は2つ以上に対する、特定のアルゴリズム的に決定された強度比の関係にしたがう、各SSPPISのプロダクトイオンのみが保持される。
LCピークが1つを超える重なり合う溶出成分を呈することがある一般的な状況では、SSPPISの作成によって、プロダクトイオンスペクトルが獲得された同じ質量分離ウィンドウ内に複数のプリカーサー電荷クラスタ(PCC)が見出される場合、それらに対して同じ高エネルギープロダクトイオンスペクトルが割り当てられる。これは、MSスキャンデータを生成得るBatemanの高−低プロトコルに常に当てはまる。このように、単一スキャン獲得のプロダクトイオンは、一般に、それらの割り当たられたPCCに対して一対多の関係を有する。このように、1つの特定のSSPPISの廃棄されたプロダクトイオンは、異なるPCCに属する異なるSSPPISで保持されるフィルタ処理済みイオンとなる。このプロセスの最高点は、関連するSSPPISで保持されるプロダクトイオンが、特定のプリカーサー電荷クラスタに属する正当なものである可能性が最も高い、CPPISの作成をもたらす。
DPエンジン310はまた、本明細書では教師ありクラスタリングと呼ばれる第2の処理モードで動作してもよく、それにより、データベース若しくはライブラリに記憶されていてもよいものなど、既知の指紋又は標的分子又は化合物のプリカーサー−プロダクトイオンを、ユーザ若しくはアルゴリズム規定のマッチング基準セット内の全てのSSPPISにマッチさせることによって、CCPISの形成が一連の1つ又は2つ以上のSSPPISから行われる。
本明細書の他の箇所に記載されるように、モジュール312、314、及び320は、教師あり及び教師なし両方のクラスタリングモードに対する処理を行ってもよい。一実施形態では、モジュール312及び314は、教師あり及び教師なし両方のクラスタリングモードに対して、MSスキャンデータ301の同じ処理を行ってもよい。モジュール320によって行われる処理は、DPエンジン310が教師なしクラスタリングモード又は教師ありクラスタリングモードのどちらで動作しているかに応じて変動してもよい。
図4を参照すると、本明細書の技術による一実施形態で処理される質量スペクトルデータに含まれてもよい情報の一例が示されている。例300は、MSスキャンデータ301の第1の形態に含まれてもよい情報を示している。要素401aは、Batemanの高−低プロトコルにしたがってMS機器を動作させたときに、図3と関連して上述した実験を行った結果として得られる、(図3でLEスキャンデータセット302として表される)プリカーサーイオンスペクトルデータを表してもよい。要素401bは、Batemanの高−低プロトコルにしたがってMS機器を動作させたときに、図3と関連して上述した実験を行った結果として得られる、プロダクト又はフラグメントイオンスペクトルデータを表してもよい。特に、Batemanの高−低プロトコルにしたがって動作するMS機器を利用する一実施形態では、401a及び401bのデータは、単一の実験又は行程で獲得されてもよく、それにより、交互のスキャンはプリカーサー及びプロダクトイオンスペクトルと関連付けられる。例400では、表401aのスキャンI、及び対応する表401bのスキャンI’’は、実質的に同じI番目のスキャン時間に対して獲得されるデータを表し、したがって対応するスキャンを表し、Iは、この例では0よりも大きい整数であるスキャン数を表す。対応するスキャン数1の場合、表401aの情報はスキャン数の列402の1によって表され、同じスキャン数に対する表401bの情報は、対になるスキャン数の列422の1’’によって表される。例300では、対応するスキャンの対1及び1’’は実質的に同じスキャン時間を有し、それにより、対のスキャン1は、表401aのデータ又は低エネルギースキャンデータを有し、同じ対のスキャン1’’は、表401bのデータ又は高エネルギースキャンデータを有する。
表401a及び401bによって示されるように、データセット401a、401bのそれぞれは、異なる質量スペクトルスキャンに対する複数のスキャン時間に関する情報を含んでもよい。各スキャンに対して、1つ又は2つ以上の検出質量及び関連する強度のリストが、質量分析を行うことによって得られてもよい。例えば、表401aを参照すると、列402はスキャンのリストを表し、列404はスキャンにおける検出質量を表し、列406は列304の検出質量の強度を表す。スキャン1の場合、セル又はエントリ410によって表される表401aの行は、検出された質量及び関連する強度を列挙している。スキャン2の場合、セル又はエントリ412によって表される表401aの行は、検出された質量及び関連する強度を列挙している。表401aの各行は、その行における検出質量の強度を表す質量及び強度を含む。例えば、i1はスキャン1で検出された質量m1の強度であり、i2はスキャン1で検出された質量m2の強度である。表401bは、表401bと関連して記載したものと同様の、ただしフラグメントイオンデータと関連付けられた交互の対応するスキャンに関する情報を含んでもよい。例300を参照すると、410及び430は、対応するスキャン1及び1’’に対する、対応する低及び高エネルギースキャンデータを表し、412及び432は、対応するスキャン2及び2’’に対する、対応する低及び高エネルギースキャンデータを表す。
実質的に同じスキャン時間を有する対応するスキャンの対(表401aからのものと、表401bからの第2のもの)は、特定の実験に応じて、保持時間又はドリフト時間を表してもよいことが注目されるべきである。例えば、質量分析の前に行われる分離処理が、イオンモビリティースペクトロメトリーを伴わず、LC又はGCなどのためのクロマトグラフィ分離を含む場合、スキャン時間は保持時間を表す。質量分析の前に行われる分離処理が、イオンモビリティースペクトロメトリーを含むがクロマトグラフィ分離は含まない場合、スキャン時間はドリフト時間を表す。クロマトグラフィ及びイオンモビリティースペクトロメトリーが両方とも、質量分析の前に行われる場合、スキャン時間は、保持時間又はドリフト時間のどちらかを表してもよい。例えば、LC/IMS/MSを用いて、連続するスキャン時間のセットは、単一の保持時間と関連付けられる複数のドリフト時間の群を表すスキャングループを形成してもよく、それにより、(ドリフト時間に対応するスキャン時間の)スキャングループは、クロマトグラフィ保持時間に対応する2つのスキャン時間内又はそれらの間に収まるように特徴付けられてもよい。例えば、図5を参照すると、N回のスキャンをそれぞれ含むスキャングループ451及び452の一例が示されている。LC/IMS/MS実験では、各スキャングループ451、452は、異なる保持時間と関連付けられてもよい。451などの単一のスキャングループ内で、個々のスキャン時間はそれぞれ異なるドリフト時間に対応してもよい。
質量スペクトルデータは、例証のため、本明細書に記載されるものに代わる形態を有してもよい。本明細書の技術を使用して操作される、図4及び図5に示されるものなどのプリカーサー及びプロダクトイオン質量スペクトルデータは、一態様では、ピーク検出を行い、スキャン及びスキャン時間を対応する保持時間及び/又はドリフト時間に対してマッピング若しくは翻訳するなどの、他のソフトウェアによってまだ処理されていない第1の形態の質量スペクトルデータとして特徴付けられてもよい。
図4及び図5と関連して記載されたようなものと同様の情報を含む質量スペクトルデータは、Batemanの高−低プロトコルにしたがって上述したようなものとは異なる方法で、実験に対してMS機器を動作させたときに得られてもよいことが注目されるべきである。
図6を参照すると、分子の指紋又はパターンに含まれる情報を生成する、本明細書の技術による一実施形態で行われてもよい処理を示す一例が示されている。例600では、P1 602は、サンプルの単一分子又は溶出成分である、親プリカーサーを表してもよい。親プリカーサー又は単一分子は、例ではP1 A0、P1 A1、P1 A2、及びP1 A3である、同位体パターン又はクラスタ604を有する。各P1 Ai(「i」は、この例604では、0...3の包括範囲内の値)は、プリカーサーP1の同位体分布を表す。本明細書の記載と関連して、同位体パターン又はクラスタ604は、単にプリカーサーと呼ばれることもある。同位体パターン604を有するプリカーサーに、MS機器と関連するものなどのイオン化606が行われると、プリカーサーはイオン化されて、異なる電荷状態610をそれぞれ有する一連のPCCがもたらされる。各プリカーサー電荷クラスタ又はPCC 610a〜610cは、同一の同位体分布を有する。同位体間のΔm/z間隔は、Ai内及びAi間の強度比が一定であっても、電荷と共に変動する。この例では、溶出成分P1 602のイオン化によって、3つのプリカーサー電荷クラスタ又はPCC 610a〜cが得られる。PCC1 610aは+1の電荷を有し、PCC2 610bは+2の電荷を有し、PCC3 610cは+3の電荷を有する。上記プリカーサーイオン又はPCC 610a〜cのそれぞれは、MS機器による処理と関連するものなどのフラグメンテーション処理612の結果として更にフラグメンテーションされてもよく、それによって一連のフラグメントセット614がもたらされる。より具体的には、この例では、PCC 610a〜cのそれぞれにフラグメンテーション612が行われて、フラグメンテーションイオン614a〜cの関連付けられたセットがもたらされる。例600では、プリカーサーイオン又はPCCをフラグメンテーションした結果として生成されたプロダクト又はフラグメントイオンは、614a〜cに含まれる各Fによって表されてもよい。PCC1 610aがフラグメンテーションされて、PCC1から発するフラグメント又はプロダクトイオンを含む、断片カセット614aが得られてもよい。PCC2 610bがフラグメンテーションされて、PCC2から発するフラグメント又はプロダクトイオンを含む、断片カセット614bが得られてもよい。PCC3 610cがフラグメンテーションされて、PCC3から発するフラグメント又はプロダクトイオンを含む、断片カセット614aが得られてもよい。
一実施形態では、プリカーサーイオンの電荷状態のSSPPISを比較することによって分子のイオン指紋が判断される場合、データがドリフト又はCCSAを含むことを要する。イオンモビリティーは、電荷によってプリカーサーイオンを分離する。電荷状態は、クロマトグラフィ溶出に対して影響を有さず、そのため、プリカーサーの全ての電荷状態は時間に伴って同様に進む。イオンモビリティーは、異なる電荷状態を分離して、DPが、プリカーサー及びプロダクト内及びそれらの間の必要な強度比を、それらの電荷状態によって計算する手段を提供する。次に、結果を比較し、縮小して単一のイオン指紋又は複合プリカーサープロダクトイオンスペクトル又はCPPISにすることができる。
本明細書の技術による一実施形態では、P1 602によって表される分子の指紋は、610a〜cで表される3つのPCCのそれぞれに対する、614a〜cで表される3つの同一の検証されたフラグメントイオンパターンから成る。本明細書に記載されるように、本明細書の技術による一実施形態はまた、イオン指紋に含まれる各プロダクトイオンに対するプリカーサー及びプロダクトイオンの面積比(例えば、本明細書の他の箇所に記載される様々なAR値)と関連付けられる、エラーインジケータ又は一貫性インジケータを記憶してもよい。
本明細書の技術による一実施形態では、各PCCと関連付けられる属性は、m/z、m/zと保持時間、m/zと保持時間とドリフト時間、又は任意の全てのイオン検出前分離測定値、又はそれらの組み合わせを含んでもよい。PCC又はプリカーサーのイオンのm/z又は記録は、A0同位体又はモノアイソトープである。単一のスキャンにおける、610a〜cのそれぞれによって表されるものなどのPCC又はプリカーサーイオンの強度は、その単一のスキャンに対する単一のPCCの同位体全ての強度の合計であってもよい。例えば、スキャンS1においてPCC1 610aによって表されるプリカーサーイオンの強度は、スキャンS1に対してPCC1 610aで生じるような、P1 A0、P1 A1、P1 A2、及びP1 A3の強度の合計である。
また、親プリカーサーP1の強度又は濃度は、PCC 610a〜cのそれぞれの強度又は濃度の合計に等しいことが注目されるべきである。それに加えて、プリカーサーの同位体604の数は、その電荷状態のそれぞれが610に反映されるように、その基本的組成及び濃度の関数である。強度分布は全ての電荷状態に対して一定であるが、所与の基本的組成は電荷状態とは独立しており、電荷状態当たりの同位体の数は、電荷状態によるP1のモル分布の関数である。特定のPCCの観察可能な同位体の数は、質量分析部のダイナミックレンジ及び検出限界によって決定される。
本明細書の他の箇所に示されるように、図3のDPエンジン310によって発生するSSPPISは、単一のPCC及びそれに関連するプロダクトイオンを表す。SSPPISは、低エネルギーの単一スキャンそれぞれで、各プリカーサー電荷クラスタに対して作成されてもよい。比較の上昇エネルギースキャンによるプロダクトイオンは、例えば、それらの親プリカーサーに対する強度及びm/zによって、又はプロダクトイオンの標的セットに対する比較によって、フィルタ処理後に同じスキャンの各PCCと共有されるか又は関連付けられて、固有のSSPPISが作成される。
図6の例を参照すると、親分子P1は、全て同じ保持時間を有するが強度又は濃度が異なり、質量が異なり、電荷が異なり、m/z値が異なり、またドリフト時間が異なる、3つのPCC又はプリカーサーイオンをもたらす。やはり図示されるように、3つのPCCのそれぞれは更に解離されて、それら自体のプロダクト又はフラグメントイオンパターン614が作成されてもよい。
プリカーサーイオン又はPCCの解離又はフラグメンテーションを行うのにMS機器の衝突セルが使用される一実施形態では、次にプロダクト/フラグメントイオンパターンがもたらされてもよく、それによって電荷が保存される。換言すれば、フラグメントイオンの電荷がその親の電荷を上回る可能性はない。一般に、プロダクトイオンを検出させるために帯電させなければならないことを所与として、プリカーサーイオンが解離して、親プリカーサーの電荷状態から1を引いた電荷状態のフラグメントイオンとなる。一般に、電荷は、フラグメンテーションするプリカーサーが2つの補完的なイオンを生成するという点で保存され、F1+F2=プリカーサーの元素質量+その電荷状態×1.007(プロトンの質量)である。例えば、PCC2+2 610bは、614bの2つのフラグメントFm及びFnにフラグメンテーションされてもよく、かかるフラグメントはそれぞれ1+の電荷を有する。PCC3+3 610cは、2つのフラグメントFx及びFyにフラグメンテーションされてもよく、Fxは1+の電荷を有し、Fyは2+の電荷を有する。本明細書の他の箇所に記載されるように、各フラグメント又はプロダクトイオンはまた、関連する強度、電荷状態、質量m/zなどを有してもよい。
PCC1 610aの第1のSSPPISは、614aのフラグメントイオンを含んで生成されてもよく、それによって、フラグメントイオン614aは、PCC1 610aのフラグメンテーションと関連付けられるか又はそれによって生成されるものと表される。PCC2 610bの第2のSSPPISは、614bのフラグメントイオンを含んで生成されてもよく、それによって、フラグメントイオン614bは、PCC2 610bのフラグメンテーションと関連付けられるか又はそれによって生成されるものと表される。PCC3 610cの第3のSSPPISは、614cのフラグメントイオンを含んで生成されてもよく、それによって、フラグメントイオン614cは、PCC3 610cのフラグメンテーションと関連付けられるか又はそれによって生成されるものと表される。
LC/MS/IMS分析を行う一実施形態では、P1などの同じプリカーサーから発するPCC 610a〜cなどのPCCは、それらの関連するドリフト時間に関して、時間寸法の点で差別化されてもよい。かかる実施形態では、PCCのそれぞれから発する様々なフラグメントイオンはまた、614によって示されるものなど、様々なフラグメントイオンのドリフト時間における差に基づいて決定されてもよい。LC/MS分析を行い、それによってIMSを省略する一実施形態では、かかるドリフト時間の差別化は利用不能であり、したがって、全てのPCCは同じスキャンで溶出するものとして観察されてもよい。かかる実施形態では、したがって、PCCのそれぞれから発する様々なフラグメントイオンを分離又は関連付けするのに、ドリフト時間を次元として使用することは不可能である。このように、LC/MSを使用し、IMSを省略するかかる実施形態では、同じフラグメントイオンの一部は、フラグメントイオンがPCC610a〜cのうち複数から発することが可能な場合、フラグメントイオンセット614a〜cの複数のセットに含まれてもよい。例えば、フラグメントイオンをその元のPCCと更に関連付けるための分離の次元として使用するのに、ドリフト時間は利用不能なので、フラグメントFkが+1の電荷状態を有してもよく、したがって場合によってはPCC610a〜cのいずれかから発してもよく、614a〜cのそれぞれに含まれてもよい一実施形態を考慮する。
図6aを参照すると、同位体パターン又はクラスタ654、655、及び656をそれぞれ有する、3つの異なるプリカーサーP1、P2、及びP3を例証する一例が示されている。この例では、P1〜P3は、同じスキャンで溶出する3つのプリカーサーを示している。P1はイオン化されて、PCC1 660aとなってもよい。P2はイオン化されて、PCC2 660bとなってもよい。P3はイオン化されて、PCC3 660cとなってもよい。PCC 660a〜cは同じLEスキャンに現れる。PCC 660a〜cは、フラグメンテーション662されて、フラグメントイオンセット664a〜cに含まれるフラグメントイオンを生成してもよく、それにより、664a〜cの全てのフラグメントイオンは同じ単一のフラグメントイオンスキャン(例えば、同じHEスキャン)に含まれてもよい。
以下のパラグラフに記載される技術を使用して、PCC1 660aの第1のSSPPISは、664aのフラグメントイオンを含んで生成されてもよく、それによって、フラグメントイオン664aは、PCC1 660aのフラグメンテーションと関連付けられるか又はそれによって生成されるものと表される。PCC2 660bの第2のSSPPISは、664bのフラグメントイオンを含んで生成されてもよく、それによって、フラグメントイオン664bは、PCC2 660bのフラグメンテーションと関連付けられるか又はそれによって生成されるものと表される。PCC3 660cの第3のSSPPISは、664cのフラグメントイオンを含んで生成されてもよく、それによって、フラグメントイオン664cは、PCC3 660cのフラグメンテーションと関連付けられるか又はそれによって生成されるものと表される。
このように、単一分子又は単一の溶出成分を表すP1プリカーサーの指紋は、それに関連するPCC1 660aの第1のSSPPISからの情報と共に、PCC及び/又はイオンの物理的若しくは化学的性質に関するPCC及び各フラグメントイオンの属性情報、並びに本明細書の他の箇所に記載される1つ又は2つ以上のメトリック及び関連エラーインジケータなどの属性情報など、追加情報を含んでもよい。同様の方法で、単一分子又は単一の溶出成分を表すP2プリカーサーの指紋は、それに関連するPCC2 660bの第1のSSPPISからの情報を含んでもよく、単一分子又は単一の溶出成分を表すP3プリカーサーの指紋は、それに関連するPCC3 660cの第1のSSPPISからの情報を含んでもよい。
図6に記載されるように、図6aのPCC 660a〜cのそれぞれは、複数の電荷状態で存在してもよく、イオンモビリティーが獲得ワークフローの一部である場合、第1の例として、異なる電荷状態に対して記載のプロセスを適用することによってフラグメントイオン指紋が生成される。イオンモビリティーがない場合、イオン指紋は、PCC又はプリカーサーイオン660a〜c及びプロダクトイオン664a〜cの面積比を比較することによって生成され、最初に、親と同様に挙動しているプロダクトイオンを同定し、次に、親分子のクロマトグラフィ溶出を反映したスキャンにわたってそれらの面積比を比較する。
本明細書に更に詳細に後述されるように、獲得したスキャンデータは、単一スキャンごとに処理されてもよい。プロダクト又はフラグメントイオンのフラグメンテーションパターン、及びPCCなど、その親イオンに対する関係は、プロダクトイオンとそれに関連するSSPPISなどのその親との強度関係として定義されてもよく、それら2つの間の面積比又は強度比は、そのクロマトグラフィプロファイルを定義するスキャン内及びスキャン間で(ある実験変数内で)一貫していなければならない。本明細書の技術は、本発明者らによって認識されるような、PCCなどの親イオンとそのフラグメントとの間におけるかかる原理及び関係を利用する。詳述するため、プリカーサーのフラグメンテーションパターンはその溶出にわたって一貫している。そのため、プリカーサーイオンとその構成成分であるプロダクトイオンとの強度関係は、干渉がない状態で一定のままであるべきである。フラグメンテーション中に発生するプロダクトイオン、プリカーサーイオン、又はPCCの数は、その長さ/質量及び濃度の関数である。溶出プロファイルを定義する、スキャンにわたってPCCの強度が変動(例えば、増加及び/又は減少)する速度は、そのプリカーサーから発するプロダクトイオンのものと同じである。同様に、一貫して適用される衝突エネルギー(eV)を所与として、フラグメンテーション効率(プロダクトイオン強度/プリカーサーイオン強度)も、プロダクトイオンの強度をその溶出成分の一部であることが分かっている全てのプロダクトイオンの強度で割ったもののように、その溶出プロファイルを定義する全てのスキャンにわたって(ある実験変数内で)一定のままである。
本明細書の技術は、単一スキャン及びスキャンごとの基準で親プリカーサーイオン又はPCCに対するプロダクトイオンのアライメントを追跡し検証する検証ヒューリスティックスを使用する。更に詳細に後述されるように、メトリックAR1(面積比1)は、単一の(同じ)スキャン時間におけるPCCに対するプロダクトイオンの強度又は面積比として定義される。本明細書の技術による一実施形態で使用されてもよい単一スキャンのスキーマを所与として、各PCCは、その強度が溶出ピークにわたって追跡される。PCCが最高値であるスキャンは枢動点(PP)又は頂点と称される。PCC及び関連又はマッチするフラグメントイオンに対するAR1メトリックは、溶出ピークの全てのスキャン/スキャン時間にわたって(ある指定の許容差内で)同じであるべきである。それに加えて、別の検証技術として、ピークにおける全ての隣接するスキャンは、別のメトリックAR2(面積比2、更に詳細に後述)を使用してピボットスキャンに対して比較される。概して、AR2値は、PCC及びマッチした(潜在的な)プロダクトイオンの両方に対して決定されてもよい。PCCのAR2は、PP又は頂点スキャンにおけるPCCに対する、ピークの任意の隣接するスキャンにおけるPCCの強度又は面積比として定義されてもよい。同様に、プロダクト又はフラグメントイオンのAR2は、PP又は頂点スキャンにおける同じイオンに対する、ピークの任意の隣接するスキャンにおけるフラグメントイオンの強度又は面積比として定義されてもよい。スキャン内(AR1)又はスキャン間(AR2)でマッチしたPCC及びそのプロダクトイオンの強度又は面積比は、統計的変数内で一貫しているべきである。曲線下面積(AUC)による定量的確度及び精度は、ピークにわたって存在するスキャンが最小数であることを説明する。これによって、どのイオンが同様に挙動しているかを判断するのに必要な統計を提供するのに十分な単一のスキャンがピークにわたって存在することが担保される。
以下、教師なしクラスタリングに関して一実施形態で行われてもよい処理について記載する。それは、実験及びデータ分析が行われているサンプルに特定の分子が含まれるという先験的知識なしに、溶出成分又は分子の指紋を決定するのに使用される。LC/MS又はLC/IMS/MSなど、サンプルの実験を行うことと関連して、同時に溶出する(例えば、ほぼ同じ保持時間を有する)複数の分子があってもよい。本明細書の技術による一実施形態における教師なしクラスタリングは、一般に、溶出成分に対する指紋を決定するのに使用されてもよく、更に、同じ又は類似の溶出時間を有する2つの重なり合うか又は干渉する成分に対して、かかる指紋を生成するのを容易にしてもよい。このように、教師なしクラスタリングは、フラグメントイオンをそれらの元の分子又は成分と適正に関連付け又はマッチさせ、フラグメントイオンをそれらの元のPCC適正に関連付け又はマッチさせるのに使用されてもよい。後述されるように、また本明細書の技術による一実施形態において本明細書の他の箇所に記載されるように、各PCC及び関連するフラグメントイオンに関する情報は、単一のSSPPISによって表されてもよいような単位として記憶され維持されてもよい。したがって、図6及び図6aの例に示されるように、分子又は溶出成分の単一の指紋は、複数のPCC及びしたがって複数のSSPPISからの情報を含んでもよい。更に詳細に後述されるように、サンプルに対するPC/MS実験の結果として生成されるデータセットに関して、教師なしクラスタリングのための処理は、どのフラグメントイオンがそれらの正しいPCCと関連付けられるかを判断してもよい。続いて、PCC(及びそれらのマッチしたフラグメントイオン)と特定の溶出成分若しくは分子とのグループ化又は関連付けを判断する(例えば、どの1つ又は2つ以上のPCCをグループ化し、単一の溶出成分若しくは分子と関連付けるべきかを判断する)、処理が行われてもよい。
図3に戻ると、DPエンジン310のPCC形成モジュール312は、スキャンごとにLEスキャンデータセット302の処理を行って、各スキャン時間に対するPCCのセットを決定してもよい。単一のスキャンにおける各PCCは、本明細書の他の箇所に記載されるような、関連するm/z(一般的に、A0モノアイソトープ)、電荷状態z、及び強度を有する。同じPCCは、その関連するm/zを使用して同定され、次に、LCピーク検出モジュール314によって、一連の連続スキャンを通して追跡される。各スキャンに関して、PCCの強度も追跡される。上記追跡の結果は、PCCに対する異なる連続スキャンにおける強度のピーク応答を形成するべきであり、それによって単一のPCCに対する溶出クロマトグラフィピークの強度エンベロープが表される。このように、単一のPCCが連続スキャンにわたって追跡されて、図7に示されるようなPCCからの溶出ピークが決定される。図7によって示されるものなど、単一のPCCに対して結果として得られる追跡は、追跡された各PCCに対して行われてもよいことが注目されるべきである。
図7を参照すると、本明細書の技術による一実施形態における、単一のPCCに対して決定されるLCピークの模式図が示されている。ピーク検出の一部として、強度が連続スキャンにおいて点Pstartから点Hまで増加し、次いで連続スキャンにおいて点Hから点Pendまで減少することを確認する処理が行われる。Pstartは、ピークの第1のスキャン、又はPCCのm/zが最初に検出できる時点を表す。Hは、PCCのm/zと関連付けられる検出強度が最大値であるピークの頂点を表す。Hはまた、枢動点(PP)と呼ばれることがある。Pendは、ピークの最後若しくは終わりのスキャン、又はPCCのm/zが検出されなくなる時点を表す。
単一のスキャン内で、プリカーサーイオンとそのプロダクトイオンとの間に関係があり、かかる関係は、プリカーサー及びそのプロダクトイオンのフラグメンテーションパターンの一部である。本明細書の技術による一実施形態では、異なるスキャンにおける同じプリカーサーイオン又はPCCのPCC又はプリカーサーイオン比を表すAR2(面積比2)のメトリックは、PCCから発生するマッチする又は関連するフラグメントイオンの決定と関連して決定され使用されてもよい。SSPPISが最初に形成されると、各プロダクトイオンはAR1値を割り当てられ、AR1(面積比1)は、プロダクトイオンの強度をプリカーサーの強度で割ったものに等しい。一貫した衝突エネルギーがプリカーサーの溶出中のスキャンにわたって適用されるものと仮定して、溶出プロファイルの各スキャンメンバーに対するAR1値は、ある実験誤差内で一貫しているべきである。
スキャンの間で、スキャンt1=X強度及びスキャンt2=Y強度からの特定のPCCの強度比は、比X/Yとなる。同じスキャンt1及びt2における同じPCCと関連付けられるフラグメントは、ある指定の許容差内の同じ強度比を有することによって、同じように挙動するはずである。PCCの強度がスキャンt1及びt2の間で増加した場合、それに関連するフラグメントイオンも同様のはずである。PCCの強度がスキャンt1及びt2の間で減少した場合、それに関連するフラグメントイオンも同様のはずである。このように、PCCの上記強度比は、フラグメントを異なるPCC又はプリカーサーイオンから差別化又は区別し、適切に関連付けるのに使用されてもよい。
本明細書の技術による一実施形態では、任意のスキャン及びそれに対応する頂点間における同じプリカーサーイオン又はPCCのPCC又はプリカーサーイオン比を表すAR2(面積比2)のメトリックは、同じPCCから発生するマッチする又は関連するフラグメントイオンの決定と関連して決定され使用されてもよい。任意のスキャンのプロダクトイオンは、同じPCCに関連する場合、それらのPCC AR2比と同様に、頂点スキャンによる対応するイオンとのAR2比を反映しなければならない。後述されるように、PCC及びそのプロダクトイオンのそれぞれに対するAR2比又はメトリックは、一般に、LCピーク曲線上の各スキャン又は点に対して決定されてもよい。図7のスキャンH1及びH2におけるFWHM点は、2つのかかる点である。
要約すると、単一のPCCの場合、処理は、第1のステップで、図7に示されるようなピーク決定を行うために、異なるスキャンを通して特定のPCCを追跡するように行われてもよい。第2のステップとして、特定のPCCに対して最大又は最高強度を有する検出されたピークのスキャンは、AR2メトリックがそこから計算される頂点又は枢動点スキャンとして同定され表されてもよい。
第3のステップとして、2つのFWHM点H1及びH2が決定されてもよい。第3のステップで、ピークの左側(LHS若しくは上り坂)及びピークの右側(RHS若しくは下り坂)の両方に対して、最大強度(例えば、頂点Hの強度)の高さの半分に対応する点又はスキャンが同定される。例えば、かかる処理は、Hの左側の点H1とHの右側の点H2とを決定し、そこでの強度は最大値の1/2(又はPP若しくは点Hにおける強度の1/2である。例えば、ピーク又は最大強度BMAXはスキャン1008の位置であってもよく、強度は、スキャン1004 H1(PPの左側)及びH2 1012(PPの右側)において、IMAX/2であってもよい。このように、H1はピークのLHSにおける半分の高さのスキャンを表し、H2はピークのRHSにおける半分の高さのスキャンを表す。
図7に示されるPCCに関する上り坂比U及び下り坂比Dを、次のように定義する。
上り坂比U=H1強度/H強度 式1
及び、
下り坂比D=H2強度/H強度 式2
式中、
Hは、同定されたピークピボットスキャンにおけるPCCの最大強度、
H1は、点H1によって表される同定されたスキャンにおけるPCCの強度、並びに、
H2は、点H2によって表される同定されたスキャンにおけるPCCの強度。
2つのFWHM点H1及びH2に対する上り坂比U及び下り坂比Dは、常に、FWHMの定義により、約1/2のPCC強度比をもたらすことが注目されるべきである。上述の式1及び2は、特定の点又はスキャンH1及びH2それぞれに対するAR2比のカスタマイズされた形態を表す。
一般に、PCC及びそのプロダクトイオンのそれぞれに対するAR2比は、ピーク又は曲線上の各スキャン又は点に対して決定されてもよい。スキャンH1及びH2に対するFWHM点は、2つのかかる点の例である。このように、AR2比は、点H(例えば、PP若しくは頂点)のスキャン、及び一般にピーク又は曲線上の他の任意のスキャンSx間のスキャンから、PCC及びそのプロダクトイオン強度の両方に対して決定されてもよい。
AR2P=Int(スキャンSx,PCC)/Int(スキャンPP,PCC) 式3a
AR2F=Int(スキャンSx,Fx)/Int(スキャンPP,Fx) 式3b
AR2に関して
式中、
Int(スキャンSx,PCC)は、PP又はHスキャン以外の別のスキャンを表す、あるスキャンSxにおけるPCCの強度、並びに、
Int(スキャンPP,PCC)は、PCCの強度が検出されたピーク中においてその最大値又は頂点にある、スキャンH(例えば、PP若しくはピークの頂点)におけるプリカーサーイオンの強度、並びに、
Int(スキャンSx,Fx)は、スキャンSxにおけるPCCに属するm/zxを有する特定のフラグメントイオンFxの強度、並びに、
Int(スキャンPP,Fx)は、スキャンH又はPPにおけるPCCに属するm/zxを有する特定のフラグメントイオンFxの強度、並びに、
AR2Fの値は、フラグメントイオンFxが真にPCCに関連する場合の所与の許容差内にある、同じスキャンSxにおけるAR2Pの同様の値を反映する。
本明細書に記載される一実施形態では、(式3aに基づいた)PCCに対するAR2値は、次のように、スキャンH1及びH2におけるFWHM点に対して最初に決定されてもよい。
AR2=上り坂比U=下り坂比D
=Int(H1,PCC/Int(H,PCC)=Int(H2,PCC)/Int(H,PCC)
式中、
Int(H,PCC)は、プリカーサーの強度が検出されたピーク中においてその最大値又は頂点にある、スキャンHにおけるPCCの強度、
Int(H1,PCC)は、PCCの強度がピークの上り坂又はLHS上のFWHMにある、スキャンH1におけるPCCの強度、並びに、
Int(H2,PCC)は、PCCの強度がピークの下り坂又はRHS上のFWHMにある、スキャンH2におけるPCCの強度である。
FWHMの定義によって、FWHMスキャンに関するPCCのAR2は、ある予期される許容差内で常に1/2となる。
第4のステップで、スキャンH、H1、及びH2に対するフラグメント又は上昇エネルギースキャンデータを検査し、スキャン間で特定のフラグメントに対して質量又はm/zをマッチさせ、フラグメントに対する強度比(IR)を、(式3aを使用して決定されるような)PCCのAR2値のものとマッチさせることによって、スキャン間でPCCに対してマッチするフラグメントイオンを決定する処理が行われてもよい。以下のフラグメントに対するIRは、式3bによって表されるような、フラグメントイオンARFに対するAR2値であることが注目されるべきである。
更に例証するため、スキャンH及びH1の間でマッチするフラグメントの第1のセットを決定し、またスキャンHとH2との間でマッチするフラグメントの第2のセットを決定する処理が行われてもよい。例えば、スキャンHのフラグメントF1は、スキャンH1のフラグメントF1’’にマッチするように決定されるが、その条件は次のものである。
F1の質量又はm/zが、ある指定の質量許容差内でF1’’の質量又はm/zにマッチすること、並びに、
次式のように計算される強度比IR
IR=スキャンH1におけるF1’’の強度/スキャンHにおけるF1の強度
が、ある指定の許容差内で(同じスキャンH及びH1に対する関連するPCCの)AR2にマッチすること。
例えば、スキャンH1がスキャン時間1004であって、フラグメントイオンF1が質量m1及び強度5,000で存在し、フラグメントイオンF2が質量m2及び強度5,000で存在すると仮定する。スキャンHがスキャン時間1008であって、フラグメントイオンF1が質量m1及び強度10,000で存在し、フラグメントイオンF2が質量m2及び強度6,000で存在すると仮定する。更に、この例に関して、スキャンH2がスキャン1012であって、フラグメントイオンF2が質量m2及び強度3,000で存在すると仮定する。
そこで、上記に基づいて、スキャンH及びH1のフラグメントイオンF1に関して、IR=5,000/10,000=1/2であり、これはPCCに対する1/2のAR2値にマッチする。したがって、F1は、PCCのマッチするフラグメントの第1のセットに含まれる。
スキャンH及びH1のF2に関して、IR=5,000/6,000=0.83であり、これはPCCに対する1/2のAR2値にマッチしない。したがって、F2は、PCCのマッチするフラグメントの第1のセットに含まれない。
スキャンH及びH2のF2に関して、IR=3,000/6,000=1/であり、これはPCCに対する1/2のAR2値にマッチする。したがって、F2は、PCCのマッチするフラグメントの第2のセットに含まれる。
したがって、AR2値は、PCCの検出されたピークにおける各スキャン(例えば、スキャンH以外の各スキャン)に対して決定され、PCCに対するマッチする又は関連するフラグメントイオンのセットを決定する、フィルタ処理又は検証で使用される検証基準に含まれてもよい。したがって、ピークに対する各スキャン点について、PCCのAR2値が存在する。例えば、PCCの検出されたピークに12の点又はスキャンが存在する場合、PCCに対して11のAR2値があることになる(12の点のうち1つはピーク若しくはPPの頂点であるため)。
上記でIRとして表されるメトリックは、より一般的には、式3bのように特徴付けられてもよく、本明細書では、PCCとして同じ2つのスキャンにおいて(PCCではなく)フラグメントイオンの強度又は面積比に対して決定される別のAR2値と呼ばれてもよいことが注目されるべきである。上述されるように、また本明細書の他の箇所に示されるように、AR2値は、2つの異なるスキャン時間に関してPCCに対して決定され、FがPCCのフラグメンテーションと関連付けられるか又はそれによって生成される場合、PCCはある指定の許容差内で同じであるはずなので、AR2値は、同じ2つの時間におけるフラグメントイオンFに対して決定される。
強度がLCピークを辿らないようにして、所与のスキャンでPCCが干渉される例では、近接スキャンの強度は線形回帰補間であり、上り坂及び下り坂が頂点スキャンと比較されるときは、範囲外のスキャンにおけるPCCの強度が大きい場合、ガウスピーク形状を所与として、2つのAR1及びAR2値は一貫しているべきである。そのため、任意の近接スキャンを比較すると、頂点と他の任意のスキャンとの間のAR2値を計算する際、PCCの強度は、第1の例では、近接スキャンに関して線形回帰及び補間を行うことによって検証される。
一実施形態では、上述したように、スキャンH1及びH2に対するAR2値にしたがって、かかるスキャンに関してマッチするフラグメントの数を決定する処理が行われてもよい。次に、スキャンH1に対して決定される第1のマッチするフラグメントセット、及びスキャンH2に対して決定される第2のマッチするフラグメントセットについて、検証処理が行われてもよい。かかる検証処理は、(AR1(面積比1)のメトリックなどの他のメトリックを含む他の基準、及び更に詳細に後述される他の基準を使用するなど、1つ又は2つ以上の追加の検証基準を使用することを含んでもよい。例えば、かかる検証処理は、セット中のマッチするフラグメントの数が少なくとも指定の最小数であるか否かを判断することを含んでもよい(例えば、図8、及び本明細書の他の箇所に記載される関連する処理を参照)。点又はスキャンH1及びH2に対して決定されたマッチするフラグメントセットの検証において検証処理が成功した場合、処理は、曲線上の他のスキャン又は点に対して継続してもよい。別の方法では、H1及び/又はH2に対する検証処理が失敗した場合、特定のPCCと関連付けられるフラグメントイオンを決定する、代替の技術が使用されてもよい。
一実施形態では、処理は更に、(図7の点X1によって表されるような)H1及びHの中点における、次に(図7の点X2によって表されるような)スキャンH及びH2の間の中間におけるスキャンに対して、マッチするフラグメントの数を決定することに進んでもよい。点X1及びX2における各スキャンに関して、上述したもの、並びに点H1及びH2における各スキャンと関連して本明細書の他の箇所に記載されるものと、同様の処理が行われてもよい。例えば、X1及びX2によって表される各スキャンに関して、AR2(面積比2)値を決定し、スキャンに関してマッチするフラグメントセットを決定し、次に、マッチするフラグメントセットが任意の更なる検証基準(例えば、AR1、及び本明細書に記載される他の基準)に合格するかを判断する。かかる検証基準は、マッチするフラグメントセットが最小数のフラグメントを含むことを含んでもよい。それに加えて、基準はまた、1つ又は2つ以上の他のスキャンに関して、スキャンの検出されたフラグメントの数を比較することを含んでもよい。例えば、PCCの強度がスキャンS1からスキャンS2まで増加するにしたがって、検出されたフラグメントの数は同様に増加し、それにより、スキャンS1の検出されたフラグメントの数<スキャンS2の検出されたフラグメントの数であることが予期される。かかる基準はまた、スキャンS1及びS2におけるフラグメントの強度を検査し、それにより、スキャンS1のフラグメントF1の強度が同様に、スキャンF2のF1の強度よりも小さいべきであることを含んでもよい。
かかる処理は、PCCのピークのかかる点が全て処理されるまで、処理された他の2つの連続スキャン点間に位置する次のスキャン点を繰り返し決定することによって反復されてもよい。このように、中間スキャン点の繰り返される処理は、PCCのピーク又は曲線の上側部分(例えば、H1からH2までのスキャン点を包括的に含む上側部分)におけるスキャンに対して、また、PCCのピーク又は曲線の下側部分におけるスキャン(例えば、点PstartからH1までのスキャン、及びH2からPendまでのスキャン)に対して行われることが注目されるべきである。一実施形態では、検証処理が、FWHM点H1及びH2の下にあるピークの下側部分のスキャンに対して決定されるフラグメントのセットを検証するのに失敗した場合、検証処理に失敗したスキャンのフラグメントのセットは除外されてもよく、処理は、PCCのピークの下側部分における任意の残りのスキャンを継続してもよい。
次に記載されるのは別のメトリックであり、どのフラグメントイオンが各PCCと関連付けられるかの判断と関連して、フラグメントイオンの検証又はフィルタ処理に使用される検証基準にやはり含まれてもよい、AR1(面積比1)メトリックである。
各スキャンSjに対して、スキャンSjにおける各プロダクト又はフラグメントイオンFiは、次式のように表されてもよいAR1(面積比1)を有する。
AR1=スキャンSjにおけるFiの強度/スキャンSjにおけるPCCの強度
例えば、スキャンS1で、強度XのフラグメントF1、強度YのF2、及び強度ZのPCC P1があるものとする。スキャンS1に対して2つのAR1値があり、第1のAR1値はX/Z、第2のAR1値はY/Zである。
本明細書の技術による一実施形態の処理は、AR1値を使用してAR2値を検証してもよい。AR2を使用して決定され、上述したような検証処理に合格する、マッチしたフラグメントFiそれぞれに対して、ここで、特定のフラグメントFiに対するAR1値を使用して、更なる検証処理が行われてもよい。Fiに対するAR1を使用して行われるかかる更なる検証処理は、フラグメントF1に関して(ピークの)スキャン1〜Nに対するAR1値を比較してもよい。全てのかかるAR1値がある許容差内で同じではない場合、フラグメントF1はPCC P1とマッチしない(その強度は、上記AR1及びAR2値を計算するのに使用される)。
特定のPCCに対するスキャンデータ及び関連するフラグメントイオンを検証するのに使用される検証基準は、更に、以下に記載されるフラグメンテーション効率に基づいて別のメトリックを含んでもよい。
一般に、良好に行われた実験では、過剰な衝突エネルギーを用いて動作することによって、プリカーサーイオンを過度にフラグメンテーションしないことが望ましい。これによって、質量M1を有する未フラグメンテーションPCC又はプリカーサーイオンP1の一部分が、各スキャンに対する上昇エネルギー又はフラグメントイオンスペクトルに現れる。本明細書の技術は、次のことを判断してもよい。
1.P1が、スキャンS1のフラグメントイオン又はEEスキャンデータに現れるか。現れた場合、
2.スキャンS1に対するEEスキャンデータにおけるP1の強度を決定する。
PCC又はプリカーサーP1が、スキャンS1に対するプロダクト又はフラグメントイオンF1及びF2と関連付けられると判断されたものと仮定する。スキャンS1の場合、P1は、LE又はプリカーサースキャンにおける強度X1と、EEフラグメントイオンスキャンにおける強度X2とを有する。以下の関係R1は、検証基準に含まれてもよく、特定のスキャンS1のデータが有効であるために、真であると評価しなければならない。
関係R1
強度差X1−X2>スキャンS1のEEスキャンデータにおける全てのフラグメント又はプロダクトイオンの強度の合計
上記関係R1は、左側(LHS)の「X1−X2」を含む。X1が、フラグメンテーション前のLEデータにおけるP1の開始強度又は量を表し、X2が、フラグメンテーション後のP1の残りの強度又は量を表す場合、式X1−X2は、EEスキャンデータにフラグメンテーションイオンとして現れてもよい、P1の合計強度又は量に対する最大値又は上界を表す。R1の右側(RHS)は、スキャンS1のEEスキャンデータにおける全てのフラグメント又はプロダクトイオンの強度の実際の計算された合計であり、それによって、EEスキャンデータにおける全ての観察可能なフラグメントイオンの強度の合計が表される。R1のRHSは、R1のLHSによって表される最大値又は上界よりも小さいべきである。
本明細書の技術による一実施形態では、検証基準はまた、PCCとマッチするか又は関連付けられるものとして、各スキャンに対して決定されるフラグメントイオンの数を検査することを含んでもよい。図7を参照すると、一般に、PstartとHとの間の点に対するスキャン時間が増加するにしたがって(例えば、Pstartからピークの頂点まで上向きに移動する)にしたがって、マッチすべきフラグメントイオンの数は増加することが予期されることがある。それに加えて、Pstart及びHの包括範囲における点P1及びP2に対して、P1が、点P2と関連付けられる別のスキャン時間よりも短いスキャン時間を有する場合、点P1に対して決定された第1のセットに含まれる1つ又は2つ以上のフラグメントイオンが、点P2に対して決定された1つ又は2つ以上のフラグメントの第2のセットにも含まれることが予期される。同様の方法で、一般に、HとPendとの間の点に対するスキャン時間が増加する(例えば、ピークの頂点からPendまで下向きに移動する)にしたがって、マッチすべきフラグメントイオンの数は減少することが予期されることがある。それに加えて、H及びPendの包括範囲における点P3及びP4に対して、P3が、点P4と関連付けられる別のスキャン時間よりも短いスキャン時間を有する場合、点P4に対して決定された第1のセットに含まれる1つ又は2つ以上のフラグメントイオンが、点P3に対して決定された1つ又は2つ以上のフラグメントの第2のセットにも含まれることが予期される。
上述したように、特定のPCCに関するフラグメンテーションの結果として得られるフラグメントの予期される数は、特定のPCCによって変動することがあり、PCCの複雑性及び強度に応じて決まることがある。同様に、PCC又はプリカーサーイオンと関連付けられるものとして決定される、マッチしたフラグメント又はスキャン中のフラグメントの数は、PCC又はプリカーサーイオンの複雑性及び強度に応じて決まることがある。一実施形態では、スキャンにおいて予期される特定のPCCに対するマッチしたフラグメントの最小数は、LEスキャンにおけるPCCの強度、並びにPCCの複雑性に関連する(例えば、それを表す)PCCの属性を含む、基準に基づいて決定されてもよい。一実施形態では、スキャンにおけるPCCの複雑性を表す属性は、分子量Mr(分子の基本的組成に基づく無電荷質量)であってもよい。変形例として、一実施形態は、PCCの複雑性を表すのに使用される属性を分子と共に変動させてもよい。例えば、単純な又は小さい分子の場合、分子量Mr(分子の基本的組成に基づく無電化質量)が使用されてもよい。ペプチド、又はより複雑な分子の場合、Mrではなく、PCCの長さが推定されてもよい。PCC又はプリカーサーイオンの長さは、その複雑性に伴って変動してもよい。例えば、ペプチドなどの複雑な分子の場合、スキャンT1におけるPCCはアミノ酸鎖であり、決定される長さはアミノ酸鎖の長さであってもよい。
したがって、一般に、スキャンS1のPCCとマッチさせるか又は関連付ける必要があるフラグメントイオンの最小数は、そのスキャンS1のLEスキャンデータにおけるPCCの複雑性C及びPCCの強度Iを有する関数として表されてもよい(例えば、スキャンS1及びPCC又はプリカーサーイオンP1の場合、G(C,I)=スキャンS1においてP1とマッチされるか又は関連付けられるべきフラグメントイオンの最小数)。一実施形態では、フラグメントの最小数は、当業者の専門家知識及び最優良事例に基づいて予め定められてもよい情報を含む、図8に示されるものなどの、値の表を使用して決定されてもよい。かかる最小値は、例えば、異なるMS機器のメーカーによって供給又は決定される情報に基づいて提供されてもよい。
図8を参照すると、PCC又はプリカーサーイオンに関して予期される、マッチするフラグメントの最小数を決定する、本明細書の技術による一実施形態で使用されてもよい表の一例が示されている。表800は、PCC又はプリカーサーイオンの複雑性を表す属性の値の列802と、LEスキャンにおけるPCC又はプリカーサーイオンの異なる強度を表す値の列804と、マッチするフラグメントの最小数を同定する列806とを含んでもよい。したがって、表800の行は、同じ行の列802及び804にある値の特定の組み合わせに対して予期される、マッチするフラグメントの最小数を同定する。一実施形態では、列802の複雑性を表す属性は、任意の好適な属性であってもよく、例えば、分子量Mr、複雑な分子などのアミノ酸鎖の長さなど、そのいくつかの例が上述されている。
図8に示されるような表は、大量の干渉がある大誤差を除去するため、特定のスキャン時間のPCCに対して予期される、マッチするフラグメントイオンの最小数を指定するのに利用されてもよい。一実施形態では、表で指定された最小数は、例えば、50〜60%の範囲のフラグメンテーション効率に基づいてもよい(例えば、その場合、フラグメンテーション効率は、本明細書の他の箇所に記載される関係R1に基づいて経験的に決定されてもよい)。
一実施形態では、図8に示されるものなどの表の使用は、PCCに関して検出される曲線又はピーク(例えば、図7に示されるものなど)において、特定のスキャンに対する特定のPCCとマッチするか又は関連付けられるものとして決定される、フラグメントイオンのセットに対する検証基準及び検証処理と関連する最終ステップとして行われてもよい。
本明細書の技術による一実施形態では、マッチするフラグメントイオンが様々なスキャン時間において決定されている特定のPCCについて、検証基準がPCCのピークの上半分(例えば、LHSのFWHM(H1スキャン)からRHSのFWHM(H2スキャン)までに含まれる全てのスキャン時間に関して満たされない場合、曲線又はピーク上の他のスキャン点の更なる処理は行われなくてもよい。例えば、AR1、AR2、及びマッチするフラグメントイオンの最小数の検証基準が、PCCのピーク又は曲線の上半分のスキャンに関して満たされない場合、一実施形態は、代替の技術を使用してもよい。ピーク又は曲線の上半分のスキャンに関してマッチするフラグメントを決定するかかる処理は、上半分の任意のスキャン点のうち最初に生じたものが検証処理に失敗する(例えば、一実施形態で使用される検証基準に関して、AR1、AR2、マッチするフラグメントの最小数などが合格しない)と終了されてもよい。検証の失敗が、曲線又はピークの上半分における任意のスキャン時間に起こった場合、特定のPCCにマッチするフラグメントイオンを決定する代替の技術が利用されてもよい。検証の失敗が、PCCのピーク又は曲線の下側部分におけるスキャン(例えば、点PstartからH1までのスキャン、及びH2からPendまでのスキャンに関して起こった場合、処理は、下側部分の他の残りのスキャンを用いて継続してもよく、それにより、特定の失敗したスキャンに対して決定された任意のデータ又はフラグメントが除外される。
本明細書の技術による一実施形態はまた、特定の分子又は成分と関連付けられる各フラグメント又はプロダクトイオンに対して決定されてもよい、別のメトリックAR3(面積比3)を使用してもよい。フラグメントFiに対するAR3は次式のように表されてもよい。
AR3=フラグメントFi(強度)/PCCにマッチした全てのフラグメントの強度の合計
式中、
Fi(強度)は、PCCと関連付けられるフラグメントFiの強度、並びに、
「PCCにマッチした全てのフラグメントの強度の合計」は、PCCにマッチした全てのフラグメントの強度の数学的総和を表す。
一実施形態では、AR3は、特定のPCCとマッチするか又は関連付けられるものとして決定された各フラグメントイオンに対して、スキャンごと又はスキャン時間基準で(例えば、AR1値に関して本明細書に記載されるのと同様の方法で)決定されてもよい。フラグメントイオンF1に対してAR3値を使用して行われる検証処理は、(特定のPCCのピークにわたって)フラグメントイオンF1に対するスキャン1〜NのAR3値を比較してもよい。かかるAR3がある許容差内で全て同じではない場合、フラグメントF1はその特定のPCCとマッチしない(それにより、スキャンに対するA3の分母として合計されたフラグメントイオンは全て、スキャンにおいてPCCと関連付けられるか又はそれにマッチしたものとして判断される)。
したがって、教師なしクラスタリングのこの時点で、図7に示されるものなどの検出されたピーク又は曲線を有する各PCCに関して、ゼロ又はそれ以上のフラグメントのセットが、PCCのピークにわたる各スキャンに対して決定されてもよい。本明細書に記載されるものなどの検証基準を使用して、フラグメントイオンのかかるセットはそれぞれ、更にフィルタ処理又は改良されてもよい。検証基準及び関連する処理が、特定のスキャン時間における特定のフラグメントイオンセットに対して満たされないいくつかの場合では、フラグメントイオンセットは、廃棄されるか、又はそれ以上考慮されなくてもよく(例えば、スキャン時間が、本明細書の他の箇所に記載されるようなピークの下側部分にある場合など)、処理は他のスキャン時間からの他のフラグメントセットを用いて継続してもよい。検証基準及び関連する処理が、特定のスキャン時間における特定のフラグメントイオンセットに対して満たされないいくつかの場合(例えば、スキャン時間が、本明細書の他の箇所に記載されるような、点H1及びH2の間のピークの上側部分にある場合など)では、検証基準を使用する処理が停止して、検証基準を使用してピークにわたる他のスキャン時間からの他のフラグメントセットを評価してもよく、どのフラグメントイオンがPCCと関連付けられるかを判断する代替の技術を使用してもよい。
検証基準を使用する上述したような処理は、PCCの検出されたピークの異なるスキャン時間に対してフラグメントの複数のセットを決定する。この時点で、処理が行われて、PCCに対するSSPPISが形成されてもよい。かかる処理は、PCCの溶出ピークのスキャン時間にわたるフラグメントの複数のセットを組み合わせて、PCCと関連付けられる単一のフラグメントセットにすることを含んでもよく、それによって、PCCからのフラグメンテーション若しくは解離と関連付けられる、又はそれによって生成されるフラグメントのセットを表す。一実施形態では、PCCの検出されたピークのスキャン時間に対するフラグメントの複数のセットは組み合わされて、全てのかかる複数セットの合併集合としての単一のセットにされてもよく、それにより、組み合わされたフラグメントイオンの単一のセット及びPCCは、PCCに対するSSPPISを形成してもよい。
PCCのSSPPISを形成するにあたって、PCCの検出されたピークのスキャン時間にわたるフラグメントの複数のセットを組み合わせることの一部として、AR1、AR2、AR3、及び一実施形態で使用されてもよい他の任意のものなどの異なるメトリックの値が組み合わされてもよい。一実施形態では、平均が、AR1、AR2などに対して決定されてもよい。例えば、PCCのピークにわたる12の点又はスキャン時間、及び関連する12のAR2値(12の点に対して1つずつ)がある場合、平均AR2値は、かかる12のAR2値全ての平均としてPCCに対して決定されてもよい。フラグメントイオンF1は、12のスキャン時間のうち8つのフラグメントイオンセットに現れてもよく、このF1は8つのAR1値(8つのスキャン時間に対して1つずつ)を有し、平均AR1値は、かかるAR1値全ての平均としてF1に対して決定されてもよい。同様に、平均は、本明細書に記載される他の面積又は強度比メトリック(例えば、フラグメントイオンに対するAR2)に対して決定されてもよい。平均はまた、PCC及び/又はPCCと関連するフラグメントイオンと関連する1つ又は2つ以上の他の属性に対して得られてもよい(例えば、PCCに対してマッチされる単一のフラグメントイオンセットに含まれる)。例えば、一実施形態では、フラグメントイオンのm/zは、フラグメントイオンの平均m/z値(例えば、フラグメントイオンが現れる全てのスキャン時間のEEスキャンデータに対する平均m/z)であってもよい。変形例として、一実施形態は、ピークの頂点又は点Hのスキャン時間に生じる、フラグメントイオンのm/z値を使用してもよい。
処理のこの時点で、フラグメントの単一のセットは、各PCCと関連付けられるか又はそれに対してマッチされてもよく、それにより、SSPPISが各PCCに対して作成されている。例えば、図6を参照すると、処理は、フラグメントセット614aがPCC1 610と関連付けられ、フラグメントセット614bがPCC2と関連付けられ、フラグメントセット614cがPCC3と関連付けられていると判断している。処理は、次に、特定の溶出成分又は分子と関連付けられる、PCC(及び関連若しくはマッチしたフラグメントイオン、またしたがってかかるSSPPISのグループ化)を更にグループ化するか又は組み合わせるように行われてもよい。例えば、処理は、特定の3つのPCC 610a〜cに対して3つのSSPISを選択しグループ化するように行われ、それによって、これら3つのPCCが、P1 602など、同じ溶出成分又は分子から発することを表してもよい。したがって、3つのPCC 610a〜c及びそれらの関連するフラグメントイオンセット614a〜cを(上記と関連付けられる属性と共に)グループ化した凝集の結果は、溶出成分又は分子の指紋若しくはパターンに含まれる情報である。単一の溶出成分又は分子の指紋の情報を含む上記凝集の結果はまた、本明細書では、CPPIS(複合プリカーサー−プロダクトイオンスペクトル)と呼ばれることもある。
組み合わされてCPPISとなる特定のSSPPISは、任意の好適な技術を使用して、マッチしたセットとして決定されてもよい。例えば、一実施形態は、SSPISのそれぞれの検出されたピークそれぞれの各スキャン時間において、PCCの(指定の許容差内の)同じ相対分子量Mrをマッチさせることによって組み合わされるマッチしたセットとして、3つのPCC 610a〜cに対する3つのSSPPISを決定してもよい。それに加えて、処理は、マッチしたセットの各SSPPISにおいてPCCに対して検出されたピークのそれぞれが、各ピークが(ある指定の許容差内の)ほぼ同じスキャン時間ウィンドウに現れる、同様のピーク形状及びプロファイルを有することを担保してもよい。マッチしたセットの各SSPPISのうちどのプロダクトイオンが組み合わされるべきであるかを検証する処理は、更に、SSPPIS内及びSSPPIS間でm/z、AR1、及びAR2を使用することを含んでもよい。したがって、プリカーサーのAR2値は、ガウス型にしたがうことが予期される。したがって、SSPPISは、それらのm/z、AR1、及びAR2の値が(ある許容差内で)一貫していない場合に、マッチしたセットから除外されてもよい。
一実施形態では、マッチしたセットの各SSPPISからのフラグメントイオンセットは、溶出分子又は成分に対してCPPISフラグメントイオンセットを形成するように、合併集合動作と同様に、組み合わされてもよい。例えば、図6を参照すると、CPPISフラグメントイオンセットは、614a〜cのフラグメントの合併集合として決定されてもよい。代替例として、処理は更に、614a〜cにおけるフラグメントの合併集合として決定された、CPPISフラグメントイオンセットに含まれるフラグメントイオンを更にフィルタ処理又は還元してもよい、追加の検証処理を行うことを含んでもよい。
CPPISを作成する際に単一の溶出成分又は分子に対するSSPPISのかかる凝集を行うことと関連して、関連する属性(m/z、AR1、AR3などのメトリックを含む)、並びにPCC及びそれに関連するフラグメントイオンの測定もまた、組み合わされてもよいことが注目されるべきである。一実施形態では、AR1及びAR3に対するエラーインジケータも、それらの関連するCVであってもよい。
当該分野で知られているように、AR1若しくはAR3などのメトリックに関する変数又はCVの係数は、次式に表される、標準偏差σと平均μの比として定義されてもよい。
CVは、個体群の平均に関する変動性の程度を示す。したがって、例えば、フラグメントイオンF1のAR1に対するCVは、PCCのピークにわたって、あるいは溶出成分又は分子と関連付けられる全てのPCC若しくはSSPPISCVに関して、F1の強度と関連付けられる一貫性の誤差又はレベルを表すのに使用されてもよい。
図9を参照すると、教師なしクラスタリングに関する本明細書の技術による一実施形態で行われてもよいものを要約した、処理のフローチャートが示されている。フローチャート1200は、上述された処理を要約している。ステップ1202で、サンプルを使用して、HEスキャンデータ及びLEスキャンデータを得る実験が行われてもよい。サンプルは、1つ又は2つ以上の溶出成分又は分子を含んでもよい。ステップ1204で、LEスキャンデータにおけるイオンのPCCを決定する処理が行われてもよい。ステップ1205で、各PCCに対してピーク検出が行われてもよい。ステップ1206で、PCCのそれぞれに対して、AR1値、AR2値、及び他の基準を含む検証基準と関連する、PCCと関連付けられる(例えば、マッチする)フラグメントイオンのセットを決定する処理が行われてもよい。検証基準は、最初のフラグメントイオンをフィルタ処理又は改良し、各PCCに対して改訂されたフラグメントイオンセットを決定するのに使用されてもよい。ステップ1208で、検証処理の失敗によって、関連するフラグメントイオンのセットとマッチしないPCCのそれぞれに関して、関連するフラグメントイオンのセットを決定する代替の技術が使用されてもよい。ステップ1210で、SSPPISが各PCCに対して決定され、PCCとそのPCCから発するフラグメントイオンの関連するフラグメントイオンセットとを含む、PCCに対するSSPPISを形成する処理が行われてもよい。ステップ1212で、溶出成分又は分子に対してCPPISを構築する処理が行われてもよい。CPPISは、溶出成分又は分子から発するPCCをそれぞれ含む、SSPPISの1つ又は2つ以上のセットを決定することによって、各溶出成分又は分子に対して決定される。溶出成分又は分子のCPPISは、1つ又は2つ以上のSSPISのセットを組み合わせることによって構築される。CPPISは、溶出分子の指紋として使用されてもよい。
図9と関連して、本明細書の他の箇所の記載と一致する処理の場合、SSPPISは各LE単一スキャンの各PCCに対して作成されてもよく、プロダクトイオンは比較のEEスキャンから得られる。比較のEEスキャンにおけるプロダクトイオンは、(親プリカーサーに対する強度及びm/zによるフィルタ処理を通して)各単一のPCCと共有されて、固有のSSPPISが作成される。
図10を参照すると、本明細書の技術による一実施形態で、図9のステップ1206で行われてもよい処理(例えば、PCCのそれぞれと関連付けられるフラグメントイオンのセットを決定する)の更なる詳細を提供するフローチャート1250が示されている。フローチャート1250は、各PCCに対して行われてもよい。ステップ1214で、関連するピークを有するPCCに対して、H又はPP(PCCの最大強度を有する頂点にある)、H1及びH2(FWHMスキャン点)に対応するピークのスキャン時間/点を決定する。ステップ1216で、FWHMスキャン点H1及びH2の場合、H1は第1の現在のスキャン点C1であり、H2は第2の現在のスキャン点C2である。ステップ1218で、AR1及びAR2値がC1及びC2に対して決定される。ステップ1220で、検証基準にしたがって(例えば、m/z、AR1値、及びAR2値、及び他の基準によってフラグメントイオンをマッチさせることによって)、C1に対する第1のマッチするフラグメントイオンセット及びC2に対する第2のマッチするフラグメントイオンセットを決定する処理が行われる。ステップ1222で、第1及び第2のマッチするフラグメントイオンセットが検証基準に合格したか否かに関して判断が行われる。合格しなかった場合、処理はステップ1224に進んで、PCCに対するフラグメントイオンセットを決定する代替の技術が使用されてもよい。ステップ1222が「はい」と評価した場合、制御はステップ1226に進んで、処理がPCCピークの上側部分にある全ての点に関して完了しているか否かの判断が行われる。ステップ1226が「はい」と評価した場合、制御はステップ1228に進んで、PCCピークの下側部分にある残りのスキャン点(例えば、PstartからH1まで、及びH2からPendまでのスキャン点)の処理を行い、下側部分のSSPPISのH1をPstartに、H2をPendにマッチさせることに関連して、スキャンHのSSPPISにおけるより多量のマッチするプロダクトイオンのみが、一貫したAR1及びAR2比とマッチするという点で、更なるフィルタ処理が達成される。
ステップ1226が「いいえ」と評価した場合、制御はステップ1230に進んで、ピークの上側部分における中点C1及びC2の次のセット(例えば、スキャンH1からH2までの上側部分にあるスキャン点の次のセット)が決定される。本明細書に記載されるように、中点の次のセットはそれぞれ、Hと現在の点C1、C2の間、又はPstartとC1、及びC2とPendとの間で、スキャン時間又は距離を半分にすることによって決定されてもよい。ステップ1230から、制御は1218に進んで、スキャン点の次のセットが処理される。
図11を参照すると、PCCピークの下側部分にある残りのスキャン点を処理する、本明細書の技術による一実施形態で行われてもよい処理ステップのフローチャートが示されている。フローチャート1300は、図9のステップ1228で行われてもよい処理の更なる詳細を提供する。ステップ1302で、処理は、ピークの下側部分にある中点C1、C2の次のセットを決定してもよい。ステップ1302は、図10のステップ1230に類似しているが、中点がPCCピークの下側部分に位置することが異なる。ステップ1304で、AR1及びAR2値がC1及びC2に対して決定される。ステップ1304は、図10のステップ1218に類似している。ステップ1306で、検証基準にしたがって、C1に対する第1のマッチするフラグメントイオンセット及びC2に対する第2のマッチするフラグメントイオンセットを決定する処理が行われる。ステップ1306は、図10のステップ1220に類似している。ステップ1308で、第1及び第2のマッチするフラグメントイオンセットが検証基準に合格するか否かに関して判断が行われる。ステップ1308は、図10のステップ1222に類似している。ステップ1308が「いいえ」と評価した場合、処理はステップ1312に進んで、検証基準に合格しないフラグメントイオンセットを除外する。制御はステップ1310に進む。ステップ1308が「はい」と評価した場合、制御はステップ1310に直接進む。ステップ1310で、PCCピークの下側部分にある全てのスキャン点に対して処理が行われたか否かの判断が行われる。処理が行われた場合、処理は停止する。そうでなければ、ステップ1310が「いいえ」と評価した場合、制御はステップ1302に進む。
図12を参照すると、本明細書の技術による一実施形態において、溶出成分又は分子に関してCPPISに含まれ、溶出成分又は分子を同定する指紋として使用されてもよい、情報の一例が示されている。例900は、第1の列PCC 902と、第2の列の関連するフラグメント又はプロダクトイオン904とを有する表を含む。表の各行は、本明細書の技術を使用して決定されてもよいような、PCCと、それに関連付けられるか又はマッチしたフラグメントイオンとを表す。例は、2つの関連するPCCであるPCC1及びPCC2を有する分子を示しており、PCC1及びその関連するフラグメントイオンは行910に含まれ、PCC2及びその関連するフラグメントイオンは行912に含まれる。一般に、各行910、912は、PCC及びその関連するフラグメントイオンに対する、様々な属性などの情報を含んでもよい。更に例証するため、要素930は、本明細書の技術による一実施形態で生成され使用されてもよいような、行910の上方に関する更なる詳細を提供する。行912は、例900には示されないが、930と同様の情報を含んでもよい。
要素930に示されるように、PCC1はフラグメントイオンF1及びF2と関連付けられてもよい。PCC1の属性は、m/z及び電荷状態zを含む。各フラグメントF1、F2の属性は、m/z、AR1、AR3、AR1及びAR3に対するCV、並びに本明細書に記載され当該分野で知られているような他の属性を含んでもよい。PCC及びフラグメントイオンに対して、本明細書の技術による一実施形態で記憶されてもよいような他の属性は、例えば、疎水性値、ドリフト時間、又はイオンモビリティーが使用される場合の衝突断面積(CCSA)などを含んでもよい。
個々のフラグメントイオン及びPCCと共に、また各分子の指紋と共に、図12に示されるCVなどの1つ又は2つ以上の誤差値が記憶されてもよい。本明細書に記載される、かかる誤差値は、指紋データの一貫性又は適合度の基準としてのCVを含んでもよい。一般に、関連するCVを有する教師なしクラスタリングを使用して生成されるデータのパターン又は指紋を使用して同定される分子の場合、1つ又は2つ以上の関連するCVによって示されるものなどの一貫性が大きいほど、結果として得られるデータが良好である。更に一般的には、CV以外のエラーインジケータが、本明細書の技術による一実施形態で使用されてもよい。例えば、CVよりもむしろ、一実施形態は、一般に、標準偏差、変数など、任意の好適なエラーインジケータ又は一貫性インジケータを使用してもよい。
図12に含まれる各PCCに関して、PCCの同位体パターン又はクラスタ(例えば、図6の604によって表されるものなど)が記憶されてもよいことが注目されるべきである。
本明細書の技術による一実施形態は、(同じ成分若しくは分子を含む、同じサンプル又は異なるサンプルに対して)教師なしクラスタリングを複数回繰り返し、データの集合的結果を組み合わされた形でライブラリ又はデータベースに記憶してもよい。したがって、教師なしクラスタリングは反復する形で行われてもよく、反復ごとに、全ての反復に対して得られた分子の組み合わされた又は集合的な指紋の結果が最新のものに更新される。更なる反復が行われるにしたがって、分子の指紋と関連付けられたCV又は他のエラーインジケータも更新されて、行われたかかる反復全てが反映される。
教師なしクラスタリングの複数の例からの指紋情報を組み合わせることと関連して、第1の分子に対する第1の指紋情報は、マッチング基準に基づいて、現在ライブラリ又はデータベースにある既存の第2の指紋情報に対するマッチとして決定されてもよいことが注目されるべきである。かかるマッチング基準は、一般に、m/z、スキャン/保持時間、ドリフト時間などの属性を含む1つ又は2つ以上の属性と、指紋のPCC及び/又はフラグメントと関連付けられた1つ又は2つ以上の面積又は強度比(例えば、AR1、AR2、AR3)などのメトリックとの間での、マッチ(指定の許容差内)を決定することを含んでもよい。
かかるマッチング基準は、例えば、スキャン時間、m/z、及びAR1、AR3値など)に基づいて、(許容差内で)マッチする、統計的に顕著な数(ライブラリ内の他の全てのCPPISに対するマッチしたプロダクトイオンの相対数)のマッチするフラグメントがあるか否かを判断することを含んでもよい。かかるマッチが判断された場合、第1の指紋情報は、既存の第2の指紋情報と組み合わされてもよい。CPPISのかかる組み合わせは、更に、繰り返すm/z値のみに指紋を限定し、任意の関連するメトリック(例えば、AR1値、AR3値など)と、CVなどのエラーインジケータとを更新することによって、指紋をフィルタ処理する。組み合わされた形態で維持されるAR1値などの関連するメトリックは、例えば、メトリックの平均値であってもよい。AR1値は、指紋における任意のマッチされ検証されたプロダクトイオンの強度を所与として、PCCの強度値を推定するのに利用することができる。
教師なしクラスタリングの複数の例からの指紋情報を組み合わせることと関連して、第1の指紋情報がマッチング基準による既存の分子の指紋にマッチしないと判断された場合、新しい分子に対する第1の指紋情報が、新しい指紋としてライブラリ又はデータベースに追加されてもよいことが注目されるべきである。
特定数の教師なしクラスタリングの反復が行われた後などの第1の時点で、全ての分子に対して結果として得られた集合的な指紋データを評価する、追加の処理が行われてもよい。かかる評価は、指紋データと関連付けられるCV及び他のエラーインジケータを検査して、どのプリカーサー及び/又は関連するフラグメントが、特定の分子を同定する際に「最良に」又は最も一貫しているかを判断することを含んでもよい。
例えば、第1のPCCと第2のPCCとの間で比較される第1のフラグメントは、比較したときに、低いエラー(例えば、指定の閾値よりも低いなど)又は高い一貫性を示す関連するCVと、高いエラー又は低い一貫性(例えば、指定の閾値よりも高いなど)を示すAR1値及び/又はAR2値と関連付けられる第2のフラグメントと、を有する、AR1及び/又はAR2値を有してもよい。第2のフラグメントのAR1及び/又はAR2値のCV(第2のPCCに対する第1のPCC、若しくは第2のCPPISに対する第1のCPPIS)など、これらのエラーインジケータに基づいて、評価の間、第2のフラグメントがデータベースから除去されるべきであると判断され、教師なしクラスタリング技術を使用して観察された結果の高いエラー若しくは容認不能な非一貫性により、PCCのSSPPIS又はCPPISと実際には関連付けられないと判断されてもよい。ライブラリ又はCPPISに含まれてもよいものなどの第1のフラグメントのAR1値に対するCVなど、エラーインジケータに基づいて、評価の間、教師なしクラスタリング技術を使用して観察された低いエラー及び一貫性により、教師なしクラスタリングの繰り返される実施によって第1のフラグメントがPCCと関連付けられることが確認されていると判断されてもよい。したがって、かかる評価の結果として、組み合わされたか又は集合的な結果は、例えば、評価に基づいて分子と関連付けられる指紋の1つ又は2つ以上の特定のフラグメントを除去及び/又は追加するなど、改訂又は更新されてもよい。かかる評価は、指紋のPCCが残されるか、あるいは、プリカーサーと関連付けられるAR1値に対するCVなどのエラーインジケータを使用して指紋から除去されるべきであるかを判断してもよい(例えば、AR1値などの1つ又は2つ以上の関連するエラーインジケータが、フラグメントイオンに関して上述したような方法で指定の閾値レベルを満たさない場合、PCCを除去若しくは除外する)。
図13を参照すると、本明細書の技術による一実施形態で行われてもよい、処理ステップのフローチャートが示されている。フローチャート1000は上述された処理を要約している。ステップ1002で、結果として得られるSSPISの現在のセットが生成され、次に更に1つ又は2つ以上のCPPISへとグループ化される場合において、教師なしクラスタリングが行われてもよい。ステップ1004で、CPPISの現在のセットは、教師なしクラスタリング技術の前の実行から得られるデータを含む、既存の組み合わせデータセットなど、任意の既存のデータと組み合わされてもよい。ステップ1004は、分子の指紋を表すプリカーサーイオン及び関連するフラグメントイオンの結果を組み込んだ、現在の組み合わせデータセットをもたらしてもよい。ステップ1004は、合併集合にあるデータセットを組み合わせることで得られてもよく、それにより、指紋のフラグメント又はPCCが除去されてもよい。組み合わせデータセットは、例えば、ライブラリ又はデータベースに記憶されてもよい。
ステップ1006で、評価処理を行う時間か否かに関して決定がなされる。上述したように、ステップ1006は、例えば、教師なしクラスタリングの指定数の反復が行われたか否か、指定の時間量が経過したか否かなどを判断することを含んでもよい。ステップ1006が「いいえ」と評価した場合、制御はステップ1002に進む。ステップ1006が「はい」と評価した場合、制御は、ステップ1008に進んで、教師なしクラスタリングの複数の実行から生成された、組み合わされた情報を含むライブラリ又はデータベースの現在のバージョンなど、現在の組み合わせデータセットを評価する。ステップ1008で、現在の組み合わせデータセットを評価する評価処理が行われる。本明細書の他の箇所に記載されるように、かかる評価は、分子を同定する各指紋、指紋のイオンなどと関連付けられたエラーインジケータを検査して、組み合わせデータセットに対する何らかの更新又は改訂が必要か否かを判断することを含んでもよい。かかる更新又は改訂は、ステップ1008の評価にしたがって、ステップ1010で行われてもよい。ステップ1008及び1010は、例えば、プリカーサー又はPCCと関連付けられたどの1つ又は2つ以上のフラグメントが指紋に残るべきか、またプリカーサー又はPCCと関連付けられたどの1つ又は2つ以上のフラグメントが指紋から除去されるべきか、指紋のどの1つ又は2つ以上のプリカーサー又はPCCが残るべきか、また指紋のどの1つ又は2つ以上のPCC(及び関連するフラグメント)が除去されるべきかを判断する。ステップ1010は、例えば、フラグメントイオンのAR1、AR2、及び場合によってはAR3値に対してCVを使用するなどして、PCCと現在関連付けられているフラグメントイオンを指紋から除去すべきか否かを判断することを含んでもよく、それによって、同定する目的で、フラグメントイオンがPCC又はプリカーサーと実際には関連付けられていないと結論付けられる。ステップ1012で、ステップ1010の結果として生成された、更新された組み合わせデータセットは、分子を同定する指紋のライブラリ又はデータベースとして使用されてもよい。
したがって、フローチャート1000は、教師なしクラスタリングを複数回反復した結果を、分子を同定するのに使用される各指紋と関連付けられたエラーインジケータ又は一貫性インジケータにしたがって改訂又は更新されている組み合わせデータセットに組み込むことが行われてもよい、プロセスについて記載している。フローチャート1000の出力は、例えば、分子を同定するのに使用されるライブラリ又はデータベースの特定のバージョンであってもよい。フローチャート1000の処理は、1回以上繰り返されて、ライブラリ又はデータベースの第2及び更なるその後のバージョンを決定してもよい。このように、フローチャート1000の処理は、ライブラリ又はデータベースとして使用される、検証され改良された組み合わせデータセットを生成するように行われてもよい。改良された組み合わせデータセットは、教師なしクラスタリングを使用することによって決定される指紋を有する既知の分子を含むサンプルを使用して、繰返し実験を行うことによって生成されてもよい。
一実施形態では、フローチャート1000の処理は、指紋と関連付けられたエラー又は一貫性インジケータが指定の閾値レベルを満たし、それによって指紋データが「定常状態」にあることが示されるまで繰り返されてもよい。例えば、かかる処理は、教師なしクラスタリングを使用して得られた指紋が、指紋が指定の一貫性レベル内で一貫している(例えば、教師なしクラスタリングによって得られた集合的データ中の相対的な一貫性を表す、指定の閾値未満のCV値を有する)ことを判断するのに使用される、結果として得られる集合的データを示す、関連するエラー又は一貫性インジケータを有するまで行われてもよい。分子を同定する指紋に対して得られるかかる一貫性は、指紋が分子を適正に同定し、指紋が指紋のPCCをその1つ又は2つ以上のフラグメントイオンと適正に関連付けているという点で、関連する高レベルの信頼度を表す。
本明細書の技術による一実施形態は、異なる機器タイプに対して、あるいはより具体的には、イオンの解離又はフラグメンテーションに使用される異なる技術それぞれに対して、異なるライブラリ又はデータベースを生成及び/又は利用してもよい。例えば、本明細書の技術は、フラグメンテーションのために衝突セルを使用するMS機器に対する第1のライブラリ又はデータベース、イオントラップMS機器であるMS機器に対する第2のライブラリ又はデータベースなどを生成及び/又は利用してもよい。
一貫したデータを有する検証されたライブラリが教師なしクラスタリングを使用して生成されると、サンプルが特定の分子を含むか否かを同定するため(同定の前にサンプルが特定の分子を含むか否かが不明の場合)、ライブラリの指紋に対する比較が行われてもよい。例えば、本明細書の他の箇所に記載されるように、検証されたライブラリが教師ありクラスタリングと関連して使用されてもよい。それに加えて、検証されたライブラリはまた、サンプルに対する差又は異形を更に同定するため、特定の分子を含むことが分かっているサンプルと共に使用されてもよい。例えば、サンプルは、ライブラリの第1の指紋を有する、第1のペプチドなどの第1の分子を含むことが分かっていてもよい。サンプルはまた、他の分子を含んでもよい。このように、本明細書の他の箇所に記載される教師ありクラスタリングなど、サンプルの処理は、第1の指紋を生成することが予期される。サンプルを処理したときにやはり生成された、更なるアンマッチしたイオン(例えば、検証されたライブラリのいずれの分子にもマッチしないPCC及び/又はフラグメントイオン)が存在する場合、それらの更なるアンマッチしたイオンは、サンプル中にやはり存在する別の分子又は成分による干渉の結果として生成されたものであることがある。
一般に、複数の実験によるSSPPISは、個別に記憶されてもよく、又は別の方法で、本明細書ではデータベースに記憶されたCPPISとも呼ばれるものなど、任意の好適な組み合わされた形態で記憶されてもよいことが注目されるべきである。本明細書の技術による一実施形態では、本明細書の技術は、SSPPISの形態でデータ上で動作してもよく、SPPISを生成してもよい。SPPISは、組み合わされた形態又はCPPISなどの組み合わせデータセットの形で記憶されてもよい。CPPISは、本明細書に記載される処理に用いるため、それに関連するSSPPISの形に分解されてもよい。
以下、教師ありクラスタリングに関連して使用されてもよい技術について記載する。教師ありクラスタリングは、既知の標的化合物(指紋データベース若しくはシミュレートされたデータベースからのものなど)のPCC及び関連するフラグメントイオンを、サンプルの実験結果から得られたSSPPISと比較することによって、教師ありCPPISを作成することを指し、それにより、かかる比較は、保持時間、ドリフト(IMSが行われた場合)、m/z、AR1、AR2、及びマッチしたプロダクトイオンが既知のものの場合はAR3に関して、マッチ及び許容差の既知のセットを使用してもよい。
一般に、教師ありクラスタリングでは、分子に関する既知の指紋又はパターンを有する標的ライブラリ(例えば、どの指紋が特定の溶出成分又は分子に関するものであるかのライブラリ)が存在する。実験(例えば、LC/MS若しくはLC/MS/IMS実験など)が行われる所与のサンプルに関して、実験データは、本明細書に記載される教師ありクラスタリング技術を使用して処理されて、サンプルが既知の分子又は溶出成分を含むか否かが判断されてもよい。かかる判断は、サンプルの実験データが、ライブラリから得られてもよいような、既知の分子の既知のパターン又は指紋にマッチするか否かを判断することによって行われてもよい。既知の分子の指紋情報を含む標的ライブラリは、任意の好適な方法で生成又は取得されてもよい。例えば、標的ライブラリは、本明細書に記載されるような教師なしクラスタリングを使用して生成される、検証されたライブラリのバージョンであってもよい。標的ライブラリに対するデータは、例えば、シミュレータなどを使用して生成されてもよい。教師ありクラスタリングによれば、例えば、サンプルの実験データセットを分析した結果としてPCCが得られてもよい。ライブラリに問い合わせて、ライブラリ内にPCCに関する既存の情報があるか否かを判断する、処理が行われてもよい。かかる判断は、実験データセットから得られるようなPCCの属性情報を、ライブラリ内のPCCの属性情報とマッチさせることによって行われてもよい。PCCに関するかかる属性情報は、例えば、m/z、AR1、AR3値などを含んでもよい。
本明細書の技術による一実施形態は、例えば、参照により本明細書に組み込まれる、Geromanos,S.J.,Hughes,C.Golick,D.,Ciavarini,S.,Gorenstein,M.V.,Richardson,K.,Hoyes,J.B.,Vissers,J.P.C.、及びLangridge,J.I.(2011)、Simulating and validating proteomics data and search results.Proteomics,Volume 11、Issue 6:1189〜1211に記載されているような、シミュレータ又はモデリングソフトウェアを使用してもよい。
マッチするPCC入力が標的ライブラリに見出された場合、教師なしクラスタリングに関して本明細書の他の箇所に記載されるように、標的ライブラリからのPCCの情報を使用して、更なる処理が行われてもよいが、頂点又はピークスキャン(例えば、PP若しくはHスキャン)のスキャンデータを使用するのではなく、PCCに関するライブラリからの標的指紋を使用して処理が行われる点が異なる。例えば、Hスキャンからのフラグメントを使用又は比較するのではなく、PCCに関するライブラリからのフラグメントが使用される。更に例証するため、教師なしクラスタリングを行ったときなどの、HスキャンのフラグメントをH1及びH2スキャンのフラグメントと比較するのではなく、教師ありクラスタリングは、別の方法として、実験データから得られたH1及びH2スキャンのフラグメントを、ライブラリから得られたPCCのフラグメントイオン情報と比較する。一実施形態では、第1の例において、ライブラリからのフラグメントはm/zによってHスキャンとマッチされる。これらのマッチしたプロダクトイオンには、次に、教師なしクラスタリングに関して記載されるのと同一の処理が行われる。
教師ありクラスタリングを用いて、LEスキャンデータにおけるPCCを決定するのに分析されるスキャンデータセットを得るため、教師なしクラスタリングを用いて上述したように、サンプルを使用して実験が行われる。次に、更なる処理が、ライブラリからのPCCにマッチする生成されたデータの特定のPCCに対して行われてもよい。例えば、生成されたデータは、ライブラリ内のPCC1にマッチするm/zを有するPCC1の溶出ピークを含んでもよい。教師なしクラスタリングについて本明細書の他の箇所に記載されるように、LEスキャンデータにおいてPCC1に関して検出されたピークが検査されて、分子の溶出ピークを特徴付ける条件を満たすことが担保されてもよい。例えば、検出されたピークは、ピークのスキャン点における強度の適切な分布(例えば、Pstartから頂点まで増加し、頂点からPendまで減少する)を有するはずである。
この例を続けると、ライブラリは、PCC1が15のフラグメントイオンF1〜F15と関連付けられることを示している。教師なしクラスタリングのようにEEスキャンデータをスキャンHからのフラグメントと共に使用するのではなく、教師ありクラスタリングの処理は、フラグメントイオンF1〜F15と、ライブラリから得られた関連する属性及び情報とを使用して行われる。教師なしクラスタリングと同様に、かかる処理は、第1の数のフラグメントが、PCC1に関するライブラリ内のF1〜F15とスキャンH1に関するEEデータ中のフラグメントとの間で一致することを判断してもよい。同様に、スキャンH2の場合、第2の数のフラグメントが、PCC1に関するライブラリ内のF1〜F15とスキャンH2に関するEEデータ中のフラグメントとの間でマッチすると判断する処理が行われてもよい。かかるマッチするは、教師なしクラスタリングに関連して上述されたような検証基準及び処理を使用して行われてもよいが、HスキャンからではなくライブラリからのPCC1の情報を使用する点が異なる。例えば、PCCの溶出ピークのスキャンに関するフラグメントイオンセットは、フラグメントに関するAR1、AR2、及びAR3値、又はそれらの任意の組み合わせに基づいて、m/zのマッチ及び強度比のマッチにしたがって、ライブラリ内のF1〜F15の情報に対してマッチされてもよい。AR値は、実験的計算との比較のため、ライブラリに含まれてもよいことが注目されるべきである。
以下、教師なしクラスタリングについて本明細書の他の箇所に記載されるものではなく、教師ありクラスタリングで使用される、様々なメトリックに関する違いの更なる詳細について記載する。
1つの違いは、AR1、AR2、及びAR3のメトリック計算が、m/zによってライブラリフラグメントにマッチするプロダクトイオンに対してのみ行われることである。教師なしクラスタリングと同様に、教師ありクラスタリングは、m/z(ある許容差内)によってライブラリフラグメントイオンをHスキャンにマッチさせることによって始まり、その後の全ての処理は教師なしクラスタリングと同一である。
教師なしクラスタリングに関連して、処理は次に、H1及びH2スキャンに関するフラグメントイオンデータ又はEEスキャンデータを検査する。スキャンH1の場合、EEスキャンデータを検査し、スキャンH1からのEEスキャンデータのどのフラグメントイオンが、ライブラリ内のPCC情報のフラグメントイオンF1〜F15のいずれかにマッチするかを判断する。教師なしクラスタリングに関連して記載されるように、かかるフラグメントのマッチは、m/z、AR1、AR2、及びAR3の強度比値(指定の許容差内)をマッチさせることによって、スキャンH1とライブラリとの間で判断されてもよい。
このように、ライブラリ内で同定されるようなPCCのフラグメントイオンと、スキャンH1に対するEEスキャンデータのフラグメントとの間で、PCCに関してマッチするフラグメントの第1のセットを決定する、処理が行われる。また、同様に、ライブラリ内で同定されるようなPCCのフラグメントイオンと、スキャンH2に対するEEスキャンデータのフラグメントとの間で、マッチするフラグメントの第2のセットを決定する、処理が行われる。例えば、次の場合に、ライブラリ内のフラグメントF1は、スキャンH1のフラグメントF1’’にマッチすると判断される。
ライブラリ内のF1のm/zが、ある指定の許容差内で、スキャンH1のF1’’のm/zにマッチし、並びに、
次式のように計算される強度比IR
IR=スキャンH1におけるF1’’の強度/HからのF1の強度
が、ある指定の許容差内で、同じ2つのスキャンH1及びHに対するPCC強度のAR2値にマッチする。第2の実施形態として、ライブラリからのF1などのフラグメントイオンの予測強度は、F1のAR1値を使用して得られてもよい。特に、F1の推定強度はマッチしたPCCから得られてもよく、それにより、ライブラリからのAR1値は、スキャンH1のPCCの強度によって乗算されてもよい。同様に、ライブラリから得られる任意のフラグメントイオンのAR1値は、溶出ピークの任意のスキャンにおけるPCC強度を決定するのに使用されてもよい。本明細書の他の箇所に示されるように、AR1=プロダクトイオンの強度/プリカーサーイオン又はPCCの強度である。そのため、PCC強度を所与として、フラグメントイオンの強度は、フラグメントイオンのAR1×PCC強度を乗算することによって得られる。
PCCピークの各スキャン時間におけるフラグメントイオンセットの検証処理は、教師なしクラスタリングを用いて本明細書の他の箇所に記載されるように行われて、PCCのピークのそれらのスキャン時間に対して、PCCに関するライブラリ内のフラグメントイオンとEEスキャンデータに含まれるフラグメントイオンとの間のマッチが判断されてもよい。例えば、上述されたように、処理は、スキャンH1及びH2に関するAR2値にしたがって、それらに関するライブラリ内のマッチするフラグメントF1〜F15の数を判断してもよい。次に、スキャンH1に対して決定される第1のマッチするフラグメントセット、及びスキャンH2に対して決定される第2のマッチするフラグメントセットについて、検証処理が行われる。かかる検証処理は、教師なしクラスタリングを用いて本明細書の他の箇所に記載されるような、1つ又は2つ以上の検証基準を使用することを含んでもよい。教師なしクラスタリングと同様に、かかる検証処理は、AR1値を使用してAR2値を検証すること、及び関係R1が真であるか否かを判断すること(即ち、フラグメントイオンの強度はそのPCCの強度よりも大きくてはならない)を含んでもよい。AR1メトリックは、教師なしクラスタリングに関して本明細書の他の箇所に記載されるように、教師ありクラスタリングにおいて決定されてもよい。検証処理は、ライブラリ内に表されるフラグメントイオンF1に関して、PCCのピークにおけるスキャンのAR1値を比較してもよい。PCCのピークの全てのスキャンに関する全てのかかるAR1値(実験データセットを使用して決定されるような)が、ある許容差内で、ライブラリからのF1のAR1値にマッチしない場合、フラグメントF1はPCCとマッチせず、その強度はAR1及びAR2値の計算に使用される。
かかる検証処理は、H1に関する第1のマッチするセット及びH2に関する第2のマッチするセットのそれぞれにおけるマッチするフラグメントの数が、少なくとも指定の最小数であるか否かを判断すること(例えば、本明細書の他の箇所で考察される、図8の表を使用して決定されてもよいなど)を含んでもよい。教師ありクラスタリングに対して行われるかかる処理は、AR2値、並びに最小数を満たすマッチするフラグメントの関連する数を各スキャンが有するか否かの検証基準に関して、教師なしについて上述されたようなものと同様である。例えば、PCCのピークスキャンH1及びH2の間でスキャン点を横断し、H1からH2までの各スキャン点が、ライブラリからのPCCに関する既知のフラグメントにマッチする少なくとも最小閾値数のフラグメントを有するか否かを判断する、処理が行われてもよい。
PCCピークの全てのスキャン点に関するマッチするフラグメントイオンセットの判断は、教師なしクラスタリングに関して本明細書の他の箇所に記載されるのと同様の方法で行われてもよい。
上述されたものは、標的ライブラリに問い合わせて、特定のPCCに対するF1〜F15など、フラグメントイオンのセットが返されるプロセスであり、次に、PCCピークのスキャンに対してマッチするフラグメントイオンセットを決定し、かかるスキャンのそれぞれが、(各EEスキャンデータのフラグメントイオンとライブラリからのF1〜F15との間で)少なくとも必要な最小数のフラグメントイオンのマッチを有するか否かを判断する、処理が行われてもよいことが注目されるべきである。検出されたPCCのピークの各スキャン点に対して、本明細書に記載されるような基準(例えば、様々な比又はAR値、フラグメントイオンのマッチの最小閾値数など)が提供されてもよく、スキャン点に関してかかる基準が満たされた場合、そのスキャンに関するSSPPISは、標的ライブラリ内の標的PCCに対するマッチと見なされる。いくつかの例では、実験データの検出されたPCCが、検討中のライブラリの標的PCCにマッチするという同定は、単一のスキャンマッチのみを用いて(例えば、実験データから得られるDDAを用いるなど)行われてもよい。検出されたPCCに対して、本明細書に記載されるようにAR3値が計算されてもよい。教師なしクラスタリングを用いてやはり本明細書に記載されるように、同じ溶出分子と関連付けられる、複数のマッチしたSSPPISをグループ化する処理が行われてもよい。AR1値と同様に、AR3値は全てのSSPPISにわたって(指定の許容差内で)一貫していなければならない。
一実施形態では、標的ライブラリには、シミュレータを使用して生成されるものなど、理論上のデータが取り込まれてもよい。ライブラリ内の標的PCCとサンプルに対する実験データセットのPCCとの間のマッチが決定されると、ライブラリ内の標的PCCに関する情報が、PCCに対する実験データセットから本明細書に記載される処理によって得られた情報を使用して、置換又は補充されてもよい。例えば、実験データから決定されるようなPCCのSSPPISに関する情報は、ライブラリ内の標的PCCに関して理論的に生成された情報(例えば、保持時間)に置き換わってもよい。
本明細書の他の箇所に更に詳細に記載されるように、教師ありクラスタリングは、多くの異なるアプリケーション及びワークフロープロセスと関連して使用されてもよい。例えば、標的ライブラリからの特定のフラグメントイオンセットは、標的分子の任意の修飾又は変異型を見つけるため、実験データセットから得られる全てのSSPPISに関して問い合わされてもよい。入力されたフラグメントイオンセットは、本質的に、所与のPCCにマッチされる。分子の任意の変異型は、修飾に至るまでは、非変異形態のものと同様のフラグメンテーションスペクトル(フラグメントイオンリスト)を生成する。かかるマッチするフラグメントイオンセットの探索に応答する入力として、マッチしたフラグメントイオンと関連付けられたPCCが返されてもよい。上記は、教師ありクラスタリングが標的ライブラリと共に使用されてもよい別の方法である。このように、教師ありのSSPPIS同定及びそれに続くCPPIS形成において、SSPPISにPCCが存在することは要件ではない。標的ペプチドの有効な同定には、そのPCCが存在する必要があるが、教師ありプロセスは、プロダクトイオンの統計的に有意なマッチ数を所与として、標的ペプチドの何らかの修飾(配列、化学、翻訳後)、変異型(点変異体)、又は切断ミス形態を同定する能力を伴って、本明細書の技術にしたがって動作する一実施形態をもたらす。統計的に有意な数のプロダクトイオンがマッチする場合、標的プリカーサーのm/zと、全てのマッチしたSSPPISに存在するプリカーサーのものとの間で、Δm/zが計算されてもよい。Δm/zは、修飾のソースを同定する意図で、既知のΔm/z値のルックアップテーブルと比較されてもよい。これは、本明細書の他のプロセスと関連して更に詳細に記載される。同様に、マッチしたプロダクトイオンが、切断ミスを示す単一のフラグメンテーション経路(y’’又はbフラグメントイオン)のみを反映している場合、ペプチドのフラグメンテーションパターンに対してマッチしたSSPPISそれぞれから残留(アンマッチ)プロダクトイオンを問い合わせることによって、配座のためにそのペプチドの近接配列が検索されてもよい。これは、プリカーサーの変異型又は修飾に関連して、本明細書の他の箇所に更に詳細に記載される。
このように、教師ありクラスタリングは、サンプルが、標的ライブラリ内の指紋情報を有する特定の既知の分子を含むと同定することの一部として、そのサンプルに対して得られる実験スキャンデータセットを用いて行われてもよい。例えば、実験スキャンデータから得られた全てのSSPPISが標的ライブラリ内の既知の分子のSSPPIS情報にマッチする場合、サンプルに対して結果として得られるCPPISは、標的ライブラリ内で同定されるような既知の分子のみを含むものと確認されている。しかしながら、あるいは、サンプルの教師ありクラスタリングは、実験スキャンデータセットにおいて同定された一部のPCC及び一部のフラグメントイオンにマッチしないことがあり、それらは、残留の、親がない、又はアンマッチしたPCC及びフラグメントイオンと呼ばれることもある。例えば、図3の要素354は、かかるアンマッチしたイオンのデータの残留セットを表している。この場合、サンプルのCPPISは、標的ライブラリに含まれるような、既知又は標的の分子のマッチしたPCC及びフラグメントイオンを含む。サンプルに対して同定されたCPPISに含まれない、アンマッチしたPCC及びフラグメントイオンの残留セットは、何らかの変異型、ライブラリに含まれない未知の又は同定されなかった分子などを表してもよい。本明細書の他の箇所に記載されるように、残留セットは更に処理又は分析されてもよい。
上述されたように、教師ありクラスタリングは教師なしクラスタリングと同じ処理を行うが、教師なしクラスタリングにおける比較のための標的又はベンチマークが、スキャンにわたって追跡されるPCCの溶出ピークの頂点を表すスキャンHである、本明細書に示される点が異なる。対照的に、教師ありクラスタリングでは、標的は、ライブラリからの既知のパターン又は指紋(例えば、SSPPIS若しくはCPPIS)を有する既知の成分又は分子として指定される。少なくとも1つの実施形態では、教師ありクラスタリングで使用される標的ライブラリは、最初にシミュレータによって生じ、それによってライブラリが理論上のデータを含んでもよい。
本明細書に記載されるような教師ありクラスタリングは、異なる標的を考慮した変形を伴う(例えば、教師なしは溶出PCCピークのスキャンからの情報を使用するが、教師ありはライブラリからの情報を使用する)、同じAR(面積比又は強度比)メトリックを使用してもよい。
一般に、教師ありクラスタリングと関連して使用される標的ライブラリなどの標的は、任意の好適な方法で、生成されるか、又はより一般的には取得されてもよい。例えば、標的は、過去の実験、シミュレーション、教師なしクラスタリングなどのいずれかから生成された、ペプチドなどの既知の分子又は化合物の情報を含むライブラリから得られてもよい。
教師ありクラスタリングは、多くの異なる用途及び使用法を有し、そのうちいくつかが本明細書に記載される。例えば、教師ありクラスタリングは、本明細書に記載されるように、サンプルがライブラリに含まれるような関連する指紋を有する既知の分子を含むか否かを同定するため、既知の分子の標的ライブラリと共に使用されてもよい。このように、教師ありクラスタリングは、試験中のサンプルに既知の分子が存在するかしないかを確認するのに使用されてもよい。それに加えて、教師ありクラスタリングはまた、試験中のサンプルが任意の残留した若しくはアンマッチしたPCC及び/又はフラグメントイオンを含むか否かを判断することと関連して使用されてもよく、それによって、サンプルが1つ又は2つ以上の同定されない分子、変異型などを含んでもよいことが示されてもよい。
図14を参照すると、本明細書の技術による一実施形態で行われてもよい、処理の別のフローチャート1100が示されている。サンプルは、既知の第1の分子、及び既知又は未知の更なる変異型、異形、第2の分子などを含んでもよい。この時点で、上述されたものなど、第1の分子を表す一貫した指紋データを含むことが検証されている、標的ライブラリ又はデータベースがあるものと仮定する。かかるライブラリ又はデータベースを使用して、フローチャート1100の処理が行われてもよい。ステップ1102で、第1の既知の分子及び更なる変異型、異常、又は第2の分子を含むサンプルを使用して、実験が行われる。ステップ1104で、検証されたライブラリ又はデータベースと、サンプルに対してステップ1104から得られる実験データとを使用して、教師ありクラスタリングが行われてもよい。教師ありクラスタリングの結果として、実験データのイオンの第1の部分がクラスタリングされてSSPPISとなり、ライブラリの標的SSPPISにもマッチした。やはりステップ1104の結果として、ライブラリ又はデータベースにマッチしなかった、実験データのイオンの残りの第2の部分がある。実験データの残りの第2の部分は、1つ又は2つ以上のSSPPIS(例えば、PCC及び関連するフラグメントの1つ又は2つ以上の例)へとクラスタリングされず、したがってライブラリ又はデータベースによって表されるSSPPISにマッチしない、実験データの親なしの又はアンマッチしたイオンの残りのセットである。このように、イオンの残りの第2の部分は、既知の更なる変異型、異常、又は更なる第2の分子を特徴付けるイオンを含む。ステップ1106で、アンマッチしたイオンの残りのセットの教師なしクラスタリングによって、変異型、異常、更なる分子などを表すSSPPISの結果として得られるセットを生成する。このように、ステップ1106の教師なしクラスタリングに関して生成される、SSPPISの結果として得られるセットは、変異型、異常、更なる分子などを表す指紋として使用されてもよく、第2のデータベース又はライブラリを構築するのに使用されてもよい(例えば、図13と関連して上述される処理を使用するなど)。一実施形態は、同じ化合物又は分子を含む、同じ1つ又は2つ以上のサンプルを使用する複数の実験に対して、フローチャート1100の処理を繰り返し行ってもよい。かかる繰り返される処理は、更なる変異型、異常、更なる分子などの指紋を表す、SSPPISの複数のセットを得るのに使用されてもよい。複数の実験のステップ1106によるSSPPISの複数のセットは、本明細書に記載されるように組み合わされて、更なる変異型、異常、更なる分子などの指紋の集合的データを形成してもよい。
次に、標的ライブラリを使用する教師ありクラスタリング技術の更なる実施形態又は変形例について記載する。
図14Aを参照すると、教師ありクラスタリングの技術による一実施形態で行われてもよい、処理ステップのフローチャート1700が示されている。処理は、図9に関連したものなど、本明細書の他の箇所に記載されるような、ステップ1202、1204、及び1205を行うことを含んでもよい。ステップ1702で、可変の現在のPCCが処理されるべき次のPCCに割り当てられてもよい。ステップ1704で、実験データの現在のセットにおける全てのPCCが処理されているか否かに関して判断が行われる。ステップ1704が「はい」と評価した場合、制御はステップ1712に進む。ステップ1712の処理は、本明細書の他の箇所に記載されるような、ステップ1210及び1212、並びに任意に更なる処理を含んでもよい。ステップ1712の更なる処理は、例えば、既存のライブラリ情報(例えば、PCC及び関連するフラグメントに関するもの)を、実験データの現在の処理から得られる情報と置き換えることを含んでもよい。例えば、ライブラリが、シミュレータを使用して得られるような理論的に生成される情報を含む場合、ライブラリは、PCC又はプリカーサーを使用したかかる既存の情報、及びフローチャート1700の処理の結果として実験データから得られた関連するフラグメントイオン情報を置き換えるように更新されてもよい。
ステップ1704が「いいえ」と評価した場合、制御は現在のPCCの処理に進む。ステップ1706で、マッチするPCCが現在のPCCに関してライブラリに見出されるか否かが判断される。本明細書の他の箇所に記載されるように、かかるマッチするPCCは、(ある指定の許容差内の)マッチするm/z、m/zと保持時間、m/zと保持時間とドリフト時間、又はより一般的には、イオン検出前分離方法の任意の組み合わせに基づいてもよい。ステップ1706が「いいえ」と評価した場合、制御はステップ1702に進む。ステップ1706が「はい」と評価した場合、制御はステップ1708に進んで、ライブラリからのマッチするPCCに対するフラグメントイオン情報(1つ又は2つ以上のフラグメントイオンについて)が検索される。ステップ1710で、PCCのH又は頂点スキャンに関する実験データのHEスキャンデータが、ライブラリから得られるようなPCCのフラグメントイオンにマッチするフラグメントイオンのみを含むようにフィルタ処理されてもよい。例えば、PCCのスキャンH又は頂点スキャンに関するHEスキャンデータは、F1〜F15と表される15のフラグメントイオンを含み、ライブラリは、同じPCCに対して5つのフラグメントイオンF1〜F5を含む。ステップ1710のかかるフィルタ処理は、HEスキャンデータをフィルタ処理して、フラグメントイオンF1〜F5に関する情報のみを含む第1のフィルタ処理されたフラグメントイオンセットを決定する。第1のフィルタ処理されたフラグメントイオンセットの情報は、後に続く処理で使用され、スキャンH又は頂点スキャンに関するHEスキャンデータのフラグメントF6〜F15についての残りのフラグメントイオン情報は、後に続く処理ステップで更に利用されなくてもよい。処理は、ステップ1206に進んで、本明細書の他の箇所(図9に関連したものなど)に記載されるような処理を行う。この場合、PCCの頂点又はHスキャンに使用されるフラグメントイオン情報は、第1のフィルタ処理されたフラグメントイオンセットのフラグメントイオンのみに関する、実験データのHEスキャンデータにおけるフラグメントイオン情報に限定される。ステップ1206から、処理はステップ1702に進む。
解離中に多くのプロダクトイオンを生成するペプチド又は他の複雑な分子とは異なり、小分子は少数しか生成しない場合が多い。それに加えて、小分子は、それらのフラグメントのように一価である場合が多い。それらの強度比(AR1)は、ペプチドからのフラグメントイオンと比較した場合、非常に低い場合が多い。一価であって強度が低いため、多くの同位体はもたらされない。ここで、プリカーサープロダクトイオン面積の関係を使用した、どのプロダクトイオンがどのプリカーサープロダクトイオンと関連付けられるかの同定及び検証には、より多数の同様の実験が比較されることのみを要する。しかしながら、本明細書の技術による一実施形態は、機器制御ソフトウェアがスキャンごとに衝突エネルギーを変更できることを所与として、多くの小分子研究室によって用いられる、50%の生存収率戦略(例えば、50%のPCC収率規則)を活用してもよい。ここでは、アライメントの同定及び検証のために更なる直交性を提供する、分子の溶出全体を通したフラグメンテーションパターンの変形例である。共溶出小分子のプロダクトイオンは、所与の衝突エネルギーで異なる50%の生存収率を有するようになるので、それらは「真の」親プリカーサーから発する者とは分離される。以下のパラグラフに更に詳細に記載されるように、本明細書の技術による一実施形態は、上記のものを、小分子用途に対して行われる実験及びデータ分析に組み込んでもよい。
本明細書の技術による一実施形態は、小分子に関して、溶出ピークを通して衝突エネルギーを変動させることによって、スキャンごとに溶出ピークにわたってフラグメンテーションパターンを変更してもよい。本明細書の他の箇所に記載されるように、フラグメンテーションパターンは、プロダクトイオンと、それに関連するPCCなど、その親プリカーサーとの間の強度関係として特徴付けられてもよい。フラグメンテーションパターンは、分子溶出フラグメンテーションパターンにわたる複数サイクルを、衝突エネルギーサイクル内及びサイクル間で比較できることを所与として、2つの間の面積比又は強度が、クロマトグラフィ溶出にわたって(ある実験変数内で)一貫しているべきものである。本明細書の技術は、PCCなどの親イオンとそのフラグメントとの間におおける、かかる原理及び関係を利用する。詳述するため、プリカーサーのフラグメンテーションパターンはその溶出にわたって一貫している。そのため、同じ並びに異なる衝突エネルギーサイクルにおける、同じ衝突エネルギーでのプリカーサーイオンとその構成成分であるプロダクトイオンとの間の強度関係は、干渉がない状態で一定のままであるべきである。フラグメンテーション中に発生するプロダクトイオン、プリカーサーイオン、又はPCCの数は、その長さ/質量及び濃度の関数である。PCCの強度は検出されたピークにわたって変動(例えば、増加及び/又は減少)するので、そのプロダクトイオンの強度も同様である。
本明細書の技術にしたがって、一実施形態は、小分子を含むサンプルに対して行われる実験において、衝突エネルギーをスキャンごとに変化させてもよい。実験は、小分子を含むサンプルに対して行われ、結果としてLEスキャンデータ及びEEスキャンデータが得られたものと仮定する。本明細書に記載されるLEスキャンデータは、主にプリカーサー又はPCCスキャンデータを含み、EEスキャンデータは主にフラグメントイオンスキャンデータを含む。かかるLE及びEEスキャンデータセットが検査されて、特定のPCC又はプリカーサーイオンに関して、LEスキャンデータのようにPCC又はプリカーサーイオンの強度の約1/2又は50%(例えば、ある指定の許容差内)でEEスキャンデータに現れる、PCC又はプリカーサーイオンをもたらす衝突エネルギー(CE)を決定してもよい。本明細書の他の箇所に記載されるように、スキャンデータの異なるセットにおけるマッチするm/zに基づいて、同じイオンが、LEスキャンデータ及びEEスキャンデータなど、スキャンデータの異なるセットにおいて探索されてもよい。
第1のステップとして、LEスキャンデータが検査されて、PCC又は親プリカーサーイオンの強度が得られてもよい。例えば、スキャンS1のLEスキャンデータにおけるPCC又は親プリカーサーイオンの強度が、10e6であると仮定する。第2のステップとして、EEスキャンデータが検査されて、スキャンS1におけるEEスキャンデータのPCCが探索され、スキャンS1におけるEEスキャンデータに現れるようなPCCの強度が得られる。例えば、LEスキャンデータのスキャンS1におけるPCC又は親プリカーサーイオンの強度が10e3であり、それによって、PCCの50%がフラグメンテーションされておらず、PCCの50%がフラグメンテーションされていることを表すものと仮定する。第3のステップとして、LEスキャンのスキャンS1及びEEスキャンのスキャンS1におけるPCC又はプリカーサーイオンの強度の差が決定されてもよい。上記の差は、スキャンS1のPCC又はプリカーサーイオンから生成される任意のフラグメントイオンの予期される合計強度に対する最大値又は上界を表す。この例を続けると、上記を所与として、10e6−10e3=10e3は、スキャンS1のPCC又はプリカーサーイオンから生成される任意のフラグメントイオンの予期される合計強度に対する最大値又は上界を表すことを意味する。それに加えて、差10e3はまた、スキャンS1に対するLEスキャンデータのように、PCC又はプリカーサーイオンの強度10e6の50%に等しい。このように、本明細書の技術による一実施形態は、スキャンS1のPCC又はプリカーサーイオンのフラグメンテーションと関連して使用される特定のCEに言及してもよく、その場合、かかるCEは、PCC又はプリカーサーイオンの約50%のフラグメンテーションをもたらす。本明細書の記載において、上記は、50%のPCC収率規則と呼ばれることもある。
本明細書の技術による一実施形態は、CEエネルギーが各スキャンに対して変更され、時間に伴ってCEエネルギーを変動させて、サイクル又は期間を形成する後続のスキャンにおける一連のCE値を通して循環する、実験を行ってもよい。CEサイクル又は期間は、ステップのCE間隔などにおいて、後続のスキャンの第1の部分における最小CE値から、CEが最大値又は頂点値に達するまでCEを増加させ、次いで、CEはそれに続いて、CE間隔又はステップにおいて最小CE値に達するまで減少され、それにより、CEサイクル又は期間が次に繰り返される。
図15を参照すると、CE値がCEサイクル又は期間を含むピークを形成するように、CEをスキャンごとにどのように変動させてもよいかを模式的に示す、例1400が示されている。点A、C、E、及びGは、CEサイクル又は期間におけるCE最小値を表してもよく、点B、D、及びFは、CEサイクル又は期間におけるCE最大値を表してもよい。単一のCEサイクル又は期間は、2つの連続するCE期間又はサイクルにおける、同じCE値の対の間で表されてもよい。例えば、単一のCEサイクル又は期間は、点A及びCの間で表されてもよく、それにより、点Aから新しいCEサイクル又は期間が始まる点Cまでの各スキャンにおいて、CEは異なるCE値に設定される。一実施形態は、各スキャンにおいて、CEサイクル又はピークの上り坂で最小値から最大CE値までCE値を漸増し、また、各スキャンにおいて、CEサイクル又はピークの下り坂で最大CE値から最小CE値まで、スキャン当たり所定の量で、CE値を漸減させてもよい。かかるCE値は、各スキャンにおいて、ソフトウェア及び/又はハードウェアを使用してスキャンごとのCE設定又は選択を制御する、数学関数によるものなどの任意の好適な技術を使用して決定されてもよい。
図15及びその他に示されるものなど、本明細書に記載される一実施形態では、CEサイクルは、上り坂のCEが同じCEサイクルの下り坂では逆順で繰り返されるような、ガウスピーク又は曲線として特徴付けられてもよい。例えば、L1、L2、及びL3は、CEサイクル1510aの上り坂における点を表し、点L6、L5、及びL4は、CEサイクル1510aの下り坂における点を表し、点又はスキャンL1及びL6は同じCEを有し、点又はスキャンL2及びL5は同じCEを有し、点又はスキャンL3及びL4は同じCEを有する。同様の方法で、各サイクルのCEは、例えば、L7が、L3及びL4と同じCEを有するCEサイクル1510bにおける点又はスキャンを表し、L8が、L5と同じCEを有するCEサイクル1510bにおける点又はスキャンを表し、L11が、点L2、L5、及びL8と同じCEを有するCEサイクル1510bにおけるスキャンを表すようにして繰り返される。同様に、L9は、L3、L4、及びL7と同じCEを有するCEサイクル1510cにおける点又はスキャンを表し、L10は、L5及びL8と同じCEを有するCEサイクル1510bにおける点又はスキャンを表す。このように、ガウス型のピーク又は曲線を形成するCE値で構成されるCEサイクルを使用することで、頂点又はピークCE値以外の各CE値が、各CE曲線内で2回生じる。更に、更に詳細に後述するように1つのクロマトグラフィピークに「n個の」CEサイクルがある場合、かかるCE値(ピークCE値以外)はそれぞれ、単一のクロマトグラフィピーク内で2n回生じる。
CEが変更される各CEサイクル又は期間におけるスキャン又はスキャン事例の数は、少なくとも中央又は平均クロマトグラフィピーク幅を2で割ったものであることが注目されるべきである。より形式的には、CEがスキャンごとに変更されると仮定して、CEサイクルにおけるスキャン数を表すCEサイクルの期間Tは、次式のように表されてもよい。
T≦溶出又はクロマトグラフィピークのFWHM 式CE CYCLE
式中、
Tは、CEがスキャンごとに変更される、単一のCEサイクルにおけるスキャンの整数を表すCEサイクルの期間、並びに、
溶出又はクロマトグラフィピークのFWHMは、サンプル中の溶出成分又は分子と関連付けられる、中央又は平均の溶出又はクロマトグラフィピークのFWHMを表す(例えば、FWHM=平均又は中央溶出又はクロマトグラフィピーク幅/2)。
一般に、式CE CYCLEは、より形式的には、単一の分子と関連付けられた任意の溶出ピークにおけるスキャンに対して少なくとも1つのCEサイクルが生じる、実験を行う要求を表す(例えば、単一の分子又は成分の任意の溶出ピークは、少なくとも1つのCEサイクルを経験するか、又はCEサイクルの各CEを少なくとも1回経験する)。
単一のPCCの単一の溶出ピークに対してCEエネルギーを変更するとき、LEスキャンデータ及びEEスキャンデータが検査されて、50%のPCC収率規則を保持するスキャンを決定してもよい
(例えば、PCC又はプリカーサーイオンが、EEスキャンデータにおいて、LEスキャンデータによる強度の約50%である強度を有するスキャン)。
連続する後続のスキャンにおけるLEスキャンデータのPCCのマッチするm/zに基づいて、本明細書の他の箇所に記載されるように、特定のPCCが異なるスキャンにわたって追跡されて、それに関連する溶出ピークを決定してもよいことが注目されるべきである。それに加えて、検出されたピークの各スキャンのEEスキャンデータにおけるPCCと関連付けられた強度は、変動するCEによるスキャン間の予期される相対強度パターンに追随する。例えば、CEをスキャンNからN+1に増加すると、PCC又はプリカーサーイオンが経験するフラグメンテーションもスキャンNからN+1に増加することが予期される。このように、スキャンNからN+1まで、EEスキャンデータにおいて表されるようなPCCのフラグメンテーションから生成されたフラグメントイオンと関連する強度は増加されるので、EEスキャンにおけるPCCの強度は減少する。換言すれば、スキャンNのCE<スキャンN+1のCEである場合、スキャンNに対するEEスキャンデータにおけるPCCの強度>スキャンN+1に対するEEスキャンデータにおけるPCCの強度である(スキャンNにおけるPCCのフラグメンテーションによって生成されるフラグメントイオンの強度<スキャンN+1におけるPCCのフラグメンテーションによって生成されるフラグメントイオンの強度であるため)。
同様の方法で、PCCに対する検出ピークのスキャンの場合、CEが頂点のCE最大値からCE最小値まで減少するにつれて変動するCEにしたがって、スキャン間のEEスキャンデータにおけるPCCの強度は、スキャン間の相対強度パターンに追随することが予期される。例えば、CEがNからN+1に減少すると、PCC又はプリカーサーイオンが経験するフラグメンテーションもスキャンNからN+1に減少することが予期される。このように、スキャンNからN+1まで、EEスキャンデータにおいて表されるようなPCCのフラグメンテーションから生成されたフラグメントイオンと関連する強度は減少されるので、EEスキャンにおけるPCCの強度は増加する。換言すれば、スキャンNのCE>スキャンN+1のCEである場合、スキャンNに対するEEスキャンデータにおけるPCCの強度<スキャンN+1に対するEEスキャンデータにおけるPCCの強度である。スキャン間の上記予期される相対強度パターンは、PCCのピークを決定し、スキャン間のPCCを追跡するため、PCCのマッチするm/zと組み合わせて使用されてもよい。
50%のPCC収率規則が保持されるPCCの溶出ピークのスキャンにおいて、AR2比が、追跡された溶出ピークの各スキャンのPCCに対して決定され、(ピークのスキャン間のマッチするm/z及び予期される相対強度パターンに加えて)更なる検証基準として本明細書の他の箇所に記載されるのと同様の方法で比較されて、溶出ピークが(ピークのスキャン間のマッチするm/z及び予期される相対強度パターンを有する)特定のPCCに対するものであることが担保されてもよい。決定されたAR2比は、この場合、AR2に関する式に関連してなど、本明細書の他の箇所に記載されるようなものと同様であるが、LEスキャンデータのPCC強度に基づいた、溶出ピークの頂点又はPPスキャンにおけるPCCの強度を使用するのではなく、AR2比が、50%のPCC収率規則を保持するスキャンMに関してEEスキャンデータと同じようにPCCの強度を使用する点が異なる。任意の2つの隣接したスキャン間における衝突エネルギーの変更が、フラグメンテーションパターンに影響することが注目されるべきである。このように、スキャン間のAR2比は、上述されたものとは異なり、イオンタイプ間で一貫しないが、同じ衝突エネルギーで獲得されるスキャン間で再現可能である。それは、クロマトグラフィ溶出にわたって比較されてもよい、同じ又は類似の衝突エネルギーを有するスキャン又は点に対するフラグメンテーションのパターンの類似性である。AR2比のこの特定のものを使用して、CEを変動させたときのPCCの溶出ピークにおけるものなど、異なるスキャンにわたってEEスキャンデータに現れるような、残留する未フラグメンテーションPCC又はプリカーサーイオンの強度の追跡が行われてもよい。
図16を参照すると、異なるスキャンのLEスキャンデータにおけるPCCの強度に基づいて決定されてもよいような、PCCに対する溶出ピーク1512を模式的に示す例1500が示されている。この例1500では、PCCの単一の溶出ピーク1512に3つのCE期間1510がある。したがって、CEは、単一の溶出ピーク1512の間に3回、CEの期間を通して変更されるか又は循環する。3つのCE期間1510に対するピーク又は曲線は、このグラフ上で、以下のパラグラフにおける例証及び説明のため、単一の溶出ピークと重ね合わされている。
第1のステップとして、50%のPCC収率規則を保持する溶出ピークにおける1つ又は2つ以上のスキャンが決定されてもよい。この例では、点X1、X2、及びX3が、ピーク1512を有する追跡されたPCCに関して50%のPCC収率規則が真である、かかる点又はスキャンを表してもよい。上述したように、点X1、X2、及びX3のそれぞれは、EEスキャンデータにおけるPCCの強度が、同じスキャンに関してLEスキャンデータにおけるPCCの強度の約50%である、スキャンを表す(例えば、点X1、X2、及びX3のそれぞれによってやはり表される特定のCEにおいて、PCCに対するフラグメンテーション効率が約50%である)。
第2のステップとして、点X1、X2、及びX3のそれぞれを含む、単一のCE期間に対する関連するCEピーク又は曲線が決定されてもよい。次に、単一のCEピーク又は曲線、及びCEピークにおけるスキャンに関して行われてもよいが、単一のCE期間を表すかかるCEピーク又は曲線それぞれに関して繰り返されてもよい、処理について記載する。例えば、点X1は、例1500において点A、B、及びCによって形成される曲線で示される、第1のCE期間1510aと関連付けられるスキャンに含まれるスキャンを表す。点X1(EEスキャンデータにおけるPCCの強度がLEスキャンデータにおけるPCCの強度の約50%であるスキャンを表す)を、Hスキャン(例えば、頂点若しくはPPスキャン)として使用して、次に記載されるように、一連のAR2比が比較され、CE期間内及び期間の間の両方で検証基準として使用されてもよい。換言すれば、教師なし及び教師ありクラスタリングなどを用いて、本明細書の他の箇所に記載されるように、AR1及びAR2値は、HスキャンとしてPCC(例えば、1512)の溶出ピークの頂点を使用して、どのプロダクトイオンがPCCと整列されるかを判断するのに利用される。PCC溶出ピークの頂点を、AR1及びAR2値を計算する際にPPとして使用するのではなく、スキャンX1がPPとして使用されてもよく、点H1及びH2(それぞれ上り坂及び下り坂のFWHM点を表す)が、今度はPPとして使用されるスキャンXに対して決定される。フラグメンテーションが衝突エネルギーの関数であり、記載される実施形態では、衝突エネルギーがスキャンごとに変化していることを所与として、同じCEサイクルで生じる類似の(又は指定の許容差内でほぼ同じ)衝突エネルギーのスキャン間、並びに同じCEを有するスキャン間の両方でAR1及びAR2の比較が行われてもよく、その場合、かかるスキャンは、異なる衝突エネルギーサイクルにおけるものである(例えば、本明細書の技術による一実施形態では、中央クロマトグラフィピーク幅(FWHM)ごとに最低2つのサイクルが必要であるようなもの)。
一例として、一般的な小分子は、獲得速度が100ミリ秒である3秒幅のクロマトグラフィピーク幅(FWHM)を有し、3000ミリ秒/100ミリ秒、即ち30スキャンである。最低2つの衝突エネルギーサイクルを要することで、10の異なる衝突エネルギーが可能になり、5つの異なる衝突エネルギーを適用することで6つの衝突エネルギーサイクルが可能になる。衝突エネルギーの数は、中央クロマトグラフィピーク幅(FWHM)の獲得速度によって決定される。
したがって、AR1及びAR2比は、以下を有する衝突エネルギーサイクル内の各スキャン点に対して決定されてもよい。
AR1=Int(F1...Fn)/Int(S1,PCC)
式中、
nは、スキャンS1のEEスキャンデータにおけるフラグメントイオンの数に等しく、
Int(F1...Fn)は、スキャンS1のEEスキャンデータにおける「n個の」フラグメントイオンのうち任意の1つの強度を表し、
Int(スキャンS1,PCC)は、F1〜Fnが発するPCC又はプリカーサーイオンの、スキャンS1のLEスキャンデータにおける強度である(例えば、親プリカーサーイオン又はPCCに対する比に基づいて、F1〜Fnのn個のフラグメントのそれぞれに対して異なるAR1値が決定されてもよい)。並びに、
AR2=Int(スキャンS1,PCC)/Int(スキャンM,PCC)PCCのAR2に関する式V3式中、
Int(スキャンM,PCC)は、50%のPCC収率規則がPCCの強度に対して保持される、PCCに対するCE期間のスキャンMに関する、EEスキャンデータにおけるPCC又はプリカーサーイオンの強度、並びに、
Int(スキャンS1,PCC)は、スキャンM以外のPCCに対するCE期間の別のスキャンを表す、あるスキャンS1のEEスキャンデータにおけるPCC又はプリカーサーイオンの強度である。
同様に、フラグメントイオンに関して、式V3に基づいてAR2値を決定することができる。
AR2=Int(スキャンS1,F1)/Int(スキャンM,F1)フラグメントイオンのAR2に関する式V3
式中、
Int(スキャンM,F1)は、50%のPCC収率規則がPCCの強度に対して保持される、PCCに対するCE期間のスキャンMに関する、EEスキャンデータにおけるフラグメントイオンF1の強度、並びに、
Int(スキャンS1,F1)は、スキャンM以外のフラグメントイオンF1に対するCE期間の別のスキャンを表す、あるスキャンS1のEEスキャンデータにおけるF1の強度である。
それに加えて、AR2は、上述の式に基づいて、ただし、2つの異なるCEサイクルにおける対応する点の2つのスキャンに関して定義されてもよい(例えば、1510a及び1510bにおける2つの異なるCEサイクルのL2及びL11など、同じCE1が2つのスキャンに適用され、CEサイクル1510a、1510b、及び1510cにおけるスキャンL3、L7、及びL9それぞれに同じCE2が適用される場合)。式中、
Int(スキャンM,PCC)は、PCCに対するCE期間の任意のスキャンMに関する、EEスキャンデータにおけるPCC又はプリカーサーイオンの強度、並びに、
Int(スキャンS1,PCC)は、後に続く衝突エネルギーサイクルそれぞれにおけるスキャンMの比較又は対応する位置の、EEスキャンデータにおけるPCC又はプリカーサーイオンの強度であり(例えば、S1及びMは、同じCEが適用される場合の後に続くCEサイクルの対応する点における対応するスキャンである)、また、
Int(スキャンM,F1)は、CE期間の任意のスキャンMに関する、EEスキャンデータにおけるフラグメントイオンF1の強度、並びに、
Int(スキャンS1,F1)は、後に続く衝突エネルギーサイクルそれぞれにおけるMの対応又は比較スキャンを表す、あるスキャンS1のEEスキャンデータにおけるF1の強度である(例えば、S1及びM1は、同じCEが適用される場合の異なるCEサイクルにおける対応するスキャンである)。
図15を参照して更に例証するため、フラグメントF1に対して決定されるAR1値は、S1及びS2の両方にほぼ同じCEが使用される場合、同じCEサイクルのスキャンS1及びS2において同じであることが予期される(例えば、AR1は、スキャンの対L3及びL4においてF1に対して同じであることが予期され、AR1は、スキャンの対L2及びL5においてF1に対して同じであることが予期される)。F1に対するAR1値は、3つの異なるCEサイクルの対応するスキャンL3、L4、L7、及びL9において同じであることが予期され、その場合、複数のCEサイクルにわたって、L3、L4、L7、及びL9の全てで同じCEが使用される。上記式V3を使用してPCC又はプリカーサーイオンに対して決定されるAR2値は、同じCEが適用される、同じCEサイクルのスキャンL3、L4で同じであることが予期される。それに加えて、式V3を使用する同じPCCに対するAR2値は、同じCEが適用されるCEサイクル内で、又はCEサイクルにわたって、スキャンL3、L4、L7、及びL9で同じであることが予期される。
また、スキャンL3において上記式V3を使用してフラグメントF1に対して決定される第1のAR2値は、スキャンL3において上記式V3を使用して、F1を生じるPCCに対して決定される第2のAR2値と同じであることが予期される。更に、上記第1及び第2のAR2値はまた、スキャンL4、L7、及びL9において上記式V3を使用する、元のPCC及びF1に対するAR2値と同じであることが予期される。更にまた、上記第1及び第2のAR2値(スキャンL3におけるPCC及びF1に対する)はまた、スキャンL4、L7、及びL9において上記式V3を使用して、F1と同じPCCからやはり生じる別のフラグメントF2に対して決定される、AR2値と同じであることが予期される。
このように、AR1及びAR2両方の比が追跡されてもよく、CEが変更されるCE期間の類似のスキャン(ほぼ同じCEを有する)にわたって、ある指定の許容差内でほぼ同じであることが予期される。本明細書の他の箇所に記載されるように、AR2比が決定され、(スキャンにわたってLEスキャンデータに基づいて追跡されるような)PCC溶出ピークの点H1及びH2に関して比較される場合、PCC溶出ピークではなくCE期間のピークに関して決定されるFWHM点である点H1及びH2に対して、類似のAR2比が決定されてもよい。例えば、X1を含む第1のCE期間1510aは、点A、B、及びCの間に形成される第1のピーク又は曲線である。第1のCE期間1510aのFWHM点は、第1のCE期間1510aのPPとしてのスキャンX1の使用に関して決定されてもよい(図16に示されるものなど)。これらの比はまた、フラグメントイオンのアライメントを検証するためのメトリックとして使用されてもよい。
例えば、第1のAR1値は、第1の衝突エネルギーCE1を使用して、第1のCEサイクル1510aの第1のスキャンS1におけるその親プリカーサーイオン又はPCCに対して、フラグメントイオンF1に関して決定されてもよい。親イオン又はPCCに関するF1の第2のAR1値は、スキャンS2がスキャン1の場合と同じ衝突エネルギーCE1を使用する、第2のCEサイクル1510bの対応するスキャンS2において決定されてもよい。F1に対する上記AR1値の両方が近似しているはずであることが予期される。
一般に、CEサイクルの期間≦PCC溶出ピークのFWHMである。本明細書の技術による一実施形態では、AR2比を決定するのに使用されるH1及びH2スキャン点は、次式の間隔に基づいて計算されてもよい。
CE期間における#CE又はスキャン/3=間隔 式INTERVAL
式中、
「CE期間における#CE又はスキャン」は、単一のCEサイクル又は期間におけるCE又はEEスキャンの数である。
例えば、スキャンX1はスキャン5であり、また、各CE期間に10のCE又は10のEEスキャン(例えば、1510a、1510b、及び1510cのそれぞれに10のCE又はスキャン)があるものと仮定する。上記式INTERVALに基づいて、決定される間隔は3と1/3であり、3の整数値に丸み付けられてもよい。この場合、スキャン5をPPとして使用して、AR2値を計算するのに使用されるH1及びH2点は、PP+3スキャン(例えば、点H2としてスキャン8を表す5+3)及びPP−3スキャン(例えば、点H1としてスキャン2を表す5−3=2)であってもよい。
本明細書に記載される一実施形態では、AR2値は、第一に、2つの異なるCEサイクルの対応するスキャン(例えば、異なる衝突エネルギーサイクルからであるが、同じ衝突エネルギーを両方有するスキャン)の間で、また次式のようにCE期間のスキャンH1及びH2におけるFWHM点に対して決定されてもよい。
AR2=上り坂比U=下り坂比D 式B1
=Int(H1,Precursor)/Int(H,Precursor)=Int(H2,Precursor)/Int(H,Precursor)
式中、
Int(H,Precursor)は、PCCの50%の収率規則がCEピークに留まるスキャンMのEEスキャンデータにおけるPCCの強度、
Int(H1,Precursor)は、CEピークの上り坂又はLHSにおけるスキャンH1のEEスキャンデータにおけるPCCの強度、並びに、
Int(H2,Precursor)は、CEピークの上り坂又はLHSにおけるスキャンH2のEEスキャンデータにおけるPCCの強度である。CEは、同じCEサイクルのスキャンH1及びH2の両方でほぼ同じであることが注目されるべきである。
本明細書の他の箇所に記載されるように、処理は次に、スキャンH=M(この例では=X1)、並びにMに対して決定されるH1及びH2に対するプロダクト又はフラグメントイオンのスキャンデータを検査してもよい。かかる処理は、同様の衝突エネルギーのサイクル間並びにm/z及び強度比による衝突エネルギー比較の間で、フラグメントイオンをマッチさせることを含む。
スキャンH及びH1の間でマッチするフラグメントイオンの第1のセットと、スキャンH及びH2の間でマッチするフラグメントイオンの第2のセットとが決定されてもよい。例えば、スキャンHのフラグメントイオンF1は、次の場合に、スキャンH1のフラグメントイオンF1’’にマッチすると判断される。
ある指定の許容差内で、F1のm/zがF1’’のm/zにマッチし、次式のように計算される強度比IR
IR=スキャンH1におけるF1’’の強度/スキャンHにおけるF1の強度が、H及びH1に対応する次のCEサイクルのスキャンに関して決定されるような、フラグメントF1又はその元のPCCに対して、ある指定の許容差内で次の衝突エネルギーサイクルにおけるその比較のAR2にマッチする(例えば、式V3を使用して決定されるようなAR2にマッチする)(次のCEサイクルの対応するスキャンH’’がスキャンHと同じCEを有し、次のCEサイクルの対応するH1’’がスキャンH1と同じCEを有する場合)。
上記IRはAR2値の別の表現であり、また、スキャンH及びH1に関してPCCを発するフラグメントFUに関して、式V3を使用して決定されるようなAR2値と同じであることが予期されることが注目されるべきである。
同様の方法で、本明細書の他の箇所に記載されるように、50%のPCC収率規則を保持するスキャンをPPとして使用して、各CEサイクルの曲線又はピークの異なるスキャン点に対して異なるAR2値を決定する処理が行われてもよい。それに加えて、50%のPCC収率規則を保持するPPとして使用して、AR1及びAR3比などの本明細書に記載される他の任意の比が決定されてもよい。
上記の更なるAR1、AR2、及び/又はAR3値は、溶出PCCピークを検証するのに、本明細書に記載されるような他の検証基準と共に、またやはり本明細書に記載されるような特定のPCCと関連付けられるフラグメントイオンをフィルタ処理又は検証する検証基準として、更なる検証基準として使用されてもよい。
50%のPCC収率規則を保持するスキャンMを、AR1及びAR2値など、様々な比を決定するためにPP又はHスキャンとして使用するものの変形例として、一実施形態はまた、(1510aなどの単一のCE期間における全てのスキャンに関するEEスキャンデータの全てのセットに対して)EEスキャンデータにおけるPCCの強度がその最小値にあるCEサイクル又はピークのスキャンを使用してもよく、それによって、PCCのフラグメンテーションが最大であるスキャンが表される。
50%のPCC収率規則を保持するスキャンMを、AR2値を決定するためにPP又はHスキャンとして使用するものの更なる変形例として、一実施形態は、より一般的には、(1510aなどの単一のCE期間における全てのスキャンに関するEEスキャンデータの全てのセットに対して)EEスキャンデータにおけるPCCの強度が約50%以下であるCEサイクル又はピークのスキャンを使用してもよい。より一般的には、一実施形態は、約50%以下であってもよい閾値比率を選択し、それによって、様々な比(例えば、本明細書に記載される、AR1、AR2など)を計算するのにHスキャン又はPPとして使用するスキャンを選択することを表してもよく、その際、EEスキャンデータにおけるPCCの強度は、ほぼ閾値比率以下である(例えば、指定の閾値比率を越えず、それによってPCCのフラグメンテーションの閾値レベル又は最小レベルが表される)。
本明細書の技術による一実施形態はまた、溶出ピーク1512を有する特定の分子に対する理想的なCEを決定してもよい。かかる理想的なCEは、サンプルが溶出ピーク1512を有する特定の分子を含むか否かを判断する、標的とされたデータの獲得のためなど、他の実験に使用するCEを確立するのに使用されてもよい。50%のPCC収率規則を保持する以下のCEは、溶出ピーク1512を有する特定のPCCに対する理想的なCEとして使用されてもよい。理想的なCEは、教師なし及び/又は教師ありクラスタリングを使用して、複数の実験にわたる平均値として決定され記憶されてもよい。同様に、CV、標準偏差などのエラーインジケータが、理想的なCEに関して追跡されてもよい。
上記は、小分子を用いる特に有用な技術として特徴付けられてもよい。しかしながら、当業者には認識されるように、かかる技術は、小分子と共に使用するようには制限されず、一般医、任意の好適なサイズの任意の分子と共に使用されてもよい。
図17を参照すると、本明細書の技術による一実施形態で行われてもよい、上述の処理を要約したフローチャート1600が示されている。ステップ1601で、単一のCEサイクル又は期間におけるスキャンの数は、式CE CYCLEを使用して本明細書の他の箇所に記載されるように決定されてもよい。それに加えて、単一のCEサイクルにおける各スキャンの特定のCE値又は設定は、単一のCEサイクルにおける各スキャンに対して、CEが変更されてもよい場合に決定されてもよい。単一のCEサイクル又は期間に含まれる特定のCEは、任意の好適な方法で決定されてもよく、そのいくつかが本明細書に記載される。例えば、一実施形態は、数学関数を使用して、単一のCE期間又はサイクルのスキャンにおける連続するCE値を決定してもよい。かかるCE値は、例えば、複数のCEサイクル又は期間全体にわたって循環される異なるCE値を表すピークの波又は一連のピークを形成してもよい。ステップ1602で、CEサイクル及び各CEサイクルにおけるCEに基づいて、連続するスキャンそれぞれでCEが変更されるHE及びLEスキャンデータを得るため、サンプルを使用して実験が行われてもよい。次に、ステップ1204で、LEスキャンデータのイオンに対するPCCを決定し、ステップ1205で各PCCに対してピーク検出を行う処理が行われてもよい。図17のステップ1204及び1205は、教師なしクラスタリングに関して図9と関連して記載したようなものと同様である。
ステップ1606で、AR1値、AR2値、及び他の基準を含む検証基準にしたがって、PCCのそれぞれと関連する(例えば、マッチする)フラグメントイオンのセットを決定する処理が行われてもよい。検証基準は、最初のフラグメントイオンをフィルタ処理又は改良し、各PCCに対して改訂されたフラグメントイオンセットを決定するのに使用されてもよい。ステップ1606の処理は、図9、図10、及び図11と関連して記載されたものなどのステップ1206の処理と同様であるが、ステップ1206のかかる処理が(PCC溶出ピークではなく)各CEスキャンサイクルに関して行われてもよい点が異なる。それに加えて、Hスキャン又はPPスキャンは異なってもよく、PCC溶出ピーク強度の頂点を(ステップ1206のように)Hスキャン又はPPとして使用するのではなく、ステップ1606は、AR2及びAR1値を計算する際の代替のHスキャン又はPPとして、50%のPCC収率規則を保持する(又はより一般的には、PCCのフラグメンテーションがその最大値である)単一のCEサイクル又は期間のスキャンを使用してもよい。やはり本明細書に記載されるように、50%のPC収率規則は50%の閾値レベルを使用し、ステップ1606は、より一般的には、任意の好適な閾値レベル又は閾値比率を使用して行われてもよい。ステップ1208、1210、及び1212は、次に行われてもよく、図9と関連してなど、本明細書の他の箇所に記載されるものと同様である。
単クローン抗体は、体内のバクテリアなどの異質な侵入物を認識するタンパク質である。かかる単クローン抗体は、例えば、身体の免疫系に特定の疾病を標的とさせるなど、様々な治療及び医療目的で、体内に注入されてもよい。
ソース又は宿主は、かかる異質な侵入物を認識する単クローン抗体を製造又は生成してもよい。例えば、ソース又は宿主は、所望の単クローン抗体を生成するのに使用される、ラット、ウシなどの動物であってもよい。単クローン抗体を分離又は精製し、精製された抗体(PA)の指紋(例えば、プリカーサーイオン又はPCC、及びそれぞれに対する関連するフラグメントイオン)を決定する処理が行われてもよい。ソース又は宿主によって生成されるようなPAが「純粋」であり、PA以外の他の任意のタンパク質(例えば、ソース若しくは宿主からのものなど)、構成成分、又は化合物を含まないことを確認又は担保する処理が行われてもよい。PA中に任意の宿主タンパク質があるか否かを判断する、かかる処理が行われてもよい。当該分野で知られているように、FDAは、例えば、PAが「純粋」であり、またPAのみを含み、宿主細胞タンパク質又は他の汚染物質は何ら含まないことが検証又は確認されている点で、PAに対する制限及び要件を有する。
宿主細胞タンパク質などに対する、任意の汚染物質の量又は濃度は非常に低くてもよく、したがって、利用される技術が、PA以外の汚染タンパク質又は他の分子の、0.1%濃度などのかかる非常に低い濃度レベルを検出することができるべきであることが注目されるべきである。
PAは既知のタンパク質であってもよく、それに対して、ペプチドの標的ライブラリ、関連するフラグメントイオン、並びに関連するプリカーサー及びフラグメントイオン情報が決定されてもよい。一実施形態では、シミュレータ又はモデリングソフトウェアが、タンパク質の特定のペプチドに関しては、全てのプリカーサーイオンを、また各プリカーサーイオンに関しては、かかるプリカーサーイオンそれぞれをフラグメンテーションすることによって生成される、関連するフラグメントイオンを予測するのに使用されてもよい。上記は、PAなどのタンパク質の標的ライブラリが生成されてもよい、1つの方法である。より一般的には、本明細書の技術による一実施形態は、PAの標的ライブラリに取り込むのに使用される情報を得るのに、任意の好適な技術を使用してもよい。本明細書の技術によれば、一実施形態は、シミュレータを使用して、教師ありクラスタリングの標的として使用されるPAに対してCCPISを予測し生成してもよい。
例えば、図18に示されるように、例えば、ペプチド1〜Mとして表される100以上のペプチドに関する情報を含んでもよい、単一のPAに関するライブラリに含まれてもよい、情報の表現の一例が示される。各ペプチドに対して、ライブラリは、プリカーサーイオン及び関連するフラグメントイオンのセットを同定してもよい。例えば、ペプチド1に対して、プリカーサーイオン化の結果として、プリカーサーイオン1〜Nが生成されてもよい。それに加えて、ライブラリは、かかるプリカーサーイオンそれぞれに対して、かかるプリカーサーイオンのフラグメンテーションの結果として生成されるフラグメントイオンを同定してもよい。例えば、プリカーサーイオン1は、フラグメンテーションされると、関連するフラグメントイオンのセットを生成する。本明細書に記載されるように、ライブラリ中の各プリカーサーイオンは、単一のPCCに対応してもよく、別の方法では、同じプリカーサーイオンの異なる電荷状態を表す、1つ又は2つ以上のPCCの組み合わされたセットとしての単一のプリカーサーに関する情報を表してもよい。それに加えて、ライブラリは、例えば、各イオンのm/z、保持時間、イオンの異なる強度又は面積比(例えば、AR1及びAR3メトリックに関する値)など、プリカーサー及びプロダクトイオンに関するイオン情報を含んでもよい。
図19を参照すると、本明細書の技術による一実施形態で行われてもよい、例示のワークフローが示されている。実験1854は、PAが「純粋」であり、PAのみを含むか否かを判断するのに、PAを含むサンプル1852に対して行われてもよい。かかる処理は、分析中のサンプルが任意の宿主細胞タンパク質汚染物質又は他の汚染物質を含むか否かを判断してもよい。本明細書に記載されるように、また当該分野で知られているように、実験1854は、タンパク質消化及びLC/MS又はLC/IMS/MS分析を行うことを含んでもよい。LE及びHEスキャンデータ1855が実験に対して得られてもよく、その実験が更に、本明細書に記載される教師ありクラスタリング技術1856を使用して、教師ありクラスタリングの標的ライブラリとして使用されるPAタンパク質1857に関するライブラリを用いて処理されてもよい。例えば、1856によって表されるかかる処理は、マッチしたイオンが更なる考慮からデジタル的に除去される、図14Aに記載されるような教師ありクラスタリングを使用して行われてもよい。
1856によって表されるかかる処理は、教師ありクラスタリングを行い、アンマッチしたイオンの残留又は残存セット1858を生成することを含んでいてもよい。本明細書の他の箇所に記載されるように、アンマッチしたイオンの残留又は残存セット1858は、PAライブラリ1857の情報にマッチしないと判断された、アンマッチしたプリカーサーイオン又はPCC及びアンマッチしたフラグメントイオンを含んでもよい。
この時点で、後続の処理は、2つの代替のワークフローのうち1つを使用してもよい。第1の後続の処理ワークフローは、更に詳細に後述される、1860、1862、1864、及び1866によって表される処理を含む。第2の後続の処理ワークフローは、1870、1872、及び1874によって表される処理を含む。
第1の後続の処理ワークフローと関連して、アンマッチしたイオンの残留又は残存セット1858は、教師なしクラスタリング1860による処理のために入力されてもよい。出力として、教師なしクラスタリング1860は、PCC又はプリカーサーイオン及び関連するフラグメントイオンのマッチしたイオンセットを含む出力1862を決定してもよい。1858の各PCCに対して、教師なしクラスタリング1860は、出力1862に含まれるような、1つ又は2つ以上の関連又はマッチするフラグメントイオンのセットを決定してもよい。マッチしたイオンセット1862は、次に、宿主細胞タンパク質汚染物質1864の第三者DB又はライブラリに対して問い合わせ1866されてもよい(例えば、プリカーサーイオン及び関連するフラグメントイオンの任意のマッチしたセットが、DB又はライブラリ1864内にあるもののいずれかにマッチするかを判断し、それによって、マッチしたイオンセット1862が宿主細胞タンパク質汚染物質を含むことを同定するため、マッチしたイオンセット1862を検索する)。
第2の後続の処理ワークフローと関連して、宿主細胞プロテオーム1868は、本明細書の他の箇所に記載されるような形でモデリングソフトウェア1870に入力されて、(例えば、図18、図12などにある情報を含む)宿主細胞タンパク質汚染物質1874のDB又はライブラリを生成してもよい。アンマッチしたイオンの残留又は残存セット1858は、宿主細胞タンパク質汚染物質のDB又はライブラリを標的ライブラリとして使用する、教師ありクラスタリング1872による処理のために入力されてもよい。この方法で、教師ありクラスタリング1872は、残留セット1858のアンマッチしたイオンと宿主細胞タンパク質汚染物質のDB又はライブラリとの間で十分な数のマッチがなされるか否かを同定して、残留物1858が任意の宿主細胞タンパク質を同定することを同定又は確認するのに使用されてもよい。
図20を参照すると、本明細書の技術による一実施形態で行われてもよい、処理ステップのフローチャートが示されている。フローチャート1900は、図19と関連して上述されたような処理を要約している。ステップ1902で、PAを含むサンプルに対して、実験のためのLEスキャンデータ及びHEスキャンデータを得るのに、実験が行われてもよい。ステップ1904で、実験データを使用して、またPAタンパク質ライブラリを標的ライブラリとして使用して、教師ありクラスタリングが行われてもよい。本明細書の他の箇所の記載と同じく、標的ライブラリ内の各プリカーサーイオン又はPCCに関して、LEスキャンデータにおいてマッチがあるか否か、またかかるマッチしたPCCそれぞれに関して、HEスキャンデータが標的ライブラリで同定されたようなPCCに対する任意のフラグメントイオンを含むか否かを判断するため、ステップ1904の教師ありクラスタリングが行われてもよい。結果として、ライブラリのPAに関する好適な数のプリカーサーイオン又はPCC及び関連するフラグメントイオンは、実験のためのLE及びHEスキャンデータに含まれるようなイオン情報にマッチするはずである。ステップ1906で、アンマッチしたプリカーサーイオン又はPCCの残留又は残存セット、及びPAライブラリに関してステップ1904でマッチが判断されなかった実験データのイオンとしてのアンマッチしたフラグメントイオンを決定する処理が行われてもよい。ステップ1906から、一実施形態は、あるいは、ステップ1908及び1910を行うように進んで、第1の後続のワークフローを形成してもよく、又はステップ1912及び1914を行うように進んで、第2の後続のワークフローを形成してもよい。
第1の代替例として、処理は、ステップ1906からステップ1908に進んで、ステップ1906からの残留又は残存するアンマッチしたイオンに関して教師なしクラスタリングを行って、マッチしたPCC及び関連するフラグメントイオンのSSPPIS又はセットを生成してもよい。処理は、ステップ1910に進んで、ライブラリとPCC及び関連するフラグメントイオン(ステップ1908の処理によって決定されるようなもの)のマッチしたセットとの間のマッチに関して、宿主細胞タンパク質汚染物質のDB又はライブラリを検索する。ステップ1910で使用されるDB又はライブラリは、例えば、第三者が提供するライブラリであってもよい。
第2の代替例として、処理は、ステップ1906からステップ1912に進んでもよい。ステップ1912で、本明細書に記載されるようなモデリングソフトウェアを使用するなど、宿主細胞タンパク質汚染物質のDB又はライブラリを生成する処理が行われてもよい。ステップ1914で、次に、残留セット(ステップ1906で生成される)におけるDB又はライブラリ(ステップ1912で生成される)のマッチしたPCC及び関連するフラグメントイオンのSSPPIS又はセットを検索する、教師ありクラスタリングが行われてもよい。
図21を参照すると、特定の精製された抗体(PA)の標的ライブラリを生成する、本明細書の技術による一実施形態で行われてもよい処理の一例2101が示されている。PAライブラリ2117は、特定のタンパク質又は分子の存在に関するサンプルの検証と関連してなど、本明細書に記載される他の技術と関連して使用されてもよい。PAライブラリ2117はまた、サンプル中の変異型、異常、汚染物質などの検出及び/又は同定と関連して使用されてもよい。例えば、本明細書に記載されるように、PAライブラリは、プリカーサーの変異型又は修飾、ジスルフィド結合ペプチド、抗体薬物複合体(ADC)、及び宿主細胞タンパク質汚染物質のいずれかを検出する、サンプルの分析と関連して使用されてもよい。したがって、図21は、本明細書の技術による一実施形態で教師ありクラスタリングを行うのと関連して、標的ライブラリとして後で使用するためにPAライブラリが生成されてもよい、1つの方法を示している。
処理の第1の部分として、PAライブラリ2117は、最初に、理論上のデータを取り込んでもよい。一実施形態では、本明細書の他の箇所で言及されるシミュレータ又はシミュレーションソフトウェアなどのモデリングソフトウェア2021は、PAプロテオーム2020を入力として備えてもよい。出力として、モデリングソフトウェア2021は、PAに対する理論上のペプチドマップを生成する。ペプチドマップは、PAに関してペプチド及び関連するイオンとを含んでもよい。例えば、ペプチドマップは、プリカーサーイオン又はPCC、及びかかるPCCそれぞれに対して、PCCのフラグメンテーションを通して生成される関連するフラグメントイオンなどを含んでもよい。モデリングソフトウェア2021によって理論的に生成されるペプチドマップは、最初に、PAライブラリ2117にペプチド及びPAのフラグメントイオン情報を取り込むのに使用されてもよい。PAライブラリ2117に取り込むのに使用されるペプチドマップは、全てのシステインがジスルフィドを有さないように修飾されている、PAに対するイオン情報を含むことが注目されるべきである。標的PAライブラリは、全ての標的ペプチドの全ての理論上の「インシリコ」CPPISを含む。
ライブラリ2117に最初に理論上のペプチドマップを取り込んだ後、PAを含むことが分かっているサンプル2112に対して実験2114が行われてもよい。本明細書に記載されるように、また当該分野で知られているように、実験2114は、タンパク質消化及びLC/MS又はLC/IMS/MS分析を行うことを含んでもよい。この実験では、サンプル調製は、還元及びアルキル化を行うことを含み、それにより、サンプル中の全てのシステインがジスルフィドを有さない(例えば、トリプシンペプチドのみを有する)ように修飾される。LE及びHEスキャンデータ2115が、実験2114に対して得られてもよい。LE及びHEスキャンデータ2115は、本明細書に記載される教師ありクラスタリング技術2116を使用して、教師ありクラスタリング標的ライブラリとして使用されるPAタンパク質2117のライブラリを用いて更に処理されてもよい。例えば、2106によって表されるかかる処理は、図14Aに記載されるような教師ありクラスタリングを使用して行われてもよい。上述したように、ライブラリ2117の情報は、全てのシステインがジスルフィドを有さないように修飾されているPAに関するイオン情報を含む。システインが修飾され、分析されたサンプル中にジスルフィドを有さないようにして、サンプルが2114に記載されるように調製された場合、システインを含有するものを含むライブラリ2117内の全てのペプチドは、実験データセット2115内の対応するイオン情報にマッチされるはずである。出力として、教師ありクラスタリング2116は、PAライブラリ2117を更新するのに使用されてもよい、マッチしたイオン情報2122を生成してもよい。本明細書に記載されるように、教師ありクラスタリング2116は、2115のLEスキャンデータにおける標的PAライブラリ2117の各標的プリカーサーイオン又はPCCの存在を探す。かかるマッチした標的プリカーサーイオン又はPCCそれぞれに関して、マッチした標的プリカーサーの関連する標的フラグメントイオンが、次に、ライブラリ2117から検索され、そのプリカーサーの標的フラグメントイオンのうちどれが実験データ中に存在するかを判断する、更なる処理と関連して使用される。このように、教師ありクラスタリング2116の終了時に、マッチしたイオン情報2112は、実験データセット2115のLEスキャンデータにおいてマッチしたライブラリ2117の各標的PCC又はプリカーサーイオンと、かかるマッチしたPCC又はプリカーサーイオンそれぞれに対して、マッチしたPCC又はプリカーサーイオンから発するフラグメントイオンの関連するフラグメントイオンセットとを同定してもよい。教師ありクラスタリングの結果として生成される関連するフラグメントイオンセットは、教師ありクラスタリング2116によって、実験データセット2115のマッチしたPCC又はプリカーサーイオンと関連付けられると判断された、PAライブラリ2117のフラグメントイオンを同定する。例えば、ライブラリ2117は、マッチした標的PCC又はプリカーサーイオンに対して15のフラグメントイオンを含んでもよい。しかしながら、教師ありクラスタリングは、それら15のフラグメントイオンのうち10のみが、実際の実験データセット2115におけるマッチした標的PCC又はプリカーサーイオンと関連付けられると判断してもよい。
このように、教師ありクラスタリング2116を完了した後、マッチしたイオン情報2112は、PAライブラリ2117の更新又は再取込みに使用されてもよい(例えば、それによって、実際の実実験データ2115に基づいて、理論上の又はシミュレートされた2117のイオン情報をマッチしたイオン情報2112と置き換える)。例えば、図14A及び関連する本明細書の記載を再び参照すると、PAライブラリ2117に、最初に、理論上のデータが取り込まれ、教師ありクラスタリング2116と関連して使用されてもよい。ライブラリ2117内のPCC又はプリカーサーイオンにマッチする実験データセット2115の各PCC又はプリカーサーイオンに関して、PCC及びそれに関連するフラグメントイオンに対するライブラリ2117の理論上のイオン情報は、実験データセットから得られるようなイオン情報と置き換えられるか、又はそれを含むように更新されてもよい。それに加えて、ここで記載される処理に関して、一実施形態は、マッチしたPCC又はプリカーサー及び関連するフラグメントイオンに関して、実験データセットに含まれるようなイオン情報を使用してもよい。
以下、プリカーサーの変異型又は修飾の同定と関連して行われてもよい技術について記載する。
ここでの説明の文脈では、「変異型」は、精製された抗体又は治療薬と関連付けられたペプチドの一点突然変異と見なされてもよい。より広義では、本明細書の技術は、より一般的に適用され、ペプチドの任意の修飾型である「変異型」と共に使用されてもよい。一般的な修飾としては、酸化(M、W)、メチル化(K、R)、アセチル化(K、R)、標識(SILAC)、リンカー、又は性薬物を伴うライカー(liker)(例えば、ADC)、グリカン、リン酸などが挙げられるが、それらに限定されない。プリカーサーとそのプロダクトイオンとの関係に沿って、変異型/修飾の地点までのペプチドのフラグメンテーションパターンはほぼ同一である。変異型/修飾が、保持時間の物理化学的属性に対して、またIMSが用いられる場合は、ドリフト時間又は断面積(CCSA2)に対して及ぼす影響は、ペプチドの長さの関数である。例外である特定の化学的修飾がある。例えば、ADCと関連して、リンカー及びその細胞毒性薬物は、非常に疎水性が高く、ペプチドの保持時間に対して顕著な影響を有する。
最初の検証又はスクリーニングにおいて、統計的に有意な数のマッチしたプロダクトイオンがあることを所与として(プリカーサーイオンのマッチが存在することは必須ではない)、ペプチドの修飾/変異型を正確に同定することができる。本明細書で更に詳細に後述されるような処理は、マッチしたSSPPIS中にプリカーサーイオンが存在しないことを認識し、更なる処理を始動させ、それにより、マッチしたSSPPIS(1つのみが存在する)中のプリカーサーイオンと標的m/zとの間のΔm/zが計算され、既知の変異型/修飾のルックアップテーブルと比較される。マッチが見出された場合、修飾/変異型のプロダクトイオンスペクトルが生成され、新しいCPPIS(変異型)の作成における同定及び包含を検証するため、プリカーサーのピークエンベロープ内の全てのSSPPISと比較される。このアプローチの成功は、ペプチドのアミノ酸直鎖及びそのフラグメンテーションパターンにおける修飾/変異型の位置の関数である。明瞭にするため、Δm/zが、C末端からの第2のアミノ酸残基の修飾又は点変異体(変異型)であり、フラグメンテーション(例えば、衝突解離)によって生成されたプロダクトイオンの90%がy’’イオンである場合、修飾/変異型のy’’2〜y’’maxからのy’’イオンは全て、Δm/zを有することになる。そのため、これらのプロダクトイオンは検証処理においてマッチすることがない。他方で、十分な数のbイオンがフラグメンテーション中に生成され、それらのうち統計的に有意な数がマッチした場合、ペプチドの修飾/変異型は同定されるであろう。
プリカーサーイオンに関するΔm/zに基づいた第1の合格において変異型が同定されない場合、全ての可能なアミノ酸交換(一点突然変異)の正確な質量差を反映したΔm/z値のルックアップテーブルを使用して、処理が更に行われてもよい。Δm/z、Δ時間、及びΔドリフト時間(IMSが利用される場合)は、抽出されたプロダクトイオンに追加されてもよい。これらのプロダクトイオンは、次に、m/z、保持時間、及びドリフト時間におけるユーザ定義のマッチ許容差内にある、全てのSSPPISに対してスクリーニングされる。プリカーサーのΔm/zがプロダクトイオンのΔm/zと一貫しており、変異型CPPISが作成された場合に、マッチが見出される。変異型が見出されると、同定されたプロダクトイオンは、配列における修飾/変異型の位置についての洞察を与えてもよい。上述したように、プロダクトイオンのm/z値は、修飾の地点まで一貫している。Δm/zの第1の組込みを示すプロダクトイオンのm/z値は、変異アミノ酸の一般位置をアルゴリズムに伝える。暫定的な同定が行われると、変異型の全ての可能な部位に対してプロダクトイオンが生成され、マッチしたSSPPISに常在する他のプロダクトイオンと比較される。この時点で、処理は、修飾又は変異型の正確な位置を同定することを試みてもよい。上述した位置的な限定と同様に、Na+及びK+付加物は、共通のフラグメントイオンタイプ(b、y’’)のどちらか又は両方のm/z値を大幅に変更する。ナトリウム付加又はカリウム付加電荷がC末端に局在する場合、フラグメンテーションで生成されたy’’イオンは、ナトリウム付加又はカリウム付加のΔm/zを含むようになる(それらが未修飾ペプチドに対してマッチしないように制限される)。同じことが、y’’イオンをそれらの補体であるbイオンと置き換える、n末端にも当てはまる。Na+及びK+付加物の形成はガス相で起こる。そのため、ペプチドのNa+及びK+付加物は、同一の保持時間及びドリフト時間を有するようになる。これが該当する場合、処理は、Na+及びK+付加物を検索し、Δm/zが上述したルックアップテーブルに追加されてもよいので、かかる修飾は標的ペプチドの修飾/変異型の1つとして同定されてもよい。本明細書の技術による一実施形態は、同定を支援する確証的なプロダクトイオンデータがあるか否かに関わらず、任意の可能な変異型を報告してもよい。
本明細書の技術の明確に有利な点は、スクリーニングされたSSPPISにおけるPCCの存在に対して中立なことである。主要なペプチドの同定はその親分子の存在によって向上するが、それは必須ではない。本明細書に記載される処理は、標的CPPISを有する同位体を含む、統計的に有意な数のプロダクトイオンのマッチするのみを根拠として、プリカーサーの修飾/変異型を同定するのに使用されてもよい。
プリカーサーの変異型又は修飾を検出及び/又は同定する、本明細書の技術と関連する処理の第1の部分として、最初にサンプル中のPAの存在を検証するステップが行われてもよい。図22を参照すると、本明細書の技術による一実施形態で行われてもよい、例示のワークフローが示されている。実験2104は、サンプル2102が実際にPAを含むか否かを判断するのに、PAを含むサンプル2102に対して行われてもよい。本明細書に記載されるように、また当該分野で知られているように、実験2104は、タンパク質消化及びLC/MS又はLC/IMS/MS分析を行うことを含んでもよい。この実験では、サンプル調製は、還元及びアルキル化を行うことを含み、それにより、サンプル中の全てのシステインがジスルフィドを有さない(例えば、トリプシンペプチドのみを有する)ように修飾される。LE及びHEスキャンデータ2105が、実験2104に対して得られてもよい。LE及びHEスキャンデータ2105は、本明細書に記載される教師ありクラスタリング技術2106を使用して、教師ありクラスタリング標的ライブラリとして使用されるPAタンパク質2107のライブラリを用いて更に処理されてもよい。例えば、2106によって表されるかかる処理は、図14Aに記載されるような教師ありクラスタリングを使用して行われてもよい。本明細書に記載されるように、PAライブラリ2107は、任意の好適な技術を使用して生成されてもよく、プリカーサーイオン又はPCCと、かかるPCCそれぞれに対して、PCCのフラグメンテーションを通して生成された関連するフラグメントイオンとを含む(例えば、PAライブラリ2107は、PAに関するプリカーサー及び関連するプロダクトイオンのCPPISを含む)。例えば、PAライブラリ2107は、図21の処理と関連して記載されるような情報を含むように生成されてもよい。ライブラリ2107の情報はPAに関するイオン情報を含む。サンプルが2104に記載されるように調製された場合、ライブラリ2107内の全てのペプチドは、実験データセット2105の対応するイオン情報にマッチされるはずである。このように、一実施形態では、サンプル2102中におけるPAの存在は、ライブラリ2107の全てのペプチドを、教師ありクラスタリング2106を行った結果としての実験データセットのイオン情報に対してマッチさせることによって検証されてもよい。代替例として、サンプル2102中におけるPAの存在は、ライブラリ2107内の少なくとも指定された数のペプチドを、教師ありクラスタリング2106を行った結果としての実験データセットのイオン情報に対してマッチさせることによって検証されてもよい。処理の上記第1の部分はまた、ペプチドフラグメントの形成をもたらすタンパク質の化学又は酵素処理と、それに続く再現可能な形でのフラグメントの分離及び同定とを含む、タンパク質に対するアイデンティティ試験であるペプチドマッピングとも呼ばれることがある。
2106で教師ありクラスタリングを行った結果として、実験データセット2105の対応するイオン情報にマッチした、ライブラリ2107内のプリカーサーイオン又はPCC及び関連するフラグメントイオン(例えば、CPPIS)を同定する、情報の第1のセット2106aが得られてもよい。それに加えて、2106の処理の結果として、アンマッチしたイオンの残留又は残存セット(例えばアンマッチしたPCC及びアンマッチしたフラグメントイオン)を表す、情報の第2のセット2106bが得られてもよい。アンマッチしたイオン2106bの残留又は残存セットは、各スキャンにおいてライブラリのPCC又はプリカーサーにマッチしないイオンのセットを含んでもよい。
したがって、要素2106aは、実験データセットの対応するイオン情報に対して同定又はマッチされたPAのペプチドを表す(例えば、要素2106aは、PAライブラリのマッチした標的(例えば、実験データセットのイオン情報に対してマッチしたライブラリのPCC又はプリカーサーイオン)を表す)。2106aで同定されるようなPAライブラリのマッチしたPCC又はプリカーサー標的から、ここで、かかるマッチしたPCC又はプリカーサーイオンそれぞれのプロダクトイオンスペクトル(例えば、CPPIS)を有し、それにより、プロダクトイオンスペクトルは関連するPCC又はプリカーサーイオンから発するフラグメントイオンを表す。それに加えて、2106aにおけるマッチしたPCC及び関連するフラグメントイオンに対する、AR1値、AR2値などのイオン情報は、実験データセット2105に含まれるものとされてもよい。
この時点で、2106aのマッチしたPCC又はプリカーサーイオン標的のフラグメントイオンに対して、アンマッチしたイオン2106bの残留又は残存セットを検索する処理が行われてもよい。マッチしたフラグメントイオンに関するフラグメントイオン情報は、実験データに含まれるものとされてもよい。例えば、ライブラリ2107は、PCC又はプリカーサーイオンP1を含んでもよく、P1と関連付けられる(例えば、そのフラグメンテーションを介して生成される)20のフラグメントイオンが存在することを示してもよい。教師ありクラスタリング2106を行う際、ライブラリの標的P1は、実験データセットの対応するP1にマッチされてもよい。
それに加えて、実験データセット2105は、P1と関連付けられる5つのみのフラグメントを含んでもよい。教師ありクラスタリングを用いる本明細書の技術による一実施形態では、ライブラリ2107は、20のフラグメントイオンを5つのフラグメントイオン及び実験データセットの対応するフラグメントイオン情報と置き換えるように更新されてもよい。それに加えて、P1に対してマッチしたイオン情報2106aにおける情報は、実験データセットのように、5つのフラグメントイオン及び関連するイオン情報のフラグメントイオンセットを含んでもよい。
図22を参照すると、マッチしたイオンセット2106aに含まれるのはイオン情報の行である。2106aの各行は、教師ありクラスタリング2106においてライブラリ2107の対応するPCC又はプリカーサーイオンにマッチした、マッチしたPCC又はプリカーサーイオンを同定してもよい。2106aの各行は、同じ行に含まれるマッチしたPCC又はプリカーサーイオンと関連付けられるものとして実験データセットにおいて同定される、フラグメントイオンのフラグメントイオンセットを含んでもよい。本明細書のこの例及び他の例と同じく、PCC又はプリカーサーイオンは、Pi(「i」は整数)と表されてもよく、プロダクト又はフラグメントイオンはFiと表されてもよい。例えば、2106aは、ライブラリ2107の対応するPCC又はプリカーサーイオンにマッチしたP1を含む第1の行を含む。実験データセット2105において、P1は、フラグメントイオンセット2110aと関連付けられることが(教師ありクラスタリング2106を介して)判断されている。2106aは、ライブラリ2107の対応するPCC又はプリカーサーイオンにマッチしたP2を含む第2の行を含む。実験データセット2105において、P2は、フラグメントイオンセット2110bと関連付けられることが(教師ありクラスタリング2106を介して)判断されている。
マッチしたイオン情報2106aのフラグメントイオンセットの場合、フラグメントイオンセットは、同じプリカーサーイオン又はPCCから全て発しているものと判断されている関連又は関係するフラグメントイオンのセットを表し、PCC又はプリカーサーイオンは、ライブラリ2107の対応するPCC又はプリカーサーイオンにマッチされている。
例2100におけるイオンの残留又は残存セット2106bは、教師ありクラスタリング2106の一部としてのライブラリ2107の標的にマッチしない各スキャンのイオンの行を含んでもよい。例えば、2106bは、P3及びF1〜3を含むスキャンXからのイオンの第1の行と、P4及びF8〜F12を含むスキャンYからのイオンの第2の行と、P6及びF10〜11を含むスキャンZからのイオンの第3の行と、P5及びF5〜7を含むスキャンXXからのイオンの第4の行とを含む。本明細書の技術による一実施形態では、2106bの各行は、教師ありクラスタリングから生成されたが、ライブラリ2107の対応するPCC又はプリカーサーイオンにはマッチしていない、SSPPISに対応してもよい。
一実施形態は更に、2106aのフラグメントイオン2110a〜bをフィルタ処理してもよい。例えば、各フラグメントイオンセット2110a〜bにおいて、処理は、最小強度閾値を満たすもののみを利用するようにフラグメントイオンをフィルタ処理してもよい。一実施形態では、各フラグメントイオンセット2110a〜bに関して、最小強度を表す閾値は、最大強度を有するセットにおけるフラグメントイオンの強度の1/3であってもよい。例えば、2110aのF4が、2110aの全てのフラグメントイオンの最大強度MXを有するものと仮定する。この場合、2110aのフラグメントイオンは、少なくともMX/3の強度を有さない2110aの任意のフラグメントイオンを更に処理することから除外されるようにフィルタ処理されてもよい。
同様のフィルタ処理が、2106aのフラグメントイオンセットのそれぞれに対して行われてもよい。この例では、2110a及び2110bの全ての例証されるフラグメントイオンが、各フラグメントイオンセットの最大フラグメントイオン強度に関して決定された最小閾値強度に基づいて、かかるフィルタ処理基準を満たすものと仮定する。
残留物2106aのフラグメントイオンのセット2112a〜dを検索して、残留物2106aの任意のフラグメントイオンセットが、2106aのフラグメントイオンセット2110a〜bの1つにマッチする閾値数のフラグメントイオンを含むか否かを判断する処理が行われてもよい。一般に、マッチしたイオン情報2106aのフラグメントイオンセットと残留物2106bとの間のかかるマッチは、マッチするフラグメントの(指定の許容差内の)m/z、マッチするフラグメントのイオン強度比、並びにフラグメントイオンマッチの最小閾値数がマッチするm/z及びマッチするフラグメントイオン強度比の基準を満たすことの判断を含む、マッチング基準を使用して行われてもよい。これについては更に詳細に後述される。
例えば、マッチしたイオン情報2106aの第1のフラグメントイオンセット2110aが検索され、残留物2106bの各フラグメントイオンセット2112a〜bと比較されて、マッチするm/zとマッチするフラグメントイオン強度比の基準を満たす、少なくとも閾値数のマッチするフラグメントがそれらの間にあるか否かが判断される。第1のフラグメントイオンセット2110aは、フラグメントイオンセット2112aと比較されて、2つのセット間でマッチするフラグメントの数が決定される。かかるマッチは、ある指定の許容差内で同じm/zを有するマッチするフラグメントを探してもよい。2110a及び2112aに関するこの例では、両方のセットのF1〜F3がマッチするm/z値を有するものと仮定する。
それに加えて、フラグメントイオン強度比基準がセット2110a及び2112aの間で満たされなければならない。2110aなどのフラグメントイオンセットの場合、フラグメントイオン強度比(FII)は、同じフラグメントイオンセット内の任意のフラグメントの最大強度に関して、その各フラグメントイオンFnに対して決定されてもよい。公式的には、これは次式のように表されてもよい。
FII Fn=強度(Fn)/MAXフラグメント強度
式中、
Fnは、FIIが決定されるフラグメントイオンセットのフラグメントイオンを表し、
MAXフラグメント強度は、Fnとしての同じフラグメントイオンセット中の全てのフラグメントイオンの最大フラグメント強度を表す(例えば、フラグメントイオンセットが2106a又は2106bのどちらかによるものである場合)。
更に例証するため、ここまでは2110aのF1〜F3が2112aのF1〜F3に対してマッチするm/z値を有するものと判断されており、それにより、結果として得られるフラグメントイオンセットがここまではF1〜F3を含み、F3がF1〜F3の最大強度を有する、フラグメントイオンセット2110aについて検討する。本明細書の他の箇所の記載と同じく、2110aのF1に対する第1のFI、及び2112bのF1に対する第2のFIIを決定し、次に上記第1のFII及び第2のFIIを比較して、ある指定の許容差内での上記第1のFII及び第2のFEとのマッチを判断する、処理が行われてもよい。マッチしない場合、フラグメントイオンF1は、結果として得られるイオンフラグメントセットから除去され、処理を続けてもよい。FIIを決定し比較する上記処理は、結果として得られるフラグメントイオンセットの各Fiに対して繰り返されてもよい。
処理のこの時点で、結果として得られるフラグメントイオンセットがF1〜F3を含み、2110a及び2112bのF1〜F3が、マッチするm/z及びマッチするフラグメントイオン強度比基準を満たしていると判断されているものと仮定する。次に、結果として得られるフラグメントイオンセットが、少なくとも最小閾値数のフラグメントイオンを含むか否かを判断する処理が行われてもよい。例えば、一実施形態では、最小閾値数のフラグメントイオンは、次の整数値まで切り上げられて、N/2として表されてもよく、Nはセット2110aにおけるフラグメントイオンの数であってもよい。結果として得られるフラグメントイオンセットが最小閾値数のフラグメントイオンを含む場合、処理は、全てのマッチング基準が満たされると判断してもよく、それにより、2110a及び2112aは、マッチング基準にしたがってマッチするフラグメントイオンセットであるものと判断される。それに加えて、結果として得られるフラグメントイオンセットは、2112aからのフラグメントイオンにマッチするフラグメントイオンセット2110aの部分を同定する。別の方法として、結果として得られるフラグメントイオンセットが最小閾値数のフラグメントイオンを含まない場合、処理は、2110a及び2112aがマッチするフラグメントイオンセットではないと判断してもよい。
上記例を続けると、F1、F2、及びF3は、2110aのフラグメントイオンにマッチする2112aのフラグメントイオンを表す、結果として得られるマッチするフラグメントイオンセットを形成すると判断されてもよい。2110aと2112aとの比較が、マッチするm/z及びマッチするフラグメントイオン強度比のマッチング基準を満たす閾値数のフラグメントイオンに対するマッチをもたらさない場合、2110aと2112b、2110aと2112c、及び2110aと2112dのフラグメントイオンを比較して、2212b〜dのいずれかが2110aに対するマッチであるか否かを判断することによって、処理を継続してもよい。同様の処理がまた、フラグメントイオン2106aの各セットに対して行われてもよい(例えば、2110bを、2112a、2112b、2112c、及び2112dのそれぞれと比較する)。
上記例を続けると、F1、F2、及びF3は、2110aのフラグメントイオンにマッチする2112aのフラグメントイオンを同定する、結果として得られるマッチするフラグメントイオンセットを形成すると判断されている。かかるマッチに基づいて、処理は、修飾又は変異型が存在していると判断する。ここで、元の分子(例えば、元のPCC若しくはプリカーサー)に対する特定の修飾又は変異型を決定する処理が行われてもよい。この時点で、2110a及び2112aと関連付けられた2つのPCC又はプリカーサーイオンのm/z値間の差を計算することによって、プリカーサー又はPCCの修飾のデルタ質量(Δ質量)を決定する処理が行われてもよい。2112aと関連して、P3は、同じスキャンXにおいて、フラグメントイオンセット2112aとして出現してもよく、この例では、例えばBateman技術及び高−低プロトコル(本明細書の他の箇所に記載)を使用して、LE及びHEスキャンデータが生成されてもよいことが注目されるべきである。より一般的には、LE及びHEスキャンデータがどのように得られるかに応じて、プリカーサーP3は、スキャンXによって表されるスキャンにおいて関連するフラグメントイオンを有するプリカーサーイオンであってもよい。また、単一のプリカーサーイオンP3のみが、アンマッチされ、またスキャンXにおいてフラグメントイオンを有するものとして示されているが、2つ以上のプリカーサーイオンが単一のスキャンXとそのように関連付けられてもよい(例えば、複数のプリカーサーイオンが、スキャンXにおいてそれらのフラグメントイオンを有してもよい)ことが注目されるべきである。
この例では、Δ質量は、(2110aにおける)P1の第1のm/zと(2112aにおける)P3の第2のm/zとの間の差の絶対値として決定される。より一般的には、第1のイオンIXと第2のイオンIYとの間の質量差MDは、次式のように表されてもよい。
MD=ABS(IX m/z−Iy m/z)
式中、
Ix m/zはIxのm/zを表し、
Iy m/zはIyのm/zを表し、
ABSは、差の数学的絶対値を表す。
MDは、分子又はプリカーサーに対する修飾のm/z差を表す、この例ではP1及びP3(P1=Ix及びP3=Iy)などの、2つのプリカーサーイオン又はPCCに関して決定されてもよい。本明細書の技術による一実施形態は、表によって示されるような異なるプリカーサーの修飾をそれぞれ表す、MDに対する異なる値によって索引付けされるルックアップテーブルを利用してもよい。例えば、一実施形態は、Unimod.orgを通して利用可能なものなど、分子に対して分かっている修飾又は変異型の表を使用してもよい。
次に、図23を参照して、本明細書の技術による一実施形態で使用されてもよい、表2210の一例について更に例証する。表2210は、列2212が対象のものであってもよい既知の修飾のm/z差を含む、プリカーサーΔ質量修飾の表の一例である。MDの値は、列2212のマッチする値(指定の許容差内のマッチ)を検索することによって、表2210に対するインデックスとして決定され使用されてもよい。計算されたMD値が列2212の値にマッチする場合、対応するプリカーサー修飾に関する情報を得るため、表2210の行が検索されてもよい。要素2220は、表2210の最後の列にあるm/z差を決定するのに利用される、モノアイソトピック質量を表してもよい。
プリカーサー修飾又は変異型の表2210は、本明細書の技術による特定の実施形態における対象にしたがって変動してもよいことが注目されるべきである。
計算されたMD値と表の入力とでマッチが見出された場合、マッチした表入力によって表されるようなプリカーサーの修飾又は変異型があったものと判断される。
2210のマッチする表入力によって表されるプリカーサー修飾又は変異系に対応する、修飾されたプリカーサーのフラグメントに対するm/z値を決定する、処理が行われてもよい。一実施形態は、例えば、シミュレータを使用して、表のマッチする入力によって提案される(例えば、Δ質量若しくはMD一致によって提案される)修飾に対するフラグメント質量又はm/z値を計算してもよい。
例えば、図22及び上記例を再び参照して、上述されたように2112a及び2110aの間でマッチが行われ、かかるマッチするフラグメントイオンセットに対して計算されたMDが表2210の入力にマッチし、それによってMDがプリカーサー修飾又は変異型に対応することを示すものと仮定する。上述のように、マッチしたイオン情報2106aは、P1が、ライブラリ2107の対応するプリカーサー又はPCCにマッチした、PCC又はプリカーサーイオンであることを示す。この例では、P1は、修飾されている元のPCC又はプリカーサーイオンとして判断されてもよく、P1の特定のプリカーサー修飾又は変異型はP3によって表されてもよい(例えば、P3は、P3及びP1に関して計算されたMDに基づいて、2210のマッチする表入力によって表されるP1を修飾したもの又は変異型である)。
この時点で、シミュレータ又はモデリングソフトウェアを使用して、マッチする表入力によって提案される特定のプリカーサー修飾又は変異型に関して、予期されるフラグメントイオン及び関連するフラグメントイオンのm/z値が決定されるか、又は理論的に計算されてもよい。シミュレータが、マッチする表入力によって表されるような、又は計算されたMD値に基づいた、P1の修飾に関するフラグメントイオンのセットが、F1、F2’’、F3’’、F4であるものと仮定する(その場合、シミュレータは、フラグメントイオンF1、F2’’、F3’’、及びF4のそれぞれに対して、可能な他の情報と共にm/z値を決定する)。以下のパラグラフにおける例証のため、F1、F2’’、F3’’、及びF4によって、プリカーサー修飾又は変異型の計算されたフラグメントイオンセットを形成させる。
次に、計算されたMD値又は質量差によって提案されるように、プリカーサー修飾又は変異型を検証する処理が行われてもよい。かかる処理は、残留物2106bにおけるプリカーサー変異型のフラグメントイオンの1つ又は2つ以上を検索することを含んでもよい。より具体的には、かかる処理は、プリカーサー変異型P3のPCCに対する溶出ピークのスキャン(例えば、図7は、PCCに対する溶出ピークのスキャンを示している)において、プリカーサー修飾の計算されたフラグメントイオンセットの修飾されたフラグメント(例えば、F2’’、F3’’、F4’’)の1つ又は2つ以上を検索してもよい。
例えば、図22を再び参照すると、残留物2106bが、次のようなスキャンYYに関する別の行も含むものと仮定する。
スキャンYY P3 F1 F2’’ F3’’
プリカーサーイオン又はPCC P3が関連するフラグメントF1、F2’’、及びF3’’の異なるセットと共に出現する、別のスキャンYYを表す。プリカーサー修飾又は変異型を検証するかかる処理は、P3によって表される修飾されたプリカーサーイオン又はPCCが現れるスキャンX以外のスキャンに関して、残留物2106bを検索してもよい。この場合、P3は追加のスキャンYYに現れ、スキャンYYは、P3の溶出ピークのスキャンを表してもよい。P3が現れるマッチするスキャンYYに関して、修飾されたフラグメントF2’’、F3’’、又はF4’’のうち1つも現れるか否かが判断される。現れる場合、処理は、プリカーサー修飾又は変異型が存在することを確認し、そうでなければ、検証は、プリカーサー修飾又は変異型が存在することを確認しない。この例を続けると、修飾されたフラグメントF2’’及びF3’’は両方ともスキャンYYに現れ、それによってP3が、上述の計算されたMD(例えば、計算されたMDにマッチする値を2212に有する表における入力)によって表されるような、特定のプリカーサー修飾又は変異型として確認又は検証される。
本明細書の技術にしたがって、一実施形態は、例えば、本明細書の他の箇所に記載されるようなAR1及びAR2の値を使用して、特定の修飾を更に検証する他の検証基準を更に利用してもよい。例えば、残留物2106bのイオン情報を使用して、P3が、図7に関連して本明細書に記載され例証されるようなスキャンにわたって追跡されてもよく、やはり本明細書に記載されるように、AR1及びAR2値などの検証基準を使用して、P3に対する関係又は関連するフラグメントイオンのセットを決定する処理が行われてもよい。この場合、P3と関連付けられるフラグメントイオンのセットは、修飾されたフラグメントF2’’及びF3’’の1つ又は2つ以上を含むべきである。それに加えて、AR1などの検証基準を使用する本明細書の他の箇所の考察と同じく、F2’’に対して決定されるようなAR1は、P3の溶出ピークのスキャンにわたって同じであるべきであり、F3’’に対して決定されるようなAR1は、P3の溶出ピークのスキャンにわたって同じであるべきである。P3に対して決定されるAR2値、並びにF2’’及びF3’’などのそのフラグメントは、P3の溶出ピークのスキャンにわたって同じであるべきである。例えば、P3の溶出ピークのスキャンH及びMの場合、以下が(ある指定の許容差内で)真のままであるべきである。
スキャンHにおけるP3の強度/スキャンMにおけるP3の強度=
スキャンHにおけるF2’’の強度/スキャンMにおけるF2’’の強度=
スキャンHにおけるF3’’の強度/スキャンMにおけるF3’’の強度
上記は、少なくとも閾値数のフラグメントイオンに関して、フラグメントイオンセット2110a及び2112aの間のマッチの判断に応答して行われる処理である。代替例として、次に、処理が、少なくとも閾値数のフラグメントイオンに関する、2110a及び2112aの間のマッチを探索又は判断しない処理の場合について検討する。この場合、2110aにおけるフラグメントイオンの数が、少なくとも4などの最小数である場合に、代替の処理が行われてもよい。かかる代替の処理は、(本明細書の他の箇所に記載されるように)MD値を決定することを含んでもよいが、このMD値が、2110aにおける「隣接する」フラグメントイオンの対に関する質量又はm/z差を表すことが異なる。2つのプリカーサーイオン又はPCCに関してMDについて上述されたようなかかる処理は、「隣接する」フラグメントイオンの対(例えば、2110aのF1及びF2)に基づいて、MD値に対して繰り返されてもよい。PIなど、特定のPCC又はプリカーサーイオンと関連付けられる、2110aなどのフラグメントイオンに関して隣接するフラグメントイオンの対を決定する際、セット2110aのフラグメントは、フラグメントの増加又は減少するm/z値に関して順序付けられてもよい。2つのフラグメントイオンF1及びF2は、この文脈では、F1及びF2がm/zの順位において順序付けられた位置で互いに隣り合っている場合に、隣接していてもよい。
プリカーサーに対して決定されたMD、又は上述されたようなフラグメントイオンの対に対するMDのどちらかが、表2110の質量Δ又は異なる入力にマッチしない場合に、かかるアンマッチしたMDは、表に組み込まれない、新しい若しくは追加のタイプ又はプリカーサー修飾を表してもよい。
図24を参照すると、本明細書の技術による一実施形態で行われてもよい、処理ステップのフローチャート2300が示されている。フローチャート2300は上述されたような処理を要約している。ステップ2302で、質量又はm/z差に基づいたプリカーサー修飾又は変異型の表が得られてもよい。表2210は、かかる表に含まれてもよい情報の一例である。ステップ2304で、処理されたサンプルに対して実験が行われ、実験データが得られてもよい。ステップ2304で、マッチしたイオン情報のセット2106a、及びイオン情報の残留又は残存セット2106bを得るため、教師ありクラスタリングも行われてもよい。処理は、ステップ2306で開始して、ライブラリ2107の対応するPCC又はプリカーサーイオンにマッチされた、PCC又はプリカーサーイオンと関連付けられた2106aの各フラグメントイオンセット全体を通して反復される。ステップ2306で、現在のフラグメントイオンセットが、マッチしたイオン情報2106aの次のフラグメントイオンセットに割り当てられてもよい。ステップ2308で、マッチしたイオン情報2106aの全てのフラグメントイオンセットが処理されているかについて判断が行われる。処理が行われた場合、処理は停止する。そうでなければ、ステップ2308が「はい」と評価した場合、制御はステップ2310に進んで、現在のフラグメントイオンセットと残留セットの同じスキャンにおけるフラグメントイオンの第2のセットとの間のマッチに関して、イオンの残留セット2106bを検索する。例えば、図22を参照すると、ステップ2310の処理は、上述されるような2110a及び2112aの間におけるマッチの判断をもたらしてもよい。ステップ2312で、残留物2106b及びマッチしたイオン情報2106aにおいて、マッチするフラグメントイオンセットが見出されるか否かについて判断が行われる。ステップ2312が「いいえ」と評価した場合、制御はステップ2306に進む。ステップ2312が「はい」と評価した場合、制御はステップ2314に進んで、マッチしたフラグメントイオンセットのPCC又はプリカーサーイオンに対するMD値が決定される。ステップ2314は、例えば、図22のP1及びP3に対するMD値を決定してもよい。ステップ2316で、MD値に対してマッチする入力がプリカーサー又は修飾変異型の表で探索されるか否かに関して判断が行われる。ステップ2316が「はい」と評価した場合、制御はステップ2320に進む。ステップ2320で、ステップ2316でマッチしたプリカーサー変異型又は修飾のフラグメントイオンセットは、例えば、本明細書の他の箇所に示されるようなシミュレータを使用して、決定されてもよい。ステップ2322で、プリカーサー変異型又は修飾の存在を検証又は確認する検証処理が行われてもよい。例えば、本明細書に記載されるように、かかる検証処理は、プリカーサー修飾又は変異型(ステップ2320で生成されたような)及び残留物2106bに対して、シミュレートされたフラグメントイオンセットを使用して、P3がプリカーサー修飾又は変異型であることを確認してもよい。図22及び上記例を参照すると、かかる検証処理は、残留物2106bにおける、F2’’又はF3’’などの修飾されたフラグメントの存在を検索してもよい。かかる検証処理は、例えば、イオンP3及び関連するフラグメントイオンF1、F2’’、及びF3’’に対して、AR1及びAR2値を使用してもよい。ステップ2322から、処理はステップ2306に進む。
ステップ2316が「いいえ」と評価した場合、代替の処理が行われてもよい。本明細書に記載されるように、かかる処理は、2106aのマッチしたプリカーサーイオン又はPCC P1に対して、2110aに含まれる隣接するフラグメントイオンに関するMD値を決定することを含んでもよい。
ジスルフィド結合ペプチドは、本明細書の技術を使用して同定され検証されてもよい。かかる技術について考察する前に、最初に、本明細書の技術による一実施形態で使用されてもよいような、タンパク質の一例を示す図25を参照する。タンパク質は、システイン(Cによって表される)、リジン(Kによって表される)、及びアルギニン(Rによって表される)などの様々なアミノ酸を含んでもよい。ジスルフィド結合は、要素2002によって示されるように、システインに付着する。実験のためのサンプル調製及び処理の一部として、サンプル中のタンパク質に、様々な酵素消化(例えば、トリプシン)、及びペプチド切断を引き起こしてもよい他の処理が行われてもよい。一般的なペプチド切断部位は、例えば、アルギニン及びリジン部位を含んでもよい。
例えば、プロテオミクス分析中にタンパク質を質量分析によって同定するためのサンプル調製の一部として、ゲル内消化が行われてもよい。ゲル内消化は、例えば、タンパク質中のシステインの脱染、還元、及びアルキル化(R及びA)、タンパク質のタンパク質分解切断、並びに生成されたペプチドの抽出を含んでもよい。サンプル調製処理の一部として一般的に行われてもよいような、タンパク質に潜在的に埋め込まれたシスチン又はシステインの還元及びアルキル化(R及びA)によって、タンパク質のジスルフィド結合(例えば、2002によって示されるようなもの)が不可逆的に破壊され、アミノ酸直鎖としてのタンパク質の三次構造が最適な展開が得られてもよい。かかるサンプル調製は、例えば、図21と関連するものなど、本明細書に記載される様々なワークフローと関連して行われてもよい。
本明細書の技術による一実施形態は、システインがジスルフィド結合に関与しないシステイン含有ペプチドを同定する、PAタンパク質構造の検証の一部として本明細書に記載されるような処理を行ってもよい。更に詳細に後述されるようなかかる処理と関連して、分析されるサンプルは、例えば、ゲル内消化を使用して調製されてもよく、それにより、サンプル調製は還元及びアルキル化(R及びA)を省略する。このようにして、サンプル中にシステイン又はシステインがあっても、本明細書に記載される技術を使用する後に続く検出に対して不活性のままである。例えば、図21と関連して記載されるようにして生成される標的PAライブラリを使用する教師ありクラスタリング技術は、システイン(ジスルフィド結合アンカーとして機能してもよい)を有する全てのペプチドを見つけるのに使用されてもよく、かかるシステインはやはりジスルフィド結合に関与しない。
本明細書の技術による一実施形態は、サンプル中にあるジスルフィド結合ペプチドを同定する処理を行ってもよい。更に詳細に後述されるように、標的ペプチド中に残留するシステインの存在によって、かかる処理が行われてもよい。ジスルフィド結合の局在化は、図21と関連して記載されるような全てのシステイン含有ペプチドの線形配列を含む標的ライブラリ又はデータベースを使用して、本明細書に記載されるような教師ありクラスタリングを使用して行われてもよい。ジスルフィド結合ペプチド検出及び/又は検証に関して本明細書に記載される処理は、標的ライブラリ又はデータベースに問い合わせ、全てのシステイン含有ペプチドのCPPISを抽出することを含んでもよい。各システイン含有CPPISのプロダクトイオンスペクトルは、生成される全てのSSPPISプロダクトイオンスペクトルに対する他のペプチドと同様の方法でスクリーニングされてもよい。容認可能なクロマトグラフィピーク幅に及ぶSSPPISの適切な数が同定された場合、CPPISが作成される。正確に同定されたSSPPISは、時間又はスキャン数の点で、溶出ペプチドに、スパンにわたる適切な強度分布(増加/減少)を説明する、マッチしたプロダクトイオン及びそれらの強度/面積を反映させる。マッチが見出されなかった場合、処理は次のシステイン含有CPPISに移り、プロセスが繰り返される。統計的に有意な数のプロダクトイオン(例えば、指定の閾値数など)がマッチする場合、アルゴリズムは次に、任意のユーザ定義の数の可能なジスルフィド結合ペプチド間におけるΔm/z値のマトリックス又は表を使用して処理を行う。次に、マッチしたペプチドとプリカーサーイオンのm/zとの間のΔm/zが計算され、マトリックスのΔm/z値と比較される。マッチが見出された場合、処理は次に、検証及び結合の局在化のため、相手のペプチドのプロダクトイオンの比較に進む。統計的に有意な数のプロダクトイオンが2つのペプチドにマッチし、それらのAR1及びAR2比が全てのマッチしたSSPPISにわたって繰り返された場合、ジスルフィド結合CPPISが作成されてもよい。
本明細書の技術による一実施形態は、ジスルフィド結合ペプチドに対して更なる検証基準を使用してもよい。ジスルフィド結合に組み込まれた線形配列はそれぞれ、その実験値と一致しない、保持時間と、IMSが用いられる場合はドリフト時間とに存在する。実験において、治療薬は還元されアルキル化されて、システイン結合形成がないことが担保される。一貫したプロダクトイオンのセットが時間に伴って移動することにより、同定は不規則な事象へと大幅に制限される。ジスルフィド結合ペプチドの同定及び/又は検証に関する技術による一実施形態で行われてもよい処理は、以下のパラグラフで更に詳細に記載される。
ジスルフィド結合ペプチドを検出及び/又は同定する、本明細書の技術と関連する処理の第1の部分として、最初にサンプル中のPAの存在を検証するステップが行われてもよい。
図26を参照すると、本明細書の技術による一実施形態で行われてもよい、例示のワークフローが示されている。2420によって示される第1の部分は、図21と関連して本明細書の他の箇所に記載されるものと同様のステップを行うことを含んでもよい。実験2404aは、PAサンプル2402に対して行われる第1のかかる実験であってもよい。実験2404aは、タンパク質消化及びLC/MS又はLC/IMS/MS分析に対して行われるサンプル調製処理を含んでもよい。この第1の実験2404aでは、サンプル調製は、還元及びアルキル化を行うことを含み、それにより、サンプル中の全てのシステインがジスルフィドを有さない(例えば、トリプシンペプチドのみを有する)ように修飾される。LE及びHEスキャンデータ2405aが、実験2404aに対して得られてもよい。LE及びHEスキャンデータ2405aは、本明細書に記載される教師ありクラスタリング技術2406を使用して、教師ありクラスタリング標的ライブラリとして使用されるPAタンパク質のライブラリ2407を用いて更に処理されてもよい。
サンプルが2404aに記載されるように調製された場合、PAライブラリ2407内の全てのペプチドは、実験データセット2405aの対応するイオン情報にマッチされるはずである。このように、一実施形態では、サンプル2402中におけるPAの存在は、ライブラリ2107の全てのペプチドを、教師ありクラスタリング2406を行った結果としての実験データセットのイオン情報に対してマッチさせることによって検証されてもよい。代替例として、サンプル2402中におけるPAの存在は、ライブラリ2407内の少なくとも指定された数のペプチドを、教師ありクラスタリング2406を行った結果としての実験データセット2405aのイオン情報に対してマッチさせることによって検証されてもよい。処理の上記第1の部分はまた、ペプチドフラグメントの形成をもたらすタンパク質の化学又は酵素処理と、それに続く再現可能な形でのフラグメントの分離及び同定とを含む、タンパク質に対するアイデンティティ試験であるペプチドマッピングとも呼ばれることがある。
2420によって表される上記を行った後、同じPAサンプル2402の別の部分が、第2の実験2404bで処理されてもよい。サンプル調製を含む実験2404bは、実験2404aと同じであってもよいが、実験2404bはサンプル調製を含み、還元及びアルキル化を行うのが省略される点が異なる。このようにして、サンプル処理は、2404bを介して分析されるサンプル中にある既存のジスルフィド結合を破壊しないように、還元及びアルキル化ステップを省略する。したがって、ジスルフィド結合がサンプル中に存在している場合、かかるジスルフィド結合は不活性のままであり、サンプル処理で破壊されない。
LE及びHEスキャンデータ2405bが、第2の実験2404bに対して得られてもよい。LE及びHEスキャンデータ2405bは、本明細書に記載される教師ありクラスタリング技術2409(例えば、図14Aのものなど)を使用して、教師ありクラスタリング標的ライブラリとして使用されるPAタンパク質のライブラリ2407を用いて更に処理されてもよい。PAライブラリ2407は、2420のワークフローを行った結果として生成されてもよいことが注目されるべきである。
2409で教師ありクラスタリングを行った結果として、実験データセット2405bの対応するイオン情報にマッチしなかった、ライブラリ2107のペプチド又はプリカーサーイオン(若しくはPCC)及び関連するフラグメントイオン(例えば、CPPIS)を同定する、またかかるペプチド又はプリカーサーもシステインを含有する、情報の第1のセット2406aが得られてもよい。それに加えて、2409の処理の結果として、実験データセット2405bのアンマッチしたイオンの残留又は残存セット(例えばアンマッチしたPCC及びアンマッチしたフラグメントイオン)を表す、情報の第2のセット2406bが得られてもよい。アンマッチしたイオン2406bの残留又は残存セットは、各スキャンにおいてライブラリのペプチド(例えば、PCC又はプリカーサー)にアンマッチした実験データセットB 2405bのイオンのセットを含んでもよい。
したがって、要素2406aは、実験データセット2405bの対応するイオン情報に対して同定又はマッチされなかった、またジスルフィド結合の形成に必要なシステインアミノ酸を含有する、PAのペプチド又はプリカーサー(例えば、要素2406aは、PAライブラリのアンマッチした標的を表す(例えば、システインを含有し、また実験データセットB 2405bのイオン情報に対してマッチしなかった、ライブラリ2407のPCC、ペプチド、又はプリカーサーイオン)を表す)。2406aで同定されるようなPAライブラリのアンマッチしたシステイン含有ペプチド又はプリカーサー標的から、ここで、かかるアンマッチしたシステイン含有ペプチド又はプリカーサーイオンそれぞれのプロダクトイオンスペクトル(例えば、CPPIS)を有し、それにより、プロダクトイオンスペクトルは関連するペプチド又はプリカーサーイオンのフラグメンテーションから発することが予期されるフラグメントイオンを表す。この例では、2406aは、ライブラリ2407が、教師ありクラスタリング2409によって、実験データセットB 2405bの対応するプリカーサー及びフラグメントイオン情報に対してマッチしなかった、プリカーサー又はペプチドP1及びP2を含むことを表す。それに加えて、2406aは、ライブラリが、ライブラリの標的プリカーサーP1に対する標的フラグメントイオンセット2410aも含むこと、またライブラリが、ライブラリの標的プリカーサーP2に対する標的フラグメントイオンセット2410aも含むことを示す。
本明細書の技術によれば、2405bと比較して、2405aにおいて異なる保持時間をそれぞれ有する、プリカーサー又はペプチド2406aを同定する処理が行われてもよい。例えば、本明細書に記載されるような異なるスキャンにわたってプリカーサー又はペプチドのPCCを追跡して、異なるスキャン(図7に示されるものなど)にわたって溶出ピーク又はプロファイルを決定する処理が行われてもよく、それにより、追跡されたプリカーサーが最大強度を有する頂点又はスキャンが、その適切な保持時間として決定されてもよい。第2の実験においてプリカーサーがジスルフィド結合ペプチドではない場合、2つの同じ追跡されたプリカーサー又はペプチドが、2405a及び2405bで同じ保持時間を有することが予期される。したがって、プリカーサーP1がジスルフィド結合ペプチドに含まれる場合、P1は、2405a及び2405bで異なる保持時間を有することが予期される。同様に、プリカーサーP2がジスルフィド結合ペプチドに含まれる場合、P2は、2405a及び2405bで異なる保持時間を有することが予期される。IMSが実験2404a、2404bで利用される場合、P1又はP2などのプリカーサーが第2の実験2404bにおいてジスルフィド結合ペプチドに含まれる場合は、そのプリカーサーはまた、2405a及び2405bにおいて異なるドリフト時間又は異なる若しくは衝突する断面積(CCSA2)を有することが予期されることが注目されるべきである。
この例に関して、P1及びP2の両方が、2405a及び2405bにおいて異なる保持時間及びドリフト時間を有する、ライブラリ2407のアンマッチしたシステイン含有標的ペプチド又はプリカーサーであるものと仮定する。P1及びP2の組み合わせと関連付けられる閾値数のフラグメントイオンが、同じスキャンで残留物中に現れるか否かを判断する、残留物2406bを検索する処理が行われてもよい。例えば、この例では組み合わせフラグメントイオンセット(CFIS)={F1,F2,F3,F4,F5}である、フラグメントイオンセット2410a及び2410bの合併集合を形成し、次に、同じスキャンにおいてCFISの少なくとも閾値数のフラグメントにマッチする残留物2406bを検索する、処理が行われてもよい。この例における例証のため、スキャンTは、2410a及び2410bに基づいてCFISの全てのフラグメントイオンを含み、それによって、同じスキャンTにおいて残留物2406b中にシステインが現れる2つのペプチドP1及びP2を表すと判断されてもよい。
P1及びP2の間にジスルフィド結合を含む、新しい分子Mnewの理論上の質量を決定する処理が行われてもよく、その分子は次式のように表されてもよい。
Mnew=M1+M2−(c×水素の質量)
式中、
M1はP1の質量(例えば、P1のモノアイソトピック質量であってもよい)、
M2はP2の質量(例えば、P2のモノアイソトピック質量であってもよい)、
cは、P1及びP2の間のシステイン結合又はアンカーの数を表す0よりも大きい整数、並びに、
水素の質量は、約1.007原子質量単位(amu)である水素の原子質量を表す。
シミュレータ又はモデリングソフトウェア2021が、Mnewに対して理論上可能なm/zを決定するのに使用されてもよい。例えば、Mnewは、シミュレータが決定してもよい、+3、+5、及び+7など複数の電荷状態を有してもよい。このように、シミュレータは、Mnewが2405bなどの実験データセットに現れてもよい、かかる複数の電荷状態に対する理論上のm/z値を決定してもよい。したがって、かかるm/z値はそれぞれ、MnewのPCCのm/zに対応する。
次に、処理は続いて、Mnewに対する(シミュレータによって決定されるような)m/z値の1つにマッチするm/zに関して、2405bのLEスキャンデータを検索してもよい。例えば、シミュレータは、2405bのLEスキャンデータの対応するm/z値にマッチされる、Mnewに対する第1のm/z値を決定するものと仮定する。第1のm/z値はMnewのPCC+3に対するm/zを表すものと仮定する。2405bのLEスキャンデータを検索して、MnewのPCC+3に対するm/zを含む全てのスキャンが決定される。MnewのPCC+3に対する第1のm/z値が2405bのLEスキャンデータの任意のスキャンに現れる場合に、ジスルフィド結合ペプチドMnewの存在又は検証が確認されてもよい。
次に、Mnewと関連付けられる、又はそれから発する、2405bのフラグメントイオンを決定する処理が行われてもよい。シミュレータを使用して、ジスルフィド結合ペプチド対P1及びP2の分子である分子Mnewに対して、全ての理論上のフラグメントイオンが計算されてもよい。分子Mnewに対するかかる理論上のフラグメントイオンは、実験データセットB 2405bに関して行われる教師ありクラスタリングの標的ライブラリとして使用される、新しいライブラリL1に含まれてもよい。本明細書の他の箇所の説明と同じく、かかる教師ありクラスタリングによって、MnewのCPPISが生成され、ジスルフィド結合分子又はペプチドMnewはP1及びP2を含む。
上記例は、ジスルフィド結合対P1及びP2を含むペプチドであるMnewの検出及び同定を示しており、P1及びP2は、教師ありクラスタリング2409によって、実験データセットB 2405bの対応するプリカーサー及びフラグメントイオン情報にマッチされなかった、標的ライブラリ2407の標的ペプチド又はプリカーサーイオンを表すことが注目されるべきである。したがって、P1及びP2は、ジスルフィド結合ペプチド対として含まれてもよい、ペプチド又はプリカーサー候補を表してもよい。ジスルフィド結合ペプチド対の候補であるペプチド又はプリカーサーはまた、ライブラリ2407の「マッチした」標的ペプチド又はプリカーサー(例えば、教師ありクラスタリングによって、実験データセットB 2405bの対応するプリカーサー及びフラグメントイオン情報にマッチされた、2407のペプチド又はプリカーサー)を含んでもよいが、かかるマッチした標的ペプチド又はプリカーサーは、かかるマッチした標的ペプチドをジスルフィド結合対に含むことと一貫する、他の異常な又は予期されない挙動を呈する。例えば、P3は、ライブラリ2407のマッチした標的プリカーサー又はペプチドを表すものと仮定する。P3は、2405a及び2405bにおいて異なる強度挙動を呈してもよい。実験2404a及び2404bが、上述されるようなサンプル処理における違い(2404aは、2402の任意のジスルフィド結合対を破壊するサンプル処理を含み、2404bは、かかるサンプル処理を省略し、2402の任意の既存のジスルフィド結合対を保存する)以外は複製であるものと見なされてもよいことを想起する。したがって、同じペプチド、プリカーサー、又はPCCが、2405a及び2405bの両方において類似の挙動を呈するはずである。例えば、P3は、P3にジスルフィド結合対が関与しない場合、両方の実験においてほぼ同じスキャン及びほぼ同じドリフト時間でその最大強度を有することが予期される。P3はまた、両方の実験において同じスキャンで類似の強度を呈するはずである。例えば、2405a及び2405bにおいて同じスキャンS1に対して、P3は、両方の実験において(ある許容差内で)ほぼ同じ強度を有するはずである。同様に、P3から発するフラグメントイオンもまた、両方の実験において同じスキャンで類似の強度を有するはずである。更に、P3及びそのフラグメントのAR2値は、2405a及び2405bの両方で一貫しているはずである。例えば、P3の第1のAR2値は、実験データセットA 2405aのLEスキャンデータの2つのスキャンS1及びS2におけるP3の強度に関して計算されてもよく、P3の第2のAR2値は、実験データセットB 2405bのLEスキャンデータの同じ2つのスキャンS1及びS2におけるP3の強度に関して計算されてもよく、それにより、P3がデータセットB 2405bを有する第2の実験においてジスルフィド結合に含まれない場合、第1のAR2値及び第2のAR2値は、ほぼ同じであることが予期される。同様に、P3のフラグメントイオンのAR2値も、P3がデータセットB 2405bを有する第2の実験においてジスルフィド結合に含まれない場合、ほぼ同じであることが予期される。したがって、マッチした標的ペプチド又はプリカーサーP3の一貫しない又は異常な挙動を検出するのに、かかる強度及び/又は強度比の比較が使用されてもよく、それによって、P3がまた、2406aのアンマッチした標的ペプチド又はプリカーサーと共に考慮されるべき候補のペプチド又はプリカーサーであることが表される。
図27を参照すると、サンプル中におけるジスルフィド結合対の存在を検出する、本明細書の技術による一実施形態で行われてもよい処理のフローチャートが示されている。フローチャート2500は上述された処理を要約している。
ステップ2502で、還元及びアルキル化を行い、それによって任意の既存のジスルフィド結合を破壊することを含む調製処理を使用して、PAを含むサンプルを用いて第1の実験が行われてもよい。第1の実験データセットAが、第1の実験に対して得られてもよく、教師ありクラスタリングが行われてもよい。教師ありクラスタリングで使用されるPAの標的ライブラリには、最初に、本明細書の他の箇所で言及されるシミュレータ又はモデリングソフトウェアなどを使用して、理論上のフラグメントイオン情報が取り込まれてもよい。かかる教師ありクラスタリングによって、サンプルがPAを含むことが検証され、また、標的ライブラリがデータセットAからの実実験データを用いて更新されてもよい。
ステップ2504で、同じサンプルを使用し、調製処理が還元及びアルキル化を省略することによって任意の既存のジスルフィド結合を不活性なままにする点以外はステップ2502と同じ実験を行う、第2の実験が行われてもよい。第2の実験データセットBが、第2の実験に対して得られてもよく、教師ありクラスタリングが行われてもよい。教師ありクラスタリングで使用される標的ライブラリは、ステップ2502の教師ありクラスタリングで更新されるような、PAの更新された標的ライブラリであってもよい。ステップ2504における教師ありクラスタリングの結果として、標的PAライブラリのマッチされなかった標的プリカーサー又はペプチドのセット2406aが、教師ありクラスタリングで標的PAライブラリにマッチされなかったイオンのスキャンを含む、残留又は残存セット2406bと共に決定されてもよい。
ステップ2506で、候補のペプチド又はプリカーサーの対P1及びP2が、指定の基準を満たすことが判断されてもよい。上述されるように、かかる基準は、それぞれの候補が少なくとも1つのシステインを含むと判断すること、対のフラグメントイオンの閾値数が単一のスキャンで第2の実験データセットBの残留物に現れると判断すること、それぞれの候補が、実験データセットA及びBにおいて異なる保持時間(及び、IMSが行われる場合は異なるドリフト時間)を有すると判断すること(例えば、実験データセットA及びBの異なるスキャンにおける、関連する最大強度)、各候補が、マッチされなかった標的プリカーサー若しくはペプチドセット2406aにあるか、あるいはライブラリの標的プリカーサーにマッチされ、また異常な又は一貫しない挙動を呈することを含んでもよい。プリカーサー又はペプチド候補のかかる一貫しない挙動は、サンプル中のジスルフィド結合に含まれていない候補に対して一貫しない。
ステップ2508で、ジスルフィド結合対としてP1及びP2を含む分子のMnewが計算されてもよい。ステップ2510で、シミュレータ又はモデリングソフトウェアを使用して、Mnewが存在してもよいPCCの様々な電荷状態が決定されてもよい。異なる電荷状態を有するかかるPCCそれぞれについて、対応するm/z値が決定されてもよい。ステップ2512で、第2の実験データセットBのLEスキャンデータを検索して、MnewのPCCのうち1つに対するm/z値とマッチする、LEスキャンデータにおけるm/zが探索されてもよい。ステップ2514で、かかるマッチするm/zが第2の実験データセットBのLEスキャンデータにおいて探索されているか否かの判断が行われる。ステップ2514が「いいえ」と評価した場合、制御はステップ2516に進んで、第1及び第2の実験の両方で分析されるサンプル中の分子又はペプチドにおいて、P1及びP2がジスルフィド結合対を形成しないという判断が行われる。ステップ2514が「はい」と評価した場合、制御はステップ2518に進んで、第1及び第2の実験の両方で分析されるサンプル中の分子又はペプチドMnewにおいて、P1及びP2がジスルフィド結合対を形成するという判断が行われる。制御は、ステップ2520に進んで、シミュレータ又はモデリングソフトウェアなどを使用して、Mnewに対する理論上のフラグメントイオンセットを計算し、最初に、Mnewの標的ライブラリにかかる情報を取り込む。Mnew標的ライブラリは、第2の実験データセットBに関して行われる教師ありクラスタリングの標的ライブラリとして使用されて、Mnewに対するCPPISが決定されてもよい。このように、Mew標的ライブラリはかかるCPPIS情報を用いて更新されてもよい。
ステップ2506で始まるステップが、候補のペプチド又はプリカーサーの単一の対に関するフローチャート2500に示されていることが注目されるべきである。かかる処理は、候補のかかる対それぞれに対して繰り返されてもよい。
本明細書の技術による一実施形態はまた、サンプルが任意の抗体薬物複合体(ADC)を含むか否かを検出して同定する処理を行ってもよい。かかる技術は、同定されたジスルフィド結合対に関して本明細書に記載されるようなものに類似した処理を行うことを含んでもよい。当該分野で知られているように、ADCは、がん患者の治療向けに標的治療として設計された、非常に強力なバイオ薬物の分類として特徴付けられてもよい。ADCは、安定結合、化学結合、不安定な結合を有するリンカーを介して、生物活性細胞毒性(抗がん)ペイロード又は薬物(本明細書では、細胞毒性薬物若しくは複合体とも呼ばれる)とリンクされた抗体を含む、複雑な分子である。このように、細胞毒性薬物又は複合体は、抗体のペプチドの特定のアミノ酸(例えば、システイン若しくはその他)で、抗体に付着又はリンクされてもよい。
ADCを展開する際、抗がん剤(例えば、細胞毒素又は細胞毒)は、特定の腫瘍マーカー(例えば、理想的には、腫瘍細胞の中若しくは上にのみ見出されるタンパク質)を特異的に標的にする、抗体に結合される。抗体は、体内のこれらのタンパク質を追跡し、それらをがん細胞の表面に付着させる。抗体と標的タンパク質(抗原)との間の生化学反応によって、腫瘍細胞内の信号が作動し、それが次に抗体を細胞毒性薬物と共に吸収又はインターナライズする。ADCがインターナライズされた後、細胞毒性薬物が解放され、がんを死滅させる。この標的化により、理想的には、薬物は副作用が少なく、他の化学療法薬物よりも広い治療ウィンドウをもたらす。
図28を参照すると、サンプル中におけるADCの存在を検出する、本明細書の技術による一実施形態で行われてもよい処理のフローチャート2600が示されている。2600においてADCがサンプル中に存在するか否かを判断する処理が行われる特定のADCに関して、細胞毒性薬物が後退に付着する地点、リンカーの質量、及び細胞毒性薬物又は複合体の質量を同定する、標的アミノ酸を含む入力が提供されてもよい。後続のステップに記載されるような処理と関連して、複合体又は細胞毒性薬物はシステインアミノ酸に付着してもよい。しかしながら、より一般的には、複合体又は細胞毒性薬物は、抗体のペプチドの任意のアミノ酸に付着してもよい。
ステップ2602、2604、2606、2608、2610、2612、2614、2616、2618、及び2620はそれぞれ、図27のステップ2502、2504、2506、2508、2510、2512、2514、2516、2518、及び2520と類似していることが注目されるべきである。
ステップ2602で、第1の実験が、PAを含むサンプルを用いて行われてもよい。サンプルは、例えば、当該分野で知られているタンパク質消化技術を行うことによって処理されてもよい。例えば、かかるサンプル調製処理は、還元及びアルキル化を行うことを含んでもよい。調製されたサンプルは、次に、クロマトグラフィ分離、質量分析、IMSなどを含む実験を行うことによって分析されてもよい。第1の実験データセットAが、第1の実験に対して得られてもよく、教師ありクラスタリングが行われてもよい。教師ありクラスタリングで使用されるPAの標的ライブラリには、最初に、本明細書の他の箇所で言及されるシミュレータ又はモデリングソフトウェアなどを使用して、理論上のフラグメントイオン情報が取り込まれてもよい。かかる教師ありクラスタリングによって、サンプルがPAを含むことが検証され、また、標的ライブラリがデータセットAからの実実験データを用いて更新されてもよい。
ステップ2604で、ステップ2602と同じサンプルを使用し、同じ実験を行う第2の実験、及び同じサンプル処理が行われてもよい。第2の実験データセットBが、第2の実験に対して得られてもよく、教師ありクラスタリングが行われてもよい。教師ありクラスタリングで使用される標的ライブラリは、ステップ2602の教師ありクラスタリングで更新されるような、PAの更新された標的ライブラリであってもよい。ステップ2604における教師ありクラスタリングの結果として、標的PAライブラリのマッチされなかった標的プリカーサー又はペプチドのセット(例えば、2406a)が、教師ありクラスタリングで標的PAライブラリにマッチされなかったイオンのスキャンを含む、残留又は残存セット(例えば、2406b)と共に決定されてもよい。
ステップ2606で、候補のペプチド又はプリカーサーP1が、指定の基準を満たすことが判断されてもよい。2506は候補の対を決定し、ステップ2606は単一の候補を決定することが注目されるべきである。ADCを用いて、かかる基準は、候補が、少なくとも1つのシステイン、又は細胞毒性薬物が付着する他の標的アミノ酸を含有すると判断することを含んでもよい。これは、検出又は同定される特定のADCに対する入力として提供される標的アミノ酸である。かかる基準は、候補P1に対する閾値数のフラグメントイオン(かかるフラグメントイオンが、PAの標的ライブラリで指定される場合)が、第2の実験データセットBの残留物において単一のスキャンで現れると判断することを含んでもよい。かかる基準は、候補P1が、実験データセットA及びB(例えば、実験データセットA及びBの異なるスキャンにおける関連する最大強度)において、異なる保持時間(及び、IMSが行われる場合は異なるドリフト時間)を有すると判断することを含んでもよい。かかる基準は、候補P1が、マッチされなかった標的プリカーサー又はペプチドセット2406aにあるか、あるいはライブラリの標的プリカーサーにマッチされず、また異常な若しくは一貫しない挙動を呈すると判断することを含んでもよい。プリカーサー又はペプチド候補のかかる一貫しない挙動は、サンプル中のADCに含まれていない候補に対して一貫しない。かかる非一貫性は、ジスルフィド結合の検出及び同定と関連して記載され、また、本明細書に記載される処理と関連して、第1及び第2の実験の差に関してなどの異常な又は一貫しない挙動を呈する、ライブラリのマッチした標的プリカーサー又はペプチドであってもよい、候補P1を決定するのに使用されてもよい。
ステップ2608で、P1、指定のリンカー、及び指定の細胞毒性薬物又は複合体を含む、ADCに関する質量を表すMxが計算されてもよい。Mxは、上記のそれぞれに関する質量の合計として計算されてもよい。
ステップ2610で、シミュレータ又はモデリングソフトウェアを使用して、Mx、ADCが存在してもよいPCCの様々な電荷状態が決定されてもよい。異なる電荷状態を有するかかるPCCそれぞれについて、対応するm/z値が決定されてもよい。ステップ2612で、第2の実験データセットBのLEスキャンデータを検索して、MxのPCCのうち1つのm/z値にマッチするLEスキャンデータのm/zが探索されてもよい。ステップ2614で、かかるマッチするm/zが第2の実験データセットBのLEスキャンデータにおいて探索されているか否かの判断が行われる。ステップ2614が「いいえ」と評価した場合、制御はステップ2516に進んで、第1及び第2の実験の両方で分析されるサンプルのADCにP1が含まれないという判断が行われる。
ステップ2614が「はい」と評価した場合、制御はステップ2618に進んで、P1がADCに含まれ、ADCが第1及び第2の実験の両方で分析されるサンプルに含まれるという判断が行われる。制御は、ステップ2620に進んで、(シミュレータ又はモデリングソフトウェアなどを使用して)関連する質量Mxを有するADCに対する理論上のフラグメントイオンセットが計算される。ADCの理論上のフラグメントイオンセットは、最初に、ADCの標的ライブラリに取り込むのに使用されてもよい。ADC標的ライブラリは、第2の実験データセットBに関して行われる教師ありクラスタリングの標的ライブラリとして使用されて、ADCに対するCPPISが決定されてもよい。このように、ADC標的ライブラリはかかるCPPIS情報を用いて更新されてもよい。
ステップ2606で始まるステップが、単一のペプチド又はプリカーサー候補P1に関するフローチャート2600に示されていることが注目されるべきである。かかる処理は他の候補に対して繰り返されてもよい。
次に、多重モード獲得(MMA)と本明細書では呼ばれる技術について記載する。一態様では、MMAは、DDAとBateman技術、又は本明細書の他の箇所に記載される高−低プロトコルデータ獲得技術の組み合わせを含むものとして特徴付けられてもよい。MMAは、1つ又は2つ以上の更なる分離の次元に対する処理と組み合わせて、質量分析を行うことを含んでもよい。例えば、MMAはLC/MS分析を含んでもよく、またMSを行うことを含んでもよい。以下のパラグラフで更に詳細に記載されるように、MMAは、可変サイズの質量分離ウィンドウ(MIW)の連続的分離を提供し、それにより、MIWの幅(例えば、質量フィルタ処理若しくは選択を行うMSの四重極)が溶出時間にわたって調整される。一実施形態では、溶出時間範囲は、本明細書ではバケット又はビンと呼ばれる均等な部分に分割されてもよい。MIWの幅は変動されてもよく、幅は、特定の時間のバケット又はビン内にあるプリカーサーイオンの数の関数である。言い換えると、本明細書に記載されるMMA技術による一実施形態は、例えば、後続のフラグメンテーションのために第1のフィルタ処理四重極に入るプリカーサーイオンの数をほぼ同じに保つように、MIW幅を時間にわたって変動させてもよい。上記の目標は、単一のサイクル内で、それぞれ異なる連続したMIWを用いてフラグメンテーションされたほぼ同じ数のプリカーサーイオンを有することである。
MMAを用いて、最小m/z値から最大m/z値までのm/z値の合計範囲が指定されてもよい。m/z値の合計範囲は複数のm/z間隔に分割されてもよい。各m/z間隔は、m/z値の合計範囲内の上界及び下界を有する。以下のパラグラフに記載されるものなどのいくつかの実施形態では、m/z間隔はm/z範囲の点で重なり合ってもよい。それぞれ異なるm/z間隔に対してMMA技術と関連して行われる処理は、本明細書では、異なるサイクルと呼ばれることがある。例えば、合計m/z値範囲は、「n」個のm/z間隔に分割されてもよく、それにより、m/z間隔「i」(1≦i≦n)に対してMMAと関連して行われる処理は、サイクルiと呼ばれることがある。
考慮されるm/z値の合計範囲の特定の最小及び最大m/z値は、例えば、特定のサンプル(例えば、小分子、単一のタンパク質若しくは抗体、複数の未知のタンパク質の複雑な構造のサンプル)、行われる特定のサンプル処理(例えば、どの特定の酵素が使用されるか)など、1つ又は2つ以上の要因に伴って変動してもよい。例えば、本発明者らは、サンプルの一般的なトリプシン分析に関して実験のシミュレーションを行っており、一般に、シミュレートした実験の全てのイオンのうちほぼ50%が、一般的なトリプシン分析に対して約350〜1350の合計m/z範囲内にあるm/z値を持つイオンを有すると判断している。合計m/z範囲は、特定の分析、及び分析される対象のサンプルに伴って変動してもよいことが注目されるべきである。したがって、サンプル、実験、サンプル処理等に伴って変動してもよい、かかる1つ又は2つ以上の要因に基づいて、m/z値の合計範囲は、以下のパラグラフに記載されるMMA技術と共に使用することが指定されてもよい。
図29を参照すると、溶出時間にわたるプリカーサーイオンの数に関する頻度又は計数の分布を示す一例が示されている。Y軸上はm/zであり、X軸上は保持時間(RT)である。グラフにおける長方形又は点の太さは、特定のm/z値を有する特定のRTビン又は範囲内におけるプリカーサーイオンの頻度又は数を表す。グラフ上のある地点における長方形又は点が大きいほど、グラフ上のその地点における特定のm/z値及びRTと関連付けられたイオンの数又は頻度は多くなる。例えば、破線Q及びQ’の間の四角又は長方形は、プリカーサーイオンのほぼ50%が約350〜1350の合計m/z範囲内にあることを示す。グラフ上の様々な長方形間の白い二等分線は、各RTビンにおける中央値を表す。要素2802は、RTビンのうち1つの中央値をそれぞれ表す3つのかかる線を同定する。
合計範囲の最小及び最大m/z値、異なるm/z値を有するイオンの頻度に関する分布などは、以下のパラグラフに記載されるように、任意の好適な方法で得られてもよいことが注目されるべきである。例えば、一実施形態は、様々なサンプルに対して実際の実験を実施することによって、シミュレーションによってなどで、かかる情報を得てもよい。例えば、溶出時間にわたるプリカーサーイオンのm/z値における頻度の分布に関する図29に示される情報は、本明細書の他の箇所で考察されるものなどのシミュレータ又はモデリングソフトウェアを使用して得られてもよい。
例証のため、「n」個のm/z間隔又は区分に分割される350〜1350の合計m/z範囲が、MMA技術の使用を例証するのに、後続の例及び説明と併せて使用されてもよい。しかしながら、合計m/z範囲は、一般に、所望のm/z値の任意の範囲であってもよいことが注目されるべきである。
様々なm/z値を有するプリカーサーイオンの数の頻度又は計数の分布に関する情報を、MMA技術に使用して、MIWの幅又はサイズを変動させてもよい。以下のパラグラフに記載されるように、MIWのサイズ又は幅は、選択され、後に続くフラグメンテーションが行われるプリカーサーイオンの数が、サイクル内の溶出時間又はRTビンにわたってほぼ同じであるように選択されてもよい。
図29に示されるのは、グラフ上にサイクルA、B、及びCとして表される「n」個のm/z間隔のうち3つである。サイクルAは、350〜550のm/z間隔を有してもよい。サイクルBは、475〜700のm/z間隔を有してもよい。サイクルCは、525〜750のm/z間隔を有してもよい。このように、図示される例では、異なるm/z間隔又はサイクルのm/z範囲が重なり合う。
m/z間隔の間に重なり合いがある場合、その特定の量が、本明細書に記載される処理と関連する入力として指定されてもよいことが注目されるべきである。例えば、第1の選択肢として、一実施形態は、n個のサイクルと関連付けられるm/z間隔の間に重なり合いがないことを示してもよい。第2の選択肢として、一実施形態は、それぞれ2つの連続するサイクル間に固定量の重なり合いが生じることを示してもよい。かかる重なり合いは、例えば、m/z値の絶対量又は数(例えば、25)を示すことによって示されてもよい。別の選択肢として、一実施形態は、関数、式などに基づいてなど、2つの連続するサイクル間で重なり合いの量を変動させてもよい。
図30を参照すると、本明細書の技術による一実施形態でサイクルA、B、及びCと関連して使用されてもよいMIWの更なる詳細を示す一例が示されている。
例2700では、全体として、サイクルA、B、及びCのそれぞれにおける異なるMIWが示されている。この例の各サイクルは、10のスキャンを含み、1つは低エネルギースキャン、1つは2711に示されるような最初のMIWを網羅する上昇エネルギースキャン、8つは、そのサイクルに対してスケジューリングされた可変サイズのMIWによる上昇エネルギースキャンである(例えば、図31の2930につきなど)。本明細書の技術による一実施形態は、各サイクルの第1及び第2のスキャンに対して、Bateman技術、本明細書の他の箇所に記載される又は高−低プロトコルデータ獲得技術を使用して、各サイクルの最初のMIW(例えば、最初のMIWはサイクルに対する全m/z間隔である)に対するプリカーサー及び関連するフラグメントデータを得てもよい。後に続く各スキャン(3〜10)は、そのサイクルのそのスキャンに対してスケジューリングされたMIW内のプリカーサーイオンのみのプロダクトイオンスペクトルを反映する。
サイクル1又はAを参照すると、2710に示されるのは、MIW幅を変動させ、各MIW幅に対してサイクルA内で関連するm/z範囲も変動させながら、溶出時間にわたって行われる四重極のプリカーサーイオンMIW(LE)及び上昇エネルギー(EE)又は高エネルギー(HE)における変動を表す、2つのタイムラインLE及びEEである。同様に、サイクルBを参照すると、2720に示されるのは、MIW幅を変動させ、各MIW幅に対してサイクルB内で関連するm/z範囲も変動させながら、溶出時間にわたって行われる四重極のプリカーサーイオンMIW(LE)及び上昇エネルギーにおける変動を表す、2つのタイムラインLE及びEEである。更に、サイクルCと関連して、2720に示されるのは、MIW幅を変動させ、各MIW幅に対してサイクルC内で関連するm/z範囲も変動させながら、溶出時間にわたって行われる四重極のプリカーサーイオンMIW(LE)及び上昇エネルギーにおける変動を表す、2つのタイムラインLE及びEEである。
この例では、各サイクルに対して、スキャン1で表される第1のスキャンは、サイクルと関連付けられる全m/z間隔に対応するMIWを使用する。例えば、サイクルAの場合、要素2710は10のスキャンを同定し、1つは、サイクルAと関連付けられたm/z間隔に対して全m/z範囲350〜550を表す。スキャン2は、最初のMIW(m/z=350〜550)のプロダクトイオンスペクトルを反映する。3〜10と番号付けされた残り8つのスキャンはそれぞれ、2930に示されるように、そのスキャンに対してスケジューリングされたMIWウィンドウ内のプリカーサーイオンから発するフラグメントイオンのセットを反映する。
サイクルAに関して記載したのと同様の方法で、サイクルBの場合、要素2720は10のスキャンを同定し、スキャン1は、全m/z範囲475〜700を表し、スキャン2は、サイクルBと関連付けられたm/z間隔に対して最初のMIWからのフラグメントイオンを表す。残り8つのスキャン3〜10は、後に続く又は連続するスキャンにわたってどちらも変動する幅及び関連するm/z範囲又はウィンドウを有する、スケジューリングされたMIW内のプリカーサーイオンのプロダクトイオンスペクトルを反映する。
サイクルBに関して記載したのと同様の方法で、サイクルCの場合、要素2730は10のスキャンを同定し、スキャン1は、全m/z範囲525〜750を表し、スキャン2は、サイクルCと関連付けられたm/z間隔に対して最初のMIWからのフラグメントイオンを表す。残り8つのスキャン3〜10は、後に続く又は連続するスキャンにわたってどちらも変動する幅及び関連するm/z範囲又はウィンドウを有する、スケジューリングされたMIW内のプリカーサーイオンのプロダクトイオンスペクトルを反映する。
本明細書の技術による実施形態では、サイクルAのスキャン1の場合、LEスキャンデータはm/z範囲350〜550に対して得られてもよく、HEスキャンデータはm/z範囲50amuから最大m/zに対して得られてもよく、最大m/zは、その時間におけるそのMIW及びIMSが用いられる場合はドリフトの、最高のm/z及びzの関数である。サイクルAのスキャン3〜10の場合、LEスキャンデータは得られない。それよりもむしろ、四重極は、かかるスキャンそれぞれに対してスケジューリングされたMIWのみを伝達するように変動される。各スキャン3〜10において、MIWは、そのサイクルの最初のMIWのどの部分が2930に示されるようにサンプリングされているかに応じて、指定のより狭い又はより広いものであってもよい。MIW幅の変動については、更に詳細に後述される。サイクルAのスキャン3〜10の場合、HEスキャンデータは、特定のスキャンの特定の変動するMIW幅を使用して得られる。
サイクルA、B、及びCのかかるスキャン3〜10において変動するMIW幅、並びに各MIWと関連して変動するm/z範囲を決定するのに使用されてもよい技術は、以下のパラグラフで更に詳細に記載される。MIWの幅は、一実施形態では、DDAがスイッチリストを作成するのと同様の方法で設定されてもよいことが注目されるべきである。あるいは、MIWの幅は、計装を制御するシミュレータ又は他のソフトウェアなどを使用して、事前プログラムされてもよい。それに加えて、各MIWと関連付けられるm/z値の範囲又はウィンドウは、各スキャンと共に変化するようにプログラムされてもよい。
このように、図30を参照すると、サイクルの長方形又は棒のそれぞれは、本明細書の技術による一実施形態で行われてもよいデータ獲得を表す。例えば、サイクルAでは、要素2711は、サイクルAの単一の実行の中で獲得される様々なLE及びHEデータセットを表す。要素2711は、サイクルAの単一の実行の中で獲得されてもよいような、スキャン1に対する単一のLEスキャンデータセット、及びスキャン2〜10に対する9つのHEデータセットを含む。サイクルBでは、要素2721は、サイクルBの単一の実行の中で獲得される様々なLE及びHEデータセットを表す。要素2721は、サイクルBの単一の実行の中で獲得されてもよいような、スキャン1に対する単一のLEスキャンデータセット、及びスキャン2〜10に対する9つのHEデータセットを含む。サイクルCでは、要素2731は、サイクルCの単一の実行の中で獲得される様々なLE及びHEデータセットを表す。要素2731は、サイクルCの単一の実行の中で獲得されてもよいような、スキャン1に対する単一のLEスキャンデータセット、及びスキャン2〜10に対する9つのHEデータセットを含む。
本明細書の技術による一実施形態では、単一のサイクルと関連付けられる処理は、次のサイクルを使用した継続処理の前の時限の間、繰り返されてもよい。例えば、以下を考慮する。実験は、100分間の実験行程に対して合計溶出時間又は合計時間量を有する。指定されるm/z間隔の数「n」は20であってもよく、それにより、各m/z間隔又はサイクルは5分間で実行されてもよい(例えば、100/20=5)。MSスキャン速度は、10スキャン/秒又は600スキャン/分であってもよい。したがって、3,000のデータスキャンが各サイクルに対して5分で獲得されてもよい。この例では、サイクルAと関連付けられた処理は5分間繰り返されてもよい。サイクルAが5分の時限で実行されると、次に続くサイクルが5分間行われてもよく、20=サイクル全てがそれぞれ関連する処理を行うまでそれが続く。
一般に、以下のパラグラフで更に詳細に記載されるように、適切に同じ数のイオンが、後に続くフラグメンテーションのために時間に伴って質量フィルタを通るように選択するか、又はそれを可能にする目的で、m/z間隔内におけるイオンの数の頻度又は計数が増加すると、MIWの幅は減少する。このように、各スキャンにおけるMIWの幅及びm/zウィンドウ又は範囲の属性は、異なるm/z値におけるプリカーサーイオンの頻度の分布の関数として特徴付けられてもよい。
図31を参照すると、本明細書の技術による一実施形態で使用されてもよいサイクルAに対するm/z値の頻度分布を例証する一例が示されている。例2900は、350〜550の関連するm/z間隔を有するサイクルAの分布を模式的に示している。本明細書の他の箇所で言及されるように、2900の分布は任意の好適な方法で得られてもよい。例えば、分布は、シミュレータ又はモデリングソフトウェアを使用してシミュレートされるか又は理論的に決定されてもよく、実際の実験を行った結果として得られてもよく、その他であってもよい。
例2900は、8つのm/zビン又はバケットを示し、各m/zビンは25m/z単位である。サイクルAのm/z間隔は350〜550であり、それにより、この例では、m/z間隔は350を含むが、終点550は含まない(例えば、m/z間隔350≦m/z≦550を表す)ことが注目されるべきである。図31は、表される各m/zビンに対する包括m/z値を指定している。例えば、第1のビンは350〜374の包括m/z範囲を有し、プリカーサーイオン頻度5がm/z範囲内にある。第2のビンは375〜399の包括m/z範囲を有し、プリカーサーイオン頻度15がm/z範囲内にある。包括m/z範囲425〜449を有する第4のビンは、図示される全てのm/zビンの中で最大頻度60を有する。m/zビン又は間隔内のプリカーサーイオンの数を表す頻度又は計数が増加するにしたがって、MIWの幅は減少する。
要素2920は、m/z間隔350〜550を有するサイクルAに対する分布と関連付けられるいくつかの性質を列挙している。この例では、m/z間隔350〜550は、160の合計イオン数(例えば、2900における全ての頻度の合計)を有する。そのMIWにわたるスキャンの数が=8(例えば、図30のスキャン3〜10のように)に変更された場合、各スキャンでフィルタ処理されるか又は通過させられるプリカーサーイオンの平均数は約20のはずである。これに基づいて、サイクルAの各スキャンに対して、変動するMIW幅及びそれに関連するm/zウィンドウ又は範囲を決定するコードが実行されてもよい。この例では、サイクルAのスキャンは、MIWを有してもよく、関連するm/zウィンドウは、同じサイクルAにおける前のスキャンのm/zウィンドウと重なり合わない。全てのスキャン3〜10にわたる全てのMIWのm/zウィンドウは全m/z間隔を網羅してもよい。次のスキャンは、前のスキャンのm/zウィンドウが終わったところから始まる、関連するm/zウィンドウを有する(例えば、スキャン4は、そのMIWに対してm/z=400で始まる関連するm/zウィンドウを有し、前のスキャン3は、m/z=399で終わる関連するm/zウィンドウを有する)。したがって、Aなどのサイクル内で、処理は、そのサイクルAに対する全m/z間隔を通して段階的に漸増する、関連するm/zウィンドウを有するように設定されてもよい。
要素2930は、サイクルAの単一の実行に関する処理と関連して決定され使用されてもよい、各スキャン数3〜10に対する、変動する幅及びm/zウィンドウを列挙している。
図32を参照すると、サイクルAの単一の実行に対して本明細書の技術による一実施形態で様々なスキャンに使用されてもよい、変動するMIW幅及びm/zウィンドウの更なる例証が示されている。例3000は、検査を簡単にするために表2930から連載された情報を含む。それに加えて、例3000は、サイクルAの単一の実行における各スキャンに対して、関連するMIWのm/zウィンドウ及びMIW幅を同定する表3010を含む。行3012は、各スキャンに対する異なるMIWのm/zウィンドウを表す。行3014は、各スキャンに対する異なるMIW幅を表す。行3016は、低エネルギー又は高エネルギースキャンのどちらであるかに関する指示と共に、番号によって特定のスキャンを表す。
本明細書の他の箇所で言及されるように、サイクルAは、行3016の1つのセルにそれぞれ対応する10のスキャンセットを含む。スキャン「X」(Xは、1〜10の包括範囲内の整数)に関して、指定する「XLE」はそのスキャンXがLEスキャンであることを表し、指定する「XHE」はそのスキャンXがHEスキャンであることを表す。このように、行3016の各セルは、単一の低エネルギースキャン又は単一の高エネルギースキャンのどちらかを表してもよい。
上記で言及されたように、また本明細書の他の箇所で言及されるように、スキャン1 3016a(1LEで表される)において、サイクルの全m/z間隔であるMIWを使用して、LE「調査」スキャンに対するデータセットが獲得される。スキャン2 3016b(2HEで表される)は、スキャン1からのMIWを使用してプリカーサーイオンによって生成されるフラグメントイオンを含む高エネルギースキャンである。スキャン3〜10では、指定のMIW(かかる各スキャンに対して、行3012及び3014によって示されるような、幅及びm/zウィンドウを有する)を設定し使用し、次に、そのスキャンの指定のMIW内にあるプリカーサーイオンに対してHEスキャンデータ獲得(3HE〜10HEによって表されるような)を行う処理が行われてもよい。例えば、要素3016aは、200のMIW幅を有する、350〜549を包含する全m/z間隔に対して設定されたMIWに対してLEスキャンデータのセットが得られる第1のスキャンを表す、表3010の単一セルである。セル3016bは、350〜549を包括するm/zウィンドウに対して指定のMIW幅200のm/zを有するプリカーサーイオンのフラグメンテーションを通してHEスキャンデータのセットが獲得される、第2のスキャンを表す。同様に、セル3016c〜3016jは、残りのスキャン3〜10に関して行3012及び3014に示される特定の設定に合わせてMIW幅及びm/zウィンドウを設定することを表す(例えば、スキャン3〜10のそれぞれにおいて、HEデータ獲得は、そのスキャンに対して指定された特定のMIWのm/zウィンドウ内にあるm/zを有するプリカーサーイオンから生成される、フラグメントイオンに対して行われる)。
図31の分布に基づいて、図32の表3010のようなMIW幅及びm/zウィンドウを使用することによって、変動するMIW幅及びm/zウィンドウがもたらされるので、ほぼ同じ数の20のプリカーサーイオンがフィルタ処理又は選択され、後に続くフラグメンテーションのために通過させることが可能になる。
図31及び図32と関連する上記例は、LC/MS実験のように、m/z値の関数である頻度分布を使用することを示していることが注目されるべきである。実験はまた、LC/MSと組み合わせてIMSを使用してもよく、それによって、ドラフト時間又は衝突断面積(CCSA2)である分離の別の次元が追加される。したがって、やはりIMSを使用するような実施形態では、図31に示されるようなX軸上のバケット又はビンは、m/z及びドリフト時間又はCCSA2の両方の関数であってもよい。
それに加えて、本明細書の技術による一実施形態はまた、各スキャンにおいて、特定のMIW m/zウィンドウ、保持時間(RT),及び/又はドリフト時間若しくはCCSA2のうち1つ又は2つ以上と共に変動してもよい、衝突エネルギーを選択してもよい。例えば、本明細書の技術による一実施形態で使用されてもよい3100の表が示される、図33が参照される。
表3100は、所定の衝突エネルギー値のルックアップテーブルであってもよい。表3100は、列3110によって示されるような、m/z、RT、及びドリフト時間又はCCSA2のうち任意の1つ又は2つ以上によって索引付けされてもよい。列3112は、m/z、RT、及びドリフト時間又はCCSA2の異なる値に対して使用される、異なる衝突エネルギーを提供してもよい。表3100の各行は、RT、及びドリフト時間又はCCSA2に対して指定された1つ又は2つ以上の値の特定のセットに対して、使用が推奨される対応する衝突エネルギー値又は範囲を同定してもよい。したがって、本明細書の技術による一実施形態は、表3100を使用して、特定のHEスキャンと関連付けられた特定のMIW m/zウィンドウに基づいて、各HEスキャンの衝突エネルギーを変更又は選択してもよい。例えば、425〜432のm/zウィンドウを有するスキャン5に関して、図32の要素3020を再び参照する。サイクルA処理の特定の実行において、RT又は溶出時間及びドリフト時間が、425〜432のm/zウィンドウと共に決定され選択されて、3110のマッチする入力を選択してもよい。マッチする入力3110を含む表3100の行から、衝突エネルギー値が列3112から検索され、プリカーサーフラグメンテーション又はHEスキャン5HEに対して選択された衝突エネルギーとして使用されてもよい。したがって、サイクルA処理の間、衝突エネルギーは、サイクル5HEの検索された衝突エネルギー値に設定されてもよい。
本明細書の技術による一実施形態では、上記されたように、シミュレータ又はモデリングソフトウェアを使用して、様々なサイクルに対してMIW幅及びm/z値を決定するのに使用される理論上の分布が決定されてもよい。かかる実施形態では、ソフトウェアに一連の入力が提供されてもよい。かかる入力は、合計溶出時間、m/z間隔の数、サンプル及びサンプル調製を特徴付ける1つ又は2つ以上のパラメータ、獲得時間(例えば、単一のスキャンの時間長)、m/z間隔間の重なり合いを特徴付ける1つ又は2つ以上のパラメータ、IMSが行われるか否か、一定の衝突エネルギーを使用するか否か、並びに図33と関連して記載されるようなルックアップテーブルを使用して(例えば、m/z、RT、及び/又はドリフト時間若しくはCSSA2にしたがって)HEスキャンの衝突エネルギーを変更又は設定するか否かを含んでもよい。上記入力は、本明細書の他の箇所に更に詳細に記載される。入力に基づいて、シミュレータ又はモデリングソフトウェアは、様々なサイクルに関して上述されたような変動する幅及びm/zウィンドウを有するMIWを決定してもよい。
本明細書に記載されるように、「SSPPIS」は、LEスキャン及びそれに対応するHEスキャンからのデータを含む単一スキャンプリカーサー−プロダクトイオンスペクトルである。本明細書に記載されるように、かかるLE及びHEスキャンデータセットは、様々な獲得方法と関連して得られてもよく、その方法のいくつかが本明細書に記載される。例えば、Bateman技術又は高−低プロトコル技術が使用されてもよい。それに加えて、一実施形態は、上述したようなDDA及びMMAなどの他の獲得技術を使用してもよい。DDA及びMMA獲得に関して、SSPPISは、毎調査スキャンから選択されたプリカーサーイオンの質量分離ウィンドウ内の各PCCに対して構築されてもよい。MMAと関連して、「調査スキャン」は、質量又はm/zフィルタ処理がサイクルのm/z間隔における全てのm/zを選択する、各サイクルの第1のスキャンであってもよく(例えば、図32の3016aを参照)、それによって、全てのかかるm/zのプリカーサーイオンがフラグメンテーションのために通過できるようにしてもよい。
獲得方法に関わらず、個々のPCCはそれぞれ、最初にその随伴プロダクトイオンスペクトルを割り当てられてもよい。これは、MMA又はDDA獲得などにおけるMIW内、又はBateman技術若しくは高−低プロトコル技術などに関連するLEスキャン内の、全てのプリカーサーイオンを含む。データがIMSを作動させて獲得された場合、最初のプリカーサー及びプロダクトイオンのアライメントは、規定の許容差内でドリフト時間をマッチさせることによって達成されてもよい。
図33Bを参照すると、MMA技術による一実施形態で行われてもよい処理ステップのフローチャートが示されている。フローチャート3150は、上述された処理を要約した。ステップ3152で、指定の合計m/z範囲に対するm/z値の頻度の分布が決定される。ステップ3154で、実験に対するサイクル数が決定され、各サイクルに対して、対応するm/z間隔範囲が決定される。ステップ3156で、現在のサイクルが、後続のステップで処理が行われる次のサイクルに割り当てられてもよい。ステップ3158で、全ての「n」個のサイクルに対して処理が完了しているか否かに関して決定がなされる。完了している場合、制御はステップ3160に進んで、「n」個のサイクルのスキャンに対して決定された様々なMIWを使用して実験が行われてもよい。ステップ3158が「いいえ」と評価した場合、制御はステップ3162に進む。現在のサイクルに対して、現在のサイクルのm/z間隔に対するm/z値の頻度の分布が決定される。例えば、図31は、現在のサイクルに対してステップ3158と関連して行われてもよい、かかる処理を示している。ステップ3164で、最初の2つのスキャン以外の現在のサイクルの各スキャンに対して処理が行われる。最初の2つのスキャン以外のかかる各スキャンに対して、MIW幅及び関連するm/zウィンドウを決定し、それにより、ほぼ同じ数のプリカーサーイオンが選択されるか、又は各スキャン(最初の2つのスキャン以外)において通過できるようにされる。例えば、ステップ3164は、図32の表2930に示されるような情報を決定する。ステップ3166で、任意に、HEスキャンと関連付けられたMIWのm/zウィンドウ、並びに特定のHEスキャンと関連付けられたRT及び/又はドリフト時間にしたがって、各HEスキャンを行うときに使用される衝突エネルギーを選択する処理が行われてもよい。制御はステップ3156に進む。
このように、フローチャート3150は、ステップ3166で任意に決定された衝突エネルギーと共に、「n」個のスキャンに対して特定のMIW幅及び関連するm/zウィンドウのスケジュールを決定する処理を行い、次に、上記を使用してステップ3160と関連するデータ獲得の実行に進む。
図34を参照すると、本明細書の技術による一実施形態で行われてもよい、MMA又はDDA獲得におけるPCCの強度を決定する処理が記載される。関連するm/zを有する特定のPCCに関して、様々なスキャンにおけるPCCの強度が追跡されてもよい。DDAの場合、かかるスキャンは調査スキャンを含んでもよい。MMAの場合、かかるスキャンはサイクルの第1のスキャンを含んでもよい(例えば、図32の要素3016a)。PCC又はプリカーサーイオンの強度が調査スキャンにおいて既知であること、またMS/MS獲得が時間的に連続しているという事実を所与として、調査スキャン及びフラグメンテーションにおけるプリカーサーイオンの強度は異なる。AR1は、フラグメンテーションされたときのプロダクトイオンと親プリカーサーの比である。MIW内に5つのプリカーサーイオン又はPCCがある場合、各プリカーサーイオンはそれ自体のプロダクトイオン又はMS/MSスペクトルを生成している。MS/MSスペクトルにおけるプロダクトイオンは、全てのプリカーサーからの複合スペクトルを表す。これが当てはまる場合、複合プロダクトイオンは5つのプリカーサー全てで共有され、m/z及び面積又は強度によってフィルタ処理される。プロダクトイオン強度は、m/z又は強度が大きいことはなく、並びに最小強度はそれらのプリカーサーの1/250である。本明細書の技術によれば、フラグメンテーション時におけるPCC強度を決定する処理が行われてもよい。図34は、これがどのように遂行されてもよいかを示している。各調査スキャンで、PCCの強度値が記録されてもよく、調査スキャン間の任意の所与の強度値を決定する線形回帰又は補間が行われてもよい。図34に示されるのは、同じPCCの強度が既知であり、時間にわたって追跡されて図示される曲線を形成する、10のスキャンに対応する10の点である。例えば、かかる10の点は、PCCのm/zが選択される10の調査スキャン又は時間に対応してもよい。PCCのフラグメンテーションは、例えば、2つの調査スキャンの間であってもよい点P1で起こってもよい。点P1におけるPCCの強度は、線形補間又は当該分野で知られている他の任意の好適な技術を使用して決定されてもよい。
プロテオミクス研究では、一般に、ダイナミックレンジの有効範囲の深さはDDA獲得に限定される。方法の連続的性質により、サンプリングすることができるプリカーサーイオンの感度及び数の両方が限定される。そのため、データ独立型の獲得(DIA)戦略の数は、そのうちいくつかが本明細書に記載されるが、これらの方法を導入しており、大部分ではサンプリングの問題に影響されず、いくつかは感度に対する限定を有する。DIAのアプローチによる1つの主要な制限は干渉であり、即ち、MS/MSスペクトルはキメラ性が高く、多くの場合、従来のデータベースサーチエンジンを使用して同定することができない。イオン検出前の分離の利用可能な次元をそれぞれ利用する、本明細書の技術の少なくとも1つの実施形態では、以下のパラグラフに記載されるMMA戦略の特定の実装及びワークフローが利用されてもよい。一実施形態で使用されてもよい以下のパラグラフにおけるMMA戦略及びワークフローは、狭帯域及び広帯域両方のDIA獲得を単一の分析ワークフローにおいて多重化することを含む。本明細書の技術のいくつかの実施形態は、反復する性質を有するMMAを行ってもよく、それにより、MMAワークフローは感度の損失を最小限にして干渉の副作用を制限する。定性的同定を、選択イオンクロマトグラム(SIC)又は従来のデータベース検索戦略によって行うことができる。
高分解能DIA獲得戦略は、新技術として強調され、定性的及び定量的「標的分析」の領域で高まる人気を示してきた。また、複雑なマトリックスにおける標的定量化の領域において、高分解能Q−Tof及びOrbitrap質量分析部を「採用する機が熟して」いることが広く容認されるようになってきた。より高分解能の質量分析部は、研究者が各ペプチドに対する最良の転移を前もって決定する必要性を排除することによって、アッセイの開発時間を低減させる。複雑な混合物中のペプチドを正確に定量化する能力は、周囲のマトリックスとは独立して各イオンの物理化学的属性を測定する、適用される分析ワークフローの能力に基礎を置いてもよい。m/zに関して分解能が高いほど、クロマトグラフィ及びドリフトピーク幅は、イオン干渉の副作用を低減するのに極めて重要である。本明細書の技術と関連して使用されてもよいものなどのデータ処理ツールは、各イオンの面積がどの程度良好に測定されているかを反映するメトリックである、イオン純度スコア(IPS)を計算してもよい。IPSは、半値、m/z、時間、及びドリフトを、それらそれぞれの実験手段に対して比較することによって計算される。測定されたm/zを評価する場合、ロックマスチャネルの分解能が比較に使用され、それにより、ICRに関して、質量分解能は、過渡的測定時間及びm/zの関数であり、分かっている過渡的測定時間及びm/zによって、比較のために理論上の質量分解能を計算する手段がもたらされる。クロマトグラフィ及びドリフトピーク幅に関して、それぞれの幅は、それぞれに対する勾配溶出全体にわたって計算された全ての値の中央値に対して比較される。
分解能の増加は、用いられる分離空間のいずれにおいても必ず結果を伴う。分析技術と関連して、選択性と分解能との関係は標準的なS曲線を辿る。変曲点を超える分解能設定は、多くの場合、実験の他の態様に対する悪影響、例えば感度の損失を有する。感度はイオン流束(イオン/単位時間)の関数である。より狭いクロマトグラフィピークはより高いイオン流束をもたらす。より狭いクロマトグラフィピークは、デューティサイクルを維持するため、より速いスキャン時間を要する。スキャン速度の増加と同時に、単位時間当たりのプロダクトイオンスペクトルの数が増加する場合、デューティサイクル又は感度のどちらかの純益がない。イオン流束は、一般に、イオンが単位時間当たりにMS検出器から出力される速度(例えば、イオン数/単位時間、及びそれらがm/z範囲にわたってどのように分布されるか)として定義されてもよい。イオン流束は、本明細書の他の箇所(例えば、MMAを伴うMIW選択サイズ及び範囲に関する説明と関連した図31)に記載されるような、時間にわたる異なるm/z値の頻度分布と類似している。
トラップ機器における質量分解能は、m/z及び過渡的測定時間の関数であり、狭いピークはより速いサンプリング速度を要し、同時に過渡的測定時間が増加することにより、それに比例して実験の質量分解能が低減される。Q−Tofのジオメトリに関して、分解能は測定時間とは独立しており、飛行時間分析器のデューティサイクル及び伝達によって感度が支配される。直交分離の数を増加させることによって、質量及びクロマトグラフィ分解能に対する応力を軽減して、それぞれの変曲点未満でそれぞれ動作させることが可能になる。適用される分析ワークフローが、複雑な混合物中のペプチドの最大数を、最も広いダイナミックレンジわたって、最高の確度及び精度で正確に同定し定量化する能力は、イオン検出の前に用いられる全ての分離技術の数及び分解能の直接的な結果として特徴付けられてもよい。
MSEDIAワークフローは、低エネルギー状態と上昇エネルギー状態との間の衝突移動セルを用いて交互の形でMSフルスキャンデータを獲得する。当該技術で知られているように、また本明細書の他の箇所に記載されるように、MSE(本明細書では、Bateman技術又は高−低プロトコルとも呼ばれる)は、低エネルギー衝突によって誘発される解離と高エネルギー衝突によって誘発される解離とを交互に使用し、前者が定量化のためにプリカーサーイオンの正確な質量及び強度データを得るのに使用され、後者がプロダクトイオンの正確な質量を得るのに使用される、タンデム型質量分析データ獲得方法を指す。MSE(例えば、Bateman技術又は高−低プロトコル)の場合、プリカーサーイオンの選択はなく、全てのプリカーサーイオンは同時にフラグメンテーションされる。かかる一実施形態では、衝突エネルギーは、全ての電荷状態にわたってより完全なフラグメンテーションを提供するため、上昇エネルギー獲得時間にわたって低エネルギーから上昇エネルギー状態へと増やされてもよい。プロダクトイオンは、ピーク形状及び頂点保持時間(場合によっては、本明細書ではRT又はtとも呼ばれる)の類似性によって、それらの親プリカーサーに対して整列される。有効範囲の深さ、ペプチド同定の数は、その時の更に従来的なDDA獲得戦略と匹敵してもよい。しかしながら、これらのキメラ性が高いプロダクトイオンスペクトル内での同定には、専用のデータベース検索エンジンを要する。市販及びオープンソース両方のデータ処理及び検索ツールを使用して、MSEDIAデータの処理及び検索ができないことは制限であった。この方法の選択性は、例えば、進行波イオンモビリティースペクトロメトリー(TWEMS)を用いて改善された。TWIMSのジオメトリによって、検出前にイオンが二次元で分離される(IMSドリフト及びm/z)。IMSの追加によってピーク能力が増加し、キメラ性が低減されるが、感度はほとんど低減されない。IMSで向上したデータセットに対して、プリカーサー及びプロダクトイオンは、それらそれぞれのピーク形状、並びに頂点の保持及びドリフト時間によって整列される(tdも、本明細書で、ドリフト時間又はドリフト時間ビンを指すのに使用される)。これらの高精細MSE(HDMSE)IM(イオンモビリティー)−DIAプリカーサー及び生成スペクトルは、より深い有効範囲を可能にするより高い選択性とダイナミックレンジとを反映する。選択性は増加され、したがってプロダクトイオンスペクトル品質が改善されるが、HDMSE IM−DIAプロダクトイオンスペクトルはキメラ性が高いままであり、大体において、専用のDIAデータ処理ツールを依然として要する。このように選択性は改善されるが、より最近の高いスキャン速度のDDA機器と比較して、同様の数のペプチドを同定する能力が課題である。
DIAプロダクトイオンスペクトルは、選択イオンクロマトグラム(SIC)を使用したスペクトルライブラリに対してプロダクトイオンスペクトルをスクリーニングすることによって、定性的同定が最良に遂行されるという推論に基づいて、従来のデータベース検索ツールを使用して同定するのには複雑すぎることがある点が示唆されてきた。そのため、SICアプローチ(例えば、FT−ARM、SWATH(Sequential Window Acquisition of all THeoretical Mass Spectra)獲得、及びMSX(多重化DIA)獲得を含む)を利用する、多数の代替のDIA戦略が導入されてきた。プリカーサーイオン選択がない点でMSEDIAと類似しているが、m/zスケールは、ユーザ定義のm/z間隔を使用して連続的にサンプリングされる。m/zスケールを狭くすることで、同時にフラグメンテーションされるペプチドの数が制限されて、プロダクトイオンスペクトルのキメラ性が低減される。これらのDIAワークフローにおいて、ユーザ定義の質量分離幅は、所定の質量スケールにわたって段階的にされる(SWATH)か、又はその中で不規則に位置付けられる(MSX)。一例として、MSXアプローチを用いて、一連の4Th幅の質量分離ウィンドウが、500〜900m/zの所定の質量範囲にわたって不規則にサンプリングされる。モデリング及びシミュレーションに関する以下のパラグラフ及び本明細書の他の箇所における考察と同じく、m/zドメインこの部分(例えば、500〜900m/z)は、時間ドメイン全体にわたるプリカーサーイオン流束の最大密度を反映する。仮定は、より狭い(ただしDDAよりは広い)質量分離ウィンドウから生成されるプロダクトイオンスペクトルのキメラ性が低くなり、SICアプローチを介した同定を行いやすくなるというものである。方法はまた、重なり合うプロダクトイオンスペクトルを逆多重化し、プロダクトイオンを区別してグループ化することによって改善し、キメラ性を低減させることができる。マッチしたプロダクトイオンは、それぞれのm/zビンそれぞれに対して固有であるものを残して、重なり合う領域に割り当てられる。選択されたm/zウィンドウ(500〜900Th)のイオン密度、及びより高いスキャン速度MS2(例えば、MS/MS)の獲得におけるより低い分解能を所与として、2つ以上の同時にフラグメンテーションするプリカーサーが、質量分解能内で類似のm/zのプロダクトイオンを生成する能力は高い。これらのイオンが枯渇することによって、選択性が増加する代わりに制限されることがある。
DIAのモードは、それら自体によってDDAの既存の制限を克服しないことがある。デューティサイクルは依然としてスキャン速度の関数であり、スキャン速度が高いほど感度に対して悪影響である。SWATH又はMSXとのデューティサイクルのある程度の類似を維持するためには、感度を完全に犠牲にしない獲得時間を設定するためにm/zドメインの幅を低減する必要がある。全ての溶出ペプチドに対してプロダクトイオンスペクトルが獲得されるが、m/z空間のサンプリングが大幅に制限されていることは、m/zの大きい領域がサンプリングされずに残されることを意味する。全m/zスケールのサンプリングには、更に速いスキャン速度、より幅広いm/z分離ウィンドウ、又は複数の注入を要する。複数の注入を獲得しなければならないことは、デューティサイクルを増加させず、実験ピーク能力又はイオン干渉にも何ら影響しない。
本明細書に記載される技術を使用する一実施形態は、感度を損なうことなくDIA技術と共に利用可能な、改善された選択性を有するものとして特徴付けられてもよい。このため、以下のパラグラフに記載されるのは、MMA獲得戦略が、イオン流束、m/z、及びドリフトを利用して、各DIA獲得に対するMIWの幅を設定する、本明細書の技術による一実施形態である。かかる一実施形態では、溶出時間は、スキャンサイクルへとセグメント化されてもよく、スキャンサイクルの数は、全ての溶出成分の平均クロマトグラフィ(FWHM)の関数であってもよい。正確なAUC(曲線下面積)定量化が、クロマトグラムピークのFWHMにわたって最低5つのデータ点を要することを所与として、5つのスキャンサイクルの下限が実施されてもよい。後述されるような少なくとも一実施形態では、各スキャンサイクルは、17の別個のDIA獲得を含んでもよく、1つが低エネルギー、2つが広帯域(50Th<MIW<500Th)、及び14が狭帯域(1Th<MIW<50Th)のHDMSE IM−DIA(高精細MSEイオンモビリティー)獲得である(例えば、HDMSEは、データ獲得に関するBateman技術又は高−低プロトコルであるMSEと組み合わせてIMSを行うことを表す)。後述されるように、また本明細書の他の説明と同じく、広帯域及び狭帯域獲得のそれぞれは、サイズ又は幅、及び各スキャンサイクルで変動してもよい関連するm/z範囲を有するMIWを使用してもよい。各MIWは、後続のフラグメンテーションのために低エネルギースキャンを通過することが可能にされるm/z値の範囲を表すm/z範囲を指定してもよい。したがって、m/z範囲を有するMIWを使用することで、プリカーサーイオン又はm/z範囲内のm/zを有する低エネルギースキャンのイオンを選択的にフラグメンテーションすることを可能にして、プリカーサーイオンの1つから発する生成フラグメントイオンの量が限定される。繰り返す低エネルギーHDMSE IM−DIAフルスキャン獲得以外に、少なくとも1つの実施形態では、各広帯域及び狭帯域HDMSE IM−DIA獲得に対する中央m/z値がスキャンサイクルと共に変化する。少なくとも一実施形態では、後に続くスキャンにおけるMIW間の重なり合いも可能にしながら、全m/z範囲を段階的にするため、広帯域及び狭帯域MIWのMIWウィンドウを選択する処理が行われてもよい。スキャンサイクル間の中央m/zの動的移動によって、変動するMIWの成分として各プリカーサーを複数サンプリングすることが可能になる。逆多重化スキーマを使用して、本明細書に記載される技術は、感度をほとんど犠牲にすることなく、非常に弁別的なプロダクトイオンスペクトルを生成する。
非常に選択的なプロダクトイオンスペクトルは、従来のデータベース検索エンジンを使用して検索するか、又は既知のSIC技術を使用してマッチさせることができる。同定されたスペクトルは、分子イオンリポジトリ(MIR)の推定的な区画に入れられてもよい。溶出分子又は成分に対するかかる推定的な同定(putative identification)(例えば、プリカーサー、及び各プリカーサーに対してそれに関連するフラグメントイオン)は、適正であるがまだ検証されていないものと推定又は確信されてもよい。少なくとも一実施形態では、最低50の推定的な同定が入れられると、MIR内部の検証アルゴリズムが始動される。検証アルゴリズムは、背景で動作して、30の推定的に同定されたプロダクトイオンスペクトルの不規則なサンプリングを継続的に選択し、かかるスペクトル間の相関及び統計的有意性を決定する処理を行ってもよい。例えば、一実施形態は、当該分野で知られているドット積スペクトル相関及びピアソンの積率相関係数の両方を適用して、有意性を判断してもよい。例えば、ドット積スペクトル相関は、本明細書に参照により組み込まれる、Toprak,U.H.、Gillet,L.C.、Maiolica,A.、Navarro,P.、Leitner,A.、及びAebersold,R.(2014)、Conserved peptide fragmentation as a benchmarking tool for mass spectrometers and a discriminating feature for targeted proteomics、Molecular & Cellular Proteomics、13(8)、2056〜2071に記載されており、ピアソンの積率相関係数は、本明細書に参照により組み込まれる、Morreel,K.,Saeys,Y.,Dima,O.,Lu,F.,Van de Peer,Y.,Vanholme,R.、及びBoerjan,W.(2014)、Systematic structural characterization of metabolites in Arabidopsis via candidate substrate−product pair networks、The Plant Cell、26(3)、929〜945に記載されている。正の相関が見出された場合、複合プロダクトイオンスペクトル(本明細書の他の箇所に記載)が生成され、そのペプチドの分子イオンシグネチャーがMIRに記憶されてもよい。
次に、以下のパラグラフで記載される本明細書の技術と共に一実施形態で使用されてもよい、材料及び方法が記載される。
サンプル調製において、酵母株W303 MATα(ATTC:24657)(Blue Sky BioServices,Worcester,MA)を、対数初期から対数中期までYPD媒質中で成長させた。4,000g、5分間、4℃の遠心分離によって細胞を採取した。ペレットを、100mMのジチオスレイトール(DTT)及び5%のドデシル硫酸ナトリウム(SDS)を含有する100mM Tris pH7.6に懸濁させた。別に規定されない限り、全ての化学物質はSigma−Aldrich(St.Louis,MO)製であった。結果として得られる溶解物を95℃まで5分間加熱し、次にBioruptor超音波処理器(Diagenode,Liege,Belgium)で20kHz、320W、60秒サイクルで30分間音波処理した。溶解を完了した後、上澄みを16,000gで5分間遠心分離して、タンパク質抽出物を浄化した。
更にサンプル調製と関連して、各サンプルの約50μgを凍結乾燥させ、50mMの重炭酸アンモニウム中の0.05%(w/v)のRapiGest(Waters Corporation,Milfoad,USA)に溶解した。サンプルを、10mMのDTTの存在下において60℃で30分間還元し、50mMのヨードアセタミド(IAA)の存在下において周囲温度で更に30分間暗所でアルキル化した。1:10(w/w)の比でシーケンシング等級のTMPK処理済みトリプシン(Promega,Madison,MI)を添加することによって、タンパク質分解消化を開始し、37℃で一晩培養した。RapiGestを加水分解するために、0.5%(v/v)の最終濃度までTFAを添加し、溶液を37℃で20分間培養してから、13,000rpmで30分間ボルテックスし、遠心分離した。濃縮されたストックを、サンプル分析の前に、100ng/μLまで希釈した。
以下、上記サンプルの分析と関連して使用されてもよい、LC−MS構成が記載される。トリプシンペプチドのIDナノスケールLC分離を、BEH C18 1.7μm、20cm×75μmの分析用RPカラム(Waters Corporation)を具備した、nanoAcquityシステム(Waters Corporation)を用いて行った。1マイクロリットルのサンプルをカラムに取り込んだ。移動相Aは、0.1%(v/v)のギ酸を含有する水であり、移動相Bは、0.1%(v/v)のギ酸を含有するアセトニトリルであった。ペプチドを分析用カラムから溶出し、5〜35%の移動相Bの勾配で、90分間にわたって300nl/分の流量で分離し、次に90%の移動相Bを用いて10分間カラムをすすいだ。カラムを最初の条件で20分間再平衡化した。カラム温度は35℃で維持した。ロックマス化合物[Glu1]−フィブリノペプチドB(50nM)を、LCシステムの補助ポンプによって250nl/分で、質量分析計のNanoLockSpray源の基準噴霧器に送達した。
トリプシンペプチドの質量分光分析を、質量分析計のSynapt G2−S1及びXevo G2−XS QT(Waters Corporation,Wilmslow,United Kingdom)の両方を使用して行った。両方の機器は、それぞれ20,000及び25,000の公称質量分解能で、分解モードで動作させた。全ての実験は、正の電気スプレーイオン化モードで行い、イオン源ブロック温度及び毛管電圧はそれぞれ、80℃及び2.5kVに設定した。飛行時間分析器(ToF)は、m/z50〜1990からのNaCS1混合物を用いて外部で校正した。データは、[Glu1]−フィブリノペプチドBの二電荷モノアイソトピックイオンを使用して、獲得後に補正したロックマスであった。基準噴霧器は30秒の頻度でサンプリングした。正確な質量LC−MSデータを、Synapt G2−S1に対してはデータ独立型(HDMSE IM−DIA)獲得モードで、Xevo G2−XS Qtに対してはデータ独立型(MSE DIA)で収集した。全ての獲得は、0.025秒のスキャン間遅延で0.1秒間獲得された。低エネルギーMSモードでは、単位電荷当たり4eVの一定の衝突エネルギーでデータを収集した。上昇エネルギーモードでは、衝突エネルギーは、DDA獲得で使用されるのと同様のルックアップテーブルを使用して、最初の値から最後の値まで増やされた。
図35を参照すると、本明細書の技術による一実施形態で行われてもよいワークフローを例証する一例3500が示されている。ワークフロー3500は、実験が行われる上述のサンプルと関連して行われてもよい。
要素3502は、標的3502a、シミュレータ3502b、モデリングパラメータ3502c、及び校正方程式3502dを含む、ワークフローモデリング段階を表している。要素3504は、実験を行うのに使用される、スケジューラ3504b、スケジューリングパラメータ3504a、並びに計装及び機器3503を含む、ワークフローの獲得段階を表している。少なくとも一実施形態では、要素3503は、一般に、上述の調製された酵母サンプルの分析のためなど、サンプル分析のため、クロマトグラフィ(例えば、LC)、質量分析、及び(任意に)イオンモビリティースペクトロメトリーを大ナウ、科学装置システムを表してもよい。少なくとも一実施形態では、スケジューラは、実験及びサンプル分析のためにデータ獲得を行うときに、質量分析計を制御するのに使用されるスケジュールを決定してもよい。本明細書の他の箇所の考察と同じく、質量分析計以外の1つ又は2つ以上の更なる機器も、サンプル分析を行うことと関連して使用されてもよいが、本明細書に記載されるようなスケジューラの一実施形態は、質量分析計によって行われる処理のみに影響してもよい。要素3506は、生のファイル3506a、データ処理3506b、整列スペクトル処理3506c、逆多重化3506d、及びデータベース検索3506eを含む、一般的なワークフローのデータ処理又はデータ分析段階を表す。要素3508は、MIR 3508a、検証処理3508b、及び推定的なプロダクトイオンスペクトルリポジトリ3508cを含む、記憶ワークフローを表す。要素3505は、イオン流束3505a、m/z対tr 3505b、m/z対td 3505c、及びtr対td 3505dに関する出力を生成する、空間マッピング段階を表す。
一般に、ワークフロー3500は、2つの主要なワークフロー経路を示し、第1の経路は実線のコネクタ及び矢印によって定義され、第2の経路は破線の矢印及びコネクタによって定義される。第1の経路はシミュレータを使用するフローを表す。第2の経路によって表されるフローは、例えば、行われる各行程又は注入に対してなど、反復する形で、並びに本明細書の他の箇所に示されるように、複数の行程又は注入にわたって反復して使用されてもよい。
シミュレーション又はモデリングの標的3502aを表すファイルは、シミュレータ3502bに入力される。上述された酵母サンプルと関連して、標的3502aは、可能なペプチド、タンパク質、又は試験及び分析下のサンプル中にあってもよいプロテオーム全体を含んでもよい。一般に、標的3502aは、シミュレータ3502bによってシミュレートされる分子のセットを同定する。したがって、標的3502aは、分析されている特定のサンプルに伴って変動してもよい。例えば、サンプルが小分子、殺虫剤などを含んでいた場合、標的3502aは、ワークフロー3500を使用した分析下でサンプル中に生じることがある、かかる分子を同定するであろう。シミュレータ3502bは、標的3502aの同定された分子の属性又は物理化学的性質をシミュレートする。例えば、標的分子3502aに対してシミュレータ3502bによって決定されるモデル化された属性は、保持時間、ドリフト時間、フラグメンテーションパターン情報(例えば、プリカーサーイオンをフラグメンテーションした結果として生成される、プリカーサー及び関連するフラグメントイオン)、プリカーサー及びフラグメントイオンのm/zに対する、予期された、モデル化された、又はシミュレートされた属性値を含んでもよい。モデル化された属性は、一般に、本明細書に記載され、また当該分野においても知られている任意の属性に対して、モデル化された値を含んでもよい。
モデル化又はシミュレートされた属性(例えば、3502aの標的分子に関するモデル化された物理的及び化学的性質)は、モデル化された入力を使用してMMAスケジュールを設定/決定する、スケジューラ3504aに入力される。データ獲得パラメータ3540aは、本明細書の他の箇所に更に詳細に記載され、一般に、行われる特定の実験及びデータ分析に伴って変動する。例えば、スケジューラ3504bは、シミュレートされた保持時間などに基づいて獲得と関連して溶出分子又は成分が予期される、順序を決定することができる。スケジューラ3504bは、例えば、スキャンサイクル/クロマトグラフィFWHMの数、スキャン時間、広帯域及び狭帯域m/z分離幅(MIW)、並びに衝突エネルギーテーブルなど、獲得タイムラインに影響するパラメータ3504aを設定する。パラメータ3504aはまた、任意のユーザ定義の最小値又はマッチ許容差など、ユーザ定義の情報を含んでもよい。
サンプル分析は、スケジューラ3504bによって生成されるMMA設定又はスケジュールにしたがって動作する質量分析計を含む、機器3503によって行われる。実験行程又は注入の結果として、生データ3506aが生成され、それが次にデータ処理3506bにおいて処理される。データ処理3506bは、後述される、また本明細書の他の箇所に記載されるような、データ処理を含む。例えば、データ処理3506bは、単一のスキャン処理、電荷クラスタ群又はPCCを構築する処理、及びPCCの電荷状態又は電位/候補電荷状態を決定する処理を含んでもよい。アライメント処理3506cは、各スキャンにおいて、プリカーサー及びプロダクト又はフラグメントイオンを整列させる(例えば、単一のスキャンに対してSSPPISを形成する)こと、また(例えば、時間に伴って溶出するイオン若しくはPCCの曲線を形成するため)m/zによって時間内のPCCを組み合わせることを含んでもよい。したがて、3506cのアライメント処理は、単一のスキャンに対してSSPPISを形成すること、及びSSPPISを同じPCCに対して時間に伴って組み合わせる(例えば、時間に伴って溶出する同じPCCのプロファイル若しくはエンベロープを形成する)ことを含んでもよい。整列したプロダクト及びプリカーサー又はSSPPISは、次に逆多重化3506dに入力される。
一般に、逆多重化3506dは、(例えば、実験データのPCC又はプリカーサーイオンのフラグメンテーションを通して生成されるものと判断される、実験データ中のプロダクトイオンを選択的に改良、フィルタ処理、又は制限する)特定のプリカーサーイオン又はPCCと関連付けられた特定のプロダクトイオンの更なる改良として特徴付けられてもよい。逆多重化は、例えば、各溶出成分に対して最良に同定するプロダクトイオンスペクトルの決定(例えば、フラグメントイオンが溶出成分のプリカーサーイオンを同定するのに使用されてもよい、溶出成分に関して、CPPISに含まれる最良のフラグメントイオンを決定すること)に対して、本明細書に記載されるような様々な基準を使用して、PCCと関連付けられたフラグメントイオンを更にフィルタ処理、除外、又は除去することを含んでもよい(例えば、基準は、AR1及びAR2値並びに本明細書に記載されるような他のものを使用してもよい)。
逆多重化の終わりに、教師なしクラスタリングと関連するものなど、CPPISが溶出成分又は分子に対して構築されてもよい(例えば、同じ溶出成分又は分子に対するSSPPISを組み合わせる)。教師なしクラスタリングの場合、処理3506eは、3508bの更なる検証のため、CPPISを推定的なリポジトリ3508cに追加することを含んでもよい。検証されると、CPPISはMIR 3508aに含まれてもよい。
教師ありクラスタリングの場合、ステップ3506eは、(例えば、m/z、保持時間、及びドリフト時間(IMSが使用される場合)に基づいて)実験データからのSSPPISのタイムラインにわたって、標的CPPISをリポジトリ3508cから抽出すること、及び問い合わせることを含んでもよい。標的CPPISにマッチする実験データ中のSSPPIS(例えば、マッチするプリカーサー又はPCC m/z)は、組み合わされて実験CPPISにされ、次にリポジトリ3508cに追加されてもよい。後に続く検証3508bは、MIR 3508aの溶出成分又は分子に対する既存のCPPISを置換又は補充する、実験CPPISを更に検証する処理を行ってもよい。
行われた実験からの結果は、空間マッピング3505の形態で(例えば、3506cから3505a、3505b、3505c、3505d、次にスケジューラ3504bへの流路を介して)3506cからスケジューラ3504bに戻されてもよい。3504b〜3506cにフィードバックする実験データに基づいて、スケジューラ3504bは、スケジュール又はMMA設定を修正又は改訂し、また更にパラメータを修正してもよい(例えば、衝突電圧又はエネルギーの改訂、MIWの変更などを行ってもよい)。少なくとも一実施形態では、MMAスケジュール及びパラメータは改訂されてもよく、そして、ここまで同定されてなかった分子(例えば、前の注入行程若しくは実験で実験データが獲得されなかった分子)を同定するか、又は次のサンプル注入若しくは行程を用いて実験データを生成してもよい。例えば、第1の行程では、スケジューラ3504bは、標的3502aにおける分子のシミュレートされた属性又は性質などのシミュレートされた情報に基づいて、獲得スケジュール及び関連するパラメータ3504aを決定してもよい。この第1の行程の後、3502aにおける分子のある第1の部分に対して実験データが得られてもよい。第2の行程では、スケジューラは、第1の部分にはない3502aの他の分子に対して実験データを得る目的で、獲得スケジュール及びパラメータ3504aを選択してもよい。
データベース検索3506aは、本明細書に記載される教師ありクラスタリングを含んでもよく、その場合、標的溶出成分のCPPISが実験データのSSPPISにマッチするか否かを判断するため、標的溶出成分のCPPISが3508cから選択されてもよい。マッチする場合、マッチする標的溶出成分に関する更なる属性がリポジトリ3508cから得られ、校正方程式及び/又はモデリングパラメータ3502dの形態(例えば、どの衝突エネルギーが使用されるべきか、溶出成分に対する保持時間はどれか、この溶出成分の異なるPCC又はプリカーサーに対するドリフト時間はどれか、溶出成分に対するフラグメンテーションパターン(プリカーサー、及び各プリカーサーに対する関連するフラグメントイオン)はどれか)で入力としてシミュレータ3502bに提供されてもよい。
一実施形態では、シミュレータ3502bは、最初に、全ての標的3502aに対してシミュレートされた理論上のフラグメントパターン(例えば、各プリカーサー及びフラグメンテーションを介して各プリカーサーから発する関連するフラグメントイオン)を生成することなどによって、標的3502a中の全ての分子の物理的及び化学的性質を予測、シミュレート、又はモデリングするのに使用されてもよい。例えば、標的3502aは1000の分子を有するものと仮定する。シミュレータ3502bは、最初に、1000の分子に対してかかるシミュレートされた属性情報を生成して、第1の実験行程を行う際の最初のMMAスケジュール及びパラメータ3504aを決定してもよい。ここで、第1の実験は、最初のMMAスケジュール及びパラメータに基づいて、これらの溶出分子のうち200に対する属性又は性質を含む実験データを獲得するように行われる。第1の実験行程を通して得られる200の分子の属性は、次に、ここでシミュレータに入力されるフィードバックを形成してもよい。しかしながら、シミュレータ3502bは、実験データがまだ獲得されていない標的セットの残り800の分子に対して情報のシミュレートを継続してもよい。同様の方法で、シミュレータ3502bはまた、MIR 3508aからの情報を用いて更新されてもよく(3508aから3502aへの矢印)、その場合、シミュレータ3502bは、MIR 3508aからの入力を使用し、残りの溶出分子情報をシミュレートしてもよい。例えば、第1の溶出分子の場合、MIRは、RT、ドリフト時間、溶出分子のプリカーサーのプリカーサー及びプロダクトイオンスペクトルなどの属性/物理的性質を含む。しかしながら、第2の溶出分子の場合、MIRは何ら情報を含まなくてもよい。したがって、シミュレータは、第1の溶出分子に対するMIRからの情報を使用し、それを出力してもよい。しかしながら、第2の溶出が継続する場合、シミュレータは、シミュレートされた属性情報(例えば、どのプロダクトイオンが第2の溶出分子のどのプリカーサーに対して予期されるかを表す理論上のフラグメンテーションパターン)を出力し使用し続けることになる。少なくとも1つの実施形態では、MMAスケジュール(本明細書では、スケジュール若しくは獲得スケジュールとも呼ばれる)及びパラメータが改訂されて、ここでは次のサンプル注入又は行程を用いて、前に同定されてなかった標的3502aの分子を同定してもよい(例えば、MMA設定又はスケジュール3504b及びパラメータ3504aを修正して、シミュレータがシミュレートされた属性情報をまだ生成している3502aの分子に対する実際の実験データを得ることを標的とする)。
3500における様々な項目及び処理ステップに関する更なる詳細が、以下のパラグラフ及び図面に提供される。
モデリング3502と関連して、生物システムに対する応力の摂動効果を正確にモデリングしシミュレートする能力には、シミュレートされているシステムの確実な知識及び理解を要する。ペプチドのアミノ酸の基本的組成及び線形配列は両方とも分かっているので、そのペプチドに対する全ての可能なプリカーサー及びプロダクトイオンのm/z及びzを計算することができる。これは、全てのオープンソース及び市販のペプチドデータベース検索エンジンに対する一般的な「運用法」である。プリカーサーが生成できる同位体の数は、その基本的組成及び濃度に直接関係する。以下のパラグラフは、モデリング段階又はプロセス3502の個々の構成要素について更に記載する。
上記された酵母サンプルに関する特定の実験と関連して、標的ファイル3502aが提供されてもよい。細胞溶解物からのイオンがLC−MSワークフローにおいてどのように分布するかを正確にシミュレートするため、所与のピーク容量を反映して、入力されるタンパク質リストは可能な限り濃度によって順序付けされなければならない。この目的を達成するため、例えば、インターネット上などの一般に利用可能なソースから、100を越える生及び処理済みの酵母細胞溶解物のデータセットが得られる。生データファイルは、当該分野で知られており、また例えば、本明細書に参照により組み込まれる、Cox,J.及びMann,M.(2008)、MaxQuant enables high peptide identificaton rates,individualized ppb−range mass accuracies and proteome−wide protein quantification、Nature biotechnology、26(12)、1367〜1372に記載されている、Mascot Distiller及びMaxQuantを使用して処理した。UniProt S.cerevisiae(2014年7月3日、入力6752件)fastaデータベースに対して、例えば、本明細書に参照により組み込まれる、Cox,J.,Neuhauser,N.,Michalski,A.,Scheltema,R.A.,Olsen,J.V.、及びMann,M.(20011)、Andromed:a peptide search engine integrated into the MaxQuant environment、Journal of proteome reseaerch、10(4)、1794〜1805に記載されているような、当該分野で知られているMascot,X! Tandem and Andromedaを使用して、全てのプロダクトイオンスペクトルを検索した。各検索結果に対して、各スコアを全てのスコアの合計で割ることによって、タンパク質スコアを正規化した。タンパク質の濃度は、その正規化されたスコアの直接的結果であるものと仮定して、結果を組み合わせ、再正規化し、降順で分類した。これは、順序付けられたデータベースがどのように構築されるかを構成する。酵母の順序付けされたデータベースは、シミュレータ3502bに対する入力(例えば、標的3502a)とし手の役割を果たした。順序付けされたデータベースに加えて、ユーザは、オンカラム充填、勾配及びIMS校正ファイル、並びにドリフト、クロマトグラフィ、及びm/zに対する分解能に関して、モデリングパラメータ3502c及び校正方程式3502dを入力する。Hi3定量化戦略を使用して、オンカラム充填は、各タンパク質モル濃度を確立するシミュレートされたタンパク質全体にわたって分配される。Hi3定量化戦略は、例えば、本明細書に参照により組み込まれる、Silva,J.C.,Gorenstein,M.V.,Li,G.Z.,Vissers,J.P.、及びGeromanos,S.J.(2006)、Absolute quantification of proteins by LCMSE a virture of parallel MS acquisition、Molecular & Cellulrar Proteomics、5(1)、144〜156に記載されているように、当該分野で知られている。
図36A及び図36Bを参照すると、シミュレータ3502bに提供されてもよい異なる入力を更に例証する、例3600及び3601が示されている。集合的に、3600及び3601の要素は、モデリングパラメータ3502c及び校正方程式3502dに含まれる情報のサンプリングを表してもよい。特に、3600及び3601の表及びモデルは、ペプチド、タンパク質、又はプロテオーム全体の入力セットからプリカーサー及びプロダクトイオン流束を推定するのに、シミュレータによって使用される、表及びモデルのサンプリングを示している。パネルA 3606は、ペプチド配列長さに基づくzの分布を反映している。パネルB 3602は、n末端及びc末端に対する帯電可能な残留物(K、R、H)の位置付けを所与として、適用される調節(%)の表を表す。パネルC 3604は、m/zによるイオン化順序(最高から最低へ)を決定する。各ペプチドの各電荷状態のm/zは、y切片がイオン化順序を定義する曲線上に置かれる。パネルD 3614の曲線は、各zに割り当てられるペプチドの面積の比率を定義する。パネルE 3616及び表1 3608は、各アミノ酸のCCSA及び疎水性値をそれぞれ示す。シミュレータは、これらの値を使用して、各ペプチドの保持時間及び各電荷状態のCCSAを計算する。表2 3612は、各ジペプチド結合に対する頻度の値を反映する。低エネルギーにおけるプリカーサーイオン強度から上昇エネルギーにおける残留物の強度を引いた差として定義される残留物の差に、計算された値を掛けて、フラグメントイオン強度が設定される。割り当てられた強度(1000を掛けたもの)は、同位体にわたって分配される。
質量分析部内へと電気スプレーされると、ペプチドは複数の電荷状態を帯びることができる。パネルA 3606及びパネルB 3602はそれぞれ、ペプチド長さ及び特定の帯電可能な残留物の位置の関数としてのzの分布を反映する。タンパク質は、アミノ酸組成が関与する限り、非常に類似している。パネルC 3604に反映された曲線はイオン化順序を割り当てる。各ペプチドは、それが取ることができる理論上の電荷状態の数に基づいて、m/z又は一連のm/z値が割り当てられる。各m/z値の曲線上における位置は、0〜1(1は最良のイオン化)の順位に反映される。組成の類似性を所与として、最良から最低までのタンパク質ごとのペプチドイオン化の数は、長さの直接の関数である。それらのペプチドがどのように分配されるかは、パネルD 3614に示される。組成の類似性を仮定して、3614の各ビンを占めるペプチドの数も長さの関数である。これが当てはまる場合、ペプチドはタンパク質に対して、3614の10個のビンにわたって分配される。どのペプチドがどのビンに常在するかは、それらのm/z値がパネルC 3604の曲線上のどこにあるかの関数である。概して、10kDa(ダルトン)のタンパク質はビン1つ当たり1つのペプチドをもたらし、それにより、100kDaのタンパク質は10個をもたらす。順序が定義されると、最良のイオン化ペプチドの強度が、タンパク質のモル量を所与として割り当てられ、応答因子(cts/モル)が計算又は定義され、他の全てが、最良のイオン化ペプチドの強度を乗算することによって、それらの曲線上の位置に割り当てられる。各プリカーサーm/zがその強度を受け取ると、同位体モデリングアルゴリズムを使用して分配される。
物理化学的属性、保持時間、ドリフト時間、及び衝突断面積に対するモデリングアルゴリズムは、当該分野において、例えば、全て参照により本明細書に組み込まれる、Krokhin、Oleg V.、及びVic Spicer、「Predicting peptide retention times for proteomics」、Current Protocols in Bioinformatics(2010):13〜14、Petritis、Konstantionsら、「Improved peptide elution time prediction for reversed−phase liquid chromatography−MS by incorporating peptide sequence information」、Analytical chemistry 78.14(2006)、5026〜5039、並びにMeek、James L.、「Prediciton of peptide retention times in high−pressure liquid chromatography on the basis of amino acid composition」、Proceedings of the National Academy of Sciences 77.3(1980):1632〜1636、Moruz、Luminitaら、「Chromatographic retention time prediction for post−translationally modified peptides」、Proteomics 12.8(2012):1151〜1159、Valentine、Stephen J.ら、「Using ion mobility data to improve peptide identification intrinsic amino acid size parameters」、Journal of proteome research 10.5(2011):2318〜2329、並びにKnapman、Tom W.ら、「Considerations in experimental and theoretical collision cross−section measurements of small molecules using travelling wave ion mobility spectrometry−mass spectrometry」、International Journal of Mass Spectrometry 298.1(2010):17〜23において知られている。
パネルE 3616及び表1 3608はそれぞれ、各アミノ酸の衝突断面積及び疎水性係数(HI)値を示す。基本的組成、線形配列、長さ、及びzが分かっていると、所与のカラムタイプ、勾配プロファイル、流量、カラム温度、ガス密度、及び電界強度に対して、溶出及びドリフト時間を予測することができる。シミュレータ3502bは、これらの値を利用し、モデル化されたペプチド及びそれらそれぞれの電荷クラスタ群の溶出及びドリフト順序を推定する。実験値と予測値との間のばらつきは、測定可能な属性それぞれに対してどの程度良好にモデルが定義されているかの関数である。
ペプチドフラグメンテーションは、提供される機器プラットフォーム/ジオメトリとは独立している。同様のフラグメンテーション方法(例えば、低エネルギーCID/衝突セル)及びそれらの機器は、同様のガス圧及び衝突エネルギー下で動作する。表2 3612は、シミュレータによって利用される3つのフラグメンテーション表のうち1つの一区画を示している。各表は、アミノ酸の全ての可能な二元対(AA、AC、ADなど)のマトリックスを反映する。順序付けられた入力fastaデータベースの構成と同様に、マッチしたプロダクトイオン強度はそれぞれ、そのペプチドのマッチしたプロダクトイオン全ての合計強度に対して正規化される。第1の表は、400の可能な二元対それぞれに対して正規化された強度を反映する。第2のものは、可能な二元対(配列)それぞれの正規化された頻度を反映し、第3のものは、同定された対の頻度を表す。各二元対に対して、対がどの程度の頻度で同定されたかと、対がどの程度の頻度で同定されたかとの頻度比が計算される。次に、正規化された強度比値を、正規化された頻度で割り(現在/検出されたもの)、結果を二元対の総計に対して正規化する。3つのモデルを使用して、分数値を理論上のプロダクトイオンそれぞれに割り当てる。プロダクトイオン強度は、その分数値を、ペプチドの電荷クラスタ群の強度値に対して乗算することによって計算される。次に、割り当てられた強度は、適切な数の同位体へと分配される。フラグメンテーションモデリングプロセスの更に詳細な説明は、例えば、参照により本明細書に組み込まれる、「Conserved peptide fragmentation as a benchmarking tool for mass spectrometers and a discriminating feature for targeted proteomics」、Molecular & Cellular Proteomics、13(8)、2056〜2071に見出すことができる。
少なくとも一実施形態では、3500のMMA全体のワークフローは、自動化プロセスとして、完全なユーザ制御又は行程下にあってもよい。ワークフロー3500の概略は、単一のサンプルに適用することができ、あるいは技術的又は生物学的複製の帰納的及び/又は徹底的分析のため、反復して実行することができる。上述されたように、実線の矢印及びコネクタは、最初のMMAスケジュール設定及びパラメータ構成に対してシミュレートされたイオン流束を使用することを示す第1の経路を形成し、破線の矢印及びコネクタは、スケジューリングされた獲得(スケジューラ3504bによって生成される)の獲得タイムラインが前の注入のイオン流束に基づく、反復するワークフローを反映する第2の経路を形成する。
バッチ分析モードでは、獲得後処理は、最も高いスコアのペプチドを最小二乗適合に対する分子マーカーとして使用して、注入間の保持及び/又はドリフト時間のあらゆるばらつきを補正してもよい。それに加えて、一実施形態のスケジューラ3504b及びMMAスケジュールと関連して、各狭帯域及び広帯域獲得に対する中央m/zは、同じサイクルの次のスキャンでは除外される。除外リストは累積的であり、m/zスケールのどの部分が単位時間ごとに狭域でサンプリングされるべきかを継続して限定する。中央m/zの一定した変化により、異なるプロダクトイオンスペクトルの獲得が、逆多重化アルゴリズムによって処理される場合、継続して増加する選択性のプロダクトイオンスペクトルを生成することが担保される。低エネルギースキャンの全m/zドメインが、複数の分離ウィンドウ内で複数回サンプリングされると、プロセスは、生物学的サンプルの単一の混合物、複製、又はコホートの全ての注入が使い果たされるまで繰り返す。更に詳細に後述される例3700におけるグレイのストリップ状の境界線D1は、同じm/z空間の複数のサンプリングを示す。この反復アプローチによって、各溶出ペプチドに対して非常に特異的なプロダクトイオンスペクトルの作成が可能になる。全ての注射にわたる全スペクトルの全イオンに対して測定された全ての物理化学的属性が含まれる。MMA戦略は、プロダクトイオンスペクトルの数及び選択性を著しく増加させるが、感度にはほとんど影響しない。各プロダクトイオンスペクトルの結果として得られる清浄性によって、ワークフローが、従来のデータベース検索に対して、並びにSIC標的化に対して理想的になる。
スケジューラ3504bによるサイクル時間の決定と関連して、図37が参照される。標識なしの、等圧の、及び同位体標識付きのサンプルの非常に正確なAUC定量化を行う能力を維持するためには、そのピークの溶出ペプチドのFWHMにわたって最小で5つのデータ点を要する(例えば、図7の点H1及びH2の間など、2つの半値点間に5つのデータ点/5つのスペクトルを必要とする)。そのため、適切なスキャンサイクル時間、獲得速度、及びスキャンサイクルごとの獲得数を決定するための開始メトリックは、中央クロマトグラフィFWHMである。スケジューラ3504bは、ダイナミックレンジ(例えば、検出されたイオンに対する信号強度を表す計数の範囲)、検出器の検出範囲の基準、機器の応答因子(計数/注入モルの単位)、及びLODなどの入力を使用する、MMAタイムラインを構築するアルゴリズムを使用して、処理を行ってもよい。応答因子は、ユーザ定義であるか、又は例えば、参照により本明細書に組み込まれる、
Silva,J.C.、Gorenstein,M.V.、Li,G.Z.、Vissers,J.P.、及びGeromanos,S.J.(2006)、Absolute quantification of proteins by LCMSE a virtue of parallel MS acquisition、Molecular & Cellular Proteomics、5(1)、144〜156などに記載されるように、実験的に決定されてもよい。
要素3710は、1つの例示的実施形態において、スキャンサイクル時間を決定するのに使用される情報を要約している。獲得速度は、LODの5倍に比例する(最低の予期されるイオンに対して有用な信号を生成するMS蓄積時間)が、最速スキャン時間(50ms)を超えることはない。手動モードでは、スキャン速度、獲得時間、応答因子、及びダイナミックレンジを含む全てのパラメータが、ユーザ定義であってもよい。スキャンサイクル当たりの獲得数は、計算された獲得速度、機器のスキャン間遅延時間、基準(ロック)マスの獲得頻度を使用して決定される。スキャンサイクル時間の決定と関連して、中央ピーク幅、及びしたがって中央FWHMは、実験行程から分かる。この例3710では、FWHMが0.18分又は10.8秒であると仮定する。本明細書に記載されるような少なくとも1つの実施形態では、10.8秒間隔内で最低5つの点、及びしたがって5つのスペクトル又はスキャンが望ましい。したがって、2.16秒/スキャンサイクルの最小スキャンサイクル時間が、最小5つを担保するのに使用されてもよい。この特定の例では、1.86秒のサイクル時間が、約6サイクル/FWMHで、MMワークフロー3500と共に使用される(例えば、10.8/6=1.8秒)。
3720を参照すると、1.86秒の第1のスキャンサイクルの場合、一実施形態は、17のデータ獲得又は実験を、またしたがって、感度を損失することなく(100ミリ秒の獲得時間で)単一ピークにわたって17×6=102の実験又は獲得を行ってもよい。17のデータ獲得は、1つの低エネルギースキャンA1と、2つの広帯域スキャンB1と、14の狭帯域スキャンC1とを含む。要素A1は、300〜1950m/z範囲にある全てのプリカーサーイオンが通される、単一の低エネルギー(LE)スキャンを表す。広帯域MIW B1及び狭帯域MIW C1に関して異なるMIWが、選択的なプリカーサーイオンフラグメンテーションに利用されてもよい。50〜500m/z値の範囲又は幅をそれぞれ有する、2つの広帯域MIW B1が選択されてもよい。1〜50m/z値の範囲又は幅をそれぞれ有する、14の狭帯域MIW C1が選択されてもよい。一般に、特定のm/z範囲内におけるプリカーサーイオンの数の密度に応じて、異なるMIW(中帯域又は狭帯域)が選択されてもよい。例えば、より低いイオン流束を有するm/z範囲 A1の領域では、中帯域MIWが使用されてもよい。より高い/最高のイオン流束のm/z範囲 A1の領域では、狭帯域MIWが使用されてもよい。このように、かかるより高い/最高のイオン流束の領域においてイオン干渉を最小限に抑え、イオン(例えば、プリカーサーから生成されたフラグメント)を空間的に分解又は分離するために、より高い/最高のイオン流束を有するm/z範囲の部分には、より狭いMIWが使用されてもよい。一実施形態では、後に続くスキャンサイクルにおいて、後に続くスキャンの各MIWと関連付けられるm/z部分範囲をシフトさせるために、前のスキャンサイクルとは異なる中央点をそれぞれ有する、2つの広帯域MIW及び14の狭帯域MIWが選択されてもよい。各MIWのサイズは、ある連続する数のm/z値に対応する、任意の規定のm/zビン内におけるプリカーサーイオンの所望の最大数に基づいて決定されてもよい(例えば、m/zビンごとに10以下のプリカーサーイオン)。これについては、前の注入からの様々な分布を示す図38を参照して更に詳細に後述される。
IMWの決定と関連して、任意のプロダクトイオンスペクトルが占めることができる、限定された量のm/z空間がある。したがって、最小限のキメラ性の干渉でその空間に取り込むことができるプロダクトイオンの数は、単位時間当たりに衝突セル内に存在する、プリカーサー個体群及びその凝集プロダクトイオンの関数である。図38の例3750では、実験データから生成され、本明細書の技術による一実施形態におけるサイクル時間の特定のスキャンで使用されるMIWを決定するなど、MMAスケジューラ3504bへの入力を提供するのに使用されてもよい、空間マッピング3505を例証する例が示されている。パネルA 3752は、2次元のm/z対trビンへとグループ化されたプリカーサーイオンを示すイオン流束ヒートマップを表す。各m/z対trビンは、10Th幅及び0.2分幅である。パネルB 3754は、m/z対保持時間の分布を反映する。パネルC 3756は、m/z対ドリフトの分布を反映する。パネルD 3758は、保持時間tr対ドリフト時間tdの分布を反映する。最高のイオン流束を有するm/z範囲の密に取り込まれた部分は、3752の「*」によって表され、また、3754及び3756では、密に取り込まれたm/z範囲は境界線β及びβ’の間である。したがって、例えば、3754及び3756における境界線β及びβ’の間のm/z範囲は、狭帯域MIWが使用されるm/z範囲を表してもよく、広帯域MIWは、境界線β’の上及びβの下のm/z範囲(境界線β及びβ’によって区切られる範囲外)で使用される。
3710に示されるような100msのスキャン速度及び10msのスキャン間遅延時間において、各スキャンサイクルは、それ自体の実験としてそれぞれ処理される約108のスペクトルを含んでもよい。1.86秒の中央クロマトグラフィFWHMにわたってこれらのスペクトルがどのように分配されるかの例が、図37の3720に示される。3720で、毎スキャンサイクルの第1の獲得は、低エネルギープリカーサーイオンスキャンであり、その後、(パネルB 3754に反映されるように)上下の境界線β及びβ’の外にある関連するm/z範囲を有する、2つの広帯域上昇エネルギースキャンB1が続く。広帯域MIW獲得の幅は、ドリフトビンごとに10のプリカーサーイオンの限界によって定義されてもよい。狭帯域MIWと関連する第1の例として、スケジューラは、各スキャンサイクルに対して、境界線β及びβ’内の最高の正規化された強度を反映する、計算された数のプリカーサーイオンを選択する。かかるプリカーサーイオンに対するm/z値は、狭帯域MIWの開始m/z範囲を決定するのに使用されてもよい。選択されたm/z値を使用して、各狭帯域獲得のための幅は、ドリフトビンごとに最大10のプリカーサーイオンと同様に計算されてもよい。このように、本明細書の他の箇所に記載されるように、各MIWと関連付けられたm/z範囲及び幅は、ドリフト時間ビンごとに10の最大数10のプリカーサーイオンを含むことに基づいて、MIWの調整目標によって変動してもよい。変形例として、広帯域及び/又は狭帯域MIWと関連付けられた質量分離幅もユーザ定義であってもよい。同じ時間空間、ドリフト、及びm/zの部分は、MIWの中央のプリカーサーm/zが固有である限り、同じスキャンサイクル内で再サンプリングされてもよい。スキャンサイクル数を定義する中央クロマトグラフィFWHMを用いて、各プリカーサーは、単一のスキャンサイクルにおけるその溶出にわたって2回以上サンプリングされる機会を有する。プロセスは、現在のスキャンサイクルの狭帯域又は広帯域MIWのどちらかで全てのプリカーサーイオンがサンプリングされるまで繰り返す。スケジューラは、多次元空間のどの領域が狭帯域でサンプリングされているかを把握する。バッチ獲得モードで操作されて、中央m/z値の累積的な除外によって、パネルB 3754、C 3756、及びD 3758に示される境界線β及びβ’内のm/z、時間、及びドリフト空間が、プロセスを繰り返す前に完全にサンプリングされてもよい(例えば、区切られた多次元空間全体に対して上昇エネルギースキャンデータを得る)ことが担保される。
区切られた多次元領域の規定の範囲(例えば、パネルB 3754、C 3756、及びD 3758の境界線β及びβ’によって表される)が、規定の範囲に対して再び繰り返される前にサンプリングされることを担保する上記処理は、一般に、単一の注入若しくは行程の中で行われてもよく、又は複数の注入又は行程にわたってもよい。複数の注入にわたる場合、使用するサンプルが、行われる分析に対して同じ又は共通の分子セットを含む(例えば、全てのサンプルが、標的3502aで定義されるような分子を含む)限り、各注入又は行程において、同じサンプル又は異なるサンプルが使用されてもよい。複数の注入にわたる場合、第1の注入又は行程に関連する実験データ(例えば、イオン流束、網羅又はサンプリングされたm/z範囲など)などの情報を、スケジューラによって使用して、第2の次の注入又は行程(例えば、次の第2の注入及び行程の各スキャン及びスキャンサイクルに対する広帯域及び/又は狭帯域MIWのm/z範囲)のスケジュールが自動的に決定されて、多次元有界領域全体の完全なサンプリングが担保されてもよい。より一般的には、上記は、複数の注入、同じ注入の複数のサイクル及びスキャンサイクルなどにわたってもよい、ワークフロー処理の反復性及びフィードバックを示している。スケジューラ3504bは、一般に、多次元有界領域のどの部分が現在の時点で既にサンプリングされているかに関する情報を提供されてもよく、それによって、スケジューラは、まだサンプリングされていない多次元有界領域の残りの部分をサンプリングする処理を行ってもよい(例えば、現在の時点に続いて質量分析計及び/又はイオンモビリティースペクトロメトリー計のサンプリング及び動作のスケジュールを決定して、多次元有界領域に対して行われ得る繰返しの前に、多次元有界領域全体がサンプリングされていることを担保する)。本明細書に記載されるように、上記のフィードバックを注入間にスケジューラに提供する情報は、イオン流束及び他のデータなどの実験データを含んでもよい(例えば、図38の例3750を参照)。
一般に、広帯域及び狭帯域MIWの幅は、アルゴリズムによって決定されてもよく、又は上記されたようにユーザ定義であってもよい。スケジューラは、前の獲得のタイムラインを確認して、広帯域及び狭帯域それぞれの獲得に対する中央m/zが除外されるように新しい獲得タイムラインを設定する。MMAタイムラインの構築は、ユーザ定義のクロマトグラフィFWHM又は前の実験の中央値どちらかを利用して行われてもよく、この例では、スケジューラがスキャンサイクルの数を6に設定する。この例の自動モードでは、獲得順序は、1つの低エネルギーフルスキャン、2つの広帯域(50Th<MIW<500Th)スキャン、及びn個の狭帯域(1Th<MIW<50Th)スキャンを実行するように設定され、ここで、nはユーザ定義又はアルゴリズムで決定されるLOD(モード)の関数である。スケジューラは、スキャン間遅延時間及び応答因子(cts/モード)を最小限の入力として要する。応答因子(RF)は、基準質量から計算するか、又はユーザ定義であることができる。スキャン間遅延時間に加えて、LOD/RFアルゴリズムは獲得時間を決定する。スキャンサイクル時間を獲得時間で割って獲得数が設定され、狭帯域獲得の数(n)はサイクル中のスキャンの合計数から3を引いたものに等しい。
サイクル時間、獲得速度、獲得数、及びMIWの幅を設定するのに加えて、自動モードで動作させた場合、スケジューラ3504bはまた、各MIWに対して適用される衝突エネルギーを監視し、必要に応じて調節してもよい。MMAワークフローにおけるパラメータ3504aの多くと同様に、衝突エネルギー表はユーザ定義であることができ、前の注入からのフラグメンテーション効率データを使用して常駐テーブルを最適化することができる。データ処理3506bと関連して本明細書の他の箇所に記載されるように、フラグメンテーション効率が各溶出ペプチドに対して計算されてもよい。二次元データ(時間及びm/z)では、zに関わらず、同じペプチドからのプリカーサーイオンが同時にフラグメンテーションする。各zを効率的にフラグメンテーションするため、衝突エネルギーは、獲得時間それぞれにわたって最適値の間で切り換えられる。三次元データでは、効率的なフラグメンテーションに最適な衝突エネルギーはドリフト時間の関数として適用されるので、プリカーサーイオンはm/z及びzによって分離される。スケジューラは、入力データから一連のフラグメンテーションプロファイル(m/z対z)を計算して、常駐衝突エネルギー表を最適化する。プリカーサーイオン及び質量分離ウィンドウの動的選択及び除外と同様に、バッチ分析モードで、プロセスの反復性によって衝突エネルギー表は継続的に最適化される。
次に、データ処理及び分析段階3506について更に詳細に記載する。本明細書の考察と同じく、単一のスキャン処理が行われる。3700に示される例のMMAシナリオ(例えば、60分間のクロマトグラフィ分離空間、1.86秒のサイクル時間、100msの獲得、及び10msのスキャン間遅延を有する)を考慮すると、約2,000の低エネルギーHDMSE IM−DIAの全てのイオンスキャン又はスペクトルが獲得され、約4,000の変動する質量分離幅の広帯域(50Th<MIW<500Th)スキャン又はスペクトルが獲得され、約24,000の狭帯域(1Th<MIW<50Th)スキャン又はスペクトルが収集される。3506のMMAデータ処理アルゴリズムは、各スキャンをそれ自体の独立実験として処理する。処理は、基準(ロック)マスチャネルからの情報にアクセスすることによって開始される。このチャネルの分析は2つの重要な情報、つまり、oa−TOF分析器の質量分解能と、溶出時間全体にわたるm/z校正の安定性を提供する。獲得チャネルは時間順でスキャンごとに処理される。各スキャンに対して、m/z(2D)及びm/zドリフト(3D)ベクトルが、単一スキャンのセンタリングアルゴリズムを使用してセンタリングされる。センタリングプロセスの間、全ての次元(tr、td、及びm/z)において各イオンに対してFWHMが計算される。これらの値は、基準質量データと併せて、純度スコア、イオンの面積が固有のものか否かを判断するのに利用されるメトリック、又は干渉による複合物(例えば、そのイオン信号若しくは面積は、別の干渉するイオンによる寄与を有する)を計算するのに使用される。
データ処理3506bは、後述される図39及び図40の情報を含む情報を使用して処理を行うこと、またそれと併せて、同じスキャンにおけるイオンの候補の同位体クラスタを形成すること(例えば、それによってPCCを形成すること)、電荷zをPCCに割り当てること、並びにイオン干渉に関して補正することを含んでもよい。後述されるように、PCCを形成し、それに電荷状態を割り当てるかかる技術は、本明細書に記載される他の処理と関連して行われてもよい。例えば、PCCを形成し、それに電荷状態を割り当てることは、本明細書の他の箇所に記載される教師なしクラスタリングと関連して行われてもよい。少なくとも1つの実施形態では、イオン純度スコア、センタリングされたm/zドリフト、及び面積値がプリカーサーイオンに関して計算されると、各プリカーサーイオンのm/z値が、その公称整数m/zとその分数m/zという2つの別個の値に分解される。例えば、680.33のm/zを有する単一スキャンにおけるプリカーサーイオンの場合、公称m/z=680、分数m/z=0.33である。
図39を参照すると、異なるイオン電荷状態に対する公称m/z値対分数m/z値のプロットを例証する一例が示されている。この例3850では、特定の機器の分解能に基づいて、最大6つの可能な電荷状態が存在してもよく、3850のグラフは、イオンに対する公称m/z対分数m/zの分布を示している。3850を取り込むのに使用される情報は、任意の好適な手段を使用して決定される既知のイオンデータを使用して構築されてもよい。例3850によって分かるように、特定の電荷状態に固有のベクトル、並びに同じm/zが複数のz値に対して取ってもよいベクトルを含む、電荷ベクトルが形成される。例えば、以下は、特定の電荷状態に固有の電荷状態ベクトルであってもよく、ラインL1及びL2の間は主に3+(例えば、z=3)の電荷状態のイオンを含み、ラインL2及びL3の間は主に4+の電荷状態のイオンを含み、ラインL3及びL4の間は主に5+の電荷状態のイオンを含み、ラインL5及びL6の間は主に1+の電荷状態のイオンを含み、ラインL6及びL7の間は主に4+の電荷状態のイオンを含み、ラインL7及びL8の間は主に3+の電荷状態のイオンを含み、ラインL10及びL11の間は主に5+の電荷状態のイオンを含み、ラインL11及びL12の間は主に3+の電荷状態のイオンを含み、ラインL12及びL13の間は主に4+の電荷状態のイオンを含む。以下は、ラインL4及びL5の間(例えば、1+、2+、3+、及び4+などの複数の電荷状態のイオンを含む)、並びにラインL9及びL10の間(例えば、2+及び4+などの複数の電荷状態のイオンを含む)に複数の電荷状態を含む、多重レーンの電荷状態ベクトルとして特徴付けられてもよい。更なるIMSドリフト時間の次元が利用可能な場合、ドリフト時間対分数m/z部分のプロットが同様に形成されてもよく、プロットは、固有の電荷状態ベクトル及び多重レーンの電荷状態ベクトルの両方を示す。
上記は、固有及び多重レーン両方の電荷状態ベクトルを含んでもよい分布の例であり、分数m/z空間内の分離の異なる図を提供する。m/zのモダリティは、電荷zに関連するように観察されてもよく、それにより、分数m/zの分布が、特定の電荷状態に関して多重モードとして特徴付けられてもよい。例えば、z=4イオンはz=2イオンと交互であることができ、z=6イオンはz=3イオンと交互であることができる。しかしながら、一部の分数m/z値は所与の電荷状態に対して固有であってもよい。電荷状態z=2のイオンに対しては存在できない/しない、電荷状態z=4に対するいくつかの分数m/z値がある。同じことが、電荷状態z=6及びz=3に関しても当てはまる。それに加えて、2+及び4+、又は3+及び6+のような特定の電荷状態の対は両方とも多重モードであり、更に調和級数の特性を反映する。z=3を一例として使用して、同位体間の予期される分数m/zの差は、0/3、1/3、及び2/3に等しいであろう。これらは常に、2+及び4+、又は3+及び6+のような調和する電荷状態における分数m/zの交互配置である。しかしながら、2つの2+同位体系は、4+系の同位体分布を模倣するようい交互配置することはできない。2つの3+同位体系も6+系を模倣することができない。多重レーン電荷状態ベクトルの1つにマッピングされたイオンに対するzの適正な割当ては、モジュラー演算の関数として決定されてもよく、z=係数である。少なくとも1つの実施形態では、分数m/zに基づいた1つ又は2つ以上の分布プロットなどの情報は、電荷状態分離を何らかの形で指示してもよく、それにより、電荷状態ベクトルが1つの電荷状態と一意に関連付けられる共に、多重レーン電荷状態ベクトルが複数の電荷状態と関連付けられる。かかるプロット(例えば、図39のものなど)を使用して、各イオンに対する最初の又は候補の候補電荷状態割当てが行われてもよい。いくつかの場合では、最初の電荷状態割当ては、複数の可能な電荷状態を含むセットであってもよい。ドリフト時間の更なるIMSの次元を追加することは、更なるプロット、例えば、ドリフト時間対分数m/zを得るのに使用されてもよく、異なる電荷状態のグループ化に対するイオンの選別を改善することが可能になることが注目されるべきである。かかる最初の電荷状態割当てに続いて、可能な場合、後述されるような連鎖を使用して候補の同位体クラスタ又はPCCを形成する、更なる処理が行われてもよい。
更に例証するため、次に、本明細書の技術による一実施形態で使用されてもよい表を含む図40が参照される。表3800は、係数がzに等しく、モジューロ数が、分数m/zが一巡してゼロで再開する前の一連における同位体の最大数に等しい、モジュラー演算を反映する。各セルにおいて表される分数値は、理論上の同位体/z又は係数の比を反映する。表3800の情報は、次に記載されるように、同位体を連鎖させてPCCとするのに使用されてもよい。表3800は、可能な電荷状態それぞれに対する行と、可能な同位体それぞれに対する列とを含む。この例では6つの可能な電荷状態があり、係数は、3804の行の値1=6によって表されるようなzである。それに加えて、電荷状態に応じて、6つ以下の同位体が含まれてもよい。各列は、可能な同位体A0〜A5のうち特定の1つに対応し、「An」は、より一般的には特定の同位体を表し、「n」は非負整数であり、特定の同位体に対する「n」は、その特定の同位体と関連付けられた表3800の列を表す。異なる同位体に対応する「n」の値はモジューロ数3802を表す。表の入力は、特定の同位体A1〜A5が同位体A0に対して単一のスキャン内にある、m/zに関するステップ又はΔ距離を表す。表の各入力は、値の対(X、Y)によって同定されてもよく、Xは「z」又は係数行の識別子を表し、Yは特定のAn同位体と関連付けられた列の識別子「n」を表す。表の入力の値は、その入力に対する同位体数「n」(例えば、Y)を、その入力に対する電荷状態(例えば、X)で割ったものに等しい。より一般的には、表の各入力の値=Y/Xであり、入力は上述したように(X、Y)によって同定される。
行3804dを参照してz=3を使用すると、同位体間の予期される分数m/zの差は、0/3、1/3又は.33、及び2/3又は.67に等しい。行3804aを参照してz=6を使用すると、同位体間の予期される分数m/zの差は、0/6、1/6又は.167、2/6又は.33、3/6又は.5、4/6又は.667、及び5/6又は.833に等しい。したがって、3+及び6+のような調和する電荷状態における分数m/zの交互配置があるが、それは、電荷状態3に対する2つの連続する同位体間のΔm/zが、電荷状態6に対する2つの連続する同位体間のΔm/zの倍数であるためである(例えば、電荷状態3に対するA0とA1、又はA1とA2などの任意の2つの連続する同位体間の.333Δm/zは、電荷状態6に対するA0とA1などの任意の2つの連続する同位体間の/167Δm/zの倍数(2倍)である)。しかしながら、かかる交互配置が生じず、それにより、A0同位体からの特定のΔm/z距離(例えば、表入力に記憶される値)が表の単一の入力のみに現れる、表の特定の入力がある。例えば、3803a〜3803eによって表される表3800の入力は、表の固有の入力であり、したがって電荷zがイオンに割り当てられてもよい例を表す。
更に、表3800を使用して、同じスキャンの異なる同位体を連鎖又は接続して、以下に後述されるような候補のPCCが形成されてもよい。処理は、低エネルギースキャンにおける最低のm/zイオン(例えば、スキャンにおける最低のm/zプリカーサーイオン)を選択して、最初のリンクがA0同位体であることを担保することによって始まる。全ての可能な電荷状態が分かっていて、次に処理は、2+及び4+、又は3+及び6+イオンの調和モダリティ効果に対処する最高の理論上の電荷状態で始まる。例えば、処理は、列1 3802aで始まり、最高の電荷状態z=6(行1)から最低の電荷状態z=1(行6)まで、連続順で下の列に移行する。値D(Δm/zを表す)を有する列の各入力から、スキャンのm/z値が問い合わされて、A0のm/z+Dの合計に等しいm/zがスキャン中にあるか否かが判断される。例えば、スキャンS1のA0は600.0のm/zを有するものと仮定する。入力3803a=0.167の場合、600.167(例えば、600.0+0.167)に等しいm/zがスキャンS1に存在するか?存在する場合、このマッチするm/zがA1同位体であると仮定される。本明細書の他の箇所に記載されるように、かかるm/zのマッチは、ある指定の許容差又は容認可能な誤差のレベル内で行われてもよい。次に、同じΔm/z0.167を使用して他の同位体を共に連鎖させる、同位体の連鎖が継続する。スキャンS1の検索を継続して、同じPCCの残りの同位体を探索し、探索されたイオン/同位体の連続する各対間の距離は0.167のm/z距離又は距離を有する。上記例を続けると、スキャンS1において、処理は、600.333、600.50、600.667、及び600.833のm/z値を有する、4つの更なるマッチするm/zイオンを探索してもよい。上記例と関連して、推定されたA1同位体のm/zがA0のm/zから.167のm/zで探索されたので(例えば、.167は、電荷状態6に対して行1に位置する)、6つのイオンが6+の電荷状態を有する候補のPCCとして決定される。一番最近マッチした同位体のm/zから0.167のm/距離で探索されるスキャン中のイオンがなくなると、探索されないと、現在のPCCの連鎖は停止する。例えば、601のm/zを有するイオンはスキャンS1では探索されなかった。
上記の変形例として、600.167に等しいスキャンS1中のm/zは存在しないものと仮定する。この場合、処理は、次に高い電荷状態5に対して行3804bで指定されるようなΔm/z=0.200を使用して、列3802aを下方向に継続する。同じ問い合わせが行われて、A0のm/zである600に.200を加えた合計の600.200に等しいm/zがスキャン中に存在するか否かが判断される。存在する場合、マッチするm/zは、A1同位体のものであることが推定され、0.200のΔm/zを更に使用して、上述されたように、同じPCCの他の後続の同位体に連鎖させ、この場合、探索されるイオン/同位体の連続する各対は、0.200のm/z距離又は距離を有する。PCCは、この場合、5の電荷状態を有すると推定され、連鎖は、一番最近マッチした同位体のm/zから0.200のm/z距離のイオンがスキャン中で探索されなくなるまで、更なるイオンを探索し続ける。600.20に等しいm/zがスキャンS1中にない場合、処理は更に、列3803aを連続的に横断し続け、行3804cの次に高い電荷状態4に対して、次のΔm/z値=0.250を使用する。
上記した列3803の下方への横断(最高から最低の電荷状態へ)は、1)600に等しいm/zに列3803aのm/zΔ値のうち1つを加えたものを有する、マッチするイオンが探索されるか、又は2)列の全ての入力が処理され、マッチするイオンが探索されなくなるまで継続する。600のm/zを有する候補A0を考慮しながら、3802aの全ての入力が探索されると、低エネルギースキャンの2番目に低いm/zも同様に処理されてもよい。例えば、スキャンS1の2番目に低いm/zが602.5であると仮定して、m/z=600に関して上述されたのと同様の方法で、m/z=602.5を有するイオンがA0同位体であるという推定に基づいて、同位体クラスタ又はPCCを形成する目的で、m/z=602.5であるこのイオンに対して処理が行われてもよい。
図41を参照すると、本明細書の技術による一実施形態で行われてもよい、処理ステップのフローチャートが示されている。フローチャート3800は、技術による一実施形態で、表3800を使用して連鎖を行って同位体の候補のPCCを形成することと関連する、上述の処理を要約している。ステップ3902で、現在のスキャンにおけるイオンが選択され、選択されたイオンはスキャン中の最低のm/zを有する。スキャンは、プリカーサーイオンの低エネルギースキャンである。選択されたイオンは、他のイオンに連鎖してPCCを形成する、候補のA0同位体である。X1=スキャン中の全てのイオンのうち最低のm/zを有する選択されたイオンのm/zとする。ステップ3904で、MAXが、6などの最大の可能な電荷状態に割り当てられる。ステップ3906で、現在の電荷状態にMAXが割り当てられる。ステップ3908で、現在の電荷状態に対して、A0及びA1の間の理論上のm/z距離にDeltaが関連付けられる。より一般的には、上述されたように、Deltaは、現在の電荷状態に等しい電荷状態を有する同位体クラスタにおける連続する同位体の各対間のm/z距離を表す。Deltaは、表3800の入力の値を表す。例えば、現在の電荷状態=6のとき、入力3803aに基づいて、Deltaは0.167に設定される。ステップ3908で始まるループにおいて、現在のDeltaに対して処理が行われる。
ステップ3910で、X1+Deltaに等しいm/zが現在のスキャン中に存在するか否かの判断が行われる。ステップ3910が「はい」と評価した場合、制御はステップ3912に進んで、マッチするm/zが連鎖における次の同位体のものであると推定される。ステップ3912は、スキャン中の任意の後続のイオンに対して連鎖を行うことを含み、かかる後続のイオンはそれぞれ、前にマッチしたm/zとは別のDeltaであるm/zを有する。最後にマッチしたm/zよりも大きいDeltaであるm/zを有するものがそれ以上探索されないと、連鎖は停止する。連鎖によって形成されたPCC又は同位体クラスタには、現在の電荷状態に等しい電荷状態が割り当てられる。ステップ3910が「いいえ」と評価した場合、制御はステップ3914に進んで、全ての電荷状態に対して処理が完了したか否かの判断が行われる。処理が行われた場合、処理は停止する。別の方法として、ステップ3914が「いいえ」と評価した場合、制御はステップ3916に進んで、現在の電荷状態が1漸減され、列3802aの次の入力など、表3800の次の入力を用いて、ステップ3908で処理が継続する。
候補のPCCを形成し、それに電荷状態を割り当てるのに使用された上述の処理は、選択された電荷状態に対するΔm/z値に関して処理を行ってもよいことが注目されるべきである。例えば、フローチャート3900の処理を行う前に、1つ又は2つ以上の可能な電荷状態のサブセットが、ステップ3902で選択された候補のA0イオンに対して決定されていてもよい。例えば、図39のグラフ3850及び/又は他の情報などの他の手段を使用して、6つの可能な電荷状態の数が更に低減されてもよい。例えば、候補のA0イオンは、ラインL9及びL10の間の多重レーン電荷ベクトルのうち1つにそのイオンを当てはめるm/zを有してもよく、2+又は4+の可能な電荷状態が割り当てられてもよい。この場合、フローチャート3900の処理は低減されてもよく、それにより、それらの電荷状態に対して0.250及び0.50のΔm/z値のみを評価することが必要となる。
候補のPCCが構築された後、PCCを検証する処理が行われてもよい。例えば、PCCの各同位体の面積又はイオン信号強度が、同位体モデルによって検証及び/又は調節される。同位体モデルは、アベラジンの基本的組成を使用して、理論上の同位体分布(例えば、イオン信号面積、強度、又は計数のもの)と、そのm/z及びzの理論上のペプチドに関してLODを上回る予測される同位体の数の両方を計算する。アベラジンの同位体モデルを生成することは、当該分野において知られており、また例えば、参照により本明細書に組み込まれる、Valkenborg,D.、Jansen,I.、及びBurzykowski,T.(2008)、「A model−based method for the prediciton of the isotopic distriution of peptides」、Journal of the American Society for Mass Spectrometry、19(5)、703〜712に記載されている。
更なる例証のため、図42を参照する。各イオンには、一連の測定又は計算された属性が割り当てられてもよい。少なくとも1つの実施形態では、これらの属性は、m/z、面積(例えば、イオンの強度の基準)、理論上の電荷状、m/zに対する純度スコア、並びに三次元データの場合はm/z及びドリフトを含んでもよい。例4000を参照すると、図40及び図41と関連して上述されたような処理が行われてもよく、連鎖処理は、二次元スキャンから最低のm/zイオンを選択し、最初のリンクがA0であると確認することで始まる。4010において最低のm/zを有するイオンは、548.9784である。前の処理は、例えば、可能な3+又は6+電荷状態を最初にイオンに割り当てていてもよい。最高の電荷状態6+で始まって、0.1667Th(1/z)(例えば、表入力3803a)が548.9784の最低のm/zに追加され、それにより、マッチに関してそのスキャンの完全なイオンリストに対して上記合計が問い合わされる。この例では、4010に示されるスキャンにマッチは見出されず、6+の随伴するA1イオンはないと判断される。次に、処理は、次の理論上の電荷状態3+を考慮し、0.333Th(Mz)(例えば、入力3805から)が548.9784の最低m/zに追加され、それにより、マッチに関してそのスキャンの完全なイオンリストに対して上記合計が問い合わされる。この場合、マッチするm/zイオンは549.3058に見出され、上記549.3058のm/zは候補のAi同位体である。少なくとも1つの実施形態では、質量マッチの許容差(マッチするm/z値を決定するのに使用される)は、先行する基準質量校正からの測定質量精度の±3倍に自動的に設定される。
この例では、m/z=549.3058のA1同位体は、予期されるよりも低いイオン純度スコアを有してもよい(例えば、他のスコア又は閾値レベルに対して低くてもよい)。それに加えて、質量誤差があることがある。質量誤差は、以下のパラグラフにおいて本明細書の他の箇所に記載される。上記質量誤差は、A1同位体に対して予測される値549.3117Th(測定された質量精度の±3倍)よりもわずかに低いm/zの干渉イオンが存在することを提示するものと解釈されてもよい。更なる同位体A2及びA3の検索が繰り返され、同位体関係の数は合計4に拡張される(例えば、A0 m/z=548.9784、A1 m/z=549.3058、A2 m/z=550.0、A4 m/z=5503090)。リンク2と3の間、及びリンク3と4の間の質量誤差は先行する校正の質量誤差に比例するので、疑われる干渉が確認又は検証されてもよい。
図42の4010における破線の曲線4012は、3+電荷クラスタの予測される同位体分布を示す。計算された同位体モデルは、4010の実験データに対してマッチされる。固有のz、又は検証されたzの割当て、及びに高い純度スコアに反映する連鎖イオンの強度をアンカーとして使用して、A1同位体と同じように複合イオン面積を補正してもよい。例えば、連鎖させたイオンのうち1つ(形成された候補のPCCの同位体を表す)が、高い純度スコアを有し、イオンを単一の電荷状態にマッピングする固有の電荷状態ベクトルに含まれる場合、そのイオンの性質(例えば、強度、質量、電荷状態)を同位体モデル化のアンカーとして使用して、PCCの他の同位体が決定、予測、又はモデル化され、またPCにおけるかかる他の同位体の属性がモデル化されてもよい。例えば、m/z=549.646のA2イオンはかかるアンカーイオンであってもよく、それにより、A2の属性(例えば、m/z、強度又は面積、保持時間、ドリフト時間(用いられる場合))を使用して、同じPCCのA1イオンに関して予期される理論上の属性(例えば、信号強度又は面積)がモデル化されてもよい。実験A1イオンm/z=549.3058に対するかかるモデル化された属性を、モデル化された属性と比較して、実験データに対する補正又は調節が行われてもよく、またイオン干渉を検出するのに使用されてもよい。例えば、A1イオンのモデル化された強度を使用して、A1の実験データ強度が4010に示されるものから4020に示される結果へと補正又は調節されてもよい。それに加えて、4012によって示されるモデル同位体分布は、A1イオンにおける干渉を示し、更なる補正作業が実験データに関して行われてもよい。実際の基本的組成と、同位体分布をモデル化するのに使用されるアベラジンとの間の任意のばらつきに対処するために、処理によって、「仮想イオン」を作成するなどの任意の補正作業を行う前、20%のばらつきが可能になってもよい。仮想イオンは、残りのイオン面積、並びに実験データスキャンにおける関連する親に割り当てられた他の全ての属性に割り当てられてもよい。例えば、4020に示されるように、補正されたイオン面積を有する仮想イオンが、m/z=549.3058のA1イオンに対して作成されてもよく、それによって、m/z=549.3058の同じイオンを、考慮中である現在のPCCの3+A1同位体として正確に割り当てること、並びにm/z=549.0398のA0イオンを有する電荷状態4+の別の第2のPCCと関連付けることが可能になる。したがって、要素4010及び4020は、どのようにしてm/z=549.3058の適応しない(例えば、低IPS、大面積)のA1同位体が補正され、「仮想」イオンが作成されるかを示す。仮想イオンは、m/z=549.3058を上述されたようなA0イオンとして使用して、電荷状態4の別のPCCなど、他の候補のPCCを作成するために行われる、後に続く連鎖処理と関連して使用されてもよい。
低エネルギープリカーサーイオンスキャンを処理して、上述されたような電荷状態が割り当てられたPCCを形成した後、PCCは、それらのm/z値に基づいて、また三次元データ(例えば、IMSを含む)、ドリフト時間を用いて、時間位わたって組み合わされてもよい。一般に、これは、個々のPCCが形成される上述されたよりも高レベルで行われる、別のタイプの連鎖又は連結として特徴付けられてもよい。ここで、個々のPCCを、異なるスキャンそれぞれにおいて組み合わせて、単一のPCCに対する溶出プロファイル又はエンベロープとしても知られている、クロマトグラフィピークを形成する(例えば、図7に示されるものなど、同じPCCに対して時間に伴ってピーク又はエンベロープを形成する)処理が行われる。
更に例証するため、次に図43を参照すると、パネルA 4110及びC 4120は、PCCをそれらのm/z値によって時間にわたって組み合わせ、したがって異なる時点で同じPCCを追跡して、PCCの溶出プロファイル又はエンベロープを形成するために行われる処理を示している。少なくとも1つの実施形態では、各PCCに対して使用されるm/zは、A0同位体のm/zであってもよい。パネルA 4110は、実験データの異なるスキャン時間において第1のm/zを有する第1のPCCのプロットを示し、パネルC 4120は、実験データの異なるスキャン時間において第2のm/zを有する第2の異なるPCCのプロットを示す。パネルA 4110及びC 4120は、各PCCの強度対スキャン時間のグラフ表示である。4110では、第1の追跡されたPCCに関して、要素4111a E1は頂点(例えば、図7の点H)を表し、要素4111b〜c E2及びE3はピーク半値点(例えば、図7のH1及びH2)を表し、要素4111d〜e E4及びE5はピークベースライン点(例えば、PCCのピークプロファイルが開始及び終了に対して決定される場合)を表す。4120では、第2の追跡されたPCCに関して、要素4121a F1は頂点(例えば、図7の点H)を表し、要素4121b〜c F2及びF3はピーク半値点(例えば、図7のH1及びH2)を表し、要素4121d〜e F4及びF5はピークベースライン点(例えば、PCCのピークプロファイルが開始及び終了に対して決定される場合)を表す。
それに加えて、4110及び4120の2つの追跡されたPCCに関して、関連する誤差プロットが決定されてもよい。要素4130は、4110で時間にわたって追跡又は連鎖された、第1のPCCに対する第1の誤差プロットを示す。要素4140は、4120で時間にわたって追跡又は連鎖された、第2のPCCに対する第2の誤差プロットを示す。4130及び4140では、誤差は百万分率(ppm)単位のm/z誤差である。m/z(ppm)誤差は、先行するA0のm/zを、連鎖において次に連結されたPCCと比較することによって計算されてもよい。したがって、プロット4110の第1の点Pn及び第2の点Pn+1に関して、Pn+1の質量誤差又はm/z誤差は、点Pn及びPn+1の間におけるm/z値のΔ又は差を表し、ここで、Pnは、Pn+1の直前にピークを形成するのに使用される点である(例えば、質量誤差Pn+1=m/z Pn+1−m/z Pn)。4130及び4140では、上下の境界線α及びα’は、例では±3ppm(例えば、αは−3ppm、α’は+3ppm)である、前のロックマス校正から計算された質量精度を反映する。4130では、G1 4131aは、ピーク又は頂点E1 4111aの質量誤差を表し、G2 4131bは、半値点E2 4111bの質量誤差を表し、G3 4131cは、半値点E3 4111cの質量誤差を表す。4140では、K1 4141aは、ピーク又は頂点F1 4121aの質量誤差を表し、K2 4141bは、半値点F2 4121bの質量誤差を表し、K3 4141cは、半値点F3 4121cの質量誤差を表す。
4110と4120との間のFWHMの視覚的比較は、4120の点の曲線又はプロファイルが4110の点によって形成されるものよりもはるかに幅広であって、4120において起こり得る干渉を示している。分析を通して、4120の干渉は、パネルD 点K1 4141b及びK2 4141aの間のパネルD 4140における質量誤差の情報に基づいて検証されてもよい。特に、第1の時点の点K2 4141bは、容認可能な質量誤差範囲(境界α及びα’によって表される)からの、測定された質量誤差の有意な偏差を表し、それによって干渉が表される。K1 4141a及びK3 4141cなどの後続の時点は、容認可能な質量誤差範囲内の質量誤差を表し、それによって干渉イオンの干渉が残っていることを示す。したがって、K2 4141b以降の各点又はスキャンは、干渉を有するものと判断されてもよい。このように、溶出ピーク4120は、実際には、複数の異なるPCC(例えば、重なり合って4120の組み合わされた溶出プロファイルを生成する、2つ以上のプリカーサーイオン)に対するイオン強度の複合的又は集合的ピークであり、それにより、かかる干渉がF2 4121bで始まり、4120の後に続く点におけるスキャンの残りに対して残る。干渉が65.4などのスキャン時間から生じなくなった場合、スキャン時間65.4において、K2 4141bによって表される+12ppmの質量誤差の補数又は逆数として特徴付けられてもよい、対応する負の質量誤差が検出されるであろう。換言すれば、干渉がスキャン時間65.4の先からは生じなくなった場合、スキャン時間65.4において、約−12ppmの質量誤差値が存在するであろう。
41110における点に対するスキャン又はスペクトルの質量誤差には、容認可能な質量誤差範囲を超えるものはないので、かかるスキャン又はスペクトルのいずれに対しても決定される干渉がないことが注目されるべきである。
干渉と関連する別の例として、図44の4200を参照する。例4200は、互いに干渉する2つの異なるPCCに対する2つのクロマトグラフィピークC1 4210及びC2 4220を示す、要素4202を含む。要素4202は強度対スキャン時間を示す。実際に見られる複合の又は結果として得られるピークC3 4222は、4210及び4220の合計の組み合わせであってもよい。1つの目的は、見られる複合ピークC3 4222は、4210及び4220などの複数のイオンが実際に寄与し、次に4210及び4220などのその成分へと複合ピークC3を解析又は分解しようと試みるという事実を検出することである。第1の点又はスキャン時間P1において、容認可能な質量誤差範囲外にある第1の質量誤差が決定されてもよく、それにより、干渉の開始スキャンを表す。同様の方法で、第2の時点P2における第2の質量誤差の後に続く次の発生は、第2の質量誤差が容認可能な質量誤差範囲外にあり、それによって、第1の点P1で検出される干渉の終わりが表される場合に得られてもよい。上記第1及び第2の点P1及びP2の間の点に関する質量誤差は、容認可能な質量誤差範囲内であってもよい。要素4204は、4202の異なる点における対応するスキャンに対して得られてもよい質量誤差値を表す、質量誤差対スキャン時間を示す。特に、X1 4204a及びX2 4204bは、それぞれ点P1及びP2における、容認可能な質量誤差範囲を超える質量誤差を表してもよい。4204の残りの誤差値は全て容認可能な質量誤差範囲内にあってもよい。このように、X1及びX2は、可能な干渉の境界を表す点として使用されてもよい。干渉が疑われる時間に行われるスキャンは、追跡されたプリカーサーイオン又はPCCに対するCPPISの形成と関連する考慮から除外されてもよい。代替例として、更に詳細に後述されるように、干渉するスキャンの実験データから抽出された情報を補正又は更に改良する作業が行われてもよい。
この例4200では、容認可能な質量誤差範囲を超える質量誤差X1及びX2が検出されると、更なる処理が行われてもよい。X1における質量誤差は10ppmであり、X2における質量誤差は−10ppmなので、干渉はスキャン時間P1で始まり、スキャン時間P2で終わると判断されてもよい。CPPISに含めるスキャン又はスペクトルを選択する際、一実施形態は干渉するスキャンを除外することを選んでもよい。代替例として、一実施形態は、フラグメンテーションパターンを検査することによるものなど、別の作業を行ってもよい。特に、干渉がP1からP2までで生じている状態でのフラグメントイオンスキャンは、複数の干渉するイオンのいずれかから発してもよい。しかしながら、P1の前又はP2の後にスキャンに現れるが、P1からP2までのスキャンには現れないフラグメントイオンfrag1は、追跡されたプリカーサーイオン又はPCCから発するものと判断されてもよい。同様の方法で、P1からP2までの干渉するスキャンに固有のフラグメントイオンfrag2、(例えば、frag2は、P1からP2までの1つ又は2つ以上のスキャンに現れるが、P1の前及びP2の後には現れない)は、干渉するプリカーサーイオンから発するが、追跡されたプリカーサーイオン又はPCCからは発しないものと判断されてもよい。
一実施形態は、平均検出イオンピーク幅W1に基づいて、CPPISの形成及び更なる分析と関連して使用される、スキャン又はスペクトルを更に除外してもよい。例えば、一実施形態は、検出されたピークのテール状の左端及び右端に含まれるスキャンを除外してもよい。少なくとも1つの実施形態では、平均ピーク幅W1±2の標準偏差以内のスキャンのみがCPPIS形成に使用されてもよい。
少なくとも1つの実施形態では、ピークの2つの左側及び右側の半値点間の少なくとも2つのスキャン又はスペクトルが、追跡されたPCC又はプリカーサーイオンに対してCPPISを形成するのに使用されてもよい。代替実施形態では、2つの左側及び右側の半値点間の単一のスキャン又はスペクトルのみが選択されてもよい。選択された特定のスキャン(及びしたがって、関連するプリカーサーイオンに対してCPSを形成する際に使用される、かかる選択されたスキャンの特定のフラグメント又はプロダクトイオン)は、実験データに基づいて情報を除外及び/又は改良するのに使用される、本明細書に記載されるような1つ又は2つ以上の基準にしたがってもよい。例えば、一実施形態は、干渉が疑われる任意のスキャンを除外することを選んでもよく、かかる干渉は、容認可能な質量誤差範囲外にある1つ又は2つ以上の質量誤差を使用して決定されてもよい。一実施形態は、CPPISを形成する際に使用するスキャンを選択してもよく、スキャンは2つの左側及び右側の半値点の間であり、追跡されたPCC又はプリカーサーイオンは、かかる点間の全てのスキャンの最大強度を有する。一実施形態は、CPPISを形成する際に使用するスキャンを選択してもよく、スキャンは2つの左側及び右側の半値点の間であり、追跡されたPCC又はプリカーサーイオンは、かかる点間の全てのスキャンの最大イオン電流を有する。スキャン内のイオンに対するイオン電流は、スキャン内の全てのイオンの合計強度に対するそのイオンの相対強度として定義されてもよい。したがって、プリカーサーイオンが最大イオン電流を有するスキャンは、プリカーサーイオンがスキャン内の全てのイオンの合計強度に対して最大強度を有するスキャンである。例えば、スキャンS1では、プリカーサーイオンprec1は10の強度を有してもよく、スキャン内の全てのイオンの合計強度は20であってもよいので、prec1はS1において10/20=50%のイオン電流を有する。スキャンS2では、プリカーサーイオンprec1は10の強度を有してもよく、スキャン内の全てのイオンの合計強度は200であってもよいので、prec1はS2において10/200=5%のイオン電流を有する。このような場合、S2はprec1を特徴付けるように選択されてもよく、prec1はS2においてその最大イオン強度を有するので、S1は除外されてもよい。
干渉がない状態で、少なくとも1つの実施形態は、ピークの2つの半値点の間で1つ又は2つのスキャンを選択してもよく、選択された1つ又は2つのスキャンは、選択されてもよい可能性がある全ての候補スキャンの最大イオン電流を有する。全ての候補スキャンの最大イオン電流を有するスキャンは、かかる全ての候補スキャンの最高又は最大強度を有するスキャンでなくてもよいことが注目されるべきである。かかる全てのスキャンのうち最高のイオン電流を有するスキャンを選択することによって、選択されたスキャン。
疑われる又は検出される干渉(容認可能な質量誤差範囲を超える1つ又は2つ以上の質量誤差などに基づく)が存在する状態で、一実施形態は、干渉を有するあらゆるスキャンを除外することを選んでもよい。あるいは、一実施形態は、追跡されたPCC又はプリカーサーイオンから発するものと判断される特定のフラグメントイオンを更に改良する(例えば、このように、CPPISに含まれるフラグメントイオン、及びプリカーサーイオンの推定的な同定を改良する)などのため、干渉するスキャン及び干渉しないスキャンの組み合わせを選択してもよい。例えば、第1の干渉するスキャンS1が選択されてもよく、第2の干渉しないスキャンS2が選択されてもよい。(S1ではなくS2における)S2に固有のフラグメントイオンの第1のセットR1は、追跡されたPCC又はプリカーサーイオンから発するものと判断され、S2の残りのフラグメントイオンは、プリカーサーイオンを同定する際に無視され/使用されなくてもよい。S1及びS2の両方に共通のフラグメントイオンの第2のセットR2が決定されてもよく、R2におけるかかるフラグメントイオンは、追跡されたPCC又はプリカーサーイオンからは発しないものと判断され、それよりもむしろ、干渉するイオンから発するものと判断される。
図46A及び図46Bを参照すると、本明細書の技術による一実施形態で行われてもよいフローチャート4400及び4401が示されている。フローチャート4400及び4401は、図35に示されるような1つの特定のワークフローに基づいて行われてもよい処理を要約している。ステップ4402で、シミュレータを使用して、図35の標的3502aで同定されるような溶出分子又は成分に対してモデル化される、シミュレートされた属性が提供されてもよい。ステップ4404で、スケジュールされたMMAは、スケジュールされたMMA獲得及びパラメータを決定する処理を行ってもよい。ステップ4406で、MS及び/又はMSとIMSを含む機器システムを使用して、サンプル分析が行われてもよい。サンプル分析は、MMAスケジュール及びパラメータにしたがったデータ獲得技術及びスケジューリングを通して行われてもよい。ステップ4406は、MMAスケジュールにしたがった、複数のスキャンサイクルにおける異なるMIWの反復選択を含んでもよい。ステップ4408で、実験データがサンプル分析から生成されてもよい。後続のステップは、ステップ4408で得られた実験データを使用して行われてもよい、異なるデータ処理ステップを概説する。本明細書の他の考察と同じく、一実施形態は、フローチャート4400及び4401に含まれるような追加のステップを行ってもよいことが注目されるべきである。ステップ4410で、属性の最初のセットが、実験データからの各イオンに対して行われてもよい。かかる属性は、例えば、1つ又は2つ以上の次元におけるm/z、RT、ドリフト時間、純度スコア、FWMH、面積、又は信号強度などを含んでもよい。ステップ4412で、1つ又は2つ以上の電荷状態の最初の割当ては、低エネルギースキャンでプリカーサーイオン又はイオンに対して行われてもよい。ステップ4412は、図39と関連して本明細書に記載されるものなどの情報を使用して、処理を行うことを含んでもよい。ステップ4414で、PCCが構築され、それぞれ電荷状態を割り当てられてもよい。PCCは、例えば、プリカーサーイオンの同位体モデルを含む入力にしたがって、また図40の表3800を使用して、同じプリカーサーイオンの同位体変化を連鎖させることによって構築されてもよい。PCCは、連鎖に使用するように選択された表3800の入力と関連付けられる、電荷状態を割り当てられる。入力は、クラスタの同位体を連鎖させるのに使用される、特定のΔm/zを表す。特定のΔm/zは、連鎖されてPCCを形成する、連続する同位体間の差である。ステップ4416で、ピーク溶出プロファイル又はエンベロープ(例えば、クロマトグラフィピーク)がプリカーサーイオンに対して決定される。ステップ4416は、(例えば、マッチするA0 m/zに基づいて)同じPCCを時間にわたって組み合わせるか又は連鎖させることを含んでもよい。ピークプロファイルはそれぞれ、点又はスキャンの最小数を使用して決定されてもよい。ステップ4418で、各プリカーサーイオンをプリカーサーイオンから発するフラグメントイオンと整列させる処理が行われてもよい。ステップ4418は、例えば、質量誤差に基づいてスキャンの干渉を検出し扱う処理を行うことを含んでもよい。ステップ4420で、各プリカーサーイオンに対して1つ又は2つ以上のスキャン及びそのフラグメントイオンを選択して、CPPIS又は複合プリカーサープロダクトイオンスペクトルを形成する処理が行われてもよい。ステップ4422で、実験データにしたがって、シミュレータ、MMAスケジュール、及びパラメータが更新されてもよい。図示されないが、処理はまた、教師なしクラスタリングなどと関連して、推定的なCPPISをリポジトリ3508cに記憶することを含んでもよい。
各スキャンがそれ自体の独立実験として処理されることを所与として、全てのプロダクトイオンは、最初に、狭帯域のMS質量分離ウィンドウ内の各プリカーサーイオンに割り当てられてもよい。フラグメンテーション効率は、各プリカーサーに対して、その強度をプロダクトイオンスペクトルで見出される任意の残留(残りの)強度と比較することによって計算される。フラグメンテーションの瞬間、プリカーサーイオンの強度は、電荷クラスタ連鎖における最初のリンクの獲得時間に対するその獲得時間の関数である。要素4110は、任意の2つのスキャンサイクル間のプリカーサーイオン強度における変化を示す。アスタリスクは、プリカーサーイオンがフラグメンテーションのために選択された時間を示す。アライメント処理は、線形回帰を使用して、4115に表されるように、選択されたプリカーサーを結合する2つのリンクを接続する、プレフラグメンテーション強度を補間してもよい。上向きの矢印は交差を意味する。
直接的関係が、フラグメンテーション効率と、プリカーサーイオンが生成することができるプロダクトイオンの数及びダイナミックレンジとの間に存在する。適切にフラグメンテーションされたプリカーサーは、過大又は過小にフラグメンテーションされたものよりも、その長さに対してより多くのプロダクトイオンを生成するであろう。親プリカーサーに対するプロダクトイオンのダイナミックレンジは、親のフラグメンテーション効率に反比例する。過大及び過小にフラグメンテーションされたプリカーサーは、一般に、それらのプリカーサー長さに対してより少数のプロダクトイオンを生成するが、それらは一般に、より幅広いダイナミックレンジを反映する。反復バッチ処理では、これらの効率を使用して、注入間の衝突エネルギー表が最適化される。図44は、親プリカーサーイオン強度対フラグメンテーション効率の比率として表される、プロダクトイオン面積のダイナミックレンジを定義する2つの線形回帰線を示している。プロダクトイオンの割当ては、ダイナミックレンジのみによってではなく、m/z及びzによっても制限される。イオンの分子質量がその基本的組成を直接反映することを所与として、公称整数質量対分数m/zのプロットも、プロダクトイオンの変化を決定するのに使用することができる。衝突によって誘発される解離(CID)をフラグメンテーションのメカニズムとして用いる機器の場合、電荷zのプリカーサーイオンのみが、z−1の最大電荷を反映するプロダクトイオンを生成することができる。この規則に対する単一の例外は、z=1のプリカーサーイオンを用いてもたらされる。一価のプリカーサーイオンは一価のプロダクトイオンのみを生成することができる。このため、その親プリカーサーイオンのzと同一基準の電荷ベクトルに常在しない、任意のプロダクトイオン又は連鎖同位体は、プロダクトイオンスペクトルからすぐに排除される。同様に、散乱を低減する意図で、ユーザは、z>1のプロダクトイオンをz>2のプリカーサーイオンに対して整列させることを選定することができる。
(例えば、プリカーサーイオンのクロマトグラフィピーク又は溶出プロファイルを生成する、図43と関連して記載されるように)プリカーサーイオンの連鎖プロセスを通して、逆多重化処理は、いつどのスキャンにおいて、プリカーサーイオンがフラグメンテーションされるかを決定してもよい。MMAと関連して上述されたように、スキャンサイクル内及びスキャンサイクルにわたって、広帯域及び狭帯域それぞれの獲得に対してMIWの中心を制御することによって、並びに任意の続く注入において後で選択するために、それらのm/z値を累積的に排除することによって、逆多重化処理が、任意のプロダクトイオンスペクトルの選択性を継続的に増加させる機会を与えられる。各反復に続いて、獲得後処理は、任意の2つの注入間における保持又はドリフト時間の任意のばらつきを補正する。注入間の保持及びドリフト時間における相対的な位置付けを連続的に改良することによって、逆多重化アルゴリズムが更なる重なり合うプロダクトイオンスペクトルにアクセスすることが可能になる。
それに加えて、逆多重化処理はまた、あらゆるスキャンにおける全てのイオンに関する、実際の又は補間されたプリカーサーイオン強度、質量校正誤差、実際の又は補正されたプロダクトイオン強度、及び純度スコアなど、全てのメタデータに対するアクセスを有する。このメタデータを利用して、逆多重化アルゴリズムは、プロダクトイオンを、規定の質量誤差内で同じm/zを有し、推定的なプリカーサーに比例する相対存在比の変化を呈するもののみに制限することによって、幅広い質量分離ウィンドウのキメラ効果を大幅に低減する。m/z及び強度比両方のマッチ許容差は、アルゴリズムで、前の基準質量校正に基づいて、イオン純度スコアによって決定することができ、又はユーザ定義であることができる。一般に、許容される面積比許容差は、実際のm/zよりもはるかに幅広い。換言すれば、マッチしたプロダクトイオン強度は、プリカーサーイオン強度が大きい場合は大きく、プリカーサーイオン強度が小さい場合は小さくなければならない。少なくとも1つの実施形態における全てのフィルタ処理の終わりに、各プロダクトイオンスペクトルは、後のデータベース検索のため、工業規格mzML又はmgfファイル形式のどちらかに書き込まれてもよい。同定はまた、教師ありクラスタリングと関連して本明細書に記載されるものなどのMIRから、シミュレートされたプロダクトイオンスペクトル又は複合プロダクトイオンスペクトルを、問い合わせることによって行われてもよい。
図35を再び参照すると、検索エンジンの計算された95%の信頼区間を超えるスコアを反映するペプチドのプロダクトイオンスペクトルが、推定的な同定として3508cに入れられてもよい。ペプチドに対する固有の又はグローバル識別子を作成するため、ペプチド配列をそのm/zと連結してもよく、配列が修飾を含む場合、n末端に対する修飾の位置も含まれる。かかる修飾を同定するのに使用されてもよい技術は、本明細書の他の箇所に記載される。同定されたペプチドに加えて、アンマッチしたプロダクトイオンスペクトルも入れられ、ペプチドに固有の識別子の代わりではあるが、グローバル識別子が割り当てられる。グローバル識別子は、その計算されたCCSA(場合によっては、本明細書では、衝突断面積に対するCCS(Å2)とも呼ばれる)に連結される、丸められた(1小数位)プリカーサーイオンのm/zから成るという点で、UPC(汎用プロダクトコード)と同様に使用される。推定的な同定(例えば、ペプチド配列又はグローバル識別子)の最小数(例えば、50)が3508cに入れられると、背景で動作する検証処理3508cが行われてもよい。3508bの検証アルゴリズムは、最小で30のマッチ又は同定されたプロダクトイオンスペクトルを不規則に選択することによって、CPPISを作成することを継続して試みてもよい。検証処理は、例えば、ドット積スペクトル相関及びピアソンの積率相関係数(r)を使用して、最初に有意性を判断してもよい。ピアソンの積率相関係数rが正の相関を反映した場合、一連のヌル相関を比較対象として要する。これらのヌル相関は、類似のm/z及びzの、ただし異なる線形配列のペプチドから作成される。一般に、相関は、r≧0.75の場合に有効と見なされ得る。
概して、DDAは、最も広い実験のダイナミックレンジにわたって、定性的なカバー深度及び定量的な精度を最大限にするには、速度及び感度が不足していると考えられてもよい。連続DDA分析のサンプリングの制限に対処するため、MSX及びSWATHなどのDIA戦略が開発されてきたが、これらのDIAアプローチによる感度は依然として欠乏又は欠陥を有することがある。データ獲得のためのBateman技術又は高−低プロトコルのような、他のDIA方法は、感度によって制限されないが、非常にキメラ性の高いプロダクトイオンスペクトルを生成する。それは、MS/MSスペクトルにおいて取り込むことができる、固定量の質量の十分な空間がある。より高い分解能の質量分析部では、プロダクトイオンスペクトルにおけるアクセス可能なm/z空間は、そこに含まれるプロダクトイオンの数、基本的組成、及び濃度によって制限される。MIW内に含まれるペプチドの線形配列は異なるが、全てプロテオームの同じアミノ酸分布をサンプリングする。質量分離ウィンドウ内でプロダクトイオンスペクトルを獲得すると、その中及びそれ自体の分離ウィンドウによって、全ての同時にフラグメンテーションされるプリカーサーが、類似のm/zのものであることが担保される。濃度に対して、プロダクトイオンに対する同位体の数及び面積分布は、その基本的組成及び濃度の直接の関数である。電荷ベクトル(例えば、図39)に示されるように、異なるプロダクトイオンからの異なる同位体は、同じm/zを共有することができる。MIW内のペプチドに対するダイナミックレンジの2桁の大きさを仮定すると、1つのプロダクトイオンからの1つの同位体が第2のプロダクトイオンからの別のものと干渉する可能性が非常に高い。
プリカーサーイオンサンプリングを最大限にし、感度を維持し、プロダクトイオンの干渉を制限するために、本明細書に記載されるような最適な獲得方法を使用して、MS/MS獲得ごとに衝突セルに入るプリカーサーイオンの数が制御されてもよい。その数は、イオン検出の前に用いられるインラインの直交分離技術全ての複合分解能の関数である。単一の実験で行うことができる、正確なペプチド同定の数に関連する選択性は、スキャン速度及び/又はMIWの関数ではない。それよりもむしろ、選択性は干渉の関数である。最も複雑な構造であっても、適用される分析ワークフローが十分な直交性を、即ち、IMS、より高い質量分解能、狭いクロマトグラフィピーク、変動するMIWウィンドウ、周囲のマトリックスからは独立して各イオンの属性を測定するモデル化及び多重化を用いる場合に、プリカーサー及びプロダクトイオンのより大きい補数の物理化学的属性を測定する能力を達成することができる。
定量的精度も、同位体的又は等圧的のどちらで標識付けられたペプチドに対するものかに関わらず、干渉の結果である。iTRAQ及びTMT標識付けに関して、報告されるイオン面積はそれぞれ、解離中に衝突セル内に2つ以上のペプチドが存在する場合に犠牲になる。AUC分析による標識なし又は絶対的定量に関して、どちらかの面積が複合体である場合、計算される相対又は絶対存在比が犠牲になる。限定数のイオン検出前分離技術によって質が低下する分析ワークフローは、一般に、キメラ性を最小限に抑える目的で、非常に狭い質量分離幅及び質量分解能に依存する。MIWを<1Thまで狭くすることによって同時フラグメンテーションの可能性が低減されるが、排除はされない。適切なサンプリング速度を担保するには非常に高速のスキャン速度を要するので、狭い質量分離幅は必然的にデューティサイクルを犠牲にする。MSからMS/MSへの強度の切替えが、一般に、最も弱い対象のイオンの頂点強度に設定されることを所与として、感度は更に犠牲にされる。強度の切替えをかかるレベルに設定することで、プリカーサーがその頂点強度でサンプリングされることがほぼ担保される。狭いMIWに依存するワークフローの場合、デューティサイクルを維持するにはより速い獲得速度が必要であるが、速いスキャン速度は、特にMS/MS獲得の場合に、質量分解能に悪影響を及ぼす。
キメラ性のプロダクトイオンスペクトルに悪影響を生じることなくサンプリング速度を上昇させるには、高度な方法でサンプルの複雑性を扱うことができる、図35のMMAワークフローなどの分析ワークフローを要する。最大ピーク容量を利用するには、利用可能な分離空間、分解能(m/z、クロマトグラフィ、及びドリフトの次元における)、アクセス可能なダイナミックレンジ、及び最も重要な、研究中のサンプルの複雑性に関する徹底的な理解を要する。本明細書の技術による一実施形態に含まれる獲得スケジューラ3504bは、この情報を利用し、「複合分解能」を作成してもよい。一般に、分解能はm/zに関係するが、多次元空間でデータを獲得する場合、分解能/ピーク容量は複合物である。MMAワークフローでは、実験分解能/ピーク容量は、用いられるイオン検出前分離技術のそれぞれの分解能の積であるという点で乗法的である。本明細書に記載される一例では、図38の3756に示されるようなドリフトによるm/zの分布は、全てのイオンの〜50%がドリフト空間全体の狭い30のドリフトビン部分内にあるという点で、図38の3754の時間によるm/zの分布に非常に類似している。本明細書に記載されるデータ処理アルゴリズムの一実施形態は、スキャンごとのm/z及びドリフトを中心にしており、結果として±1ドリフトビンのドリフト分解能が得られ、したがって、IMSが可能になることによって任意の単一のスキャンのピーク容量が〜10倍に増加する。更に、図43に示されるようなプリカーサーイオンの連鎖によって、面積比フィルタが逆多重化アルゴリズムに役立つことが可能になる。MMAワークフロー内において、スケジューラは、非常に正確なモデル又は前に処理されたデータから得られた前の知識によって誘導される、衝突セルを通してイオン流束を高度に支配することができる。
図38の3752に示されるデータは、0.2分のビンによる10Thのイオン密度を反映している。少なくとも1つの実施形態では、MMAが固定MIWモードで操作されるときの既定の設定があってもよい。MIWはユーザ定義可能であってもよい。自動モードでは、スケジューラは、MIWをアルゴリズムで決定される最大値に設定してもよい。例えば、二次元獲得の場合、MIWはプリカーサーイオンの数を10に制限するように設定されてもよい。三次元データでは、MIWは、ドリフトビンごとの最大数のプリカーサーイオンが10未満であるように設定されてもよい。三次元獲得に関して、ドリフトの関数としてのm/zの分布は、獲得ごとに同時にフラグメンテーションするプリカーサーの最大数を定義する。図38の要素3754は、全てのプリカーサーの〜50%が250Th(±50Th)のMIW内に存在し、中央のm/zは時間と共に定常的に増加することを示している。第2及び第3の四分位数は、2つの線形回帰線β及びβ’によって時間と共に制限される。β及びβ’は発散性であって、時間に伴うm/zの広がりを表す。図38の要素3756は、m/z対ドリフトを反映する同様のパターンを示す。これによって、MMAワークフローが、境界線β及びβ’の上下にあるm/zの領域内で狭帯域から広帯域の獲得へと、MIWを増加させることが可能になる。AUC定量化を使用してペプチドの濃度又は相対存在比を正確に決定するため、最低5つのデータ点がそのピークFWHMにわたって獲得されなければならない。図37に示されるデータは、例えば、スキャンサイクルの数、狭帯域及び広帯域獲得、並びにスキャン時間が、平均クロマトグラフィピーク幅に基づいてどのように計算されてもよいかを示す。
本明細書の技術による少なくとも1つの実施形態では、逆多重化処理は、既定のm/z範囲がサンプリングされた全ての狭帯域獲得からのプロダクトイオンスペクトルを比較することを含んでもよい。プロダクトイオンは、±3のマッチ許容差×先行する基準質量精度(ppm)、±1ドリフトビン、及び±2.5×既定のm/z範囲で常在する各A0同位体に対して計算された面積比を使用して、m/z、ドリフト、及び面積比によってマッチされてもよい。2つ以上のプリカーサーイオンが存在する例では、プロダクトイオンスペクトルは、プリカーサーイオンz及びその計算されたフラグメンテーション効率(例えば、図40及び図45)を利用して更にフィルタ処理されてもよい。広帯域プロダクトイオンスペクトルは同様に扱われてもよい。図35のワークフローを実現するなど、本明細書の技術による実施形態では、自動化ワークフローの反復する性質として、全ての狭帯域及び広帯域獲得に対する中心m/zの一定した移動によって、逆多重化及び検証アルゴリズムがプロダクトイオンスペクトルの選択性を継続的に改善する機会が提供される。
本明細書の技術を使用する少なくとも1つの実施形態では、95%の信頼度を超える同定されたプロダクトイオンスペクトルが、他の全てのアンマッチしたプロダクトイオンスペクトルと共に、MIRの推定的な区画3508cに入れられてもよい。それぞれと関連付けられるのは、プリカーサー及びプロダクト両方のイオン全てに対する全てのメタデータである。かかる実施形態では、最低50の推定的なペプチド同定又はマッチしたグローバル識別子が入れられると、検証アルゴリズム3508bはそれぞれに対してCCPISを作成しようとする。検証アルゴリズムは、例えば、ピアソンの標本相関係数及びANOVAを利用して、有意性に関して試験してもよい。有効な相関を所与として、各プロダクトイオンの正規化された強度における容認可能な変動を反映する誤差バーを含むCPPISが作成され、MIR 3508aの検証された区画へと移動される。
明確性及び有効範囲の深さは、複雑なプロテオミクスサンプルの正確な定性的及び定量的分析に関係するので、ピーク容量の直接関数である。任意の分析ワークフローのピーク容量は、イオン検出の前に適用される各直交分離技術からの全ての分解能の積として定義することができる。全ての分析技術と同様に、選択性が特異性と共に増加する程度は標準的なS曲線を辿る。変化率は、最初は低く、線形領域へと移動し、変曲点に達し、次に漸近的限界へと急速に近付く。漸近線を超える増加がある場合、データ品質に悪影響を有する可能性がある。イオン検出の前にインライン及びオフライン両方で更なる直交分離を用いることは、ピーク容量を最大限にすることに対して好影響を有することは明白である。更なる分離の次元が追加されるにしたがって、それぞれに適用される応力が少なくなって、それぞれが変曲点又はその付近で作用することが可能になる。一実施形態においてMMAで用いられてもよい直交分離技術としては、1D及び2D UPLC、質量分解能、IMS、多重化、面積比、及び分数m/zを挙げることができるが、それらに限定されない。
ピーク容量を最大限にすることで、本明細書に記載されるようなデータ処理は、複雑な混合物のDIA分析と関連付けられた多くのイオン干渉を補正することができる。各イオンの測定されたFWHM(m/z、tr、td)を使用して、その面積がどの程度良好に測定されているかを反映する純度スコアが割り当てられる。ペプチドの各電荷状態に対するA0同位体及びそれに関連するプロダクトは、電荷ベクトル、同位体モデリング、及びイオン連鎖を使用して正確に同定される。同位体は、電荷群へとクラスタリングされ、それぞれの数及び面積分布が検証又は補正される。干渉が決定されている場合、仮想イオンが作成され、後に続くクラスタリングに利用可能にされる。データをスキャンごとに分析することで、注入内及び注入間のプロダクトイオンスペクトル間などで、m/z、面積変化率、及び継続性を比較する手段である、データ処理及び逆多重化アルゴリズムが提供される。前の注入の処理済みデータを使用して現在のMMAワークフローを定義することによって、狭帯域DIA獲得として前にサンプリングされなかったm/zの領域を問い合わせる能力である方法が提供される。
各広帯域及び狭帯域獲得の中央m/z値を一定して調節することによって、前のスキャンサイクル又は注入からのプロダクトイオンスペクトルを、他方をフィルタ処理するのに使用することができる。親プリカーサーのものを含む全てのプロダクトイオンスペクトルに対して結果として得られるメタデータを、MIRの推定的な部分に入れることによって、同定の状態に関わらず、プロダクトイオンスペクトルを比較することが可能になる。複合プロダクトイオンスペクトルは、ドット積スペクトル及びピアソンの積率相関係数から作成される。これらの複合プロダクトイオンスペクトルは、次に、処理され、クラスタリングされていないイオン検出に対して問い合わせすることができる。
本明細書に記載されるものの変形、修正、及び他の実現は、請求される本発明の趣旨及び範囲から逸脱することなく、当業者には想到されるであろう。したがって、本発明は、前述の例証的説明によってではなく、その代わりに以下の特許請求の範囲の趣旨及び範囲によって定義されるものとする。