JP2006527371A - 質量分析計のデータを用いたグリカン構造同定方法 - Google Patents
質量分析計のデータを用いたグリカン構造同定方法 Download PDFInfo
- Publication number
- JP2006527371A JP2006527371A JP2006515535A JP2006515535A JP2006527371A JP 2006527371 A JP2006527371 A JP 2006527371A JP 2006515535 A JP2006515535 A JP 2006515535A JP 2006515535 A JP2006515535 A JP 2006515535A JP 2006527371 A JP2006527371 A JP 2006527371A
- Authority
- JP
- Japan
- Prior art keywords
- glycan
- cleavage
- fragment
- mass
- scoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
Abstract
グリカンまたはグリカン誘導体の構造または部分構造を決定する方法は、未同定のグリカン分子の質量を実験によって測定し、未同定のグリカン分子の質量と確定され構造が決定されているグリカン構造とを比較し、グリカン分子の構造の候補を選択する。次に、グリカン分子のフラグメントの質量が実験によって測定され、選択された候補が理論的にフラグメント化される。未同定のグリカン分子のフラグメントの質量が構造の候補から理論的に得られたフラグメントの質量と照合される。次に、実験から得たフラグメントの質量と理論的に得たフラグメントの質量とを比較することによって各構造の候補に順位付き信頼度点をつけるように採点が行われる。2つの採点方法、すなわち、セグメント化採点法と一致採点法が開示されている。最高順位で信頼度が不十分な場合には、理論的フラグメント化工程においてより複雑な開裂パターンを考慮するかあるいはスペクトルをさらに入手することによって、上記の手順を繰り返す工程をさらに含む。
Description
本発明はオリゴ糖としても知られるグリカンおよびその誘導体の構造を決定する方法に関する。特に、本発明は実験から測定された質量分析計によるフラグメントのデータをグリカンフラグメントのデータベースに保存されているデータと対比することによりグリカンの構造を同定する方法である。
「グリカン」という用語は、本明細書中で使用する際、特に明記しない限りグリカンとその誘導体の両方を表すために使用される。手作業のインタプリティブ処理を用いて、実験から測定された質量分析計によるフラグメントのデータをグリカンフラグメントデータベースに保存されているデータと対比することによってグリカンの構造を特定できることは知られている。これらの方法では、研究者が分析計によるフラグメントのデータと既知のフラグメントのマスデータとを比較することが必要である。そのような手作業の方法の問題は遅くて時間がかかることである。
このような問題は主としてグリカンの構造が複雑であることに原因がある。以下のリストは図1および図2に基づいてグリカンを説明しており、本明細書の以後の部分で使用される言葉を定義したものである。
構造 ― グリコシド結合3によって結合された単糖群2からなるオリゴ糖1。個別の単糖からなる集合はこれら単糖間のグリコシド結合によって繋がったオリゴ糖の形で配列させることができる。オリゴ糖の一致度を採点するため、オリゴ糖はある方向をもつと定義される、すなわち、ある特定の単糖が他の全ての単糖がそこに直接または間接に結合される還元末端単糖であると定義される。異なった単糖配列はそれぞれオリゴ糖のアイソフォームである。m糖オリゴ糖の最大オリゴ糖配列数は式mm-1で示される。この数は自然界で見られる現実の配列数よりも大きい。また、単糖群は同じ質量を有している場合もあり、したがって全てのアイソフォームが特異であるとは限らない。
還元末端 ― 構造のグリコシド結合に関与していない末端r。
非還元末端 ― 構造の還元末端ではない末端4。
エッジ ― 単糖間に位置する。E1, E2, E3, E4は図1に示す構造のエッジである。
深さ ― 図1に示すように、還元末端から各エッジまでの距離である。深さ(E1) < 深さ(E2) < 深さ(E3) = 深さ(E4)であり、E1は最高順位である。
開裂 ― 構造内の炭素結合が切断されている。開裂はグリコシド開裂、クロスリング開裂、特異的開裂の場合がある。図2はE3とE4で開裂を示す。
グリコシド開裂 ― グリコシド結合の切断を伴う開裂。
クロスリング開裂 ― 糖の炭素環のうちの1つの炭素−炭素結合2個を切断することを伴う開裂。
特異的開裂 ― 診断上有意であるが直接グリコシド開裂またはクロスリング開裂の範疇には入らない開裂。
単開裂 ― グリコシド開裂現象、クロスリング開裂現象または特異的開裂現象を1つだけ伴う開裂現象、すなわち1開裂。
多重開裂 ― 1より多い開裂現象を伴う開裂現象。n開裂現象、すなわち2開裂、3開裂などと表現することができる。図2は2開裂現象の一例である。
フラグメント ― 単開裂現象または多重開裂現象の結果物。図2では、フラグメントは21、22および23である。
独立フラグメント ― 他と共通の単糖を有していないフラグメントである。
還元末端フラグメント ― 構造の還元末端を含んだフラグメント。図2のフラグメント21。
非還元末端フラグメント ― 構造の還元末端を含まないフラグメント。図2のフラグメント22および23。
開裂型 ― 本明細書に全内容を引用の形で盛り込んだ、グリココンジュゲート・ジャーナル(Glycoconjugate J)(1988)5:397〜409ページにおいて公開されたブルーノ・ドモン(Bruno Domon)およびキャサリン・イー・コステロ(Catherine E Costello)による記事「複合糖質のFAB−MS/MSスペクトルにおける炭水化物フラグメント化のための系統的命名法(“Systematic Nomenclature for Carbohydrate Fragmentations in FAB-MS/MS Spectra of Glycoconjugates“)」に記載されている。ドモンおよびコステロ(“Domon and Costello“)表記法はグリカンフラグメントイオンをラベル付けするために一般的に認められた基準であり、本明細書中でも使用される。
還元末端フラグメントは特定の開裂型の結果物だけである。1開裂の場合、Y型、Z型、X型およびいくつかの特異的開裂型が存在する。n開裂の場合、還元末端フラグメントは発生する開裂の集合の中にB開裂、C開裂、A開裂が存在しない場合にのみ発生する。例えば、還元末端フラグメントにはYフラグメント、ZフラグメントおよびY/Z(YとZが同時発生)フラグメントがある。Aフラグメント、B/Yフラグメントは還元末端フラグメントではありえない。
非還元末端フラグメントは1非還元開裂型しか含まない開裂型組合せから得られる。1つより多い非還元開裂型からはフラグメントを作成することはできない。
ピーク ― MS/MSスペクトルのピーク。このピークは質量−荷電比(m/z)と(スペクトルの最大ピークに対する)相対強度を有している。
グリカンは、異性体やアノマーのみならず、図1の5で示すように各単糖に複数の枝部分を有している場合もある。これにより、観測されたフラグメントが様々な型の開裂、様々な位置の開裂および多重開裂から生じるような複雑なフラグメント化スペクトルが得られる。
1開裂フラグメントは、通常、2開裂よりも多くの配列情報を保持している傾向がある。1開裂現象の場合、オリゴ糖は還元末端を含む一部分と非還元末端を含むもう一部分との2つの部分に分割される。完全オリゴ糖の組成は既知であるので、1開裂フラグメントの組成から相補の1開裂フラグメントの組成を確定的に推測することができる。還元末端を含むフラグメントの組成は確実に決定されているので、1開裂還元末端フラグメントは配列決定にとって非常に重要である。また、還元末端フラグメントの組成が既知であるので、還元末端フラグメントと完全オリゴ糖との間の組成の違いから非還元末端フラグメントの組成を推測することもできる。
2開裂現象によれば、通常、3個の考えられるフラグメントが作成されることになる。3個のフラグメントのうちの1個だけの組成が過去に完全に決定されている。さらに、フラグメントが還元末端フラグメントであれば、2開裂現象の場合には還元末端糖の位置しか明らかにならない。2開裂の還元末端結果物の場合、2個の「失われた」各フラグメントの組成は明確には決定することができない。同様に、多重開裂時の還元末端や2開裂非還元末端の場合には、主要フラグメントから2個の相補フラグメントの組成は明確には決定することができない。2開裂現象からは1フラグメント中に見えるオリゴ糖の部分の組成しか正確に決定することができないので、相補フラグメント中の単糖の配列についての不確かさはさらに大きくなる。
本明細書中に含まれる文献、行為、材料、装置、記事などの記述は本発明の背景を提供する目的にすぎない。これらの事柄の一部または全てが従来技術の基礎の一部をなしていることや、本発明に関連する分野で本出願の各請求項の優先日以前にオーストラリアで存在していた一般知識であったことを認めたものとして解するべきではない。
本発明の第1の広い側面では、グリカンまたはグリカン誘導体の構造または部分構造を決定する方法であって、
未同定のグリカン分子の質量を実験から得る工程と、
上記未同定のグリカン分子の質量と確定グリカン構造とを比較し、上記グリカン分子の構造の候補を選択する工程と、
上記グリカン分子のフラグメントの質量を実験から得る工程と、
上記選択された候補を理論的にフラグメント化する工程と、
上記未同定のグリカン分子のフラグメントの質量を上記構造の候補から理論的に得られたフラグメントの質量と照合する工程と、
上記実験から得たフラグメントの質量と上記理論的に得られたフラグメントの質量とを比較することによって各構造の候補に順位付き信頼度点をつけるように採点する工程を含む方法を提供する。
未同定のグリカン分子の質量を実験から得る工程と、
上記未同定のグリカン分子の質量と確定グリカン構造とを比較し、上記グリカン分子の構造の候補を選択する工程と、
上記グリカン分子のフラグメントの質量を実験から得る工程と、
上記選択された候補を理論的にフラグメント化する工程と、
上記未同定のグリカン分子のフラグメントの質量を上記構造の候補から理論的に得られたフラグメントの質量と照合する工程と、
上記実験から得たフラグメントの質量と上記理論的に得られたフラグメントの質量とを比較することによって各構造の候補に順位付き信頼度点をつけるように採点する工程を含む方法を提供する。
そのようなシステムはグリカン構造の質量分析と自動的、総合的かつ高速な構造決定によってグリカンの高スループットの構造決定を実現することができるとともに、インタープリターの知識に基づいて質量スペクトルの偏らない解釈を支援する。
最高順位で信頼度が不十分な場合には、上記理論的フラグメント化工程においてより複雑な開裂パターンを考慮するかあるいはスペクトルをさらに入手することによって、上記の手順が繰り返される。
実験によって測定された質量との比較に使用される初期のデータ集合は1開裂フラグメント化の結果物であるフラグメントのみからなっていてもよい。この初期のデータ集合は専らグリコシド開裂型から形成された2開裂現象も含んでいてもよい。グリコシド開裂パターンはオリゴ糖配列に関する情報を含んだパラメータである。この限定されたフラグメントの集合でも初期の配列採点法が奏功するのに十分なデータがもたらされる。さらにフラグメントを追加することによるデータ集合のサイズ増大は、必要に応じてデータ集合を細分化することで抑えられる。このように、採点の結果に応じて作成されるフラグメントの型を限定することにより、データ集合のサイズを扱いやすいサイズに保つことができる。
オリゴ糖の構造を決定するために、満たすべき2つの基準がある。すなわち、配列を同定する必要があることと、結合の立体配置と位置を決定する必要があることである。これら2つのどちらかに関する情報があれば、有益なデータがもたらされる。大雑把に言って、質量分析は配列の情報を予測することができるが、その技術で結合の情報を得ることはもっと難しい。クロスリング開裂や特異的開裂は結合位置を決定させることができる可能性をもっているが、結合のアノマー性は最も入手するのが難しいパラメータである。計算上では、数学的にのみシリコグリコシドフラグメントおよび環フラグメントの配列決定を行うことができるが、結合のアノマー性の情報を含めることはできない。アノマー性の何らかの情報を含ませることができるフラグメント化スペクトル特性はピーク強度である。その理由は、単に、異なるアノマー立体配置は異なる反応速度論によってフラグメント化の再構成を受けると考えられるからである。フラグメントの強度はもちろん他のパラメータにも依存する。
採点方法は以下のように構成される。
1.配列が少なくとも正しいか否かの判定を可能にする配列に基づく品質採点を提供すること。
2.配列(グリコシド開裂)に基づいてオリゴ糖同士間の順位付けを提供すること。
3.結合位置(クロスリング開裂)に基づいてオリゴ糖同士間の順位付けを提供すること。
4.一般n開裂型や他の特異的開裂型などの他の開裂型に基づいてオリゴ糖同士間の順位付けを提供すること。なお、特異的開裂とは例えば水の欠損があるような当該構造に特有のフラグメントを発生させる開裂である。
別の側面では、採点方法は一致したオリゴ糖フラグメントの集合によって同定されたグリカンの考えられる立体配座の数を計数するセグメント化採点法を含んでいる。特定の立体配座が証拠となるフラグメントによってどの程度裏づけされているかを求めることにより、特定の構造の一致の品質を評価することができる。1開裂フラグメント化から生じた順番付きセグメント群(すなわち、セグメントの結合部位が既知である)の採点が、各セグメントの配列の数を各セグメントがその次のセグメント内で結合可能な点の最大数で乗算することによって算出される。
採点はセグメント内の単糖の配列数として算出されてもよく、順番付きセグメントが結合可能な次のセグメントが既知であるので、順番付きセグメントが結合し得る点の数を知ることができる。
2個のセグメント間の境界をまたぐ2開裂からの追加の情報は、その2開裂セグメントを固定することによって、セグメントが結合可能な考えられる位置の数を減少させることができる。
小セグメントのサイズが一様でない場合と独立開裂が多数の場合について更なる調整が考慮されてもよい。
フラグメント作成処理は、重複するフラグメントと既知の場合には化学的にあり得ないフラグメント化とを省いてフラグメントの量と処理すべきデータ量とを削減することにより、方法を効率化することが好ましい。
グリカンの差を識別することにより、例えばタンパク質、脂質またはプロテオグリカンで発生するグリコシル化の違いの認識に対する指標が提供される。これらの変形は疾病、細胞分化、細胞間通信、免疫的認識および他の重要な特性に関連付けられている。
添付の図面に基づいて本発明の具体的な実施形態を例示的に説明する。
構造決定方法は糖鎖フラグメントマスフィンガープリント法すなわちGMFと称し、図4に概略化されている。
実験から未同定のグリカン分子の質量が得られる(40)。
理論的作業は、同定かつ構造決定されている報告済みグリカンである確定グリカン構造のデータベース41すなわち理論的グリカン構造から始まる。
事前照合は、未同定グリカン分子の質量を確定グリカン構造と比較し、グリカン分子の構造候補を選択することを含んでいる。
さらなる実験から分子のフラグメントの質量が得られる(42)。
その後、選択された候補を用いて理論的なフラグメント化が実行される(43)。
照合44は未同定グリカン分子のフラグメントの質量と構造候補から理論的に得られたフラグメントの質量とを比較することを含んでいる。
採点45では、実験から得たフラグメントの質量と理論的に得たフラグメントの質量とを比較することにより各構造候補に順位付き信頼度点がつけられる。多数の様々な採点方式が利用可能である。
最高順位で信頼度が不十分な場合、理論的フラグメント化工程43においてより複雑な開裂パターンを考慮することによって、あるいはさらにスペクトルを入手することによって上記の手順が繰り返される(46)。
質量分析はグリカンの質量を測定し、グリカンをフラグメント化するのに好適な方法であるが、フラグメントの質量を測定するには依然として質量分析を用いながらも化学的方法などの他の方法をグリカンのフラグメント化に用いてもよい。例えば、エキソグリコシダーゼ、酸加水分解後の過ヨウ素酸塩処理やスルファターゼによってグリカンフラグメントを生成してもよい。
グリカン分子の質量を得ること40
利用者は質量分析の結果から未同定グリカン分子の質量を提供する。
同定かつ構造決定されているグリカン構造のデータベース41
多数の適切なデータベースを利用可能である。例えば、www.glycosuite.comで利用可能なGlycoSuiteDBは、データベースGlycomindsと同様に、同定かつ構造決定されているグリカン構造のデータベースを提供している。このデータベースは簡単な表形式またはリレーショナル形式によって、生物学的起源情報などグリカン構造に関連する他の情報を活用することができる。
グリカン分子の質量を得ること40
利用者は質量分析の結果から未同定グリカン分子の質量を提供する。
同定かつ構造決定されているグリカン構造のデータベース41
多数の適切なデータベースを利用可能である。例えば、www.glycosuite.comで利用可能なGlycoSuiteDBは、データベースGlycomindsと同様に、同定かつ構造決定されているグリカン構造のデータベースを提供している。このデータベースは簡単な表形式またはリレーショナル形式によって、生物学的起源情報などグリカン構造に関連する他の情報を活用することができる。
事前照合には、未同定グリカン分子の質量を同定かつ構造決定されているグリカン構造と比較してグリカン分子の構造候補を選択することが含まれる。
実験から分子のフラグメントの質量を得ること42
例えばタンデム型質量分析によってフラグメントイオンを作成する条件の下での質量分析の後に、あるいはソースフラグメント化の形で個々のオリゴ糖をGMFにかけてもよいし、質量分析と組み合わせた分離方法を用いてオリゴ糖混合物を個別の構成成分に分離してもよい。これには、高速液体クロマトグラフィー、キャピラリー電気泳動などの技術がある。様々なイオン化方法や条件が使用され得る。フラグメントイオンをさらにフラグメント化する必要がある場合には、多段階の質量分析を使用しても良い。
選択された候補を用いた理論的フラグメント化43
本発明では、同定かつ構造決定されているグリカン構造のデータベース全体について理論上のフラグメントの集合を照合順序化することにより、考えられるあらゆるグリカンフラグメントの理論的質量ピークがその未フラグメント化分子である親の質量とともにデータベース化される。
実験から分子のフラグメントの質量を得ること42
例えばタンデム型質量分析によってフラグメントイオンを作成する条件の下での質量分析の後に、あるいはソースフラグメント化の形で個々のオリゴ糖をGMFにかけてもよいし、質量分析と組み合わせた分離方法を用いてオリゴ糖混合物を個別の構成成分に分離してもよい。これには、高速液体クロマトグラフィー、キャピラリー電気泳動などの技術がある。様々なイオン化方法や条件が使用され得る。フラグメントイオンをさらにフラグメント化する必要がある場合には、多段階の質量分析を使用しても良い。
選択された候補を用いた理論的フラグメント化43
本発明では、同定かつ構造決定されているグリカン構造のデータベース全体について理論上のフラグメントの集合を照合順序化することにより、考えられるあらゆるグリカンフラグメントの理論的質量ピークがその未フラグメント化分子である親の質量とともにデータベース化される。
本発明の改良物では、既存のデータベースにはまだ開示されていない新規なグリカン構造と照合して同定するために、理論的に可能性のあるグリカンのはるかに大きな集合の考えられるあらゆるフラグメント化の理論的データベースを構築することも可能である。このはるかに大きなデータベースを、グリカンフラグメントの質量が既知のどのグリカンフラグメントのフィンガープリントとも十分には一致しない場合の二次の経路探索のために使用することが考えられる。
グリカン構造の理論的質量ピークを得るためには、一構造のn開裂の完全集合のフラグメント集合を作成するアルゴリズムが必要である。このフラグメント作成に使用される方法は順列・組合せ方法に基づく。この方法は2段階、すなわち、エッジ選択と開裂割当てとに分解される。
エッジ選択
構造Sは間にm−1個のグリコシド結合が存在するm個の単糖からなる。n開裂のフラグメントの完全集合を作成するためには、n個の位置(但しn≦m−1)で結合を切断することを考える必要がある。n開裂のフラグメント化にはCm-1 nとおりのグリコシド開裂点(エッジ)の組合せが存在する。サイズの複雑さを最小限にするために、反復法を用いてエッジの全ての組合せを作成する。EはS内で求められたエッジのk下位集合である。kはm−1までのいかなる数であってもよい。
エッジ選択
構造Sは間にm−1個のグリコシド結合が存在するm個の単糖からなる。n開裂のフラグメントの完全集合を作成するためには、n個の位置(但しn≦m−1)で結合を切断することを考える必要がある。n開裂のフラグメント化にはCm-1 nとおりのグリコシド開裂点(エッジ)の組合せが存在する。サイズの複雑さを最小限にするために、反復法を用いてエッジの全ての組合せを作成する。EはS内で求められたエッジのk下位集合である。kはm−1までのいかなる数であってもよい。
例えば、2下位集合は2個のエッジが組み合わされたエッジの全ての組合せの集合である。図1に示す例の場合、4個のエッジE1, E2, E3およびE4が存在する。二重開裂の場合、k=2であり、そのk下位集合はE1, E2, E3およびE4のうちの同時に2個の可能性のある全ての組合せ、すなわち、(E1, E2)、(E1, E3)、(E1, E4)、(E2, E3)、(E2, E4)および(E3, E4)を含んでいる。
その後、各k下位集合内のエッジが深さに応じて並べ替えされ、エッジベクトルを作成する。還元末端により近い単糖を含んだエッジがより深くで発生したエッジよりも上位に並べ替えされる。例えば、図1に基づいて深さ(E1) < 深さ(E2) < 深さ(E3) = 深さ(E4)の場合のグリカン構造Sのエッジの深さを説明する。図から、最善の2個のエッジであるエッジE1およびE2が選択される。エッジのk下位集合は(E2, E1)であり、E1が従来より構造の右側に描かれている構造の還元末端により近く、C-1の水酸化物がさらに単糖単位を伴って延長していない端部であるため、並べ替えると、エッジベクトルは(E1, E2)となる。独立フラグメントが作成されるように特定の開裂を選択してエッジに割り当てることが考えられるので、エッジの順序配列はフラグメントの正確な作成を保証するのに重要である。これにより、図2に示すように、エッジE3およびE4が切断されると、2個の分離したフラグメントが作成される。
炭水化物のフラグメント化パターンは、本明細書に全内容を引用の形で盛り込んだ、グリココンジュゲート・ジャーナル(Glycoconjugate J)(1988)5:397〜409ページにおいて公開されたブルーノ・ドモン(Bruno Domon)およびキャサリン・イー・コステロ(Catherine E Costello)による記事「複合糖質のFAB−MS/MSスペクトルにおける炭水化物フラグメント化のための系統的命名法(A Systematic Nomenclature for Carbohydrate Fragmentations in FAB-MS/MS Spectra of Glycoconjugates)」に記載されている。ドモンおよびコステロ(“Domon and Costello“)表記法はグリカンフラグメントイオンをラベル付けするために一般的に認められた基準であり、本明細書中でも使用される。
還元末端フラグメントは特定の開裂型の結果物だけである。1開裂の場合、Y型、Z型、X型およびいくつかの特異的開裂型が存在する。n開裂の場合、還元末端フラグメントは発生する開裂の集合の中にB開裂、C開裂、A開裂が存在しない場合にのみ発生する。例えば、還元末端フラグメントにはYフラグメント、ZフラグメントおよびY/Z(YとZが同時発生)フラグメントがあるAフラグメント、B/Yフラグメントは還元末端フラグメントではありえない。
非還元末端フラグメントは1非還元開裂型しか含まない還元型組合せから得られる。1つより多い非還元開裂型からはフラグメントを作成することはできない。
考えられる全てのフラグメントを算出することは計算量を多く費やす。2つ以上の開裂が発生すると、2開裂の一部は1開裂において既に算出されていたフラグメントを作成することになる。例えば、2つのエッジE1およびE4が切断される場合に作成される還元末端部フラグメントはE1での1開裂の結果としても作成される。E4での開裂の結果は、E4がE1での開裂の結果である還元末端部フラグメントに存在していなかったために、使われない。1開裂によっても作成される2開裂作成のフラグメントは算出する必要がない。通常、n開裂の全てを作成する場合、m開裂(但し、m<n)によって作成可能なフラグメントは破棄される。
エッジ選択ステップで得られたエッジの各組み合わせに関して、フラグメントの型の集合を付与することによってフラグメントを作成することができる。非独立で二重の非還元末端フラグメントを示す図3に基づいて、2開裂現象から形成されたエッジAおよびエッジBからなるエッジ組合せについて考察する。エッジAでは、発生する可能性のある開裂型は還元末端開裂と非還元末端開裂である。エッジBでは、還元末端フラグメントのみが発生する可能性がある。エッジBでは、非独立フラグメントとなる2つの非還元末端開裂型をもつことができないので、還元末端開裂のみが発生する。この型のフラグメントは、実際には、エッジBで最大深さで発生する単開裂に等しい。
開裂割当て
開裂をフラグメントに割り当てるために、開裂型の選択をEの各要素に対応付ける。
開裂割当て
開裂をフラグメントに割り当てるために、開裂型の選択をEの各要素に対応付ける。
T=n要素の開裂型の順列の集合
t∈T(但し、tのサイズはn)の場合、
∀e∈E:∀t∈T:フラグメント=(t, e)すなわち(フラグメント型,位置)
Tはn要素の開裂型の各順列が非還元末端フラグメントを1個より多くは含まないように制限されている。また、独立フラグメントの発生を防ぐため、当該構造が確実にフラグメントを裏づけできているかどうかが検査される。開裂点に割り当てられた還元末端開裂型の場合に、構造の還元末端への移動が他の開裂点を横切らない場合にはあらゆる還元末端フラグメントを無効にする基本検査が行われる。どの還元末端開裂点についても還元末端への移動がB開裂点を通過しない場合には、非還元末端フラグメントが無効とされる。検査は、最小深さ(還元末端に最も近い点)で発生する開裂点から始まり、還元末端に向かって構造を移動し、移動し終えた単糖全てにマークをつけることによって行われる。これをフラグメントの他の開裂点についても繰り返す。A開裂型によるマーク付き単糖を含む枝が失われたフラグメントは破棄される。
t∈T(但し、tのサイズはn)の場合、
∀e∈E:∀t∈T:フラグメント=(t, e)すなわち(フラグメント型,位置)
Tはn要素の開裂型の各順列が非還元末端フラグメントを1個より多くは含まないように制限されている。また、独立フラグメントの発生を防ぐため、当該構造が確実にフラグメントを裏づけできているかどうかが検査される。開裂点に割り当てられた還元末端開裂型の場合に、構造の還元末端への移動が他の開裂点を横切らない場合にはあらゆる還元末端フラグメントを無効にする基本検査が行われる。どの還元末端開裂点についても還元末端への移動がB開裂点を通過しない場合には、非還元末端フラグメントが無効とされる。検査は、最小深さ(還元末端に最も近い点)で発生する開裂点から始まり、還元末端に向かって構造を移動し、移動し終えた単糖全てにマークをつけることによって行われる。これをフラグメントの他の開裂点についても繰り返す。A開裂型によるマーク付き単糖を含む枝が失われたフラグメントは破棄される。
開裂点への開裂型の割当てが確認されると、構造の仮想フラグメント化が行われる。このプロセスはフラグメントの構造が表示されるように構造の仮想表現から枝を取り除くことを含んでいる。仮想フラグメントが作成されると、フラグメント化の型の質量損失のみならず残っている単糖の質量を調べることによって質量を求めることができる。このフラグメントの識別子がドモンおよびコステロ表記法に基づいて作成され、フラグメントに割り当てられる。
フラグメントの作成は難解な組合せ問題である。許容開裂の数が増えるにつれてフラグメントの数が劇的に増加するので、先験的に全てのフラグメントを作成することは不可能である。本発明の方法は、最初に、データベースに保存されているより少数の理論的フラグメントの下位集合に対して実行される。通常、1開裂のフラグメントと専らグリコシド開裂による2開裂のフラグメントとが最初に使用される。
照合44
照合は未同定グリカン分子のフラグメントの質量と構造候補から理論的に得られたフラグメントの質量とを比較することを含んでいる。
採点45
利用者はm/zと強度値の対からなるスペクトルを提供する。各対はピークと呼ばれる。質量ピークは電荷状態と付加物を調整することによって真の質量に変換された後、理論的フラグメントの集合と比較され、真の質量ピークの許容範囲内の質量を有するフラグメントが見出される。その後、このフラグメントは親の構造に照らして順番に並べられ、採点される。
照合44
照合は未同定グリカン分子のフラグメントの質量と構造候補から理論的に得られたフラグメントの質量とを比較することを含んでいる。
採点45
利用者はm/zと強度値の対からなるスペクトルを提供する。各対はピークと呼ばれる。質量ピークは電荷状態と付加物を調整することによって真の質量に変換された後、理論的フラグメントの集合と比較され、真の質量ピークの許容範囲内の質量を有するフラグメントが見出される。その後、このフラグメントは親の構造に照らして順番に並べられ、採点される。
採点プロセスには2つの要素が存在する。1つは構造候補の一致度の配列品質を求めることであり、もう1つは構造候補を互いに順位付けすることである。各採点方式のアルゴリズムの系統はそれぞれ品質採点法と相対採点法に定義される。これら2つの採点法の組合せに基づいて、配列情報、結合情報またはその両方に鑑みて入力スペクトルによって確定された構造である構造結果の尤度を求めることができる。
品質採点法
結果の品質採点は配列について照合されたフラグメントがどの程度その配列を明確化しているかを含んでいる。例えば、1個の小さなフラグメントとしか一致しない構造結果は低品質結果となる一方、一致したフラグメントが全体にわたって多数分布している構造は高品質点を有することになる。そのような品質採点アルゴリズムの1つはグルーピングアルゴリズムである。
品質採点法
結果の品質採点は配列について照合されたフラグメントがどの程度その配列を明確化しているかを含んでいる。例えば、1個の小さなフラグメントとしか一致しない構造結果は低品質結果となる一方、一致したフラグメントが全体にわたって多数分布している構造は高品質点を有することになる。そのような品質採点アルゴリズムの1つはグルーピングアルゴリズムである。
グループ採点法により、フラグメントの型から開裂点が得られ、構造がそれに関連するフラグメント集合によってどの程度決定されたかを表す数字が得られる。構造を決定するために使用される最良のフラグメントは1開裂から得られたフラグメントである。m個の単糖を有するグリカンのグリカン構造に関連する1開裂フラグメント内にm−1個の特異な開裂点が存在すれば、その構造の配列が有効であるという十分な証拠がフラグメント内に存在することになる。
2開裂の結果得られたフラグメントは構造内に特異な開裂点が存在することを必ずしも示していない。1開裂は、フラグメントの存在がフラグメントが開裂点で発生したことを証明する十分な証拠であるので、特別である。2開裂はフラグメント化のフラグメント化であると見なしてもよい。2開裂の開裂点の一方は、他方の開裂点がその存在を裏付ける証拠を持つ場合には証拠として使用されてもよい。言い換えると、その2開裂は別の1開裂と重なり合う部分を有しているか、一方の開裂が等しい情報量を含むように割り当てられた2開裂を有しているはずである。この理由により、2開裂は1開裂ほど重要視されない。開裂点を審査するどの採点法もこの情報を含ませることができる。考えられるアルゴリズムの1つは、一致したフラグメントを有する元の構造内で各開裂点を実現させるように試みる方法を含んでいる。可能ならばいつでも、グルーピング採点アルゴリズムは単開裂フラグメントを用いて開裂点を実現させるように試みることができる。開裂点を1開裂フラグメントによって実現できない場合には、アルゴリズムは2開裂フラグメントを使用する。付与される実際の採点は方程式1:
採点=(a−0.25b)/(m−1)
を用いて求められる。但し、aは1開裂現象に割り当てられた開裂点の数、bは2開裂フラグメントに割り当てられた開裂点の数である。開裂点がそのフラグメントによって強固に裏づけされている構造は1に近い採点が付与される。この方法は、上記の式を開裂の重要性を適切に重み付けするように拡張し、それをaから減算することによって、nが1より大きい一般n開裂を扱うことに拡張することができる。
採点=(a−0.25b)/(m−1)
を用いて求められる。但し、aは1開裂現象に割り当てられた開裂点の数、bは2開裂フラグメントに割り当てられた開裂点の数である。開裂点がそのフラグメントによって強固に裏づけされている構造は1に近い採点が付与される。この方法は、上記の式を開裂の重要性を適切に重み付けするように拡張し、それをaから減算することによって、nが1より大きい一般n開裂を扱うことに拡張することができる。
上記のことは採点の方程式の単純な1型式に過ぎず、他の方程式を利用して単開裂および二重開裂の両方からの情報を含ませる同じ機能を実現することができることに注意すべきである。
セグメント化採点法
セグメント化採点法は一致したオリゴ糖フラグメントの集合によって同定されたオリゴ糖の考えられる立体配座数を算出する品質採点方法である。特定の立体配座が証拠となるフラグメントによってどの程度裏づけされているかを求めることによって、特定の構造の一致品質を評価することができる。
単純セグメント化
オリゴ糖に対して行われる1開裂フラグメント化はオリゴ糖の特定の配列特性の証拠であるとみなしてもよい。例えば、図12に基づいてグリコシド結合部位で1開裂フラグメント化が行われる場合のオリゴ糖について考察する。このフラグメント化により、配列に関して2つの証拠が得られる。フラグメント化がオリゴ糖をS´とS″の2つの部分に分割したと考えてもよい。S´とS″はオリゴ糖のセグメントである。オリゴ糖のセグメントはそれ自体がオリゴ糖であり、実験によって観測された特定のフラグメント化の証拠の価値を計る手助けをするために用いられる。
セグメント化採点法
セグメント化採点法は一致したオリゴ糖フラグメントの集合によって同定されたオリゴ糖の考えられる立体配座数を算出する品質採点方法である。特定の立体配座が証拠となるフラグメントによってどの程度裏づけされているかを求めることによって、特定の構造の一致品質を評価することができる。
単純セグメント化
オリゴ糖に対して行われる1開裂フラグメント化はオリゴ糖の特定の配列特性の証拠であるとみなしてもよい。例えば、図12に基づいてグリコシド結合部位で1開裂フラグメント化が行われる場合のオリゴ糖について考察する。このフラグメント化により、配列に関して2つの証拠が得られる。フラグメント化がオリゴ糖をS´とS″の2つの部分に分割したと考えてもよい。S´とS″はオリゴ糖のセグメントである。オリゴ糖のセグメントはそれ自体がオリゴ糖であり、実験によって観測された特定のフラグメント化の証拠の価値を計る手助けをするために用いられる。
S″はその単糖集合内のどこかにオリゴ糖の還元末端を含んでいる。S″内に含まれている全ての単糖は還元末端に結合可能であり、すなわち還元末端の単糖で終端する単糖鎖を形成している。S″に含まれる単糖が還元末端に結合される場合、S´からS″に結合される1個の子単糖が存在しているはずである。S″内の単糖はS´内の単糖の子にはなり得ない。すなわち、S″内のどの単糖もS″内のどの単糖よりも還元末端に近い。
このフラグメント化により、このオリゴ糖の配列に関して3つの証拠が得られる。すなわち、
S´内の全ての単糖がS´内の少なくとも1個の単糖に結合されているはずであり、
S″内の全ての単糖がS″内の少なくとも1個の単糖に結合されているはずであり、
S´内の1個の単糖がS″内の別の単糖に結合されている。
これら3つの証拠を用いて、発見されたフラグメントと質量が同じフラグメントを裏づけすることが可能なオリゴ糖の集合を作成することができる。さらに、完全単糖の組成などの証拠も用いてこれらのオリゴ糖が作成される。
S´内の全ての単糖がS´内の少なくとも1個の単糖に結合されているはずであり、
S″内の全ての単糖がS″内の少なくとも1個の単糖に結合されているはずであり、
S´内の1個の単糖がS″内の別の単糖に結合されている。
これら3つの証拠を用いて、発見されたフラグメントと質量が同じフラグメントを裏づけすることが可能なオリゴ糖の集合を作成することができる。さらに、完全単糖の組成などの証拠も用いてこれらのオリゴ糖が作成される。
このフラグメント化の裏づけとなる考えられる全ての構造を作成して配列決定することはアルゴリズム上可能であるが、作成される構造の数を算出するだけでよい。構造の総数はセグメントの考えられる配列と特定のセグメントを他のセグメントに結合可能な通り数とを計上することによって算出することができる。S´の場合、数式mm-1を用いてS´内に含まれる単糖の考えられる配列の数を算出することができる。同様に、S″はnn-1通りに配列可能である。S´をS″に結合可能な通り数を算出するため、S´からの還元末端の単糖がS″内の1単糖に結合可能な位置の数を考える。S″はn個の単糖を含んでいるので、n通りの結合位置が考えられる。全体では、nn-1×mm-1×n通りの単糖の配列が考えられる。
例えば、図14a乃至図14cによれば、図14cに示すように32×43×4=2304通りの配列が考えられる。
複雑セグメント化
フラグメントが1つだけの場合はセグメント化は単純であるが、フラグメントが多数であればセグメント化のプロセスは非常に複雑になる。
2開裂フラグメント化
これを図13に基づいて説明する。2開裂現象によるセグメント化には2つの場合が存在する。
複雑セグメント化
フラグメントが1つだけの場合はセグメント化は単純であるが、フラグメントが多数であればセグメント化のプロセスは非常に複雑になる。
2開裂フラグメント化
これを図13に基づいて説明する。2開裂現象によるセグメント化には2つの場合が存在する。
還元末端2開裂現象 ― 還元末端2開裂現象のフラグメントをセグメント化の証拠として使用する場合、オリゴ糖を3個のセグメントに分割する。証拠は2個のグリコシド開裂が発生した場合のみであるので、S″およびS″′はS´のどの位置にも結合可能である。
非還元末端2開裂現象 ― 非還元末端2開裂現象も3個のセグメントを作成する。このフラグメントには方向の情報が含まれていないので、還元末端はS″とS″′のどちらに含まれていてもよい。S´はS″とS″′のどちらに結合させてもよい。同様に、S″はS´とS″′のどちらに結合させてもよく、S″′はS´とS″のどちらに結合させてもよい。S´、S″およびS″′が一緒に配列される9通りの方法が考えられる。S´がx個の単糖を含み、S″がy個の単糖を含み、S″′がz個の単糖を含むとする。完全な構造はm個の単糖を含んでいる。したがって、
これらの条件を満たす9×xx-1×yy-1×zz-1×(y×z)×(x×z)×(x×y)通りのオリゴ糖配列が考えられる。
多数独立1開裂現象
多数1開裂現象は入れ子状のセグメントを導入することによってセグメント化プロセスを複雑にする。入れ子状セグメントは既存の1セグメントのセグメント化によって作成されたセグメントである。元のセグメントは単糖集合を含んでいたものからセグメント集合に変わることになる。セグメントは、非還元末端単糖からフラグメント化の証拠を考察し、還元末端に向かって作業することによって作成される。フラグメント化の各証拠がセグメント化に付与されるので、還元末端を含んだセグメントがさらにセグメント化される。このセグメント化の細分化によって構造作成規則の複雑な集合が作成される結果、各代々のフラグメントが証拠とみなされる場合に作成可能な考えられる構造の数が削減される。1開裂現象の全てが証拠とみなされると、互いの関係が明らかなセグメント集合が求められる。
多数2開裂現象
前段階の終了時点で、他のセグメントに明らかに結合されるセグメントに関する情報を伴ったセグメント集合が作成される。1個より多い単糖を含んだどのセグメントについても、さらに配列の証拠を求めてさらにセグメントが問い合わせされる。2開裂還元末端開裂は既存のセグメントと2開裂現象によって作成されたセグメントを交わらせるようにして取り扱われる。その他の2開裂現象はフラグメント内の単糖のグループ化の場合にのみ基づくことができる。この単糖のグループもセグメントとして取り扱われ、既存のセグメントと交わらせる。全てのフラグメントを用いてセグメントを作成すると、オリゴ糖が最大にセグメント化される。すなわち、単糖の全てのグループが統合されて考えられる最少の単糖グループが作成される。
採点の算出
採点は順番付けされたセグメントの採点を算出し、次に順番付けされていないセグメントの採点を算出することによって行われる。順番付けされたセグメントは結合先のセグメントが分かっているセグメントである。順番付けされたセグメントは1開裂フラグメント化により生じる。順番付けされたセグメントの採点を算出するためには、各セグメントの配列数を算出した後、それを各セグメントが次の文節に結合可能な位置の数で乗算する。
これらの条件を満たす9×xx-1×yy-1×zz-1×(y×z)×(x×z)×(x×y)通りのオリゴ糖配列が考えられる。
多数独立1開裂現象
多数1開裂現象は入れ子状のセグメントを導入することによってセグメント化プロセスを複雑にする。入れ子状セグメントは既存の1セグメントのセグメント化によって作成されたセグメントである。元のセグメントは単糖集合を含んでいたものからセグメント集合に変わることになる。セグメントは、非還元末端単糖からフラグメント化の証拠を考察し、還元末端に向かって作業することによって作成される。フラグメント化の各証拠がセグメント化に付与されるので、還元末端を含んだセグメントがさらにセグメント化される。このセグメント化の細分化によって構造作成規則の複雑な集合が作成される結果、各代々のフラグメントが証拠とみなされる場合に作成可能な考えられる構造の数が削減される。1開裂現象の全てが証拠とみなされると、互いの関係が明らかなセグメント集合が求められる。
多数2開裂現象
前段階の終了時点で、他のセグメントに明らかに結合されるセグメントに関する情報を伴ったセグメント集合が作成される。1個より多い単糖を含んだどのセグメントについても、さらに配列の証拠を求めてさらにセグメントが問い合わせされる。2開裂還元末端開裂は既存のセグメントと2開裂現象によって作成されたセグメントを交わらせるようにして取り扱われる。その他の2開裂現象はフラグメント内の単糖のグループ化の場合にのみ基づくことができる。この単糖のグループもセグメントとして取り扱われ、既存のセグメントと交わらせる。全てのフラグメントを用いてセグメントを作成すると、オリゴ糖が最大にセグメント化される。すなわち、単糖の全てのグループが統合されて考えられる最少の単糖グループが作成される。
採点の算出
採点は順番付けされたセグメントの採点を算出し、次に順番付けされていないセグメントの採点を算出することによって行われる。順番付けされたセグメントは結合先のセグメントが分かっているセグメントである。順番付けされたセグメントは1開裂フラグメント化により生じる。順番付けされたセグメントの採点を算出するためには、各セグメントの配列数を算出した後、それを各セグメントが次の文節に結合可能な位置の数で乗算する。
各セグメントの採点は2つの方法のうちの1つで算出される。セグメントが2開裂フラグメント化によってさらに小セグメント化されている場合には、後述の方法が使用される。小セグメント化が行われていない場合には、採点はセグメント内の単糖の配列数として算出される。順番付きセグメントが結合可能な次のセグメントが分かっている場合には、順番付きセグメントが結合し得る点の数を知ることができる。追加の情報が無い場合、セグメントは次のセグメントに存在する分の単糖に結合させることができる。2個のセグメント間の境界をまたぐ2開裂からの追加情報があれば、基本的にその2開裂セグメントを固定することによって、セグメントが結合可能な考えられる位置の数を削減することができる。同定された順番付きセグメントが存在しない場合には、オリゴ糖全体が1つの大きなセグメントとして扱われ、可能ならば2開裂フラグメントを用いて採点が行われる。
小セグメントの配列数は上記の式によって得られる。小セグメントのサイズが一様でないならば、作成される構造の数をさらに調整する必要がある。1個の大きな単糖よりも大きい小セグメントの場合には、兄弟小セグメント数に基づいて配列数が増加される。結合点数は当該小セグメントが兄弟小セグメントと共有する小セグメントの最少小文節を求めることによって得られる。固定セグメント数とは当該セグメントが兄弟セグメント由来のセグメントとグループを形成した小文節の数である。
対比強度
上記セグメント化採点方法を用いて一致物同士をさらに識別するため、対比強度採点が用いられる。対比強度採点は2段階で与えられる。第1段階は他の構造候補のグリコシド開裂に一致した総強度と比較して一致物のグリコシド開裂フラグメントに一致した総強度を調べる。第2段階では、クロスリング開裂および他のフラグメント型に一致した総強度を比較する。
実施例1
xが任意の数であるSxで記すセグメントをフラグメントの構造への対応付けによって直接得られたセグメントであると定義する。
対比強度
上記セグメント化採点方法を用いて一致物同士をさらに識別するため、対比強度採点が用いられる。対比強度採点は2段階で与えられる。第1段階は他の構造候補のグリコシド開裂に一致した総強度と比較して一致物のグリコシド開裂フラグメントに一致した総強度を調べる。第2段階では、クロスリング開裂および他のフラグメント型に一致した総強度を比較する。
実施例1
xが任意の数であるSxで記すセグメントをフラグメントの構造への対応付けによって直接得られたセグメントであると定義する。
xが任意の数であるMxで記すセグメントはフラグメントの構造への対応付けおよび異なるSxフラグメント同士の交わりの両方に由来するセグメントである。
図15(a)に示す構造の質量と4個のフラグメントの質量(図15(b)乃至図15(e))とが求められている、図15に示す六糖について考察する。最初に、構造内の単糖の配列についての規則はない。
(a)
フラグメントがないので、構造は単糖を全て含んだ1個のセグメントにセグメント化される。
フラグメントがないので、構造は単糖を全て含んだ1個のセグメントにセグメント化される。
規則
(1)S={A,B,C,D,E,F}
(2)M=S
配列
=arrangements(M)
=65=7776
但し、arrangementsはセグメントの配列を算出する関数である。attach関数(下記参照)とはセグメントが別のセグメントと結合可能な点の数である。
(1)S={A,B,C,D,E,F}
(2)M=S
配列
=arrangements(M)
=65=7776
但し、arrangementsはセグメントの配列を算出する関数である。attach関数(下記参照)とはセグメントが別のセグメントと結合可能な点の数である。
これは構造内の単糖の配列の純粋に数学的な数であり、実際には現実を反映しておらず、
配列数は各単糖の考えられる結合点の数によって制限される。
配列数は各単糖の考えられる結合点の数によって制限される。
(b)
単糖B乃至単糖Fの損失またはAのみの損失によるセグメントが求められる。単糖B乃至単糖Fの損失によるセグメントとAのみの損失によるセグメントは補完関係にある。セグメントM1およびセグメントM2は新しいセグメント(S1およびS2)と既存のセグメント(S)との交わりによって作成される。
単糖B乃至単糖Fの損失またはAのみの損失によるセグメントが求められる。単糖B乃至単糖Fの損失によるセグメントとAのみの損失によるセグメントは補完関係にある。セグメントM1およびセグメントM2は新しいセグメント(S1およびS2)と既存のセグメント(S)との交わりによって作成される。
規則
(3)S2={B,C,D,E,F}
(4)S1={A}
(5)S2→S1
(6)M1=S∩S1
(7)M2=S∩S2
配列
=arrangements(M2)×attach(M2→M1)×arrangements(M1)
=54×1×1=625
(c)
規則
(8)S3={A,B,F}
(9)S4={C,D,E}
(10)S4→S3
(11)M3=S2∩S3
(12)M4=S2∩S4
配列
=arrangements(M4)×attach(M4→M3)×arrangements(M3)
×attach(M3→M1)×arrangements(M1)
=32×2×2×1×1=36
(d)
これは1セグメントとなる最終1開裂現象である。M4内に可変性があるが、構造の残りは完全に裏付けられた配列の全てを有している。
(3)S2={B,C,D,E,F}
(4)S1={A}
(5)S2→S1
(6)M1=S∩S1
(7)M2=S∩S2
配列
=arrangements(M2)×attach(M2→M1)×arrangements(M1)
=54×1×1=625
(c)
規則
(8)S3={A,B,F}
(9)S4={C,D,E}
(10)S4→S3
(11)M3=S2∩S3
(12)M4=S2∩S4
配列
=arrangements(M4)×attach(M4→M3)×arrangements(M3)
×attach(M3→M1)×arrangements(M1)
=32×2×2×1×1=36
(d)
これは1セグメントとなる最終1開裂現象である。M4内に可変性があるが、構造の残りは完全に裏付けられた配列の全てを有している。
規則
(13)S5={A,B,C,D,E}
(14)S6={F}
(15)S6→S5
配列
=arrangements(M4)×attach(M4→B)×arrangements(F)×attach(F→B)
×arrangements(B)×attach(B→M1)×arrangements(M1)
=32×1×1×1×1×1×1=9
(e)
2開裂現象は単糖のグループに関する情報のみを有しており、相補フラグメントの情報を有していない。そのため、規則の集合には1つの規則だけ追加することができる。M4の配列数は(f)で算出される。
(13)S5={A,B,C,D,E}
(14)S6={F}
(15)S6→S5
配列
=arrangements(M4)×attach(M4→B)×arrangements(F)×attach(F→B)
×arrangements(B)×attach(B→M1)×arrangements(M1)
=32×1×1×1×1×1×1=9
(e)
2開裂現象は単糖のグループに関する情報のみを有しており、相補フラグメントの情報を有していない。そのため、規則の集合には1つの規則だけ追加することができる。M4の配列数は(f)で算出される。
規則
(16)S7={C,D}
配列
=arrangements(M4)×attach(M4→B)×arrangements(F)×attach(F→B)
×arrangements(B)×attach(B→M1)×arrangements(M1)
=6×1×1×1×1×1×1=6
(f)
M4はM5とEのみを含むセグメントの2個のセグメントに分割される。このセグメントには2つの配列M5→CとC→M5が存在する。M5はEとただ1つの位置でしか結合できないが、EはM5とより多くの位置で結合可能である。これを数えるため、結合位置数の調整を利用してM4の配列数を修正する。この例では、M4の配列数は4から6に増加する。
実施例2
(a)
図13に示すように、この構造の場合、2個の単独フラグメントが求められた。S1、S2およびFのみを含むセグメントの3セグメントに分割される。FはS1と2位置(E,D)で結合可能であり、S2はS1と3位置(A,B,C)で結合可能である。考えられる総配列数は108である。
(16)S7={C,D}
配列
=arrangements(M4)×attach(M4→B)×arrangements(F)×attach(F→B)
×arrangements(B)×attach(B→M1)×arrangements(M1)
=6×1×1×1×1×1×1=6
(f)
M4はM5とEのみを含むセグメントの2個のセグメントに分割される。このセグメントには2つの配列M5→CとC→M5が存在する。M5はEとただ1つの位置でしか結合できないが、EはM5とより多くの位置で結合可能である。これを数えるため、結合位置数の調整を利用してM4の配列数を修正する。この例では、M4の配列数は4から6に増加する。
実施例2
(a)
図13に示すように、この構造の場合、2個の単独フラグメントが求められた。S1、S2およびFのみを含むセグメントの3セグメントに分割される。FはS1と2位置(E,D)で結合可能であり、S2はS1と3位置(A,B,C)で結合可能である。考えられる総配列数は108である。
(b)
2開裂現象を用いて(a)の構造をセグメント化する。この開裂から生じるセグメントは2個の1開裂セグメントをまたいでいる。この場合、1開裂セグメントがさらに小セグメント化されている。この2開裂が作成したセグメントをS´とする。
2開裂現象を用いて(a)の構造をセグメント化する。この開裂から生じるセグメントは2個の1開裂セグメントをまたいでいる。この場合、1開裂セグメントがさらに小セグメント化されている。この2開裂が作成したセグメントをS´とする。
S´={B,C,D}
S3=S1∩S´={E,D}∩{B,C,D}={D}
S4=S2∩S´={A,B,C}∩{B,C,D}={B,C}
また、S3がS4と結合する必要があることが分かっている。このため、S1はBよびCを解してしかS2に結合できない。S1がAを解してS2と結合したならば、S´を支配する規則が破られることになる。S4をS3に結合する必要があるので、この規則が適応されるようにS3の配列数が削減される。このフラグメント化によって裏付けられる単糖の配列は24通りしかない。S1がS2と結合する位置数は2に削減され、S1の配列数は1に削減された(DはS2との結合に用いる必要があり、EとS2の両方に結合することはできない)。また、S2の配列数は6に削減された。
相対採点法
相対採点法は同じ品質点をもつ結果の差別化を可能にする。使用可能な方法の1つは一致強度採点法である。一致強度は一致配列(グリコシド開裂のみ)強度と結合情報(グリコシド結合と併存または非併存のクロスリング開裂、特異的開裂)強度とにさらに細分化することができる。
S3=S1∩S´={E,D}∩{B,C,D}={D}
S4=S2∩S´={A,B,C}∩{B,C,D}={B,C}
また、S3がS4と結合する必要があることが分かっている。このため、S1はBよびCを解してしかS2に結合できない。S1がAを解してS2と結合したならば、S´を支配する規則が破られることになる。S4をS3に結合する必要があるので、この規則が適応されるようにS3の配列数が削減される。このフラグメント化によって裏付けられる単糖の配列は24通りしかない。S1がS2と結合する位置数は2に削減され、S1の配列数は1に削減された(DはS2との結合に用いる必要があり、EとS2の両方に結合することはできない)。また、S2の配列数は6に削減された。
相対採点法
相対採点法は同じ品質点をもつ結果の差別化を可能にする。使用可能な方法の1つは一致強度採点法である。一致強度は一致配列(グリコシド開裂のみ)強度と結合情報(グリコシド結合と併存または非併存のクロスリング開裂、特異的開裂)強度とにさらに細分化することができる。
一致強度はフラグメント下位集合(例えば、グリコシド開裂、クロスリング開裂または両方)内の少なくとも1個のフラグメントと一致した全てのピークの強度の合計を得る。少なくとも1個のフラグメントとのピークの一致は、この質量ピークを裏付けできるフラグメント化が考えられることを意味する。より正確な構造はフラグメントと一致するスペクトルピークをより多く有している。一致強度点は、さもなくば同じグループ値をもつ可能性のある、構造の異性体同士を区別するのに特に有用である。一致強度点は一致した診断フラグメントの品質を求めるものであり、点差は一致したフラグメントに相違があることを示す。
繰返し46
採点に応じて、さらにフラグメント型を追加することによってデータ集合のサイズをさらに大きくし、上記の手順を再度実行する。上記手順は、実験によるデータ集合が必要な情報について使い果たされるまで、すなわち、特定のオリゴ糖候補を特徴付ける特異なフラグメントがなくなるまでしか繰り返すことはできない。効率を向上させるためには、スペクトルの一部だけを使用すればよく、あるいはいくつかの構造がフラグメント化された結果であるフラグメントに対してのみ手順を再度実行すればよい。真の質量ピークと一致する少なくとも1個のフラグメントを有する構造がそれに関連するフラグメントの集合を有することになる。このフラグメント集合は真の質量スペクトルピークと一致した構造に由来するフラグメントの集合である。
繰返し46
採点に応じて、さらにフラグメント型を追加することによってデータ集合のサイズをさらに大きくし、上記の手順を再度実行する。上記手順は、実験によるデータ集合が必要な情報について使い果たされるまで、すなわち、特定のオリゴ糖候補を特徴付ける特異なフラグメントがなくなるまでしか繰り返すことはできない。効率を向上させるためには、スペクトルの一部だけを使用すればよく、あるいはいくつかの構造がフラグメント化された結果であるフラグメントに対してのみ手順を再度実行すればよい。真の質量ピークと一致する少なくとも1個のフラグメントを有する構造がそれに関連するフラグメントの集合を有することになる。このフラグメント集合は真の質量スペクトルピークと一致した構造に由来するフラグメントの集合である。
GMFに使用される初期のデータ集合は1開裂フラグメント化と専らグリコシド開裂型から形成される2開裂の結果物であるフラグメントのみからなる。この限定されたフラグメントの集合でも初期の配列採点法が奏功するのに十分なデータがもたらされる。さらにフラグメントを追加することによるデータ集合のサイズ増大は、必要に応じてデータ集合を細分化することで抑えられる。このように、採点の結果に応じて作成されるフラグメントの型を限定することにより、データ集合のサイズを扱いやすいサイズに保つことができる。
速度を犠牲にすることなくGMFプロセスの精度を高めるためには、GMFが実行されるデータ集合が細分化される。GMFで使用される初期のデータ集合では、戻された構造の全てが正しい配列とは限らないので、それら全てがスペクトルに関して有効な構造候補であるとは限らない。このことを利用するため、現在の結果集合のうちのより可能性の高い構造に対してより詳細なGMFを実行してもよい。さらに追加のフラグメントをより低速の二次記憶装置から取り出したり、詳細なGMF問合せのために実行中に作成してもよい。フラグメント用のGMF解空間全体が各GMF問合せで利用可能である必要はない。糖構造のフラグメント化パターンの特性を利用することにより、GMF問合せごとに関連データのみを含ませるようにデータ集合に狙いをつけることができる。
データ集合がより細分化され、可能な解の集合がより関連付けられるにつれて、一致強度点が上昇する。初期データ集合は包括性のあるフラグメントを含んでおり、発生する可能性のあるより特殊なフラグメントとは一致しない。しかしながら、これら特殊なフラグメントは大きな結果集合の中から正確な結果を求める際には必ずしも有用ではない場合がある。例えば、フラグメントに一致するピークの強度が非常に低かったり、構造の多くの部分でフラグメントが生じる場合がある。結果集合のサイズが縮小されるにつれ、上記のフラグメントが重要度を増し、最も有望な構造候補の選択に重要な役割を果たす。
結果
図5はグリカン構造10のフラグメント化によるピーク値のグラフを示す。ピークm/z689.9は同じ質量をもつ2つの異なるフラグメントと一致した。一致したフラグメントの両方または一方が正しいフラグメントであるかどうかを判定するためには、さらに情報が必要である。
実施例1
図6乃至図8は第1の実施例を示す。図6に、実験によってフラグメント化されるオリゴ糖構造を示す。図7はそのm/Zスペクトルを示す。図8A乃至図8Cは、構造の2つのアイソフォームのグループ値が同じである場合に、両方の構造が方程式1で求めた際に同じ0.8の点をもっていても、強度外れの合計を正確な構造であって強度外れの合計が低い最初の構造と比較することによってアイソフォーム同士を識別することができる方法を説明する結果表を示す。
実施例2
図9乃至図11は第2の実施例を示す。図9に、実験によってフラグメント化されるオリゴ糖構造を示す。図10はそのm/Zスペクトルを示す。この表の最初の結果は完璧なグループ値と強度外れの最低数の両方を有しているので正確である。
上記具体的な実施形態に示すように、大まかに記述された本発明の精神や範囲から逸脱することなく本発明に対して多くの変形や変更を行い得ることは当該分野の技術者には十分に理解できるであろう。したがって、本実施形態はあらゆる点で本発明の例示と見なすべきであって、限定と見なすべきではない。
結果
図5はグリカン構造10のフラグメント化によるピーク値のグラフを示す。ピークm/z689.9は同じ質量をもつ2つの異なるフラグメントと一致した。一致したフラグメントの両方または一方が正しいフラグメントであるかどうかを判定するためには、さらに情報が必要である。
実施例1
図6乃至図8は第1の実施例を示す。図6に、実験によってフラグメント化されるオリゴ糖構造を示す。図7はそのm/Zスペクトルを示す。図8A乃至図8Cは、構造の2つのアイソフォームのグループ値が同じである場合に、両方の構造が方程式1で求めた際に同じ0.8の点をもっていても、強度外れの合計を正確な構造であって強度外れの合計が低い最初の構造と比較することによってアイソフォーム同士を識別することができる方法を説明する結果表を示す。
実施例2
図9乃至図11は第2の実施例を示す。図9に、実験によってフラグメント化されるオリゴ糖構造を示す。図10はそのm/Zスペクトルを示す。この表の最初の結果は完璧なグループ値と強度外れの最低数の両方を有しているので正確である。
上記具体的な実施形態に示すように、大まかに記述された本発明の精神や範囲から逸脱することなく本発明に対して多くの変形や変更を行い得ることは当該分野の技術者には十分に理解できるであろう。したがって、本実施形態はあらゆる点で本発明の例示と見なすべきであって、限定と見なすべきではない。
Claims (17)
- グリカンまたはグリカン誘導体の構造または部分構造を決定する方法であって、
未同定のグリカン分子の質量を実験から得る工程と、
上記未同定のグリカン分子の質量と確定グリカン構造とを比較し、上記グリカン分子の構造の候補を選択する工程と、
上記グリカン分子のフラグメントの質量を実験から得る工程と、
上記選択された候補を理論的にフラグメント化する工程と、
上記未同定のグリカン分子のフラグメントの質量を上記構造の候補から理論的に得られたフラグメントの質量と照合する工程と、
上記実験から得たフラグメントの質量と上記理論的に得られたフラグメントの質量とを比較することによって各構造の候補に順位付き信頼度点をつけるように採点する工程を含み、
最高順位で信頼度が不十分な場合に、上記理論的フラグメント化工程においてより複雑な開裂パターンを考慮するかあるいはフラグメントをさらに入手することによって、上記の手順を繰り返す工程をさらに含んでいる方法。 - 上記実験から求めた質量との比較に使用される初期フラグメントデータの集合は1開裂フラグメント化の結果物であるフラグメントのみからなっている請求項1記載の方法。
- 上記初期フラグメントデータの集合は専らグリコシド開裂型から形成された2開裂現象も含んでいる請求項2記載の方法。
- 採点は、aを1開裂現象に割り当てられた開裂点の数とし、bを2開裂フラグメントに割り当てられた開裂点の数とするとき、採点=(a−0.25b)/(m−1)のアルゴリズムを用いて行われる請求項1乃至3のいずれか一項に記載の方法。
- 採点は、セグメント化採点法を用いて、一致したオリゴ糖フラグメントの集合によって同定されたグリカンの考えられる立体配座の数を計数し、特定の立体配座が証拠となるフラグメントによってどの程度裏づけされているかを求めることにより上記構造候補の少なくとも1つの一致の品質を評価することによって上記構造候補の順位付き信頼度点を求めるようにして行われる請求項1記載の方法。
- 上記セグメント化採点法は上記構造候補の複数に対して使用される請求項5記載のグリカンまたはグリカン誘導体の構造または部分構造を決定する方法。
- 1開裂フラグメント化から生じた順番付きセグメント群の採点が、各セグメントの配列の数を各セグメントが他のセグメントに結合可能な点の最小数で乗算することによって算出される請求項5または6記載のグリカンまたはグリカン誘導体の構造または部分構造を決定する方法。
- 上記採点はセグメント内の単糖の配列の数を順番付きセグメントが結合する点の数で乗算したものとして算出される請求項5乃至7のいずれか一項に記載のグリカンまたはグリカン誘導体の構造または部分構造を決定する方法。
- 2個のセグメント間の境界をまたぐ2開裂からの追加の情報を利用してセグメントが結合可能な考えられる位置の数を減少させる請求項7記載のグリカンまたはグリカン誘導体の構造または部分構造を決定する方法。
- グリカンまたはグリカン誘導体の構造または部分構造を決定する方法であって、
未同定のグリカン分子の質量を実験から得る工程と、
上記未同定のグリカン分子の質量と確定グリカン構造とを比較し、上記グリカン分子の構造の候補を選択する工程と、
上記グリカン分子のフラグメントの質量を実験から得る工程と、
上記選択された候補を理論的にフラグメント化する工程と、
上記未同定のグリカン分子のフラグメントの質量を上記構造の候補から理論的に得られたフラグメントの質量と照合する工程と、
セグメント化採点法を用いて、一致したオリゴ糖フラグメントの集合によって同定されたグリカンの考えられる立体配座の数を計数し、特定の立体配座が証拠となるフラグメントによってどの程度裏づけされているかを求めることにより上記構造候補の少なくとも1つの一致の品質を評価することによって上記構造候補の順位付き信頼度点を求める工程を含んでいる方法。 - 上記セグメント化採点法は上記構造候補の複数に対して使用される請求項10記載のグリカンまたはグリカン誘導体の構造または部分構造を決定する方法。
- 1開裂フラグメント化から生じた順番付きセグメント群の採点が、各セグメントの配列の数を各セグメントがその次のセグメント内で結合可能な点の最小数で乗算することによって算出される請求項10または11記載のグリカンまたはグリカン誘導体の構造または部分構造を決定する方法。
- 上記採点はセグメント内の単糖の配列の数を順番付きセグメントが結合する点の数で乗算したものとして算出される請求項10乃至12のいずれか一項に記載のグリカンまたはグリカン誘導体の構造または部分構造を決定する方法。
- 2個のセグメント間の境界をまたぐ2開裂からの追加の情報を利用してセグメントが結合可能な考えられる位置の数を減少させる請求項13記載のグリカンまたはグリカン誘導体の構造または部分構造を決定する方法。
- 小セグメントのサイズが一様でない場合と独立開裂が多数の場合を考慮する工程をさらに含んでいる請求項13記載のグリカンまたはグリカン誘導体の構造または部分構造を決定する方法。
- 重複するフラグメントと既知の場合には化学的にあり得ないフラグメント化とを省いてフラグメントの量と処理すべきデータ量とを削減する請求項10乃至15のいずれか一項に記載のグリカンまたはグリカン誘導体の構造または部分構造を決定する方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2003902907A AU2003902907A0 (en) | 2003-06-11 | 2003-06-11 | Characterisation of glycans |
AU2003905990A AU2003905990A0 (en) | 2003-10-31 | Characterisation of glycans | |
PCT/AU2004/000768 WO2004108742A1 (en) | 2003-06-11 | 2004-06-10 | Method of identifying glycan structures using mass spectrometer data |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006527371A true JP2006527371A (ja) | 2006-11-30 |
Family
ID=33512073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006515535A Withdrawn JP2006527371A (ja) | 2003-06-11 | 2004-06-10 | 質量分析計のデータを用いたグリカン構造同定方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20080142695A1 (ja) |
EP (1) | EP1648911A1 (ja) |
JP (1) | JP2006527371A (ja) |
WO (1) | WO2004108742A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018181320A1 (ja) * | 2017-03-29 | 2018-10-04 | 一般財団法人石油エネルギー技術センター | 多成分混合物の分子構造を近似的に特定する方法及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6017693A (en) * | 1994-03-14 | 2000-01-25 | University Of Washington | Identification of nucleotides, amino acids, or carbohydrates by mass spectrometry |
GB9710582D0 (en) * | 1997-05-22 | 1997-07-16 | Oxford Glycosciences Uk Ltd | A method for de novo peptide sequence determination |
US6963807B2 (en) * | 2000-09-08 | 2005-11-08 | Oxford Glycosciences (Uk) Ltd. | Automated identification of peptides |
FR2844357A1 (fr) * | 2002-09-10 | 2004-03-12 | Centre Nat Rech Scient | Procede de determination de molecules branchees a partir de donnees de masse |
US7297940B2 (en) * | 2005-05-03 | 2007-11-20 | Palo Alto Research Center Incorporated | Method, apparatus, and program product for classifying ionized molecular fragments |
-
2004
- 2004-06-10 JP JP2006515535A patent/JP2006527371A/ja not_active Withdrawn
- 2004-06-10 US US10/560,193 patent/US20080142695A1/en not_active Abandoned
- 2004-06-10 WO PCT/AU2004/000768 patent/WO2004108742A1/en active Application Filing
- 2004-06-10 EP EP04736491A patent/EP1648911A1/en not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018181320A1 (ja) * | 2017-03-29 | 2018-10-04 | 一般財団法人石油エネルギー技術センター | 多成分混合物の分子構造を近似的に特定する方法及びプログラム |
JP2018169280A (ja) * | 2017-03-29 | 2018-11-01 | 一般財団法人石油エネルギー技術センター | 多成分混合物の分子構造を近似的に特定する方法及びプログラム(csa1) |
US11275053B2 (en) | 2017-03-29 | 2022-03-15 | Japan Petroleum Energy Center | Method and program for approximately identifying molecular structure of multicomponent mixture |
Also Published As
Publication number | Publication date |
---|---|
EP1648911A1 (en) | 2006-04-26 |
US20080142695A1 (en) | 2008-06-19 |
WO2004108742A1 (en) | 2004-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Joshi et al. | Development of a mass fingerprinting tool for automated interpretation of oligosaccharide fragmentation data | |
Tang et al. | Automated interpretation of MS/MS spectra of oligosaccharides | |
JP4824170B2 (ja) | ポリマーを表記するためのシステムおよび方法 | |
Woodin et al. | Software for automated interpretation of mass spectrometry data from glycans and glycopeptides | |
Goldberg et al. | Automated N-glycopeptide identification using a combination of single-and tandem-MS | |
JP2006518448A (ja) | 糖ペプチドの同定および解析 | |
EP3544016A2 (en) | Methods for combining predicted and observed mass spectral fragmentation data | |
Duan et al. | An automated, high-throughput method for interpreting the tandem mass spectra of glycosaminoglycans | |
Peltoniemi et al. | De novo glycan structure search with the CID MS/MS spectra of native N-glycopeptides | |
CN112326769B (zh) | 一种鉴定完整糖肽上n-糖链分支结构的方法 | |
Ju et al. | De novo glycan structural identification from mass spectra using tree merging strategy | |
EP1419383A2 (en) | System and method for storing mass spectrometry data | |
JP2006527371A (ja) | 質量分析計のデータを用いたグリカン構造同定方法 | |
Cuff et al. | ProtEST: protein multiple sequence alignments from expressed sequence tags | |
Kearney et al. | Elimination of redundant protein identifications in high throughput proteomics | |
Fridman et al. | The probability distribution for a random match between an experimental-theoretical spectral pair in tandem mass spectrometry | |
AU2004245134A1 (en) | Method of identifying glycan structures using mass spectrometer data | |
WO2001096861A1 (en) | System for molecule identification | |
JP2008175793A (ja) | 制約による高速・高精度な糖鎖配列決定法 | |
WO2022246416A2 (en) | Biomarkers for diagnosing ovarian cancer | |
Haslam et al. | Glycoinformatics for Structural Glycomics | |
WO2002014872A2 (en) | Sequence data preparation method and apparatus | |
WO2023197013A1 (en) | Mass spectrometry methods for determining glycoproteoform-based biomarkers | |
Hogan | Methods in automated glycosaminoglycan tandem mass spectra analysis | |
Van Domselaar | Laboratory 2.4: Mascot |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070606 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20080822 |