JP2018040787A - 流体クラスのサンプル、特に生物流体のサンプルにおけるnmrスピン系の化学シフト値を予測する方法 - Google Patents

流体クラスのサンプル、特に生物流体のサンプルにおけるnmrスピン系の化学シフト値を予測する方法 Download PDF

Info

Publication number
JP2018040787A
JP2018040787A JP2017115784A JP2017115784A JP2018040787A JP 2018040787 A JP2018040787 A JP 2018040787A JP 2017115784 A JP2017115784 A JP 2017115784A JP 2017115784 A JP2017115784 A JP 2017115784A JP 2018040787 A JP2018040787 A JP 2018040787A
Authority
JP
Japan
Prior art keywords
nmr
spin system
chemical shift
nmr spin
captured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017115784A
Other languages
English (en)
Other versions
JP6602818B2 (ja
Inventor
タキス パンテレイモン
Takis Panteleimon
タキス パンテレイモン
ルキナート クラウディオ
Luchinat Claudio
ルキナート クラウディオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bruker Biospin GmbH
Original Assignee
Bruker Biospin GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bruker Biospin GmbH filed Critical Bruker Biospin GmbH
Publication of JP2018040787A publication Critical patent/JP2018040787A/ja
Application granted granted Critical
Publication of JP6602818B2 publication Critical patent/JP6602818B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N24/00Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects
    • G01N24/08Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects by using nuclear magnetic resonance
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R33/00Arrangements or instruments for measuring magnetic variables
    • G01R33/20Arrangements or instruments for measuring magnetic variables involving magnetic resonance
    • G01R33/44Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
    • G01R33/46NMR spectroscopy
    • G01R33/4625Processing of acquired signals, e.g. elimination of phase errors, baseline fitting, chemometric analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R33/00Arrangements or instruments for measuring magnetic variables
    • G01R33/20Arrangements or instruments for measuring magnetic variables involving magnetic resonance
    • G01R33/44Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
    • G01R33/46NMR spectroscopy
    • G01R33/465NMR spectroscopy applied to biological material, e.g. in vitro testing

Landscapes

  • Physics & Mathematics (AREA)
  • High Energy & Nuclear Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Molecular Biology (AREA)

Abstract

【課題】特に生物流体のサンプルのNMRスペクトル内のピークの帰属を、より信頼性に、より容易に、特により迅速に可能にする。
【解決手段】NMR分光法を用いて、流体サンプルに含まれる化合物に属するNMRスピン系の化学シフト値を予測する方法は、a)流体に含まれるキャプチャーされた物質の濃度及び化学シフト値を含み、キャプチャーされた特性間の相関情報を表すモデルアプライアンスを提供するステップと、b)サンプルのNMRスペクトルを記録するステップと、c)モデルアプライアンスの定義された基準NMRスピン系に属する記録されたNMRスペクトル内のピークを同定し、化学シフト値を決定するステップと、d)基準NMRスピン系の実験による化学シフト値に対してモデルアプライアンスを適用し、基準NMRスピン系に属さないキャプチャーされたNMRスピン系のうちの少なくとも1つの化学シフト値を予測するステップとを含む。
【選択図】図4

Description

本発明は、NMR分光法を用いて、流体クラスのサンプルに含まれる化合物に属するNMRスピン系の化学シフト値を予測する方法に関する。
NMR分光法は、サンプルの定性的及び定量的な組成を研究するための強力なツールである。最近の生化学及び医学において、尿などの生物流体の組成は、科学者及び医者にとって価値が高い。同様に、例えば、化学及び食品技術において、サンプルの組成は、特に品質管理に非常に重要である。
一般に、生物流体のサンプルを調べるために一次元NMR実験が利用される。サンプルから記録されたNMRスペクトルにおいて、サンプルに含まれる化合物のNMRスピン系は、NMR信号(ピーク)を発生させる。特定の化合物のNMRスピン系に属する1つ又は複数のピークの形状及びサイズによって、この化合物の濃度を求めることができる。
しかし、尿などの典型的な生物流体には、関連するNMRスピン系を有する多数の化合物が含まれ、したがって、それらの対応するピークが重なる。同じことが、一般に、他の流体クラスのサンプルに当てはまる。さらに、そのpH、温度、又は含まれる物質(又は代謝産物)の濃度など、サンプルの特性に応じて、同じNMRスピン系のピーク位置がサンプル間で変化することがある。これによって、NMRスペクトル内に見られるピークを正しいNMRスピン系又は化合物にそれぞれ帰属させることが困難になる。したがって、ピークをNMRスピン系に帰属させることは、通例、十分な時間を必要とする経験豊富な専門家の仕事であり、経験豊富な専門家でさえ誤った帰属をして、誤った定性的又は定量的な組成情報を招くことがある。
スパイクとして知られる方法では、サンプルのNMRスペクトルを記録した後、関心のある化合物をサンプル中で増やして、別のNMRスペクトルを記録する。元のサンプルと化合物を増やしたサンプルのNMRスペクトルを比較することによって、特に特定のピーク強度の増加を比較することによって、より信頼性の高いピークの帰属が実現され得る。しかし、この方法は非常に手の込んだものであり、元のサンプルの組成を変えてしまう。
また、コンピュータ支援ピーク同定ツールも存在するが、これらは一般に高い計算能力や長い計算時間を必要とし、時々起こる誤ったピークの割り当てが避けられず、化学分析において、誤った「肯定的な」結果を招くことがある。さらに具体的には、BATMAN(BQuantにも当てはまる)は、モンテカルロマルコフ連鎖アルゴリズムを使用して、ユーザが事前に定義したppm領域内の各NMRスピン系のベイズ(Bayesian)モデルを計算し、これには相当な計算量を必要とする。さらに、BATMAN(及びBQuant)は、完全に自動化された帰属ツールとして設計されておらず、これらは、毎回、代謝産物の帰属及び定量化のための組み込みデータベースを必要とする。BATMANでは、ただ2つの代謝産物のフィッティングを行うとき、1つのスペクトルからの狭いppm範囲の動作に30秒程度かかり、典型的な約200のスペクトルのデータセットでは、約25の代謝産物のフィッティングに、最先端のコンピュータ機器を用いて数日かかることがある。
特許文献1(米国特許第7,191,069号明細書)では、特定のpHなど、測定された条件下のサンプルからNMR試験スペクトルを得ること、及びサンプル中に存在すると思われる化合物の1セットの基準スペクトルをライブラリから選択するために、この測定された条件を使用することが提案されている。このセットからの基準スペクトルを組み合わせる(combing)ことによりマッチング化合物スペクトルが生成され、そのピークは試験スペクトルのピークと一致する。マッチングスペクトルを生成するために用いられる基準スペクトルに関連する化合物が、サンプルに含まれる化合物を示すと考えられている。
特許文献2(米国特許出願公開第2015/009966号号明細書)には、哺乳類の生物サンプル中のバイオマーカーのレベルを測定し、転移性疾患を特徴付けるために、これらのレベルと1つ又は複数のコアバイオマーカー基準レベルとを比較するための1H NMR分光法の使用が開示されている。
米国特許第7,191,069号明細書 米国特許出願公開第2015/0099668号明細書
本発明の目的は、サンプルに含まれる化合物のNMRスピン系への流体クラス、特に生物流体のサンプルのNMRスペクトル内のピークの帰属を、より高信頼性で、より容易に、特により迅速に可能にすることにある。
この目的は、本発明によれば、NMR分光法を用いて、流体クラスのサンプルに含まれる化合物に属するNMRスピン系の化学シフト値を予測する方法によって達成され、この方法は、
a)流体クラスに含まれるキャプチャーされた物質の濃度、及び流体クラスに含まれると共に、キャプチャーされた物質の中にある化合物に属するキャプチャーされたNMRスピン系の化学シフト値を含み、流体クラスのキャプチャーされた特性間の相関情報を表すモデルアプライアンスを提供するステップであって、モデルアプライアンスは、キャプチャーされたNMRスピン系のサブセットであると共に、流体クラスに遍在する化合物に属する基準NMRスピン系の定義を含むステップと、
b)流体クラスのサンプルのNMRスペクトルを記録するステップと、
c)モデルアプライアンスの定義された基準NMRスピン系に属する記録されたNMRスペクトル内のピークを同定し、且つ記録されたNMRスペクトルからピークの実験による化学シフト値を決定するステップと、
d)基準NMRスピン系の実験による化学シフト値(10)に対してモデルアプライアンスを適用することによって、基準NMRスピン系に属さないキャプチャーされたNMRスピン系のうちの少なくとも1つの化学シフト値(30)を予測するステップとを含む。
本発明は、初めに、予め定義した基準NMRスピン系に属する流体クラスのサンプルの記録されたNMRスペクトル内で2〜3本のピークのみを同定し、記録されたNMRスペクトルから、それらの化学シフト値(又はピーク位置)を決定することを提案する。モデルアプライアンスにより、基準NMRスピン系の実験による化学シフト値に基づいて、基準NMRスピン系ではないNMRスピン系(「非基準NMRスピン系」)に属する1つ又は多数の他のピークの化学シフト値が予測される。これらの予測値を、非常に信頼性の高いピーク同定のために使用することができる。
本発明は、含まれる特定の物質の濃度など、サンプルの特性が、異なる化合物の多数のNMRスピン系に属するピークの位置に同時に影響することを利用する。これは、サンプルの多くの特性、特に含まれる物質の濃度についても同時に当てはまる。このことは、含まれる異なる化合物の多数のNMR系に属するピークの位置が、サンプルの多くの特性、特に含まれる物質の濃度を介して相互に依存することを意味する。
本発明者らは、他のNMRスピン系、すなわち非基準スピン系のピーク位置を良好な精度で予測するためには、多数のNMRスピン系のピーク位置の相互依存性により、関心のあるNMRスピン系、すなわち基準NMRスピン系のサブセット(すなわち一部)のピーク位置が分かれば十分であることを見出した。関心のある特定のNMRスピン系に属するピークの予測されたピーク位置(又は化学シフト値)によって、記録されたNMRスペクトル内の対応するピークを同定することは容易である。一般に、NMRスピン系について予測されたピーク位置に最も近い記録されたNMRスペクトル内のピークは、各NMRスピン系に属するピークと見なされる。本発明によって、少数の基準ピークに対する従来のピーク同定の必要性が少なくなり、非基準NMRスピン系のピークの簡素化されたピーク同定が可能になる。
基準NMRスピン系は一般に、この流体クラス(例えば、生物流体のタイプ)について十分に予想することができるサンプルの特性のすべての組み合わせについて、例えば、それらのピークが、近くのすべての他のピークよりもはるかに強いことから、又はそれらの特徴的な形状パターンに基づいて、それらのピークが近くの他のピークから容易に区別されることから、それらの対応するピークがスペクトル内で容易に同定されるように選ばれる。基準NMRスピン系に属するピークは、サンプルの記録されたNMRスペクトル内で(非専門家によってさえも)手動で同定したり、又は適したソフトウェアによって自動的に、通常、ピークが現れる既知の化学シフトの間隔を利用して、且つ/又は、例えば、二重線において同じピーク積分又は強度など、チェック基準を適用して同定したりすることができる。さらに、基準NMRスピン系に属する化合物は、任意の流体クラスのサンプル中に、影響力を持つ他のNMRスピン系にとって関連する最小濃度で存在するはずである(「遍在する化合物」)。さらに、基準NMRスピン系に属する化合物は、相当な数のNMRスピン系(場合によっては、それ自体を含む)に著しく影響するはずである。
サンプルが属する流体クラスの相関関係情報は、好ましくは、ティーチングデータベースからの情報に基づくモデルアプライアンス内に保存される。ティーチングデータベースは、大量の試験サンプルについて、サンプル特性、特に物質濃度、及びNMRスペクトル内で同定される、含まれる化合物のNMRスピン系に属する化学シフト値(ピーク位置)を含む。モデルアプライアンスが予め得られてもよく、したがって、後に、ステップd)において予測された化学シフト値を計算するとき、(数秒のこととして)迅速に行うことができて、一般に少数の式を解くことのみを必要とする、最終的なモデルアプライアンスのみ適用する必要がある。モデルアプライアンスは通常、好ましくは完全に自動的に動作するソフトウェアツールとして実施される。
モデルアプライアンス(及び基礎となるティーチングデータベース)が、有限個のNMRスピン系(又はそれらの各化学シフト値)と有限個の特性とを関連付けることに留意されたい。一般に、モデルアプライアンスに含まれる特性が多いほど、化学シフト値の予測をより正確にすることができる。一般に、少なくとも流体クラスにおいて最も多い物質の濃度をモデルに含めることが望ましい。さらに、対象として含まれるNMRスピン系が多いほど、NMRスペクトル内で予測され得るピークが多くなる。
さらに、使用される基準NMRスピン系が多いほど、非基準NMRスピン系の化学シフト値の予測がより正確になる。しかし、使用する基準NMRスピン系が多すぎるとき、ステップc)のピーク同定は一般に、より困難になり、より時間がかかる。したがって、基準ピーク系の数Rについては、3≦R≦8であることが好ましい。キャプチャーされた非基準NMRスピン系の数Nに関しては、R≦1/4Nであることが好ましい。
流体クラスは、濃度がさまざまではあるが、任意の流体クラスのサンプルに含まれ、いくつかの物質(遍在する物質)によって特徴付けられ、しばしば、さまざまな濃度で流体クラスのサンプルに場合によって含まれるいくつかの物質(偶発する物質)によっても特徴付けられる。一般に、物質は、流体クラスのサンプルにおいて、限られた範囲の濃度で、又は限られた範囲の濃度比で存在する。通常、ある流体クラスについて、見出す(又は定義する)ことができる少なくとも10の遍在する物質が存在し、場合によっては、ある流体クラスについて、50以上もの遍在する物質を見出す(又は定義する)ことができる。本発明によれば、流体クラスは概して、少なくとも10重量%の水分を含む水成タイプである。
典型的な流体クラスは、特定の種(ヒト又はネコなど)の特定の生物流体(尿又は血清など)であり;人によって、又は例えば疾病によってサンプルのばらつきが通常発生する。生物流体において、物質は一般に代謝産物である。他の流体クラスは、例えば、ボディケアローション、調味料(ケチャップなど)又はエナジードリンクでもよい。
特定の流体クラスについて、モデルアプライアンスによってキャプチャーされた物質は、流体クラスに既知の遍在する物質又は偶発する物質でもよい。一般に、モデルアプライアンスは、流体クラスについて、既知の遍在及び/又は偶発する物質の一部のみをキャプチャーする。
化合物は、1つ又は複数のNMRスピン系を有する遍在する物質及び/又は偶発する物質である。基準NMRスピン系に属する化合物は、1つ又は複数のNMRスピン系を有する(キャプチャーされた)遍在する物質から選ばれる。
NMRスピン系は通常、1H NMRスピン系である。NMRスペクトルは通常、一次元NMRスペクトルである。
以上及び以下において、用語「キャプチャーされた」は、言及したパラメータが、モデルアプライアンスの相関情報又はティーチングデータベースのそれぞれに含まれることを意味する。サンプルの「特性」は、物質濃度、pH値及び/又は温度Tを含んでもよい。「物質」は、本明細書において、流体クラス中の分子及び/又はイオン(無機イオンを含む。)を意味する;ただし、対イオンのない単一タイプのイオン(Clなど)は、本明細書において、物質と見なしてよいことに留意されたい。「代謝産物」は、本明細書において、生物流体中の物質、すなわち、分子及び/又はイオン(無機イオンを含む。)を意味する。「化合物」は、本明細書において、少なくとも1つのNMRスピン系を有する物質を意味する。キャプチャーされたNMRスピン系は、基準NMRスピン系及び非基準NMRスピン系を含む。
本発明の方法の好ましい変形例
基準NMRスピン系に関する変形例
本発明の方法の好ましい変形例において、基準NMRスピン系は、その化学シフト値が、モデルアプライアンスによって決まると共に、平均を超える量の濃度のキャプチャーされた物質にとって有意であるキャプチャーされたNMRスピン系から選ばれる。これは、予測誤差を小さくする。好ましくは、基準NMRスピン系は、それらが最大量の著しく影響を受けた濃度を有するように選ばれる。概して、基準NMRスピン系は、他のピークから遠く離れた強いピークを伴うはずであり、したがって、それらのピークは、異なるサンプル組成の記録されたNMRスペクトル内で、手動で又は自動的に安全に同定することができる。著しく影響を受けた濃度の量は、例えば、フルタイプの第2のサブモデルの要素j=1,…,Cに適用されたANOVA分解によって求めることができる(下記参照)。さらに、基準NMRスピン系は、好ましくは、各物質濃度が、基準NMRスピン系の少なくとも2つの化学シフト値に著しく影響を与えるように選ばれる。
別の好ましい変形例において、基準NMRスピン系は、統計的相関分析法、特にANOVA分解又はスピアマン(Spearman)の順位相関又はケンドール(Kendall)の順位相関又は疑似計算又は正準相関分析を用いて決定される。統計的相関分析法は、物質濃度(又は、より一般にはサンプル特性)について関連性が高いNMRスピン系の化学シフト値と、関連性が低いものとを区別し、したがって、高い関連性(好ましくは最も高い関連性)を伴うNMRスピン系がNMR基準ピークとして選ばれてもよい。統計的相関分析法を利用して、例えば、NMRスピン系の特定の化学シフト値により、著しく影響を受けた濃度の量を確認することができる。ただし、基準NMRスピン系を選ぶとき、NMRスピン系又はその合成物それぞれの存在量も考慮されてよいことに留意されたい。
サブモデルに関する変形例
好ましい変形例において、モデルアプライアンスは、基準NMRスピン系のみの化学シフト値δの関数fとしてキャプチャーされた特性xを示す削減タイプの第1のサブモデルを含み、x=f(δ1,…,δ)(式中、j:キャプチャーされた特性の添数(j=1,…,C;Cはキャプチャーされた特性の数)、並びにi:基準NMRスピン系の添数(i=1,…,R;Rは基準NMRスピン系の数))である。好ましくは、3≦R≦8である。この削減タイプの第1のサブモデルは、非基準NMRスピン系の化学シフト値を同定するために、フルタイプの第1のサブモデルを適用するための基礎を与える(下記参照)。削減タイプの第1のサブモデルはまた、サンプルの特性の粗い推定に使用することもできる。
同様に好ましいのは、モデルアプライアンスが、基準NMRスピン系のみの化学シフト値δの関数fとして非基準NMRスピン系の化学シフト値δを示す削減タイプの第2のサブモデルを含み、δ=f(δ1,…,δ)(式中、k:非基準NMRスピン系の添数(k=1,…,N;Nはキャプチャーされた非基準NMRスピン系の数)、並びにi:基準NMRスピン系の添数(i=1,…,R;Rは基準NMRスピン系の数))である変形例である。削減タイプの第2のサブモデルは、非基準NMRスピン系の化学シフト値の粗い推定値を直接与えることができる。しかし、削減タイプの第2のサブモデルはまた、非基準NMRスピン系の化学シフト値の改善された推定値を得るために、フルタイプの第2のサブモデル及びフルタイプの第1のサブモデルを適用するための基礎を与えることができる(下記参照)。ただし、モデルアプライアンスは、削減タイプの第1及び第2のサブモデルのうちのただ1つ又は両方を含んでもよいことに留意されたい。
別の好ましい変形例において、モデルアプライアンスは、キャプチャーされた特性xの関数fとして非基準NMRスピン系又はすべてのキャプチャーされたNMRスピン系の化学シフト値δを示すフルタイプの第1のサブモデルを含み、δ=f(x1,…,)(式中、l:NMRスピン系の添数(l=1,…,N;Nは非基準NMRスピン系の数、又はl=1,…,S;SはすべてのキャプチャーされたNMRスピン系の数)、並びにj:キャプチャーされた特性の添数(j=1,…,C;Cはキャプチャーされた特性の数))である。フルタイプの第1のサブモデルは、少なくとも非基準NMRピークの化学シフト値の予測を可能にし、したがって、基準NMRスピン系の実験による化学シフト値と共に、対象として含まれる特性のフルセットに基づいて、すべての対象として含まれるNMRスピン系の化学シフト値のフルセットが得られてもよい。これは、反復プロセスにおいて、改善された予測精度のために使用することができる。フルタイプの第1のサブモデルが、一部又はすべての基準NMRスピン系の化学シフト値も予測する場合、実験による化学シフト値と予測された化学シフト値との比較は、モデルアプライアンスの複数の適用において到達する収束度についての推定を可能にする(下記参照)。
さらに好ましいのは、モデルアプライアンスが、キャプチャーされたNMRスピン系の化学シフト値δの関数fとして特性xを示すフルタイプの第2のサブモデルを含み、x=f(δ1,…,δ)(式中、j:キャプチャーされた特性の添数(j=1,…,C;Cはキャプチャーされた特性の数)、並びにl:キャプチャーされたNMRスピン系の添数(l=1,…,S;SはキャプチャーされたNMRスピン系の数))である変形例である。フルタイプの第2のサブモデルは、化学シフト値(これらは通常、部分的に実験によるもの、及び部分的に予測されたものであるが、すべて実験によるもの、又はすべて予測されたものでもよい。)のフルセットに基づいて、キャプチャーされた特性のフルセットの予測を可能にする。フルタイプの第2のサブモデルは通常、非基準NMRスピン系の化学シフト値の予測値を得るための反復プロセスの一部である。これはまた、特性、特に、イオンなど、NMR活性でない物質の濃度を含む物質濃度の推定値を得るために使用することもできる。
ステップd)の間に、削減タイプの第1のサブモデル及び上述のフルタイプの2つのサブモデルを導入する変形例を適用する別の開発において、以下のサブステップが適用される。すなわち、d1)削減タイプの第1のサブモデルが、基準NMRスピン系の実験による化学シフト値に対して適用されて、予測された特性を得るサブステップ;d2)フルタイプの第1のサブモデルが先のサブステップd1)の予測された特性に対して適用されて、非基準NMRスピン系の予測された化学シフト値を得るサブステップ;d3)フルタイプの第2のサブモデルが基準NMRスピン系の実験による化学シフト値及び先のサブステップd2)において得られた非基準NMRスピン系の予測された化学シフト値に対して適用されて、予測された特性を得るサブステップ;d4)フルタイプの第1のサブモデルが、先のサブステップd3)において得られた予測された特性に対して適用されて、非基準NMRスピン系の予測された化学シフト値を得るサブステップである。特に、サブステップd3)及びd4)のシーケンスが数回繰り返され、次いで、先のステップd4)において得られた非基準NMRスピン系の予測された化学シフト値から開始する。これは、非基準スピン系の化学シフト値の比較的正確な予測を可能にする。ステップd3)及びd4)のシーケンスを数回適用することによって、化学シフト値の収束が起こり、予測品質を改善する。
ステップd)の間に、削減タイプの第2のサブモデル及び上述のフルタイプの2つのサブモデルを導入する変形例を適用するさらに別の開発において、以下のサブステップが適用される。すなわち、d1’)削減タイプの第2のサブモデルが基準NMRスピン系の実験による化学シフト値に対して適用されて、非基準NMRスピン系の予測された化学シフト値を得るサブステップ;d2’)フルタイプの第2のサブモデルが基準NMRスピン系の実験による化学シフト値及び先のサブステップd1’)において得られた非基準NMRスピン系の予測された化学シフト値に対して適用されて、予測された特性を得るサブステップ;d3’)フルタイプの第1のサブモデルが先のサブステップd2’)において得られた予測された特性に対して適用されて、非基準NMRスピン系の予測された化学シフト値を得るサブステップである。特に、ステップd2’)及びd3’)のシーケンスが数回繰り返され、次いで、先のステップd3’)において得られた非基準NMRスピン系の予測された化学シフト値から開始する。これは、やはり、非基準スピン系の化学シフト値の比較的正確な予測を可能にする。ステップd2’)及びd3’)のシーケンスを数回適用することによって、化学シフト値の収束が起こり、予測品質を改善する。
ティーチングデータベースに関する変形例
特に好ましいのは、モデルアプライアンスが、ティーチングデータベースから得られ、ティーチングデータベースが、流体クラスの複数のティーチングサンプルの各々について、以下を含む変形例である。
この変形例は、
−キャプチャーされた物質の濃度の値を含む、キャプチャーされた特性の値と、
−各ティーチングサンプルの記録されたティーチングNMRスペクトル、及びティーチングNMRスペクトル内のピークの、キャプチャーされたNMRスピン系への帰属、特に手動の帰属、並びにそれらの化学シフト値の決定により得られたキャプチャーされたNMRスピン系の化学シフト値とを含む。
ティーチングデータベースは、モデルアプライアンスに必要な相関情報を提供することができる。ただし、原則的に、量子力学的計算を適用して相関情報を得てもよいが、これは実施するのが比較的困難であることに留意されたい。典型的な特性の数は20以上であり、通常、少なくとも10の特性がキャプチャーされたNMRスピン系に属する化合物の濃度であり、少なくとも5つの特性がNMR不活性な物質(例えば、塩化物イオン又はオキソニウムイオンなどのイオン)の濃度である。別の特性が、サンプル温度又はpHであってもよい(後者が物質の濃度として扱われない場合)。キャプチャーされる(対象として含まれる)NMRスピン系の典型的な数は少なくとも20である。データベースに含まれるティーチングサンプルの総数は通常、少なくとも500、好ましくは少なくとも1000、特に好ましくは少なくとも3000である。ティーチングサンプル(及び測定されるサンプル)は特定の流体クラスに属する。流体クラスは特に、尿など、特定のタイプの生物流体に対応するように選ばれてもよい。ティーチングサンプルは、好ましくは、測定されるサンプルにおいて、例えば、さまざまな疾病による、又は単にさまざまな人又は起源による(ただし、通常、ヒト及びイヌなどのさまざまな種には依らない)生物流体において存在することが予想される範囲内のこの流体クラスのさまざまな組成を表す。同じことが、植物由来の生成物に当てはまり、これは、さまざまな起源からの同じ生成物、例えば、リンゴジュースであるべきである。一度モデルアプライアンスがティーチングデータベースから完全に導かれると、ティーチングデータベースは、それ以上本発明の方法を適用する必要がないことに留意されたい。
この変形例の別の開発において、流体クラスのティーチングサンプルの少なくとも一部は流体クラスの人工サンプルであり、特に、ここで、人工ティーチングサンプルは、モデルアプライアンスによってキャプチャーされた物質のみを含む。人工サンプルについては、濃度が設定されてもよく、したがって周知である。さらに、限られた数の物質(キャプチャーされた物質など)のみを含むとき、ティーチングデータベースを準備するためのピーク同定はより容易である。この別の開発は、流体クラスが生物流体に対応するとき、「天然」サンプルの入手が困難である場合、極めて大量の化合物が含まれている可能性があるためにティーチングデータベースを構築するときに「天然」サンプルのピークの同定が難しい場合、特に有用である。
さらに別の有利な開発において、各キャプチャーされた物質について、少なくとも3つ、好ましくは少なくとも5つの異なる濃度のティーチングサンプルが含まれる。これは、予測誤差を低く保つ。好ましくは、キャプチャーされた物質について含まれる異なる濃度は、サンプル中の物質の濃度がである範囲を対象に含む。さもなければ、予測はさらに大きな誤差を有する。生物流体については、典型的な対象範囲は、しばしば文献に記載されている、選ばれた生物流体中に天然に存在する代謝産物の最大濃度及び最小濃度によって決定される。人工生成物については、工業的標準値が対象範囲を含んでもよい。
好ましい別の開発は、キャプチャーされた特性が温度を含み、且つ代謝産物の濃度の各セットについて、少なくとも2つの異なる温度のティーチングサンプルが含まれることを提供する。キャプチャーされた特性に温度を含むとき、異なる温度で取得されたサンプルNMRスペクトルを、本発明によって向上した予測精度で扱うことができる。ただし、さらに、NMRスペクトルを記録する間のサンプルの特別な調質は不要になることに留意されたい。
有利な別の開発において、モデルアプライアンス、又は1つ又は複数のそのサブモデルは、多変量統計アルゴリズムによるティーチングデータベースから得られ、特に、多変量統計アルゴリズムは自己学習アルゴリズムである。多変量統計アルゴリズムは、ティーチングデータベースから相関情報を抽出し、それをモデルアプライアンス又はそのサブモデルそれぞれに入力するための強力なツールを提供する。この文脈において、自己学習は、相関の統計出力、すなわち、モデルアプライアンスを継続的に改善することができるように、且つ/又は流体クラス中に存在する別の化合物(又は化合物の追加のNMRスピン系及びそれらの濃度それぞれ)にこの方法を拡張することができるように、追加のティーチングサンプル(又はそれらの化学シフト値及び特性それぞれ)をティーチングデータベースに統合することができることを意味する。
上述の別の開発について、多変量統計アルゴリズムは、多変量適応型回帰(一次及び三次)スプライン(MARS)モデル、(直交)部分最小二乗(PLS)判別分析、主成分分析、主成分回帰、多重線形回帰、局所加重回帰、マハラノビス距離に基づく分析、クラスアナロジーのソフト独立モデリング(SIMCA)、K近傍法、サポートベクターマシン(SVM)解析、線形判別分析又は古典的な最小二乗判別分析、人工ニューラルネットワーク、階層的モデリング/クラスタリング、分布に基づくクラスタリング、平行因子分析から選択されてもよい。
その他の変形例
好ましい変形例は、流体クラスが生物流体として選ばれることを規定し、特に、ここで、キャプチャーされた物質は代謝産物である。生物流体は特に多数の化合物を含み、これにより(従来の)ピーク同定を非常に困難にする。したがって、本発明の方法は、この場合に特に有用である。生物流体については、遍在する物質及び偶発する物質並びにそれらの濃度範囲又は濃度比範囲が文献に記載されていることが多く、ティーチングデータベースを容易に立案することができる。生物流体のサンプルは、必要又は希望に応じて、この変形例に従って、無希釈状態又は希釈状態で扱うことができることに留意されたい。
この変形例の好ましい別の開発において、生物流体は、好ましくは、尿、血清、汗、唾液又はCSF(脳脊髄液)から選択される体液であり、又は生物流体は、好ましくは果汁、乳糜又は花蜜から選択される植物流体である。体液では、本発明の分析後、NMRスペクトルを疾病の非常に信頼性の高い同定のために使用することができる。植物流体に関する限り、NMRスペクトルを、より正確な品質管理又は起源の検証のために使用することができる。
別の好ましい変形例において、流体クラスは、天然由来の生成物、特に、好ましくはワイン、蜂蜜又は調味料から選択される植物由来の生成物として選ばれる。やはり、本発明の分析後、NMRスペクトルを、より正確な品質管理又は起源の検証のために使用することができる。
有利な変形例において、流体クラスは、特にリン酸緩衝液を使用して、6.6〜7.5の間のpH範囲に和らげられる。この方法は化学シフト値のばらつきを抑え、したがって、化学シフト値の予測を簡素化する。ただし、一部のタイプの流体クラス、特に、血清などの一部のタイプの生物流体は元来緩衝され、したがって、サンプル/試験サンプルにおいて追加の緩衝化は必要ないことに留意されたい。
濃度測定に関する方法
また、本発明の範囲内には、NMR分光法によって、流体クラスのサンプルに含まれる少なくとも1つの物質の濃度を測定する方法があり、この方法は、
aa)上述の本発明の方法のステップa)からd)に従って、キャプチャーされたNMRスピン系の非基準NMRスピン系の化学シフト値を予測するステップと、
bb)予測された化学シフト値により、非基準NMRスピン系に属する記録されたNMRスペクトル内のピークを同定し、且つ記録されたNMRスペクトルからピークの実験による化学シフト値を決定するステップと、
cc)基準NMRスピン系及び非基準NMRスピン系の実験による化学シフト値に対してモデルアプライアンスを適用することによって、特に、上述のフルタイプの第2のサブモデルを適用することによって、少なくとも1つの物質の濃度を計算するステップとを含む。
この方法は、どのような複雑なピーク積分又は線形フィッティングも行わずに、物質濃度の良好な予測を提供することができる。この方法は、基準及び非基準NMRスピン系の両方に実験による化学シフト値を使用するため、比較的正確である。好ましくは、すべてのキャプチャーされたNMRスピン系がステップcc)において使用される。ただし、ステップbb)において、ピークが弱すぎて記録されたNMRスペクトル内に見つけられない場合、次のステップcc)のために、予測された化学シフト値を実験による化学シフト値とすることができることに留意されたい。
さらに、本発明の範囲内に、NMR分光法によって、流体クラスのサンプルに含まれる少なくとも1つの物質の濃度を測定する方法があり、この方法は、
aa’)上述の本発明の方法のステップa)からd)に従って、キャプチャーされたNMRスピン系の非基準NMRスピン系の化学シフト値を予測するステップと、
bb’)基準NMRスピン系の実験による化学シフト値及びステップaa’)において得られた非基準NMRスピン系の予測された化学シフト値に対してモデルアプライアンスを適用することによって、特に、上述のフルタイプの第2のサブモデルを適用することによって、少なくとも1つの物質の濃度を計算するステップとを含む。
この方法は、どのような複雑なピーク積分又は線形フィッティングも行わずに、物質濃度の迅速な予測を提供することができる。NMRスペクトル内で基準NMRスピン系のピークさえ同定すればよいので、この方法は短時間で行うことができる。好ましくは、すべてのキャプチャーされたNMRスピン系がステップbb’)において使用される。
上述の2つの方法の好ましい変形例において、その濃度がNMR分光法によって測定される少なくとも1つの物質は、NMR不活性な物質、特にイオンを含む。本発明により、他の物質におけるNMRスピン系のピークの位置に対するその影響によって、NMR不活性な物質(すなわち、NMRスピン系を持たない物質、したがって、記録されたNMRスペクトル内のどのピークもこの物質に属さない)の濃度を分析することができる。ただし、ClイオンなどのNMR不活性な物質は、NMRスペクトル内に、積分され得るか、又は線形フィッティングに使用され得るピークを持たないため、従来のNMRに基づく濃度測定によって利用できないことに留意されたい。
本発明の範囲内には、さらに、流体クラスのサンプルに含まれる少なくとも1つの化合物の濃度を測定する方法がある。
この方法は、
aa’’)上述の本発明の方法のステップa)からd)にしたがって、前記化合物に属し、非基準NMRスピン系である少なくとも1つのNMRスピン系の化学シフト値を予測するステップと、
bb’’)予測された化学シフト値により、前記少なくとも1つのNMRスピン系に属するサンプルの記録されたNMRスペクトル内の少なくとも1つのピークを同定するステップと、
cc’’)サンプルの記録されたNMRスペクトル内の同定された少なくとも1つのピークの形状及び/又はサイズに基づいて、特に、ピーク積分及び/又は線形フィッティングによって前述の化合物の濃度を計算するステップとを含む。
この方法において、モデルアプライアンスの相関情報が、記録されたNMRスペクトル内の少なくとも1つのピークの迅速かつ信頼性の高い同定のために使用され、次いで、例えば、ピーク積分又は線形フィッティングを使用して、従来の濃度測定が適用される。この結果、化合物の特に正確かつ信頼性の高い濃度情報が得られる。ただし、ステップcc’’)は通常、別のソフトウェアモジュールを用いて行われることに留意されたい。
別の利点は、説明及び添付の図面から引き出すことができる。前述及び後述の特徴を本発明にしたがって個別に、又は任意の組み合わせでまとめて使用することができる。述べた実施の形態は、網羅的なリストと理解されるべきではなく、本発明の説明のための例示的な特徴を有する。
本発明を図面に示す。
pH及び塩化物イオン濃度(mM)が人工尿混合物において変化するときのフィッティングしたモデルによるL−アスパラギンのスピン系−CH多重線のδΟ化学シフト値補間を示す図である。 41のH−NMR(部分)モデルに対する変数/特性(代謝産物濃度、pH、T)の寄与を示す図である。図中のバーは、フィッティングのために変数が重み付けされている(有意)モデルの数を示す。 38の代謝産物濃度、pH及びT(部分)モデルに対する変数/化学シフト値(41のHスピン系NMR化学シフト)の寄与を示す図である。図中のバーは、フィッティングのために変数が重み付けされている(有意)モデルの数を示し、矢印は、最多モデルに有意な変数に対応するバーを示す。 基準NMRスピン系の実験による化学シフト値からサンプル特性を計算する削減タイプの第1のサブモデルで開始する変形例(最上行)、及び基準NMRスピン系の実験による化学シフト値から予測された化学シフト値を計算する削減タイプの第2のサブモデルで開始する変形例(最上行から2番目)において化学シフト値を予測するための本発明の方法の提示されている実施の形態のワークフロー、並びに、さらに代謝産物濃度を決定するための続いて生じる3つの任意の変形例を示す図である。 本発明の方法の実施の形態におけるランダムに調製した20の人工尿混合物における化学シフトの分布(上図)及びそれらの対応予測誤差分布を示す図である。 本発明の方法の実施の形態におけるランダムに調製した20の人工尿混合物における17の代謝産物濃度及びpH値の分布(上図)及びそれらの対応予測誤差分布を示す図である。 本発明の方法の実施の形態におけるランダムに調製した20の人工尿混合物における12の代謝産物濃度の分布(上図)及びそれらの対応予測誤差分布を示す図である。 本発明の方法の実施の形態におけるランダムに調製した20の人工尿混合物における7つの代謝産物濃度の分布(上図)及びそれらの対応予測誤差分布を示す図である。 本発明の方法の実施の形態における20の実際の尿サンプルにおける化学シフトの分布(上図)及びそれらの対応予測誤差分布を示す図である。 本発明の方法の実施の形態における60の実際の尿の生物流体サンプルにおける36のHスピン系のδの予測誤差を示す図である。 本発明の方法の実施の形態、BQuant、BATMAN及びChenomx NMR profilerによるTMAO H−NMRピークの帰属を示す図である。 濃度、pH及びTモデルにおいて有意な変数として現れる7つの代謝産物の10のHスピン系NMR化学シフト(矢印で示す)を示す図である。破線の円は、尿の生物流体のNMRプロファイルにおいて最も容易に帰属されるものを強調している。
以下において、モデルアプライアンス及び試験サンプル並びに調査されるサンプルが関連する特定の生物流体、すなわちヒトの尿が流体クラスとして選ばれた実施の形態によって本発明の方法をさらに詳細に説明する。したがって、本実施の形態において、モデルアプライアンスのキャプチャーされた物質が代謝産物である。しかし、本発明は、他の流体クラス、例えば、特に、血清などの他のタイプの生物流体、又はシャワージェルなどの人工生成物のタイプ、又はケチャップなどの天然由来若しくは植物由来の人工生成物のタイプにも適用できることが強調されるべきである。
導入
メタボロミクス及び他の「オミクス」分野の成長は、生物のメタボローム、プロテオーム及びゲノムの詳しい情報を抽出するそれらの能力による、最近のシステムバイオロジーの研究におけるそれらの重要性を示している(参考文献1,2)。メタボロミクスの枠内において、さまざまな分光学的、分光測定的又は生化学的手法が用いられている。そのなかでも、その迅速で正確且つ非破壊的な特徴によって、NMRスペクトロスコピー−一般に1D−NMR実験による−が用いられている(参考文献3)。
メタボロミクス研究には、生物流体など、複雑な混合物中の代謝産物の同定が必要である(参考文献4〜6)。問題は多くの代謝産物から生じる。生物流体のNMRスペクトルでは、磁気的に等価なH核によって多くの代謝産物の信号が重なり、且つ/又はそれらの一部が、生物流体のマトリックスのより豊富な代謝産物のピークによって隠れる。しかし、最も大きな課題は、pH、イオン強度並びに代謝産物間の化学的−静電的相互作用によるNMR化学シフトのばらつきから生じる(参考文献7)。この問題は、多種多様な代謝産物の含量、イオン強度及びpHばらつきを示す尿などの生物流体にとって特に重大である。尿組成は、血漿/血清及びCSF生物流体のように恒常性のルールによって制御されないが、尿組成は、その採取−サンプル調製の単純さ、存在量及び代謝情報の豊かな内容によって、メタボロミクスにとっておそらく最も価値のある生物流体である(参考文献8)。これまで、3000を超える物質(有機物、無機物、イオン性物質並びに少量のタンパク質)(参考文献9)がヒトの尿中に検出され、そのなかでも、およそ300の代謝産物がNMRスペクトロスコピーによって検出−定量された(参考文献10)。
代謝産物を帰属及び定量するために、以下の手法が一般に用いられる。
i)手動の帰属−定量化。この手法は、生物流体サンプルへの化合物のスパイク及びピーク積分、Chenomx NMR Suiteなどのソフトウェアの使用、代謝産物のNMRスペクトルデータベースの徹底的な調査及び/又はスペクトルのビニングからなる。多くの代謝産物をスパイクするのは費用と時間がかかり、生物流体のマトリックスの組成を大幅に変える可能性があるため、これまで存在しなかった相互作用によるピークのシフトに寄与し、他の手動の帰属の操作には、生物流体で作業した幅広いNMRの経験が必要である。
ii)半自動化された計算ツールの使用。Bayesil(参考文献11)、MetaboMiner(参考文献12)などは最も知られたソフトウェアツールの一部であり、これらはH−NMRスペクトルからいくつかの代謝産物(Bayesilでは、血清/血漿サンプルについて約50種類)を定量する一方、ユーザは、代謝産物のH−NMRピークの帰属−フィッティングを改善することができる。しかし、特定のプロトコルの使用がサンプル調製及びNMR取得に必要であり、正確な代謝産物の帰属には生物流体のNMR解析の経験がやはり前提条件である。
iii)BATMANアルゴリズム(参考文献6)、Dolphin(参考文献5)及びBQuant(参考文献13)のような自動化された計算手法の使用。BATMAN(同じことがBQuantにも当てはまる)はほぼ自動化されたツールである。一般に、これは、代謝産物のHスピン系の最良のフィッティングのために、その定量化を意図してベイズモデルのMCMC推定を利用する。できるだけ多くの肯定的な結果を得るためには、相当量の計算能力、代謝産物のNMRピーク位置範囲に関する予備知識、並びに事前のデータベースの構築が通常必要である。しかし、誤ったNMRピークの帰属によって、誤った肯定的な結果がいくつか得られる。Dolphinソフトウェアパッケージは、BATMANよりも計算的に「さらに軽い」ように見えるが、これもやはりデータベース情報(すなわち、HMDB、BMRBなど)に基づいている一方、2D−JRESスペクトルを活用して、代謝産物の帰属、したがってそれらの定量化の精度を向上させている。高分解能の2D−JRESスペクトルが必要であることとは別に、ユーザは定量する代謝産物のリストを定義しなければならない。しかし、すべての代謝産物がカップリングしたH核を含むわけではなく、それらの多くが(1つ又は複数の)一重項のみを示し、しばしばそれらのNMR信号が同じスペクトル領域内で共鳴して、やはり誤った肯定的な帰属につながる。
結論として、成功した正確な代謝産物の濃度測定に重要な前提条件は、それらの信号の欠点のない帰属である。以前の手法は、計算時間又は計算能力又は追加のNMR実験又はユーザの高度なNMRの経験が必要であり、それでもなお100%の代謝産物の帰属(したがって、定量化)の成功は保証されない。
本発明は、化合物、本明細書においては代謝産物又はそれらのNMRスピン系それぞれを、NMRスペクトル内のそれらのピークに帰属するための新規の手法を提示する。本発明の方法又はそのモデルアプライアンスはそれぞれ、完全に自動化された計算ツール内で実施することができる。
モデルアプライアンスは既に混合物(試験サンプル)によりあらかじめ調製されたいくつかのNMRスピン系のそれぞれの組み込み位置モデルを有しており、毎回、完全に自動(計器運転)で動作する。これは、NMR信号の定量化及び/又は帰属のためのどのようなフィッティング手順も使用しない。しかし、希望に応じて、下流のソフトウェアによる積分又は線形フィッティングによって定量化が行われてもよい。実際には、モデルアプライアンスは、単にセンサ(基準)NMR信号のppm値に応じて「式」を解いているだけで、化合物(本明細書においては代謝産物)のNMRピーク位置を出力すると共に、それらの濃度を推定する。
提示されている実施の形態において、モデルアプライアンス又は計算ツールはそれぞれ、尿のNMRサンプル中の21の代謝産物/化合物の41のH−NMRスピン系を自動的に帰属する一方、さらに5つの(分子)代謝産物/物質及び相対誤差が小さい(<10%)10の主要なイオン濃度の推定値、サンプルのpH値(誤差<±0.1)、並びにNMR取得中のその温度(T)(±0.1K)を与える。予測された化学シフト値及びサンプル特性、特に化合物濃度のフルセットを与えるために、NMRスペクトルがモデルアプライアンスによって10秒程度分析されてもよい。
アルゴリズムの基礎
NMRの基礎から、溶液混合物中の化合物のスピン系(本明細書においてはH核)の観察される化学シフト(δ)値は、核周辺の化学的環境を正確に描写したものであり、溶液混合物中で化合物が受けるあらゆる種類の分子相互作用によって大きく影響されることが知られている。しかし、これら複数の弱い相互作用が化学シフトに与える影響の詳細は先験的に予測できない。一般に、速い交換条件下では、δΟ値は、多くの平衡状態で存在する、混合物中の対応する化合物分子、すなわち、尿のマトリックスのあらゆる文脈(代謝産物の数n)で可能性のあるあらゆる(自己)相互作用を生じる分子


及び相互作用に関与しない分子(X)のモル分率に関係し得る。



式中、δ及び


は、それぞれ、それ自体の内部で相互作用し、かつ((この場合)尿のマトリックス中に存在するすべての化合物を含む)n個の他の代謝産物と相互作用している代謝産物のスピン系の化学シフト値である。式(1)から、δΟ値が、相互作用している化合物の濃度と直接相関することが明確に示される。先に述べたように、pH及びTの変化は、化学シフト(shits)のばらつきの原因となる。その結果、H核を含む任意の尿化合物による各H−NMRのδ値は、以下の関数によって記述され得る。

式中、変数xは、可能性のある相互作用している化合物それぞれの濃度、pH及びT(サンプルの特性とも呼ばれる)であり、各H核のNMR化学シフトに対するこれらの寄与は、そのδΟ値にはね返ってくる。
式(2)を構成するために、各δΟに対するすべての前述の寄与のマッピングが必要である。これを実現するために、さまざまな濃度の尿の代謝産物の多くの混合物を構成し、それらの1D H−NMRスペクトルを取得し、各代謝産物のHスピン系による各H−NMRのδΟを記録することによって、実際の尿の含有物のマトリックス状態のシミュレーションが行われる。尿のシミュレーションを改善する目的で、人工尿サンプルの構成のための代謝産物を選択するために、基準が適用された。これを行うため、HMDB(ヒトメタボロミクスデータベース)及び他の文献に報告されている濃度及び尿の生物流体中の存在量にしたがって、最も多い26の尿の(分子タイプの)代謝産物並びに10のイオン(又はイオンタイプの代謝産物)を選択した(材料及び実験方法の部を参照)。すなわち、適用した基準は、NMR、MS、LC及び他の技術により測定される、健常人の数千の尿サンプル中の100%の存在量及び高存在量の分子代謝産物及びイオンに基づいていた(参考文献14)。したがって、各混合物において、通常4つの中間値と共に、その報告されている最低の濃度を出発点として用いて、この場合、平均濃度まで1つの代謝産物の濃度を変えることにより混合物を調製した(ただし、代わりに、最低の異常値から最高の異常値までの区間を用いてもよいことに留意されたい)。H−NMRに基づくメタボロミクスのために、各混合物のpH調整についても、一般的な尿の緩衝剤を添加した後、同じ実験スキームにしたがった(材料及び方法の部参照)。表1に混合物の設計された構造を示す。合計で1235の混合物を作成した。


表1に基づいて人工尿のマトリックスを構成した。ここで、マトリックスの各行は、各人工尿混合物の代謝産物(分子及びイオン)の濃度情報、pH及びT、すなわち、式2の変数xを含む。提示されている実施の形態の混合物のマトリックス(又はティーチングデータベースの第1の部分)のサイズは1235×38であった。ここで、38は変数の総数である(26の分子代謝産物/物質及び10のイオン代謝産物/物質濃度並びにpH及びT値、すなわち、キャプチャーされた特性Cの総数は38である)。各混合物(又は試験サンプル)の1D H−NMR取得は、実際の尿のスペクトルと比べて(適度により単純な)1つのスペクトルを生成した。そこから、(26の代謝産物うち)21の代謝産物(化合物)からの41のHスピン系δΟを手動で帰属した。すなわち、キャプチャースピン系Sの総数は41である。それらの記録された化学シフト値(ppmの小数第4位まで)に基づいて、新規の1235×41マトリックス(又はティーチングデータベースの第2の部分)を構成した。ここで、各列には1235の人工尿のケースの各スピン系のδΟ値が入っている。本発明者らが知る限りでは、実際の生物流体シミュレーションのためのこのような系統的な研究も、シミュレートした生物流体のNMRに基づくこの種類のマトリックス(データベース)構成も存在しなかった。Athersuchら(参考文献15)は、混合計画にしたがって既知の比率で異なる生物流体サンプルを混合すると、重なり合うNMR信号を有する一部の代謝産物の定量化を改善できることを提案している。Sokolenkoら(参考文献16)は、重なり合ったH−NMR共鳴をデコンボリューションするために、Plackett−Burman実験計画法を用いて、20の代謝産物の合成混合物をいくつか作成した。決して、代謝産物組成の変化による化学シフトの変化が予測され得るとは考えられなかった。
アルゴリズムの実装
前述のように、概して、異なる6つの濃度(提示されている実施の形態の低濃度から平均濃度の範囲)の各物質(分子又はイオン代謝産物)、5つのpH値(緩衝剤添加後、6.8〜7.2の範囲)及び2つの温度値(300.0及び302.7k)を人工尿の含有物のマトリックスのために使用した。検討した各スピン系δΟ値とすべての38変数(濃度、pH、T)との間の最良の相関関数(式(2))を導くために、多変量統計機械学習法を用いて、最良のフィッティング並びに本発明者らのデータ間の補間を行った。多変量適応型回帰(一次及び三次)スプラインモデル(参考文献17)(MARSモデル)(人工ニューラルネットワークを含むいくつかの同様の機械学習多変量法を試験した。)は、最良の交差検証R値及び最低の二乗平均平方根誤差(RMSE)並びにさまざまな試験データセットで試験した最良の予測可能性(アルゴリズムの予測−計算効率の部を参照。)を示した。要約すると、それぞれ検討したHスピン系の式2は、次の形を取った。



式中、cは、導いた回帰モデルの一定の計算値、Mは、最良のフィッティングモデル生成のために利用される一次又は三次スプライン基底関数の数、cは、m番目の一次又は三次スプライン基底関数の係数、B(x)は、一次又は三次スプライン基底関数である。検討した41の(部分)モデルスピン系の計算した交差検証R及びRMSE値は、それぞれ>0.98及び<1e−04であった。図1では、L−アスパラギンのスピン系−CH多重項(2つのうちの1つ)のδΟ値の補間を、pH及び塩化物イオン濃度の関数として示してある。
各(部分)モデルのANOVA分解を実施することによって、重み付けしたすべての変数、すなわち、各モデルの構成に有意な変数を検出することができた。図2に示す通り、すべてのイオン(イオン代謝産物)の濃度、特定の代謝産物(尿素(urea)、馬尿酸塩(hippurate)、及びクレアチニン(creatinene)など)の濃度、pH及びTが、ほぼすべての41のモデルに有意な変数として現れている。文献データ(参考文献7)並びに化学の基礎知識は、特に、化学シフトのばらつきに対するpH、T及びイオンの影響に関して、先の結果を裏付ける。さらに、クレアチニン、馬尿酸塩及び尿素が(本明細書において使用される混合物中のように)尿の生物流体中で通常示す、すべての他の代謝産物と比べて高い濃度(参考文献9)は、他の多くの代謝産物の化学シフトの決定においてこれらの代謝産物が重要である原因のようであり、この知見は、最初の代謝産物のパネル中で最も多い代謝産物を選択する選択肢を裏付ける。
ここで、化学シフト値があれば、実装には、それらの値を与えていた(分子)代謝産物及びイオン(イオンタイプの代謝産物)の濃度を再構成し得るリバース関数を作る必要がある。同じ数学的手法をリバース(部分)モデルの構成に用いた。この場合、応答(y)値は、各物質/代謝産物(イオンを含む)の濃度、pH及びT(すなわち、サンプル特性)であり、一方、変数は、検討した41のNMRスピン系であった。生成した38の(部分)モデルは、δΟ(部分)モデルよりも低い交差検証R値(>0.90)を示したが、十分に、イオン、クレアチニン、尿素、馬尿酸塩のpH及び温度は完全にフィッティングした(R>0.98)。38のモデルのANOVA分解は、人工尿の濃度のマトリックスの予測において、検討した41のNMRスピン系のうち、どのHスピン系のNMR信号が「センサ」として働き得るかを明らかにした。最も高いスコアは、図12において矢印で、図3において矢印で強調した代謝産物のH核によって示された。
尿中、クエン酸塩(citrate)、クレアチニン、及びグリシン(glycine)は、他の代謝産物に対して常に高濃度で存在し、それらのH−NMR信号は非常に特徴的であり、アスパラギン酸(aspartic acid)、アスパラギン(asparagine)、タウリン(taurine)、及びトレオニン(threonine)のNMR信号と比べて容易な帰属を可能にする。この基準を考慮に入れて、すべての濃度、pH及びTの(部分)モデルの削減を行った。次のわずか5つの変数を用いて38の削減(部分)モデルを構築した(すなわち、基準NMR系の数Rは、この場合、5である)。クレアチニンの2つの一重項、クエン酸塩の2つの二重項、及びグリシンの一重項は図12において破線の円で強調されている。見かけ上、新たにフィッティングしたモデルの交差検証R及びRMSE値は、フルモデルのものよりも悪い(いくつかの例について表2を参照されたい)。しかし、5つのセンサの前述のNMR信号の位置(又は基準NMRスピン系)を知っていれば、そのNMRプロファイルにより、どのようなフィッティング法も用いずに、かつ/又はデータベース又はNMR信号の積分からの代謝産物のNMRシグネチャテンプレートに頼らずに、(出発点として)各人工尿混合物中の(分子)代謝産物及びイオン(イオン代謝産物)の濃度並びにpH及びT値を十分に予測できる。


5つのセンサのNMR信号を検出すると、これらと、残りの代謝産物の検討した前述のNMR信号のうちの各1つとの相関を調べる機会が与えられる。すなわち、1235の混合物中の5つのセンサのピーク位置を変数として用いて、(同じ数学的手法にしたがって)新たな36のδΟ(部分)モデルを作成した(それらのR及びRMSE値の例は表3に報告する)。すなわち、非基準NMRスピン系の数Nは、この場合、36である。フィッティングしたδΟ削減(部分)モデル(関数)は、高いR及び低いRMSE値を示し、36のHスピン系のNMR信号の位置が、5つのセンサのピーク位置の位置により予測され得ることを示した。
結論として、異なる4タイプのモデル(又は、より正確に言えば、モデルアプライアンスのサブモデル)を作成した。
i)2種類のフルモデル。第1の種類(フルタイプの第1のサブモデルとも呼ばれる)は、混合物の物質/代謝産物濃度、pH及びT値(38変数)を知ることによる41のHスピン系のNMRピーク位置の予測を含み、第2の種類(フルタイプの第2のサブモデルとも呼ばれる)は、41のHスピン系のNMRピーク位置による36の物質/代謝産物濃度、pH及びTの予測を含む。
ii)2種類の削減モデル。5つのセンサのNMR信号の位置による物質/代謝産物濃度、pH及びTの38の予測(部分)モデル(共に削減タイプの第1のサブモデルを表す)、及び5つのセンサのNMRピーク位置に基づく36のHスピン系δΟ値の予測(部分)モデル(共に削減タイプの第2のサブモデルを表す)。


4種類のモデル(図4を比較されたい。)を組み合わせると、最良の代謝産物のNMR信号の位置予測(60の実際の尿サンプル及び20のランダムに調製した人工尿混合物において試験した)に基づいた、最終的なアルゴリズムが構成された。化合物濃度の予測は、物質(イオンを含む代謝産物)濃度が既知であったランダムな人工混合物にのみ注目している。
図4に示す最終的なアルゴリズムは、2つの変形例において実施することができる。最上行に示す第1の変形例において、記録されたNMRスペクトルから読み取った5つのセンサのピーク(又は基準NMRスピン系の実験による化学シフト値)10が、サブステップd1)において、削減タイプの第1のサブモデル1Rに送り込まれ、サンプルの予測された代謝産物濃度、pH及びT値の出力11(すなわち、この場合、38の予測された特性)が得られる。これらの予測された特性に対して、フルタイプの第1のサブモデル1Fがサブステップd2)において適用されて、非基準NMRスピン系の36の予測された化学シフト値δの出力12が得られる。基準NMRスピン系の実験による化学シフト値10と共に、これらがサブステップd3)においてフルタイプの第2のサブモデル2Fに入力され、予測された特性13が再び得られる。サブステップd4)において、これらがフルタイプの第1のサブモデル1Fに再び送り込まれ、2回目の反復の別の予測された化学シフト値の出力14が得られる(ただし、希望するならば、サブステップd3)及びd4)の反復をさらに適用してもよいことに留意されたい)。得られる予測された化学シフト値は、最終的な予測された化学シフト値30として使用してもよい。
以下の行に示す第2の代替の変形例において、記録されたNMRスペクトルから読み取った5つのセンサのピーク(又は基準NMRスピン系の実験による化学シフト値)10が、サブステップd1’)において、削減タイプの第2のサブモデル2Rに送り込まれ、非基準NMRスピン系の36の予測された化学シフト値δの出力21が得られる。基準NMRスピン系の実験による化学シフト値10と共に、これらがサブステップd2’)においてフルタイプの第2のサブモデル2Fに入力され、予測された特性22が得られる。サブステップd3’)において、これらがフルタイプの第1のサブモデル1Fに再び送り込まれ、別の予測された化学シフト値の出力23が得られる。示した例において、この出力23が、基準NMRスピン系の実験による化学シフト値10と共にサブステップd2’)及びd3’)の2回目の反復において使用されて、2回目の反復の予測された濃度の出力24及び2回目の反復の予測された化学シフト値の出力25が得られる(希望するならば、ステップd2’)及びd3’)の反復をさらに適用してもよい)。得られる予測された化学シフト値は、やはり、最終的な予測された化学シフト値30として使用してもよい。
(任意選択で)さらに代謝産物濃度を測定するために、先述したアルゴリズムを、非基準NMRスピン系の化学シフト値30が決定されている第1のステップaa)又はaa’)又はaa’’)とみなすことができる。
粗い精度で十分な迅速な代謝産物濃度の推定が望まれる場合、ステップbb’)において、非基準NMRスピン系の最終的な予測された化学シフト値30を(基準NMRスピン系の実験による化学シフト値10と共に)使用して、フルタイプの第2のサブモデル2Fをもう1回適用し、代謝産物濃度を含む予測された特性の出力31を得ることができる(ただし、特定の濃度のみに関心がある場合、フルタイプの第2のサブモデル2Fの部分モデルのみの適用で十分であり得ることに留意されたい)。この手法は、濃度測定のためにさらに以下で用いる(特に図6〜図8を比較されたい)。ただし、希望するならば、NMR不活性な代謝産物の濃度を導くためにこの手順を適用してもよいことに留意されたい。
幾分より正確な推定が望まれるが、ピーク積分又は線形フィッティングの手間は避けるべきである場合、ステップbb)において、最終的な予測された化学シフト値30を使用してNMRスペクトル内の非基準NMRスピン系のピークを同定し、それらの実験による化学シフト値を読み取ることができる。この入力32をステップcc)において使用して、フルタイプの第2のサブモデル2Fをもう1回適用し、代謝産物濃度を含む予測された特性の出力33を得てもよい(ただし、やはり、特定の濃度のみに関心がある場合、フルタイプの第2のサブモデル2Fの部分モデルのみの適用で十分であり得ることに留意されたい)。ただし、希望に応じて、NMR不活性な代謝産物の濃度を導くためにこの手順も適用してもよいことに留意されたい。
最後に、高精度の化合物(又はNMR活性な代謝産物)濃度が望まれる場合、ステップbb’’)において、最終的な予測された化学シフト値30を使用してNMRスペクトル内の前記化合物の少なくとも1つの(非基準)NMRスピン系のピークを同定し、同定された1つのピーク(又は複数のピーク)34のサイズ及び形状から、例えば、ピーク積分又は線形フィッティングにより濃度情報を導くことができる。
アルゴリズムの予測−計算効率
a)人工尿混合物試験。
ランダムな物質/代謝産物(分子及びイオン)濃度値(乱数発生器により計算)及びpH値を含む20の人工尿混合物を調製し、それらのNMRスペクトルを異なる温度で取得した。すべてのランダムな値が、適用したモデルの濃度、pH及びTのマトリックスの限界内であった。20のNMRスペクトル内で、5つのセンサの信号が化学シフトのマトリックスの限界内にあった。
δΟの予測誤差分布を図5にまとめる。図中に示す通り、予測精度はほぼ完璧である。すなわち、36すべての予測されたHスピン系のNMRの位置は、±0.0002ppm以下の誤差を示す。人工尿及び実際の尿ではないサンプルからは小さい誤差が生じるが、これらによって、選んだ数学的−アルゴリズム的手法がNMRピーク位置の予測について検証される。
さらに、すべてのイオン、クレアチニン、馬尿酸塩、アスパラギン酸塩、アスパラギン及び尿素の濃度、pH並びにTの予測値が2〜4%未満の相対誤差を示す一方、すべての他の代謝産物濃度が5〜15%の相対誤差で予測された。図6〜図8に示す通り、代謝産物濃度及びpHの相対的な予測誤差分布は、20の人工尿試験混合物中の代謝産物濃度の広い分布と比べて非常に狭い。すなわち、提示されているアルゴリズムは、どのようなNMR信号の積分−デコンボリューションも行わずに、尿サンプルの代謝産物の濃度範囲に関する情報を提供することができる。
b)実際の尿サンプルの試験。
自動信号予測のために、異なる60の実際の尿サンプルを、アルゴリズムの入力ファイルを構成する5つのセンサの化学シフト(又は基準NMR系の実験による化学シフト値)が、提示されている実施の形態の化学シフトのマトリックスの限界内にあるという条件で選択した。特に、入力ファイルの5つの値が化学シフトのマトリックスの上下限から非常に離れているときモデル外挿効率が低いため、この基準を設定した。提示されているアルゴリズムのこの制限は、アルゴリズムが極めて狭い代謝産物/物質濃度(文献の低い値及び平均値)、pH(6.8〜7.2)範囲で構築され、トレーニングされたことによる(ただし、ティーチングデータベースのより広い範囲では、この制限は克服されることに留意されたい)。
図9は、最も広い誤差分布を示した、60の実際の尿サンプルのうちの20のδΟの予測誤差分布を示し、図10には、60すべての実際の尿の生物流体による絶対的予測誤差をまとめる。δΟの予測誤差は≦|0.0015|ppmであり、これは−使用した人工尿の代謝産物混合物の生成を考慮して−満足以上のものである。1D H−NMRの生物流体のスペクトルによる他の半自動の標的代謝産物の検出法(例えば、ベイズ法の誤差:≦|0.0020|)によれば、このアルゴリズムのδΟの予測値は既にさらに低い誤差範囲を示している。比較例を図11に示す。図中の調査は、健康な人の尿のNMRプロファイルにおけるTMAO代謝産物の帰属である。NMRスペクトルは、Chenomx NMR profilerコンソール、2015年版にロードしている。(Chenomxによる)手動の帰属は、縦線40a,40bによって限定されたスペクトル範囲を検索するようユーザに促す。この比較的広いスペクトル領域(0.04ppm)において、(「?」で示した)3つのピークがTMAOのH−NMRの一重項の候補である。TMAOの帰属及び定量化のためにBQuant及びBATMANソフトウェアを使用すると、(領域3.26〜3.30ppmであれば)約15〜20分かかり、それらの帰属結果は、右側の矢印で示したNMRピーク41であった。本発明者らの自動化されたアルゴリズムのΗ−NMRのΤΜΑΟ((CHNO)のδΟ予測値(10秒で実行)を点線の縦線及び矢印で示す。
スパイクした結果による正しいTMAOのH−NMRピーク42を左側の矢印及びレ点で示す。すべての自動化された手法(本発明の手法を除く。)が誤った肯定的な結果を示す一方、本発明の予測誤差は+0.0002ppmであり、平均的なラップトップを使用して数秒以内に計算された。
結論
本発明の方法は、迅速なδΟの「正確な」予測(これまでのところ≦|0.0015|ppm)を可能にする。さらに(NMRによる)イオン濃度並びに他の代謝産物濃度、pH及び温度の迅速な予測が、非常に小さい相対誤差(≦2%)で、数学的方法により、代謝産物のNMRパターンフィッティング法なしで実現可能である。この方法は、実際に、高い計算能力を必要としない。この方法は、完全に自動化された方法に適切である。特定のNMRスペクトル分解能、スキャンの数のような特定のNMRプロトコル、又はさらに特定の緩衝能を有する特定のサンプル調製プロトコルを必要としない。TSPのみを参照化合物として必要とする。
材料及び実験方法
1)NMRサンプル調製
26の尿(分子)の代謝産物をSigmaから購入した。これらの代謝産物並びに検討した10のイオンを抽出した塩を表4に一覧にした。各NMRサンプルの最終容量において10%の一般的な尿の緩衝剤を使用した。緩衝剤は、1.5M KHPO、2mM NaN及びNMRの参照化合物として0.1% TSPを含み、これらはDO、99.8% Hに溶解される。濃度4NのHCl又はNaOH溶液を加え、pH計で298Kで測定してNMRサンプルのpHを調整した。


2)NMR実験
すべてのサンプルの一次元(1D)1H−NMRスペクトルは、600.13MHzプロトンラーモア周波数で動作し、z軸傾斜磁場コイルを含む5mm CPTI 1H−13C/31P−2Hクライオプローブ、自動チューニング・マッチング(ATM)及び自動サンプルチェンジャーを備えたBruker 600MHzスペクトロメーター(Bruker BioSpin)を使用して取得した。PT 100熱電対により、サンプルにおいて約0.1Kのレベルで温度が安定化された。測定前に、サンプルを温度平衡のためにNMRプローブヘッド内に少なくとも3分保持した。標準的なパルスシーケンス(NOESYpresat、Bruker)を使用して水ピークを抑制し、64の自由誘導減衰(FID)、64kデータポイント、スペクトル幅12,019Hz、取得時間2.7秒、緩和遅延4秒及び混合時間100msを用いて一次元NMRスペクトルを取得した。NOESYpresatパルスシーケンスは、Saude,Slupsky及びSykes(2006)に示されているように、水抑制に優れ、定量的な情報が得られるため、メタボロミック解析には標準である(Aranjbar,Ott,Roongta,&Mueller,2006)。
3)計算プラットフォーム
このアルゴリズムはMATLAB R2014aコンピューティング環境において開発した。このアルゴリズムは、その適用にMATLABを必要とする。すべてのMARSモデル−関数を、自由に利用できるARESlab toolboxを使用して作成した(Jekabsons G.,ARESLab:Adaptive Regression Splines toolbox for Matlab/Octave,2015,http://www.cs.rtu.lv/jekabsons/から入手可能)。アルゴリズムのすべての他の機能は本発明者らによって開発された。
参考文献
1.Holmes,E.et al.Human metabolic phenotype diversity and its association with diet and blood pressure.Nature 453,396−400(2008);
2.Weckwerth,W.,Loureiro,M.E.,Wenzel,K.&Fiehn,O.Differential metabolic networks unravel the effects of silent plant phenotypes.Proc.Natl.Acad.Sci.United States Am.101,7809−7814(2004);
3.Larive,C.K.,Jr.,G.A.B.&Dinges,M.M.NMR Spectroscopy for Metabolomics and Metabolic Profiling.Anal.Chem.87,133−146(2015);
4.Astle,W.,De Iorio,M.,Richardson,S.,Stephens,D.&Ebbels,T.A Bayesian Model of NMR Spectra for the Deconvolution and Quantification of Metabolites in Complex Biological Mixtures.J.Am.Stat.Assoc.107,1259−1271(2012);
5.Gomez,J.et al.Dolphin:A tool for automatic targeted metabolite profiling using 1D and 2D 1H−NMR data.Anal.Bioanal.Chem.06,7967−7976(2014);
6.Hao,J.et al.Bayesian deconvolution and quantification of metabolites in complex 1D NMR spectra using BATMAN.Nat.Protoc.9,1416−27(2014);
7.Jiang,L.,Huang,J.,Wang,Y.&Tang,H.Eliminating the dication−induced intersample chemical−shift variations for NMR−based biofluid metabonomic analysis.Analyst 137,4209−4219(2012);
8.Emwas,A.−H.et al.Standardizing the experimental conditions for using urine in NMR−based metabolomic studies with a particular focus on diagnostic studies:a review.Metabolomics 11,872−894(2014);
9.Wishart,D.S.et al.HMDB:the Human Metabolome Database.Nucleic Acids Res.35,D521−D526(2007);
10.Bouatra,S.et al.The human urine metabolome.PLoS One 8,e73076(2013);
11.Ravanbakhsh,S.et al.Accurate, Fully−Automated NMR Spectral Profiling for Metabolomics.PLoS One 10,e0124219(2015);
12.Xia,J.,Bjorndahl,T.C.,Tang,P.&Wishart,D.S.MetaboMiner−−semi−automated identification of metabolites from 2D NMR spectra of complex biofluids.BMC Bioinformatics 9,1−16(2008);
13.Zheng,C.,Zhang,S.,Ragg,S.,Raftery,D.&Vitek,O.Identification and quantification of metabolites in 1H NMR spectra by Bayesian model selection.Bioinformatics 27,1637−1644(2011);
14.Wishart,D.S.et al.HMDB:a knowledgebase for the human metabolome.Nucleic Acids Res.37,D603−10(2009);
15.Athersuch,T.J.,Malik,S.,Weljie,A.,Newton,J.&Keun,H.C.Evaluation of 1H NMR Metabolic Profiling Using Biofluid Mixture Design.Anal.Chem.85,6674−6681(2013);
16.Sokolenko,S.et al.Profiling convoluted single−dimension proton NMR spectra:A plackett−burman approach for assessing quantification error of metabolites in complex mixtures with application to cell culture.Anal.Chem.86,3330−3337(2014);
17.Friedman,J.H.Multivariate adaptive regression splines.Ann.Stat.19,1−141(1991)。

Claims (19)

  1. NMR分光法を用いて、流体クラスのサンプルに含まれる化合物に属するNMRスピン系の化学シフト値を予測する方法であって、
    a)前記流体クラスに含まれるキャプチャーされた物質の濃度、及び前記流体クラスに含まれると共に、前記キャプチャーされた物質の中にある化合物に属するキャプチャーされたNMRスピン系の化学シフト値を含み、前記流体クラスのキャプチャーされた特性間の相関情報を表すモデルアプライアンスを提供するステップであって、前記モデルアプライアンスは、前記キャプチャーされたNMRスピン系のサブセットであると共に、前記流体クラスに遍在する化合物に属する基準NMRスピン系の定義を含むステップと、
    b)前記流体クラスのサンプルのNMRスペクトルを記録するステップと、
    c)前記モデルアプライアンスの前記定義された基準NMRスピン系に属する前記記録されたNMRスペクトル内のピークを同定し、且つ前記記録されたNMRスペクトルから前記ピークの実験による化学シフト値を決定するステップと、
    d)前記基準NMRスピン系の前記実験による化学シフト値(10)に対して前記モデルアプライアンスを適用することによって、前記基準NMRスピン系に属さない前記キャプチャーされたNMRスピン系のうちの少なくとも1つの化学シフト値(30)を予測するステップと
    を含むことを特徴とする方法。
  2. 前記モデルアプライアンスによって決定される化学シフト値が、平均を超える量の濃度のキャプチャーされた物質にとって有意であるキャプチャーされたNMRスピン系から前記基準NMRスピン系が選ばれることを特徴とする請求項1に記載の方法。
  3. 前記基準NMRスピン系が、統計的相関分析法、特にANOVA分解又はスピアマンの順位相関又はケンドールの順位相関又は疑似計算又は正準相関分析を用いて決定されることを特徴とする請求項1又は2に記載の方法。
  4. 前記モデルアプライアンスが、前記基準NMRスピン系のみの化学シフト値δの関数fとしてキャプチャーされた特性xを示す削減タイプの第1のサブモデル(1R)
    =f(δ1,…,δ
    (式中、j:キャプチャーされた特性の添数(j=1,…,C;Cはキャプチャーされた特性の数)、並びにi:基準NMRスピン系の添数(i=1,…,R;Rは基準NMRスピン系の数))
    を含むことを特徴とする請求項1から3のいずれか1項に記載の方法。
  5. 前記モデルアプライアンスは、前記基準NMRスピン系のみの化学シフト値δの関数fとして非基準NMRスピン系の化学シフト値δを示す削減タイプの第2のサブモデル(2R)
    δ=f(δ1,…,δ
    (式中、k:非基準NMRスピン系の添数(k=1,…,N;Nはキャプチャーされた非基準NMRスピン系の数)、並びにi:基準NMRスピン系の添数(i=1,…,R;Rは基準NMRスピン系の数))
    を含むことを特徴とする請求項1から4のいずれか1項に記載の方法。
  6. 前記モデルアプライアンスは、前記キャプチャーされた特性xの関数fとして前記非基準NMRスピン系又はすべてのキャプチャーされたNMRスピン系の化学シフト値δを示すフルタイプの第1のサブモデル(1F)
    δ=f(x1,…,
    (式中、l:NMRスピン系の添数(l=1,…,N;Nは非基準NMRスピン系の数、又はl=1,…,S;SはすべてのキャプチャーされたNMRスピン系の数)、並びにj:キャプチャーされた特性の添数(j=1,…,C;Cはキャプチャーされた特性の数))
    を含むことを特徴とする請求項1から5のいずれか1項に記載の方法。
  7. 前記モデルアプライアンスは、前記キャプチャーされたNMRスピン系の化学シフト値δの関数fとして前記特性xを示すフルタイプの第2のサブモデル(2F)を含み、
    =f(δ1,…,δ
    (式中、j:キャプチャーされた特性の添数(j=1,…,C;Cはキャプチャーされた特性の数)、並びにl:キャプチャーされたNMRスピン系の添数(l=1,…,S;SはキャプチャーされたNMRスピン系の数))
    を含むことを特徴とする請求項1から6のいずれか1項に記載の方法。
  8. ステップd)の間に、
    d1)前記削減タイプの第1のサブモデル(1R)が前記基準NMRスピン系の前記実験による化学シフト値(10)に対して適用されて、予測された特性(11)を得るサブステップと、
    d2)前記フルタイプの第1のサブモデル(1F)が先のサブステップd1)の前記予測された特性(11)に対して適用されて、前記非基準NMRスピン系の予測された化学シフト値(12)を得るサブステップと、
    d3)前記フルタイプの第2のサブモデル(2F)が前記基準NMRスピン系の前記実験による化学シフト値(10)及び先のサブステップd2)において得られた前記非基準NMRスピン系の前記予測された化学シフト値(12)に対して適用されて、予測された特性(13)を得るサブステップと、
    d4)前記フルタイプの第1のサブモデル(1F)が、先のサブステップd3)において得られた前記予測された特性(13)に対して適用されて、前記非基準NMRスピン系の予測された化学シフト値(14)を得るサブステップと、
    が適用され、
    特に、サブステップd3)及びd4)のシーケンスが数回繰り返され、次いで、前記先のステップd4)において得られた前記非基準NMRスピン系の前記予測された化学シフト値(14)から開始する
    ことを特徴とする請求項4、6、及び7に記載の方法。
  9. ステップd)の間に、
    d1’)前記削減タイプの第2のサブモデル(2R)が前記基準NMRスピン系の前記実験による化学シフト値(10)に対して適用されて、前記非基準NMRスピン系の予測された化学シフト値(21)を得るサブステップと、
    d2’)前記フルタイプの第2のサブモデル(2F)が前記基準NMRスピン系の前記実験による化学シフト値(10)及び先のサブステップd1’)において得られた前記非基準NMRスピン系の前記予測された化学シフト値(21)に対して適用されて、予測された特性(22)を得るサブステップと、
    d3’)前記フルタイプの第1のサブモデル(1F)が先のサブステップd2’)において得られた前記予測された特性(22)に対して適用されて、前記非基準NMRスピン系の予測された化学シフト値(23)を得るサブステップと
    が適用され、
    特に、ステップd2’)及びd3’)のシーケンスが数回繰り返され、次いで、前記先のステップd3’)において得られた前記非基準NMRスピン系の前記予測された化学シフト値(23)から開始する
    ことを特徴とする請求項5、6、及び7に記載の方法。
  10. 前記モデルアプライアンスがティーチングデータベースから得られ、前記ティーチングデータベースは、前記流体クラスの複数のティーチングサンプルの各々について、
    −前記キャプチャーされた物質の前記濃度の値を含む、前記キャプチャーされた特性の値と、
    −前記各ティーチングサンプルの記録されたティーチングNMRスペクトル、及び前記ティーチングNMRスペクトル内のピークの前記キャプチャーされたNMRスピン系への帰属、特に手動の帰属、並びにそれらの化学シフト値の決定により得られた前記キャプチャーされたNMRスピン系の化学シフト値と
    を含むことを特徴とする請求項1から9のいずれか1項に記載の方法。
  11. 前記キャプチャーされた特性が温度(T)を含み、且つ物質の濃度の各セットについて、少なくとも2つの異なる温度(T)のティーチングサンプルが含まれることを特徴とする請求項10に記載の方法。
  12. 前記モデルアプライアンス、又は1つ又は複数のそのサブモデル(1R、2R、1F、2F)は、多変量統計アルゴリズムによる前記ティーチングデータベースから得られ、特に、前記多変量統計アルゴリズムは自己学習アルゴリズムであることを特徴とする請求項10又は11に記載の方法。
  13. 前記流体クラスが生物流体として選ばれ、特に、前記キャプチャーされた物質が代謝産物であることを特徴とする請求項1から12のいずれか1項に記載の方法。
  14. 前記生物流体が、好ましくは尿、血清、汗、唾液又はCSFから選択される体液、又は、好ましくは果汁、乳糜又は花蜜から選択される植物流体であることを特徴とする請求項13に記載の方法。
  15. 前記流体クラスが、天然由来の生成物、特に、好ましくはワイン、蜂蜜又は調味料から選択される植物由来の生成物として選ばれることを特徴とする請求項1から12のいずれか1項に記載の方法。
  16. NMR分光法によって、流体クラスのサンプルに含まれる少なくとも1つの物質の濃度を測定する方法であって、
    aa)請求項1から15のいずれか1項に記載の方法のステップa)からd)に従って、前記キャプチャーされたNMRスピン系の非基準NMRスピン系の前記化学シフト値(30)を予測するステップと、
    bb)前記予測された化学シフト値により、非基準NMRスピン系に属する前記記録されたNMRスペクトル内のピークを同定し、且つ前記記録されたNMRスペクトルから前記ピークの実験による化学シフト値(32)を決定するステップと、
    cc)前記基準NMRスピン系及び非基準NMRスピン系の前記実験による化学シフト値(10、32)に対して前記モデルアプライアンスを適用することによって、特に、請求項7に記載の前記フルタイプの第2のサブモデル(2F)を適用することによって、前記少なくとも1つの物質の濃度(33)を計算するステップと
    を含むことを特徴とする方法。
  17. NMR分光法によって、流体クラスのサンプルに含まれる少なくとも1つの物質の濃度を測定する方法であって、
    aa’)請求項1から15のいずれか一項に記載の方法のステップa)からd)に従って、前記キャプチャーされたNMRスピン系の非基準NMRスピン系の前記化学シフト値(30)を予測するステップと、
    bb’)前記基準NMRスピン系の前記実験による化学シフト値(10)及びステップaa’)において得られた前記非基準NMRスピン系の前記予測された化学シフト値(30)に対して前記モデルアプライアンスを適用することによって、特に、請求項7に記載の前記フルタイプの第2のサブモデル(2F)を適用することによって、前記少なくとも1つの物質の濃度(31)を計算するステップと
    を含むことを特徴とする方法。
  18. 前記濃度(31、33)がNMR分光法によって決定される前記少なくとも1つの物質が、NMR不活性な物質、特にイオンを含むことを特徴とする請求項16又は17に記載の方法。
  19. 流体クラスのサンプルに含まれる少なくとも1つの化合物の濃度を測定する方法であって:
    aa’’)請求項1から15のいずれか1項に記載の方法のステップa)からd)にしたがって、前記化合物に属し、非基準NMRスピン系である少なくとも1つのNMRスピン系の前記化学シフト値(30)を予測するステップと、
    bb’’)前記予測された化学シフト値(30)により、前記少なくとも1つのNMRスピン系に属する前記サンプルの前記記録されたNMRスペクトル内の少なくとも1つのピークを同定するステップと、
    cc’’)前記サンプルの前記記録されたNMRスペクトル内の前記同定された少なくとも1つのピークの形状及び/又はサイズに基づいて、特に、ピーク積分及び/又は線形フィッティングによって前記化合物の濃度(34)を計算するステップと
    を含むことを特徴とする方法。

JP2017115784A 2016-06-14 2017-06-13 流体クラスのサンプル、特に生物流体のサンプルにおけるnmrスピン系の化学シフト値を予測する方法 Active JP6602818B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP16174410.7 2016-06-14
EP16174410.7A EP3258285B1 (en) 2016-06-14 2016-06-14 Method for predicting chemical shift values of nmr spin systems in a sample of a fluid class, in particular in a sample of a biofluid

Publications (2)

Publication Number Publication Date
JP2018040787A true JP2018040787A (ja) 2018-03-15
JP6602818B2 JP6602818B2 (ja) 2019-11-06

Family

ID=56131420

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017115784A Active JP6602818B2 (ja) 2016-06-14 2017-06-13 流体クラスのサンプル、特に生物流体のサンプルにおけるnmrスピン系の化学シフト値を予測する方法

Country Status (6)

Country Link
US (1) US10401312B2 (ja)
EP (1) EP3258285B1 (ja)
JP (1) JP6602818B2 (ja)
CN (1) CN107505346B (ja)
AU (1) AU2017203959B2 (ja)
CA (1) CA2969928C (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11656174B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Outlier detection for spectroscopic classification
US11656175B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Reduced false positive identification for spectroscopic classification
US11775616B2 (en) 2018-01-26 2023-10-03 Viavi Solutions Inc. Reduced false positive identification for spectroscopic quantification

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017210700A1 (de) * 2017-06-26 2018-12-27 Robert Bosch Gmbh Verfahren zum automatisierten Quantifizieren eines Analyten sowie NMR-Messgerät zur Durchführung des Verfahrens
US20210302340A1 (en) * 2018-08-08 2021-09-30 Justin L. Neill Methods and Apparatus for Low-Volatility Sampling
WO2023115184A1 (pt) * 2021-12-22 2023-06-29 Cadore Mafaldo Rodrigo Método não invasivo para análise de implantes líquidos em planos anatômicos profundos

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02223877A (ja) * 1989-02-23 1990-09-06 Kanebo Ltd 混合物の組成分析における標準データからの成分選定方法
JPH08252238A (ja) * 1995-03-15 1996-10-01 Toshiba Corp 磁気共鳴診断装置
US20020173920A1 (en) * 2001-04-25 2002-11-21 Feng Xu Method of molecular structure recognition
JP2005161102A (ja) * 2005-03-14 2005-06-23 Toshiba Corp 磁気共鳴診断装置
JP2015512520A (ja) * 2012-04-05 2015-04-27 ヌマレス・アーゲーNumaresag Nmrスペクトルから物質を同定するための方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4933844A (en) 1988-09-26 1990-06-12 Otvos James D Measurement of blood lipoprotein constituents by analysis of data acquired from an NMR spectrometer
US6278893B1 (en) 1998-01-05 2001-08-21 Nycomed Imaging As Method of magnetic resonance imaging of a sample with ex vivo polarization of an MR imaging agent
US6346813B1 (en) * 1998-08-13 2002-02-12 Schlumberger Technology Corporation Magnetic resonance method for characterizing fluid samples withdrawn from subsurface formations
CA2331116A1 (en) 2001-01-15 2002-07-15 Chenomx, Inc. Compound identification and quantitation in liquid mixtures -- method and process using an automated nuclear magnetic resonance measurement system
JP2005312821A (ja) 2004-04-30 2005-11-10 Japan Science & Technology Agency 高偏極核種を用いて組織内の血流量及び縦緩和時間を計測する方法
EP2513653A1 (en) * 2009-10-09 2012-10-24 Carolyn Slupsky Methods for diagnosis, treatment and monitoring of patient health using metabolomics
CN102435474A (zh) 2010-09-29 2012-05-02 中国科学院武汉物理与数学研究所 一种用于尿液代谢组核磁共振分析的样品配制方法
WO2013171586A2 (en) 2012-05-14 2013-11-21 Uti Limited Partnership Metabolite biomarkers for staging colorectal cancer
US9535144B2 (en) * 2012-06-01 2017-01-03 Liposcience, Inc. NMR quantification of TMAO
US9470771B2 (en) 2012-06-08 2016-10-18 Liposcience, Inc. NMR measurements of NMR biomarker GlycA
EP3015855A1 (en) * 2014-10-27 2016-05-04 Klinikum rechts der Isar der Technischen Universität München Metal biosensors based on compounds with metal-sensitive chemical shifts for magnetic resonance spectroscopy and imaging

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02223877A (ja) * 1989-02-23 1990-09-06 Kanebo Ltd 混合物の組成分析における標準データからの成分選定方法
JPH08252238A (ja) * 1995-03-15 1996-10-01 Toshiba Corp 磁気共鳴診断装置
US20020173920A1 (en) * 2001-04-25 2002-11-21 Feng Xu Method of molecular structure recognition
JP2005161102A (ja) * 2005-03-14 2005-06-23 Toshiba Corp 磁気共鳴診断装置
JP2015512520A (ja) * 2012-04-05 2015-04-27 ヌマレス・アーゲーNumaresag Nmrスペクトルから物質を同定するための方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JERK RONNOLS, ET AL.: "Complete 1H and 13C NMR chemical shift assignments of mono- to tetrasaccharides as basis for NMR che", CARBOTYDRATE RESEARCH, vol. Vol. 380, JPN6018033140, 10 July 2013 (2013-07-10), pages P. 156-166 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11656174B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Outlier detection for spectroscopic classification
US11656175B2 (en) 2018-01-26 2023-05-23 Viavi Solutions Inc. Reduced false positive identification for spectroscopic classification
US11775616B2 (en) 2018-01-26 2023-10-03 Viavi Solutions Inc. Reduced false positive identification for spectroscopic quantification

Also Published As

Publication number Publication date
AU2017203959A1 (en) 2018-01-04
CN107505346B (zh) 2019-11-22
CN107505346A (zh) 2017-12-22
US10401312B2 (en) 2019-09-03
CA2969928A1 (en) 2017-12-14
EP3258285A1 (en) 2017-12-20
JP6602818B2 (ja) 2019-11-06
EP3258285B1 (en) 2020-10-21
US20170356865A1 (en) 2017-12-14
CA2969928C (en) 2020-09-01
AU2017203959B2 (en) 2020-11-05

Similar Documents

Publication Publication Date Title
JP6602818B2 (ja) 流体クラスのサンプル、特に生物流体のサンプルにおけるnmrスピン系の化学シフト値を予測する方法
Gromski et al. The influence of scaling metabolomics data on model classification accuracy
US20160216244A1 (en) Method and electronic nose for comparing odors
US20170177835A1 (en) Method and system for preparing synthetic multicomponent biotechnological and chemical process samples
Rousseau et al. Comparison of some chemometric tools for metabonomics biomarker identification
Puchades-Carrasco et al. Bioinformatics tools for the analysis of NMR metabolomics studies focused on the identification of clinically relevant biomarkers
Karaman et al. Sparse multi-block PLSR for biomarker discovery when integrating data from LC–MS and NMR metabolomics
WO2020105566A1 (ja) 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法
WO2020129895A1 (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
Brandmaier et al. PLS-Optimal: A stepwise D-optimal design based on latent variables
Campos et al. Advanced predictive methods for wine age prediction: Part II–A comparison study of multiblock regression approaches
Chen et al. Automatic soft independent modeling for class analogies
Dolejsch et al. Extensions of ℓ 1 regularization increase detection specificity for cell-type specific parameters in dynamic models
Metz et al. RoBoost-PLS2-R: an extension of RoBoost-PLSR method for multi-response
Cao et al. A wavelength selection method based on random decision particle swarm optimization with attractor for near‐infrared spectral quantitative analysis
Liu et al. Partial least‐squares discriminant analysis optimized by particle swarm optimization: application to 1H nuclear magnetic resonance analysis of lung cancer metabonomics
Yu et al. A weighted ensemble method based on wavelength selection for near-infrared spectroscopic calibration
Euceda et al. Prediction of clinical endpoints in breast cancer using NMR metabolic profiles
Zhang et al. An enhanced Monte Carlo outlier detection method
Wilson et al. Bayesian inference for nmr spectroscopy with applications to chemical quantification
He et al. Performance enhancement‐based active learning sample selection method
EP4105672A1 (en) Systems and methods for provisioning training data to enable neural networks to analyze signals in nmr measurements
Forouzesh et al. Structure-based analysis of protein binding pockets using von Neumann entropy
Atieh et al. MetFlexo: an automated simulation of realistic H1-NMR spectra
Fathi et al. Study of metabolic profiling Parkinson's disease

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170925

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190917

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191009

R150 Certificate of patent or registration of utility model

Ref document number: 6602818

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250