JP2018040787A

JP2018040787A - 流体クラスのサンプル、特に生物流体のサンプルにおけるｎｍｒスピン系の化学シフト値を予測する方法

Info

Publication number: JP2018040787A
Application number: JP2017115784A
Authority: JP
Inventors: タキスパンテレイモン; Takis Panteleimon; ルキナートクラウディオ; Luchinat Claudio
Original assignee: Bruker Biospin GmbH
Current assignee: Bruker Biospin GmbH
Priority date: 2016-06-14
Filing date: 2017-06-13
Publication date: 2018-03-15
Anticipated expiration: 2037-06-13
Also published as: AU2017203959A1; CN107505346B; CN107505346A; US10401312B2; CA2969928A1; EP3258285A1; JP6602818B2; EP3258285B1; US20170356865A1; CA2969928C; AU2017203959B2

Abstract

【課題】特に生物流体のサンプルのＮＭＲスペクトル内のピークの帰属を、より信頼性に、より容易に、特により迅速に可能にする。
【解決手段】ＮＭＲ分光法を用いて、流体サンプルに含まれる化合物に属するＮＭＲスピン系の化学シフト値を予測する方法は、ａ）流体に含まれるキャプチャーされた物質の濃度及び化学シフト値を含み、キャプチャーされた特性間の相関情報を表すモデルアプライアンスを提供するステップと、ｂ）サンプルのＮＭＲスペクトルを記録するステップと、ｃ）モデルアプライアンスの定義された基準ＮＭＲスピン系に属する記録されたＮＭＲスペクトル内のピークを同定し、化学シフト値を決定するステップと、ｄ）基準ＮＭＲスピン系の実験による化学シフト値に対してモデルアプライアンスを適用し、基準ＮＭＲスピン系に属さないキャプチャーされたＮＭＲスピン系のうちの少なくとも１つの化学シフト値を予測するステップとを含む。
【選択図】図４

Description

本発明は、ＮＭＲ分光法を用いて、流体クラスのサンプルに含まれる化合物に属するＮＭＲスピン系の化学シフト値を予測する方法に関する。

ＮＭＲ分光法は、サンプルの定性的及び定量的な組成を研究するための強力なツールである。最近の生化学及び医学において、尿などの生物流体の組成は、科学者及び医者にとって価値が高い。同様に、例えば、化学及び食品技術において、サンプルの組成は、特に品質管理に非常に重要である。

一般に、生物流体のサンプルを調べるために一次元ＮＭＲ実験が利用される。サンプルから記録されたＮＭＲスペクトルにおいて、サンプルに含まれる化合物のＮＭＲスピン系は、ＮＭＲ信号（ピーク）を発生させる。特定の化合物のＮＭＲスピン系に属する１つ又は複数のピークの形状及びサイズによって、この化合物の濃度を求めることができる。

しかし、尿などの典型的な生物流体には、関連するＮＭＲスピン系を有する多数の化合物が含まれ、したがって、それらの対応するピークが重なる。同じことが、一般に、他の流体クラスのサンプルに当てはまる。さらに、そのｐＨ、温度、又は含まれる物質（又は代謝産物）の濃度など、サンプルの特性に応じて、同じＮＭＲスピン系のピーク位置がサンプル間で変化することがある。これによって、ＮＭＲスペクトル内に見られるピークを正しいＮＭＲスピン系又は化合物にそれぞれ帰属させることが困難になる。したがって、ピークをＮＭＲスピン系に帰属させることは、通例、十分な時間を必要とする経験豊富な専門家の仕事であり、経験豊富な専門家でさえ誤った帰属をして、誤った定性的又は定量的な組成情報を招くことがある。

スパイクとして知られる方法では、サンプルのＮＭＲスペクトルを記録した後、関心のある化合物をサンプル中で増やして、別のＮＭＲスペクトルを記録する。元のサンプルと化合物を増やしたサンプルのＮＭＲスペクトルを比較することによって、特に特定のピーク強度の増加を比較することによって、より信頼性の高いピークの帰属が実現され得る。しかし、この方法は非常に手の込んだものであり、元のサンプルの組成を変えてしまう。

また、コンピュータ支援ピーク同定ツールも存在するが、これらは一般に高い計算能力や長い計算時間を必要とし、時々起こる誤ったピークの割り当てが避けられず、化学分析において、誤った「肯定的な」結果を招くことがある。さらに具体的には、ＢＡＴＭＡＮ（ＢＱｕａｎｔにも当てはまる）は、モンテカルロマルコフ連鎖アルゴリズムを使用して、ユーザが事前に定義したｐｐｍ領域内の各ＮＭＲスピン系のベイズ（Ｂａｙｅｓｉａｎ）モデルを計算し、これには相当な計算量を必要とする。さらに、ＢＡＴＭＡＮ（及びＢＱｕａｎｔ）は、完全に自動化された帰属ツールとして設計されておらず、これらは、毎回、代謝産物の帰属及び定量化のための組み込みデータベースを必要とする。ＢＡＴＭＡＮでは、ただ２つの代謝産物のフィッティングを行うとき、１つのスペクトルからの狭いｐｐｍ範囲の動作に３０秒程度かかり、典型的な約２００のスペクトルのデータセットでは、約２５の代謝産物のフィッティングに、最先端のコンピュータ機器を用いて数日かかることがある。

特許文献１（米国特許第７，１９１，０６９号明細書）では、特定のｐＨなど、測定された条件下のサンプルからＮＭＲ試験スペクトルを得ること、及びサンプル中に存在すると思われる化合物の１セットの基準スペクトルをライブラリから選択するために、この測定された条件を使用することが提案されている。このセットからの基準スペクトルを組み合わせる（ｃｏｍｂｉｎｇ）ことによりマッチング化合物スペクトルが生成され、そのピークは試験スペクトルのピークと一致する。マッチングスペクトルを生成するために用いられる基準スペクトルに関連する化合物が、サンプルに含まれる化合物を示すと考えられている。

特許文献２（米国特許出願公開第２０１５／００９９６６号号明細書）には、哺乳類の生物サンプル中のバイオマーカーのレベルを測定し、転移性疾患を特徴付けるために、これらのレベルと１つ又は複数のコアバイオマーカー基準レベルとを比較するための１ＨＮＭＲ分光法の使用が開示されている。

米国特許第７，１９１，０６９号明細書米国特許出願公開第２０１５／００９９６６８号明細書

本発明の目的は、サンプルに含まれる化合物のＮＭＲスピン系への流体クラス、特に生物流体のサンプルのＮＭＲスペクトル内のピークの帰属を、より高信頼性で、より容易に、特により迅速に可能にすることにある。

この目的は、本発明によれば、ＮＭＲ分光法を用いて、流体クラスのサンプルに含まれる化合物に属するＮＭＲスピン系の化学シフト値を予測する方法によって達成され、この方法は、
ａ）流体クラスに含まれるキャプチャーされた物質の濃度、及び流体クラスに含まれると共に、キャプチャーされた物質の中にある化合物に属するキャプチャーされたＮＭＲスピン系の化学シフト値を含み、流体クラスのキャプチャーされた特性間の相関情報を表すモデルアプライアンスを提供するステップであって、モデルアプライアンスは、キャプチャーされたＮＭＲスピン系のサブセットであると共に、流体クラスに遍在する化合物に属する基準ＮＭＲスピン系の定義を含むステップと、
ｂ）流体クラスのサンプルのＮＭＲスペクトルを記録するステップと、
ｃ）モデルアプライアンスの定義された基準ＮＭＲスピン系に属する記録されたＮＭＲスペクトル内のピークを同定し、且つ記録されたＮＭＲスペクトルからピークの実験による化学シフト値を決定するステップと、
ｄ）基準ＮＭＲスピン系の実験による化学シフト値（１０）に対してモデルアプライアンスを適用することによって、基準ＮＭＲスピン系に属さないキャプチャーされたＮＭＲスピン系のうちの少なくとも１つの化学シフト値（３０）を予測するステップとを含む。

本発明は、初めに、予め定義した基準ＮＭＲスピン系に属する流体クラスのサンプルの記録されたＮＭＲスペクトル内で２〜３本のピークのみを同定し、記録されたＮＭＲスペクトルから、それらの化学シフト値（又はピーク位置）を決定することを提案する。モデルアプライアンスにより、基準ＮＭＲスピン系の実験による化学シフト値に基づいて、基準ＮＭＲスピン系ではないＮＭＲスピン系（「非基準ＮＭＲスピン系」）に属する１つ又は多数の他のピークの化学シフト値が予測される。これらの予測値を、非常に信頼性の高いピーク同定のために使用することができる。

本発明は、含まれる特定の物質の濃度など、サンプルの特性が、異なる化合物の多数のＮＭＲスピン系に属するピークの位置に同時に影響することを利用する。これは、サンプルの多くの特性、特に含まれる物質の濃度についても同時に当てはまる。このことは、含まれる異なる化合物の多数のＮＭＲ系に属するピークの位置が、サンプルの多くの特性、特に含まれる物質の濃度を介して相互に依存することを意味する。

本発明者らは、他のＮＭＲスピン系、すなわち非基準スピン系のピーク位置を良好な精度で予測するためには、多数のＮＭＲスピン系のピーク位置の相互依存性により、関心のあるＮＭＲスピン系、すなわち基準ＮＭＲスピン系のサブセット（すなわち一部）のピーク位置が分かれば十分であることを見出した。関心のある特定のＮＭＲスピン系に属するピークの予測されたピーク位置（又は化学シフト値）によって、記録されたＮＭＲスペクトル内の対応するピークを同定することは容易である。一般に、ＮＭＲスピン系について予測されたピーク位置に最も近い記録されたＮＭＲスペクトル内のピークは、各ＮＭＲスピン系に属するピークと見なされる。本発明によって、少数の基準ピークに対する従来のピーク同定の必要性が少なくなり、非基準ＮＭＲスピン系のピークの簡素化されたピーク同定が可能になる。

基準ＮＭＲスピン系は一般に、この流体クラス（例えば、生物流体のタイプ）について十分に予想することができるサンプルの特性のすべての組み合わせについて、例えば、それらのピークが、近くのすべての他のピークよりもはるかに強いことから、又はそれらの特徴的な形状パターンに基づいて、それらのピークが近くの他のピークから容易に区別されることから、それらの対応するピークがスペクトル内で容易に同定されるように選ばれる。基準ＮＭＲスピン系に属するピークは、サンプルの記録されたＮＭＲスペクトル内で（非専門家によってさえも）手動で同定したり、又は適したソフトウェアによって自動的に、通常、ピークが現れる既知の化学シフトの間隔を利用して、且つ／又は、例えば、二重線において同じピーク積分又は強度など、チェック基準を適用して同定したりすることができる。さらに、基準ＮＭＲスピン系に属する化合物は、任意の流体クラスのサンプル中に、影響力を持つ他のＮＭＲスピン系にとって関連する最小濃度で存在するはずである（「遍在する化合物」）。さらに、基準ＮＭＲスピン系に属する化合物は、相当な数のＮＭＲスピン系（場合によっては、それ自体を含む）に著しく影響するはずである。

サンプルが属する流体クラスの相関関係情報は、好ましくは、ティーチングデータベースからの情報に基づくモデルアプライアンス内に保存される。ティーチングデータベースは、大量の試験サンプルについて、サンプル特性、特に物質濃度、及びＮＭＲスペクトル内で同定される、含まれる化合物のＮＭＲスピン系に属する化学シフト値（ピーク位置）を含む。モデルアプライアンスが予め得られてもよく、したがって、後に、ステップｄ）において予測された化学シフト値を計算するとき、（数秒のこととして）迅速に行うことができて、一般に少数の式を解くことのみを必要とする、最終的なモデルアプライアンスのみ適用する必要がある。モデルアプライアンスは通常、好ましくは完全に自動的に動作するソフトウェアツールとして実施される。

モデルアプライアンス（及び基礎となるティーチングデータベース）が、有限個のＮＭＲスピン系（又はそれらの各化学シフト値）と有限個の特性とを関連付けることに留意されたい。一般に、モデルアプライアンスに含まれる特性が多いほど、化学シフト値の予測をより正確にすることができる。一般に、少なくとも流体クラスにおいて最も多い物質の濃度をモデルに含めることが望ましい。さらに、対象として含まれるＮＭＲスピン系が多いほど、ＮＭＲスペクトル内で予測され得るピークが多くなる。

さらに、使用される基準ＮＭＲスピン系が多いほど、非基準ＮＭＲスピン系の化学シフト値の予測がより正確になる。しかし、使用する基準ＮＭＲスピン系が多すぎるとき、ステップｃ）のピーク同定は一般に、より困難になり、より時間がかかる。したがって、基準ピーク系の数Ｒについては、３≦Ｒ≦８であることが好ましい。キャプチャーされた非基準ＮＭＲスピン系の数Ｎに関しては、Ｒ≦１／４^＊Ｎであることが好ましい。

流体クラスは、濃度がさまざまではあるが、任意の流体クラスのサンプルに含まれ、いくつかの物質（遍在する物質）によって特徴付けられ、しばしば、さまざまな濃度で流体クラスのサンプルに場合によって含まれるいくつかの物質（偶発する物質）によっても特徴付けられる。一般に、物質は、流体クラスのサンプルにおいて、限られた範囲の濃度で、又は限られた範囲の濃度比で存在する。通常、ある流体クラスについて、見出す（又は定義する）ことができる少なくとも１０の遍在する物質が存在し、場合によっては、ある流体クラスについて、５０以上もの遍在する物質を見出す（又は定義する）ことができる。本発明によれば、流体クラスは概して、少なくとも１０重量％の水分を含む水成タイプである。

典型的な流体クラスは、特定の種（ヒト又はネコなど）の特定の生物流体（尿又は血清など）であり；人によって、又は例えば疾病によってサンプルのばらつきが通常発生する。生物流体において、物質は一般に代謝産物である。他の流体クラスは、例えば、ボディケアローション、調味料（ケチャップなど）又はエナジードリンクでもよい。

特定の流体クラスについて、モデルアプライアンスによってキャプチャーされた物質は、流体クラスに既知の遍在する物質又は偶発する物質でもよい。一般に、モデルアプライアンスは、流体クラスについて、既知の遍在及び／又は偶発する物質の一部のみをキャプチャーする。

化合物は、１つ又は複数のＮＭＲスピン系を有する遍在する物質及び／又は偶発する物質である。基準ＮＭＲスピン系に属する化合物は、１つ又は複数のＮＭＲスピン系を有する（キャプチャーされた）遍在する物質から選ばれる。

ＮＭＲスピン系は通常、１ＨＮＭＲスピン系である。ＮＭＲスペクトルは通常、一次元ＮＭＲスペクトルである。

以上及び以下において、用語「キャプチャーされた」は、言及したパラメータが、モデルアプライアンスの相関情報又はティーチングデータベースのそれぞれに含まれることを意味する。サンプルの「特性」は、物質濃度、ｐＨ値及び／又は温度Ｔを含んでもよい。「物質」は、本明細書において、流体クラス中の分子及び／又はイオン（無機イオンを含む。）を意味する；ただし、対イオンのない単一タイプのイオン（Ｃｌ⁻など）は、本明細書において、物質と見なしてよいことに留意されたい。「代謝産物」は、本明細書において、生物流体中の物質、すなわち、分子及び／又はイオン（無機イオンを含む。）を意味する。「化合物」は、本明細書において、少なくとも１つのＮＭＲスピン系を有する物質を意味する。キャプチャーされたＮＭＲスピン系は、基準ＮＭＲスピン系及び非基準ＮＭＲスピン系を含む。

本発明の方法の好ましい変形例
基準ＮＭＲスピン系に関する変形例
本発明の方法の好ましい変形例において、基準ＮＭＲスピン系は、その化学シフト値が、モデルアプライアンスによって決まると共に、平均を超える量の濃度のキャプチャーされた物質にとって有意であるキャプチャーされたＮＭＲスピン系から選ばれる。これは、予測誤差を小さくする。好ましくは、基準ＮＭＲスピン系は、それらが最大量の著しく影響を受けた濃度を有するように選ばれる。概して、基準ＮＭＲスピン系は、他のピークから遠く離れた強いピークを伴うはずであり、したがって、それらのピークは、異なるサンプル組成の記録されたＮＭＲスペクトル内で、手動で又は自動的に安全に同定することができる。著しく影響を受けた濃度の量は、例えば、フルタイプの第２のサブモデルの要素ｊ＝１，…，Ｃに適用されたＡＮＯＶＡ分解によって求めることができる（下記参照）。さらに、基準ＮＭＲスピン系は、好ましくは、各物質濃度が、基準ＮＭＲスピン系の少なくとも２つの化学シフト値に著しく影響を与えるように選ばれる。

別の好ましい変形例において、基準ＮＭＲスピン系は、統計的相関分析法、特にＡＮＯＶＡ分解又はスピアマン（Ｓｐｅａｒｍａｎ）の順位相関又はケンドール（Ｋｅｎｄａｌｌ）の順位相関又は疑似計算又は正準相関分析を用いて決定される。統計的相関分析法は、物質濃度（又は、より一般にはサンプル特性）について関連性が高いＮＭＲスピン系の化学シフト値と、関連性が低いものとを区別し、したがって、高い関連性（好ましくは最も高い関連性）を伴うＮＭＲスピン系がＮＭＲ基準ピークとして選ばれてもよい。統計的相関分析法を利用して、例えば、ＮＭＲスピン系の特定の化学シフト値により、著しく影響を受けた濃度の量を確認することができる。ただし、基準ＮＭＲスピン系を選ぶとき、ＮＭＲスピン系又はその合成物それぞれの存在量も考慮されてよいことに留意されたい。

サブモデルに関する変形例
好ましい変形例において、モデルアプライアンスは、基準ＮＭＲスピン系のみの化学シフト値δ_ｉの関数ｆとしてキャプチャーされた特性ｘ_ｊを示す削減タイプの第１のサブモデルを含み、ｘ_ｊ＝ｆ_ｊ（δ_１，…，δ_Ｒ）（式中、ｊ：キャプチャーされた特性の添数（ｊ＝１，…，Ｃ；Ｃはキャプチャーされた特性の数）、並びにｉ：基準ＮＭＲスピン系の添数（ｉ＝１，…，Ｒ；Ｒは基準ＮＭＲスピン系の数））である。好ましくは、３≦Ｒ≦８である。この削減タイプの第１のサブモデルは、非基準ＮＭＲスピン系の化学シフト値を同定するために、フルタイプの第１のサブモデルを適用するための基礎を与える（下記参照）。削減タイプの第１のサブモデルはまた、サンプルの特性の粗い推定に使用することもできる。

同様に好ましいのは、モデルアプライアンスが、基準ＮＭＲスピン系のみの化学シフト値δ_ｉの関数ｆとして非基準ＮＭＲスピン系の化学シフト値δ_ｋを示す削減タイプの第２のサブモデルを含み、δ_ｋ＝ｆ_ｋ（δ_１，…，δ_Ｒ）（式中、ｋ：非基準ＮＭＲスピン系の添数（ｋ＝１，…，Ｎ；Ｎはキャプチャーされた非基準ＮＭＲスピン系の数）、並びにｉ：基準ＮＭＲスピン系の添数（ｉ＝１，…，Ｒ；Ｒは基準ＮＭＲスピン系の数））である変形例である。削減タイプの第２のサブモデルは、非基準ＮＭＲスピン系の化学シフト値の粗い推定値を直接与えることができる。しかし、削減タイプの第２のサブモデルはまた、非基準ＮＭＲスピン系の化学シフト値の改善された推定値を得るために、フルタイプの第２のサブモデル及びフルタイプの第１のサブモデルを適用するための基礎を与えることができる（下記参照）。ただし、モデルアプライアンスは、削減タイプの第１及び第２のサブモデルのうちのただ１つ又は両方を含んでもよいことに留意されたい。

別の好ましい変形例において、モデルアプライアンスは、キャプチャーされた特性ｘ_ｊの関数ｆとして非基準ＮＭＲスピン系又はすべてのキャプチャーされたＮＭＲスピン系の化学シフト値δ_ｌを示すフルタイプの第１のサブモデルを含み、δ_ｌ＝ｆ_ｌ（ｘ_１，…，ｘ_Ｃ）（式中、ｌ：ＮＭＲスピン系の添数（ｌ＝１，…，Ｎ；Ｎは非基準ＮＭＲスピン系の数、又はｌ＝１，…，Ｓ；ＳはすべてのキャプチャーされたＮＭＲスピン系の数）、並びにｊ：キャプチャーされた特性の添数（ｊ＝１，…，Ｃ；Ｃはキャプチャーされた特性の数））である。フルタイプの第１のサブモデルは、少なくとも非基準ＮＭＲピークの化学シフト値の予測を可能にし、したがって、基準ＮＭＲスピン系の実験による化学シフト値と共に、対象として含まれる特性のフルセットに基づいて、すべての対象として含まれるＮＭＲスピン系の化学シフト値のフルセットが得られてもよい。これは、反復プロセスにおいて、改善された予測精度のために使用することができる。フルタイプの第１のサブモデルが、一部又はすべての基準ＮＭＲスピン系の化学シフト値も予測する場合、実験による化学シフト値と予測された化学シフト値との比較は、モデルアプライアンスの複数の適用において到達する収束度についての推定を可能にする（下記参照）。

さらに好ましいのは、モデルアプライアンスが、キャプチャーされたＮＭＲスピン系の化学シフト値δ_ｌの関数ｆとして特性ｘ_ｊを示すフルタイプの第２のサブモデルを含み、ｘ_ｊ＝ｆ_ｊ（δ_１，…，δ_Ｓ）（式中、ｊ：キャプチャーされた特性の添数（ｊ＝１，…，Ｃ；Ｃはキャプチャーされた特性の数）、並びにｌ：キャプチャーされたＮＭＲスピン系の添数（ｌ＝１，…，Ｓ；ＳはキャプチャーされたＮＭＲスピン系の数））である変形例である。フルタイプの第２のサブモデルは、化学シフト値（これらは通常、部分的に実験によるもの、及び部分的に予測されたものであるが、すべて実験によるもの、又はすべて予測されたものでもよい。）のフルセットに基づいて、キャプチャーされた特性のフルセットの予測を可能にする。フルタイプの第２のサブモデルは通常、非基準ＮＭＲスピン系の化学シフト値の予測値を得るための反復プロセスの一部である。これはまた、特性、特に、イオンなど、ＮＭＲ活性でない物質の濃度を含む物質濃度の推定値を得るために使用することもできる。

ステップｄ）の間に、削減タイプの第１のサブモデル及び上述のフルタイプの２つのサブモデルを導入する変形例を適用する別の開発において、以下のサブステップが適用される。すなわち、ｄ１）削減タイプの第１のサブモデルが、基準ＮＭＲスピン系の実験による化学シフト値に対して適用されて、予測された特性を得るサブステップ；ｄ２）フルタイプの第１のサブモデルが先のサブステップｄ１）の予測された特性に対して適用されて、非基準ＮＭＲスピン系の予測された化学シフト値を得るサブステップ；ｄ３）フルタイプの第２のサブモデルが基準ＮＭＲスピン系の実験による化学シフト値及び先のサブステップｄ２）において得られた非基準ＮＭＲスピン系の予測された化学シフト値に対して適用されて、予測された特性を得るサブステップ；ｄ４）フルタイプの第１のサブモデルが、先のサブステップｄ３）において得られた予測された特性に対して適用されて、非基準ＮＭＲスピン系の予測された化学シフト値を得るサブステップである。特に、サブステップｄ３）及びｄ４）のシーケンスが数回繰り返され、次いで、先のステップｄ４）において得られた非基準ＮＭＲスピン系の予測された化学シフト値から開始する。これは、非基準スピン系の化学シフト値の比較的正確な予測を可能にする。ステップｄ３）及びｄ４）のシーケンスを数回適用することによって、化学シフト値の収束が起こり、予測品質を改善する。

ステップｄ）の間に、削減タイプの第２のサブモデル及び上述のフルタイプの２つのサブモデルを導入する変形例を適用するさらに別の開発において、以下のサブステップが適用される。すなわち、ｄ１’）削減タイプの第２のサブモデルが基準ＮＭＲスピン系の実験による化学シフト値に対して適用されて、非基準ＮＭＲスピン系の予測された化学シフト値を得るサブステップ；ｄ２’）フルタイプの第２のサブモデルが基準ＮＭＲスピン系の実験による化学シフト値及び先のサブステップｄ１’）において得られた非基準ＮＭＲスピン系の予測された化学シフト値に対して適用されて、予測された特性を得るサブステップ；ｄ３’）フルタイプの第１のサブモデルが先のサブステップｄ２’）において得られた予測された特性に対して適用されて、非基準ＮＭＲスピン系の予測された化学シフト値を得るサブステップである。特に、ステップｄ２’）及びｄ３’）のシーケンスが数回繰り返され、次いで、先のステップｄ３’）において得られた非基準ＮＭＲスピン系の予測された化学シフト値から開始する。これは、やはり、非基準スピン系の化学シフト値の比較的正確な予測を可能にする。ステップｄ２’）及びｄ３’）のシーケンスを数回適用することによって、化学シフト値の収束が起こり、予測品質を改善する。

ティーチングデータベースに関する変形例
特に好ましいのは、モデルアプライアンスが、ティーチングデータベースから得られ、ティーチングデータベースが、流体クラスの複数のティーチングサンプルの各々について、以下を含む変形例である。

この変形例は、
−キャプチャーされた物質の濃度の値を含む、キャプチャーされた特性の値と、
−各ティーチングサンプルの記録されたティーチングＮＭＲスペクトル、及びティーチングＮＭＲスペクトル内のピークの、キャプチャーされたＮＭＲスピン系への帰属、特に手動の帰属、並びにそれらの化学シフト値の決定により得られたキャプチャーされたＮＭＲスピン系の化学シフト値とを含む。

ティーチングデータベースは、モデルアプライアンスに必要な相関情報を提供することができる。ただし、原則的に、量子力学的計算を適用して相関情報を得てもよいが、これは実施するのが比較的困難であることに留意されたい。典型的な特性の数は２０以上であり、通常、少なくとも１０の特性がキャプチャーされたＮＭＲスピン系に属する化合物の濃度であり、少なくとも５つの特性がＮＭＲ不活性な物質（例えば、塩化物イオン又はオキソニウムイオンなどのイオン）の濃度である。別の特性が、サンプル温度又はｐＨであってもよい（後者が物質の濃度として扱われない場合）。キャプチャーされる（対象として含まれる）ＮＭＲスピン系の典型的な数は少なくとも２０である。データベースに含まれるティーチングサンプルの総数は通常、少なくとも５００、好ましくは少なくとも１０００、特に好ましくは少なくとも３０００である。ティーチングサンプル（及び測定されるサンプル）は特定の流体クラスに属する。流体クラスは特に、尿など、特定のタイプの生物流体に対応するように選ばれてもよい。ティーチングサンプルは、好ましくは、測定されるサンプルにおいて、例えば、さまざまな疾病による、又は単にさまざまな人又は起源による（ただし、通常、ヒト及びイヌなどのさまざまな種には依らない）生物流体において存在することが予想される範囲内のこの流体クラスのさまざまな組成を表す。同じことが、植物由来の生成物に当てはまり、これは、さまざまな起源からの同じ生成物、例えば、リンゴジュースであるべきである。一度モデルアプライアンスがティーチングデータベースから完全に導かれると、ティーチングデータベースは、それ以上本発明の方法を適用する必要がないことに留意されたい。

この変形例の別の開発において、流体クラスのティーチングサンプルの少なくとも一部は流体クラスの人工サンプルであり、特に、ここで、人工ティーチングサンプルは、モデルアプライアンスによってキャプチャーされた物質のみを含む。人工サンプルについては、濃度が設定されてもよく、したがって周知である。さらに、限られた数の物質（キャプチャーされた物質など）のみを含むとき、ティーチングデータベースを準備するためのピーク同定はより容易である。この別の開発は、流体クラスが生物流体に対応するとき、「天然」サンプルの入手が困難である場合、極めて大量の化合物が含まれている可能性があるためにティーチングデータベースを構築するときに「天然」サンプルのピークの同定が難しい場合、特に有用である。

さらに別の有利な開発において、各キャプチャーされた物質について、少なくとも３つ、好ましくは少なくとも５つの異なる濃度のティーチングサンプルが含まれる。これは、予測誤差を低く保つ。好ましくは、キャプチャーされた物質について含まれる異なる濃度は、サンプル中の物質の濃度がである範囲を対象に含む。さもなければ、予測はさらに大きな誤差を有する。生物流体については、典型的な対象範囲は、しばしば文献に記載されている、選ばれた生物流体中に天然に存在する代謝産物の最大濃度及び最小濃度によって決定される。人工生成物については、工業的標準値が対象範囲を含んでもよい。

好ましい別の開発は、キャプチャーされた特性が温度を含み、且つ代謝産物の濃度の各セットについて、少なくとも２つの異なる温度のティーチングサンプルが含まれることを提供する。キャプチャーされた特性に温度を含むとき、異なる温度で取得されたサンプルＮＭＲスペクトルを、本発明によって向上した予測精度で扱うことができる。ただし、さらに、ＮＭＲスペクトルを記録する間のサンプルの特別な調質は不要になることに留意されたい。

有利な別の開発において、モデルアプライアンス、又は１つ又は複数のそのサブモデルは、多変量統計アルゴリズムによるティーチングデータベースから得られ、特に、多変量統計アルゴリズムは自己学習アルゴリズムである。多変量統計アルゴリズムは、ティーチングデータベースから相関情報を抽出し、それをモデルアプライアンス又はそのサブモデルそれぞれに入力するための強力なツールを提供する。この文脈において、自己学習は、相関の統計出力、すなわち、モデルアプライアンスを継続的に改善することができるように、且つ／又は流体クラス中に存在する別の化合物（又は化合物の追加のＮＭＲスピン系及びそれらの濃度それぞれ）にこの方法を拡張することができるように、追加のティーチングサンプル（又はそれらの化学シフト値及び特性それぞれ）をティーチングデータベースに統合することができることを意味する。

上述の別の開発について、多変量統計アルゴリズムは、多変量適応型回帰（一次及び三次）スプライン（ＭＡＲＳ）モデル、（直交）部分最小二乗（ＰＬＳ）判別分析、主成分分析、主成分回帰、多重線形回帰、局所加重回帰、マハラノビス距離に基づく分析、クラスアナロジーのソフト独立モデリング（ＳＩＭＣＡ）、Ｋ近傍法、サポートベクターマシン（ＳＶＭ）解析、線形判別分析又は古典的な最小二乗判別分析、人工ニューラルネットワーク、階層的モデリング／クラスタリング、分布に基づくクラスタリング、平行因子分析から選択されてもよい。

その他の変形例
好ましい変形例は、流体クラスが生物流体として選ばれることを規定し、特に、ここで、キャプチャーされた物質は代謝産物である。生物流体は特に多数の化合物を含み、これにより（従来の）ピーク同定を非常に困難にする。したがって、本発明の方法は、この場合に特に有用である。生物流体については、遍在する物質及び偶発する物質並びにそれらの濃度範囲又は濃度比範囲が文献に記載されていることが多く、ティーチングデータベースを容易に立案することができる。生物流体のサンプルは、必要又は希望に応じて、この変形例に従って、無希釈状態又は希釈状態で扱うことができることに留意されたい。

この変形例の好ましい別の開発において、生物流体は、好ましくは、尿、血清、汗、唾液又はＣＳＦ（脳脊髄液）から選択される体液であり、又は生物流体は、好ましくは果汁、乳糜又は花蜜から選択される植物流体である。体液では、本発明の分析後、ＮＭＲスペクトルを疾病の非常に信頼性の高い同定のために使用することができる。植物流体に関する限り、ＮＭＲスペクトルを、より正確な品質管理又は起源の検証のために使用することができる。

別の好ましい変形例において、流体クラスは、天然由来の生成物、特に、好ましくはワイン、蜂蜜又は調味料から選択される植物由来の生成物として選ばれる。やはり、本発明の分析後、ＮＭＲスペクトルを、より正確な品質管理又は起源の検証のために使用することができる。

有利な変形例において、流体クラスは、特にリン酸緩衝液を使用して、６．６〜７．５の間のｐＨ範囲に和らげられる。この方法は化学シフト値のばらつきを抑え、したがって、化学シフト値の予測を簡素化する。ただし、一部のタイプの流体クラス、特に、血清などの一部のタイプの生物流体は元来緩衝され、したがって、サンプル／試験サンプルにおいて追加の緩衝化は必要ないことに留意されたい。

濃度測定に関する方法
また、本発明の範囲内には、ＮＭＲ分光法によって、流体クラスのサンプルに含まれる少なくとも１つの物質の濃度を測定する方法があり、この方法は、
ａａ）上述の本発明の方法のステップａ）からｄ）に従って、キャプチャーされたＮＭＲスピン系の非基準ＮＭＲスピン系の化学シフト値を予測するステップと、
ｂｂ）予測された化学シフト値により、非基準ＮＭＲスピン系に属する記録されたＮＭＲスペクトル内のピークを同定し、且つ記録されたＮＭＲスペクトルからピークの実験による化学シフト値を決定するステップと、
ｃｃ）基準ＮＭＲスピン系及び非基準ＮＭＲスピン系の実験による化学シフト値に対してモデルアプライアンスを適用することによって、特に、上述のフルタイプの第２のサブモデルを適用することによって、少なくとも１つの物質の濃度を計算するステップとを含む。

この方法は、どのような複雑なピーク積分又は線形フィッティングも行わずに、物質濃度の良好な予測を提供することができる。この方法は、基準及び非基準ＮＭＲスピン系の両方に実験による化学シフト値を使用するため、比較的正確である。好ましくは、すべてのキャプチャーされたＮＭＲスピン系がステップｃｃ）において使用される。ただし、ステップｂｂ）において、ピークが弱すぎて記録されたＮＭＲスペクトル内に見つけられない場合、次のステップｃｃ）のために、予測された化学シフト値を実験による化学シフト値とすることができることに留意されたい。

さらに、本発明の範囲内に、ＮＭＲ分光法によって、流体クラスのサンプルに含まれる少なくとも１つの物質の濃度を測定する方法があり、この方法は、
ａａ’）上述の本発明の方法のステップａ）からｄ）に従って、キャプチャーされたＮＭＲスピン系の非基準ＮＭＲスピン系の化学シフト値を予測するステップと、
ｂｂ’）基準ＮＭＲスピン系の実験による化学シフト値及びステップａａ’）において得られた非基準ＮＭＲスピン系の予測された化学シフト値に対してモデルアプライアンスを適用することによって、特に、上述のフルタイプの第２のサブモデルを適用することによって、少なくとも１つの物質の濃度を計算するステップとを含む。

この方法は、どのような複雑なピーク積分又は線形フィッティングも行わずに、物質濃度の迅速な予測を提供することができる。ＮＭＲスペクトル内で基準ＮＭＲスピン系のピークさえ同定すればよいので、この方法は短時間で行うことができる。好ましくは、すべてのキャプチャーされたＮＭＲスピン系がステップｂｂ’）において使用される。

上述の２つの方法の好ましい変形例において、その濃度がＮＭＲ分光法によって測定される少なくとも１つの物質は、ＮＭＲ不活性な物質、特にイオンを含む。本発明により、他の物質におけるＮＭＲスピン系のピークの位置に対するその影響によって、ＮＭＲ不活性な物質（すなわち、ＮＭＲスピン系を持たない物質、したがって、記録されたＮＭＲスペクトル内のどのピークもこの物質に属さない）の濃度を分析することができる。ただし、Ｃｌ⁻イオンなどのＮＭＲ不活性な物質は、ＮＭＲスペクトル内に、積分され得るか、又は線形フィッティングに使用され得るピークを持たないため、従来のＮＭＲに基づく濃度測定によって利用できないことに留意されたい。

本発明の範囲内には、さらに、流体クラスのサンプルに含まれる少なくとも１つの化合物の濃度を測定する方法がある。

この方法は、
ａａ’’）上述の本発明の方法のステップａ）からｄ）にしたがって、前記化合物に属し、非基準ＮＭＲスピン系である少なくとも１つのＮＭＲスピン系の化学シフト値を予測するステップと、
ｂｂ’’）予測された化学シフト値により、前記少なくとも１つのＮＭＲスピン系に属するサンプルの記録されたＮＭＲスペクトル内の少なくとも１つのピークを同定するステップと、
ｃｃ’’）サンプルの記録されたＮＭＲスペクトル内の同定された少なくとも１つのピークの形状及び／又はサイズに基づいて、特に、ピーク積分及び／又は線形フィッティングによって前述の化合物の濃度を計算するステップとを含む。

この方法において、モデルアプライアンスの相関情報が、記録されたＮＭＲスペクトル内の少なくとも１つのピークの迅速かつ信頼性の高い同定のために使用され、次いで、例えば、ピーク積分又は線形フィッティングを使用して、従来の濃度測定が適用される。この結果、化合物の特に正確かつ信頼性の高い濃度情報が得られる。ただし、ステップｃｃ’’）は通常、別のソフトウェアモジュールを用いて行われることに留意されたい。

別の利点は、説明及び添付の図面から引き出すことができる。前述及び後述の特徴を本発明にしたがって個別に、又は任意の組み合わせでまとめて使用することができる。述べた実施の形態は、網羅的なリストと理解されるべきではなく、本発明の説明のための例示的な特徴を有する。

本発明を図面に示す。

ｐＨ及び塩化物イオン濃度（ｍＭ）が人工尿混合物において変化するときのフィッティングしたモデルによるＬ−アスパラギンのスピン系−ＣＨ_２多重線のδ_Ο化学シフト値補間を示す図である。４１の^１Ｈ−ＮＭＲ（部分）モデルに対する変数／特性（代謝産物濃度、ｐＨ、Ｔ）の寄与を示す図である。図中のバーは、フィッティングのために変数が重み付けされている（有意）モデルの数を示す。３８の代謝産物濃度、ｐＨ及びＴ（部分）モデルに対する変数／化学シフト値（４１の^１Ｈスピン系ＮＭＲ化学シフト）の寄与を示す図である。図中のバーは、フィッティングのために変数が重み付けされている（有意）モデルの数を示し、矢印は、最多モデルに有意な変数に対応するバーを示す。基準ＮＭＲスピン系の実験による化学シフト値からサンプル特性を計算する削減タイプの第１のサブモデルで開始する変形例（最上行）、及び基準ＮＭＲスピン系の実験による化学シフト値から予測された化学シフト値を計算する削減タイプの第２のサブモデルで開始する変形例（最上行から２番目）において化学シフト値を予測するための本発明の方法の提示されている実施の形態のワークフロー、並びに、さらに代謝産物濃度を決定するための続いて生じる３つの任意の変形例を示す図である。本発明の方法の実施の形態におけるランダムに調製した２０の人工尿混合物における化学シフトの分布（上図）及びそれらの対応予測誤差分布を示す図である。本発明の方法の実施の形態におけるランダムに調製した２０の人工尿混合物における１７の代謝産物濃度及びｐＨ値の分布（上図）及びそれらの対応予測誤差分布を示す図である。本発明の方法の実施の形態におけるランダムに調製した２０の人工尿混合物における１２の代謝産物濃度の分布（上図）及びそれらの対応予測誤差分布を示す図である。本発明の方法の実施の形態におけるランダムに調製した２０の人工尿混合物における７つの代謝産物濃度の分布（上図）及びそれらの対応予測誤差分布を示す図である。本発明の方法の実施の形態における２０の実際の尿サンプルにおける化学シフトの分布（上図）及びそれらの対応予測誤差分布を示す図である。本発明の方法の実施の形態における６０の実際の尿の生物流体サンプルにおける３６の^１Ｈスピン系のδの予測誤差を示す図である。本発明の方法の実施の形態、ＢＱｕａｎｔ、ＢＡＴＭＡＮ及びＣｈｅｎｏｍｘＮＭＲｐｒｏｆｉｌｅｒによるＴＭＡＯ ^１Ｈ−ＮＭＲピークの帰属を示す図である。濃度、ｐＨ及びＴモデルにおいて有意な変数として現れる７つの代謝産物の１０の^１Ｈスピン系ＮＭＲ化学シフト（矢印で示す）を示す図である。破線の円は、尿の生物流体のＮＭＲプロファイルにおいて最も容易に帰属されるものを強調している。

以下において、モデルアプライアンス及び試験サンプル並びに調査されるサンプルが関連する特定の生物流体、すなわちヒトの尿が流体クラスとして選ばれた実施の形態によって本発明の方法をさらに詳細に説明する。したがって、本実施の形態において、モデルアプライアンスのキャプチャーされた物質が代謝産物である。しかし、本発明は、他の流体クラス、例えば、特に、血清などの他のタイプの生物流体、又はシャワージェルなどの人工生成物のタイプ、又はケチャップなどの天然由来若しくは植物由来の人工生成物のタイプにも適用できることが強調されるべきである。

導入
メタボロミクス及び他の「オミクス」分野の成長は、生物のメタボローム、プロテオーム及びゲノムの詳しい情報を抽出するそれらの能力による、最近のシステムバイオロジーの研究におけるそれらの重要性を示している（参考文献１，２）。メタボロミクスの枠内において、さまざまな分光学的、分光測定的又は生化学的手法が用いられている。そのなかでも、その迅速で正確且つ非破壊的な特徴によって、ＮＭＲスペクトロスコピー−一般に１Ｄ−ＮＭＲ実験による−が用いられている（参考文献３）。

メタボロミクス研究には、生物流体など、複雑な混合物中の代謝産物の同定が必要である（参考文献４〜６）。問題は多くの代謝産物から生じる。生物流体のＮＭＲスペクトルでは、磁気的に等価な^１Ｈ核によって多くの代謝産物の信号が重なり、且つ／又はそれらの一部が、生物流体のマトリックスのより豊富な代謝産物のピークによって隠れる。しかし、最も大きな課題は、ｐＨ、イオン強度並びに代謝産物間の化学的−静電的相互作用によるＮＭＲ化学シフトのばらつきから生じる（参考文献７）。この問題は、多種多様な代謝産物の含量、イオン強度及びｐＨばらつきを示す尿などの生物流体にとって特に重大である。尿組成は、血漿／血清及びＣＳＦ生物流体のように恒常性のルールによって制御されないが、尿組成は、その採取−サンプル調製の単純さ、存在量及び代謝情報の豊かな内容によって、メタボロミクスにとっておそらく最も価値のある生物流体である（参考文献８）。これまで、３０００を超える物質（有機物、無機物、イオン性物質並びに少量のタンパク質）（参考文献９）がヒトの尿中に検出され、そのなかでも、およそ３００の代謝産物がＮＭＲスペクトロスコピーによって検出−定量された（参考文献１０）。

代謝産物を帰属及び定量するために、以下の手法が一般に用いられる。

ｉ）手動の帰属−定量化。この手法は、生物流体サンプルへの化合物のスパイク及びピーク積分、ＣｈｅｎｏｍｘＮＭＲＳｕｉｔｅなどのソフトウェアの使用、代謝産物のＮＭＲスペクトルデータベースの徹底的な調査及び／又はスペクトルのビニングからなる。多くの代謝産物をスパイクするのは費用と時間がかかり、生物流体のマトリックスの組成を大幅に変える可能性があるため、これまで存在しなかった相互作用によるピークのシフトに寄与し、他の手動の帰属の操作には、生物流体で作業した幅広いＮＭＲの経験が必要である。

ｉｉ）半自動化された計算ツールの使用。Ｂａｙｅｓｉｌ（参考文献１１）、ＭｅｔａｂｏＭｉｎｅｒ（参考文献１２）などは最も知られたソフトウェアツールの一部であり、これらは^１Ｈ−ＮＭＲスペクトルからいくつかの代謝産物（Ｂａｙｅｓｉｌでは、血清／血漿サンプルについて約５０種類）を定量する一方、ユーザは、代謝産物の^１Ｈ−ＮＭＲピークの帰属−フィッティングを改善することができる。しかし、特定のプロトコルの使用がサンプル調製及びＮＭＲ取得に必要であり、正確な代謝産物の帰属には生物流体のＮＭＲ解析の経験がやはり前提条件である。

ｉｉｉ）ＢＡＴＭＡＮアルゴリズム（参考文献６）、Ｄｏｌｐｈｉｎ（参考文献５）及びＢＱｕａｎｔ（参考文献１３）のような自動化された計算手法の使用。ＢＡＴＭＡＮ（同じことがＢＱｕａｎｔにも当てはまる）はほぼ自動化されたツールである。一般に、これは、代謝産物の^１Ｈスピン系の最良のフィッティングのために、その定量化を意図してベイズモデルのＭＣＭＣ推定を利用する。できるだけ多くの肯定的な結果を得るためには、相当量の計算能力、代謝産物のＮＭＲピーク位置範囲に関する予備知識、並びに事前のデータベースの構築が通常必要である。しかし、誤ったＮＭＲピークの帰属によって、誤った肯定的な結果がいくつか得られる。Ｄｏｌｐｈｉｎソフトウェアパッケージは、ＢＡＴＭＡＮよりも計算的に「さらに軽い」ように見えるが、これもやはりデータベース情報（すなわち、ＨＭＤＢ、ＢＭＲＢなど）に基づいている一方、２Ｄ−ＪＲＥＳスペクトルを活用して、代謝産物の帰属、したがってそれらの定量化の精度を向上させている。高分解能の２Ｄ−ＪＲＥＳスペクトルが必要であることとは別に、ユーザは定量する代謝産物のリストを定義しなければならない。しかし、すべての代謝産物がカップリングした^１Ｈ核を含むわけではなく、それらの多くが（１つ又は複数の）一重項のみを示し、しばしばそれらのＮＭＲ信号が同じスペクトル領域内で共鳴して、やはり誤った肯定的な帰属につながる。

結論として、成功した正確な代謝産物の濃度測定に重要な前提条件は、それらの信号の欠点のない帰属である。以前の手法は、計算時間又は計算能力又は追加のＮＭＲ実験又はユーザの高度なＮＭＲの経験が必要であり、それでもなお１００％の代謝産物の帰属（したがって、定量化）の成功は保証されない。

本発明は、化合物、本明細書においては代謝産物又はそれらのＮＭＲスピン系それぞれを、ＮＭＲスペクトル内のそれらのピークに帰属するための新規の手法を提示する。本発明の方法又はそのモデルアプライアンスはそれぞれ、完全に自動化された計算ツール内で実施することができる。

モデルアプライアンスは既に混合物（試験サンプル）によりあらかじめ調製されたいくつかのＮＭＲスピン系のそれぞれの組み込み位置モデルを有しており、毎回、完全に自動（計器運転）で動作する。これは、ＮＭＲ信号の定量化及び／又は帰属のためのどのようなフィッティング手順も使用しない。しかし、希望に応じて、下流のソフトウェアによる積分又は線形フィッティングによって定量化が行われてもよい。実際には、モデルアプライアンスは、単にセンサ（基準）ＮＭＲ信号のｐｐｍ値に応じて「式」を解いているだけで、化合物（本明細書においては代謝産物）のＮＭＲピーク位置を出力すると共に、それらの濃度を推定する。

提示されている実施の形態において、モデルアプライアンス又は計算ツールはそれぞれ、尿のＮＭＲサンプル中の２１の代謝産物／化合物の４１の^１Ｈ−ＮＭＲスピン系を自動的に帰属する一方、さらに５つの（分子）代謝産物／物質及び相対誤差が小さい（＜１０％）１０の主要なイオン濃度の推定値、サンプルのｐＨ値（誤差＜±０．１）、並びにＮＭＲ取得中のその温度（Ｔ）（±０．１Ｋ）を与える。予測された化学シフト値及びサンプル特性、特に化合物濃度のフルセットを与えるために、ＮＭＲスペクトルがモデルアプライアンスによって１０秒程度分析されてもよい。

アルゴリズムの基礎
ＮＭＲの基礎から、溶液混合物中の化合物のスピン系（本明細書においては^１Ｈ核）の観察される化学シフト（δ_Ｏ）値は、核周辺の化学的環境を正確に描写したものであり、溶液混合物中で化合物が受けるあらゆる種類の分子相互作用によって大きく影響されることが知られている。しかし、これら複数の弱い相互作用が化学シフトに与える影響の詳細は先験的に予測できない。一般に、速い交換条件下では、δ_Ο値は、多くの平衡状態で存在する、混合物中の対応する化合物分子、すなわち、尿のマトリックスのあらゆる文脈（代謝産物の数ｎ）で可能性のあるあらゆる（自己）相互作用を生じる分子

及び相互作用に関与しない分子（Ｘ_ｆ）のモル分率に関係し得る。

式中、δ_ｆ及び

は、それぞれ、それ自体の内部で相互作用し、かつ（（この場合）尿のマトリックス中に存在するすべての化合物を含む）ｎ個の他の代謝産物と相互作用している代謝産物のスピン系の化学シフト値である。式（１）から、δ_Ο値が、相互作用している化合物の濃度と直接相関することが明確に示される。先に述べたように、ｐＨ及びＴの変化は、化学シフト（ｓｈｉｔｓ）のばらつきの原因となる。その結果、^１Ｈ核を含む任意の尿化合物による各^１Ｈ−ＮＭＲのδ_Ｏ値は、以下の関数によって記述され得る。

式中、変数ｘは、可能性のある相互作用している化合物それぞれの濃度、ｐＨ及びＴ（サンプルの特性とも呼ばれる）であり、各^１Ｈ核のＮＭＲ化学シフトに対するこれらの寄与は、そのδ_Ο値にはね返ってくる。

式（２）を構成するために、各δ_Οに対するすべての前述の寄与のマッピングが必要である。これを実現するために、さまざまな濃度の尿の代謝産物の多くの混合物を構成し、それらの１Ｄ ^１Ｈ−ＮＭＲスペクトルを取得し、各代謝産物の^１Ｈスピン系による各^１Ｈ−ＮＭＲのδ_Οを記録することによって、実際の尿の含有物のマトリックス状態のシミュレーションが行われる。尿のシミュレーションを改善する目的で、人工尿サンプルの構成のための代謝産物を選択するために、基準が適用された。これを行うため、ＨＭＤＢ（ヒトメタボロミクスデータベース）及び他の文献に報告されている濃度及び尿の生物流体中の存在量にしたがって、最も多い２６の尿の（分子タイプの）代謝産物並びに１０のイオン（又はイオンタイプの代謝産物）を選択した（材料及び実験方法の部を参照）。すなわち、適用した基準は、ＮＭＲ、ＭＳ、ＬＣ及び他の技術により測定される、健常人の数千の尿サンプル中の１００％の存在量及び高存在量の分子代謝産物及びイオンに基づいていた（参考文献１４）。したがって、各混合物において、通常４つの中間値と共に、その報告されている最低の濃度を出発点として用いて、この場合、平均濃度まで１つの代謝産物の濃度を変えることにより混合物を調製した（ただし、代わりに、最低の異常値から最高の異常値までの区間を用いてもよいことに留意されたい）。^１Ｈ−ＮＭＲに基づくメタボロミクスのために、各混合物のｐＨ調整についても、一般的な尿の緩衝剤を添加した後、同じ実験スキームにしたがった（材料及び方法の部参照）。表１に混合物の設計された構造を示す。合計で１２３５の混合物を作成した。

表１に基づいて人工尿のマトリックスを構成した。ここで、マトリックスの各行は、各人工尿混合物の代謝産物（分子及びイオン）の濃度情報、ｐＨ及びＴ、すなわち、式２の変数ｘを含む。提示されている実施の形態の混合物のマトリックス（又はティーチングデータベースの第１の部分）のサイズは１２３５×３８であった。ここで、３８は変数の総数である（２６の分子代謝産物／物質及び１０のイオン代謝産物／物質濃度並びにｐＨ及びＴ値、すなわち、キャプチャーされた特性Ｃの総数は３８である）。各混合物（又は試験サンプル）の１Ｄ ^１Ｈ−ＮＭＲ取得は、実際の尿のスペクトルと比べて（適度により単純な）１つのスペクトルを生成した。そこから、（２６の代謝産物うち）２１の代謝産物（化合物）からの４１の^１Ｈスピン系δ_Οを手動で帰属した。すなわち、キャプチャースピン系Ｓの総数は４１である。それらの記録された化学シフト値（ｐｐｍの小数第４位まで）に基づいて、新規の１２３５×４１マトリックス（又はティーチングデータベースの第２の部分）を構成した。ここで、各列には１２３５の人工尿のケースの各スピン系のδ_Ο値が入っている。本発明者らが知る限りでは、実際の生物流体シミュレーションのためのこのような系統的な研究も、シミュレートした生物流体のＮＭＲに基づくこの種類のマトリックス（データベース）構成も存在しなかった。Ａｔｈｅｒｓｕｃｈら（参考文献１５）は、混合計画にしたがって既知の比率で異なる生物流体サンプルを混合すると、重なり合うＮＭＲ信号を有する一部の代謝産物の定量化を改善できることを提案している。Ｓｏｋｏｌｅｎｋｏら（参考文献１６）は、重なり合った^１Ｈ−ＮＭＲ共鳴をデコンボリューションするために、Ｐｌａｃｋｅｔｔ−Ｂｕｒｍａｎ実験計画法を用いて、２０の代謝産物の合成混合物をいくつか作成した。決して、代謝産物組成の変化による化学シフトの変化が予測され得るとは考えられなかった。

アルゴリズムの実装
前述のように、概して、異なる６つの濃度（提示されている実施の形態の低濃度から平均濃度の範囲）の各物質（分子又はイオン代謝産物）、５つのｐＨ値（緩衝剤添加後、６．８〜７．２の範囲）及び２つの温度値（３００．０及び３０２．７ｋ）を人工尿の含有物のマトリックスのために使用した。検討した各スピン系δ_Ο値とすべての３８変数（濃度、ｐＨ、Ｔ）との間の最良の相関関数（式（２））を導くために、多変量統計機械学習法を用いて、最良のフィッティング並びに本発明者らのデータ間の補間を行った。多変量適応型回帰（一次及び三次）スプラインモデル（参考文献１７）（ＭＡＲＳモデル）（人工ニューラルネットワークを含むいくつかの同様の機械学習多変量法を試験した。）は、最良の交差検証Ｒ^２値及び最低の二乗平均平方根誤差（ＲＭＳＥ）並びにさまざまな試験データセットで試験した最良の予測可能性（アルゴリズムの予測−計算効率の部を参照。）を示した。要約すると、それぞれ検討した^１Ｈスピン系の式２は、次の形を取った。

式中、ｃ_０は、導いた回帰モデルの一定の計算値、Ｍは、最良のフィッティングモデル生成のために利用される一次又は三次スプライン基底関数の数、ｃ_ｍは、ｍ番目の一次又は三次スプライン基底関数の係数、Ｂ_ｍ（ｘ）は、一次又は三次スプライン基底関数である。検討した４１の（部分）モデルスピン系の計算した交差検証Ｒ^２及びＲＭＳＥ値は、それぞれ＞０．９８及び＜１ｅ−０４であった。図１では、Ｌ−アスパラギンのスピン系−ＣＨ_２多重項（２つのうちの１つ）のδ_Ο値の補間を、ｐＨ及び塩化物イオン濃度の関数として示してある。

各（部分）モデルのＡＮＯＶＡ分解を実施することによって、重み付けしたすべての変数、すなわち、各モデルの構成に有意な変数を検出することができた。図２に示す通り、すべてのイオン（イオン代謝産物）の濃度、特定の代謝産物（尿素（ｕｒｅａ）、馬尿酸塩（ｈｉｐｐｕｒａｔｅ）、及びクレアチニン（ｃｒｅａｔｉｎｅｎｅ）など）の濃度、ｐＨ及びＴが、ほぼすべての４１のモデルに有意な変数として現れている。文献データ（参考文献７）並びに化学の基礎知識は、特に、化学シフトのばらつきに対するｐＨ、Ｔ及びイオンの影響に関して、先の結果を裏付ける。さらに、クレアチニン、馬尿酸塩及び尿素が（本明細書において使用される混合物中のように）尿の生物流体中で通常示す、すべての他の代謝産物と比べて高い濃度（参考文献９）は、他の多くの代謝産物の化学シフトの決定においてこれらの代謝産物が重要である原因のようであり、この知見は、最初の代謝産物のパネル中で最も多い代謝産物を選択する選択肢を裏付ける。

ここで、化学シフト値があれば、実装には、それらの値を与えていた（分子）代謝産物及びイオン（イオンタイプの代謝産物）の濃度を再構成し得るリバース関数を作る必要がある。同じ数学的手法をリバース（部分）モデルの構成に用いた。この場合、応答（ｙ）値は、各物質／代謝産物（イオンを含む）の濃度、ｐＨ及びＴ（すなわち、サンプル特性）であり、一方、変数は、検討した４１のＮＭＲスピン系であった。生成した３８の（部分）モデルは、δ_Ο（部分）モデルよりも低い交差検証Ｒ^２値（＞０．９０）を示したが、十分に、イオン、クレアチニン、尿素、馬尿酸塩のｐＨ及び温度は完全にフィッティングした（Ｒ^２＞０．９８）。３８のモデルのＡＮＯＶＡ分解は、人工尿の濃度のマトリックスの予測において、検討した４１のＮＭＲスピン系のうち、どの^１Ｈスピン系のＮＭＲ信号が「センサ」として働き得るかを明らかにした。最も高いスコアは、図１２において矢印で、図３において矢印で強調した代謝産物の^１Ｈ核によって示された。

尿中、クエン酸塩（ｃｉｔｒａｔｅ）、クレアチニン、及びグリシン（ｇｌｙｃｉｎｅ）は、他の代謝産物に対して常に高濃度で存在し、それらの^１Ｈ−ＮＭＲ信号は非常に特徴的であり、アスパラギン酸（ａｓｐａｒｔｉｃａｃｉｄ）、アスパラギン（ａｓｐａｒａｇｉｎｅ）、タウリン（ｔａｕｒｉｎｅ）、及びトレオニン（ｔｈｒｅｏｎｉｎｅ）のＮＭＲ信号と比べて容易な帰属を可能にする。この基準を考慮に入れて、すべての濃度、ｐＨ及びＴの（部分）モデルの削減を行った。次のわずか５つの変数を用いて３８の削減（部分）モデルを構築した（すなわち、基準ＮＭＲ系の数Ｒは、この場合、５である）。クレアチニンの２つの一重項、クエン酸塩の２つの二重項、及びグリシンの一重項は図１２において破線の円で強調されている。見かけ上、新たにフィッティングしたモデルの交差検証Ｒ^２及びＲＭＳＥ値は、フルモデルのものよりも悪い（いくつかの例について表２を参照されたい）。しかし、５つのセンサの前述のＮＭＲ信号の位置（又は基準ＮＭＲスピン系）を知っていれば、そのＮＭＲプロファイルにより、どのようなフィッティング法も用いずに、かつ／又はデータベース又はＮＭＲ信号の積分からの代謝産物のＮＭＲシグネチャテンプレートに頼らずに、（出発点として）各人工尿混合物中の（分子）代謝産物及びイオン（イオン代謝産物）の濃度並びにｐＨ及びＴ値を十分に予測できる。

５つのセンサのＮＭＲ信号を検出すると、これらと、残りの代謝産物の検討した前述のＮＭＲ信号のうちの各１つとの相関を調べる機会が与えられる。すなわち、１２３５の混合物中の５つのセンサのピーク位置を変数として用いて、（同じ数学的手法にしたがって）新たな３６のδ_Ο（部分）モデルを作成した（それらのＲ^２及びＲＭＳＥ値の例は表３に報告する）。すなわち、非基準ＮＭＲスピン系の数Ｎは、この場合、３６である。フィッティングしたδ_Ο削減（部分）モデル（関数）は、高いＲ^２及び低いＲＭＳＥ値を示し、３６の^１Ｈスピン系のＮＭＲ信号の位置が、５つのセンサのピーク位置の位置により予測され得ることを示した。

結論として、異なる４タイプのモデル（又は、より正確に言えば、モデルアプライアンスのサブモデル）を作成した。

ｉ）２種類のフルモデル。第１の種類（フルタイプの第１のサブモデルとも呼ばれる）は、混合物の物質／代謝産物濃度、ｐＨ及びＴ値（３８変数）を知ることによる４１の^１Ｈスピン系のＮＭＲピーク位置の予測を含み、第２の種類（フルタイプの第２のサブモデルとも呼ばれる）は、４１の^１Ｈスピン系のＮＭＲピーク位置による３６の物質／代謝産物濃度、ｐＨ及びＴの予測を含む。

ｉｉ）２種類の削減モデル。５つのセンサのＮＭＲ信号の位置による物質／代謝産物濃度、ｐＨ及びＴの３８の予測（部分）モデル（共に削減タイプの第１のサブモデルを表す）、及び５つのセンサのＮＭＲピーク位置に基づく３６の^１Ｈスピン系δ_Ο値の予測（部分）モデル（共に削減タイプの第２のサブモデルを表す）。

４種類のモデル（図４を比較されたい。）を組み合わせると、最良の代謝産物のＮＭＲ信号の位置予測（６０の実際の尿サンプル及び２０のランダムに調製した人工尿混合物において試験した）に基づいた、最終的なアルゴリズムが構成された。化合物濃度の予測は、物質（イオンを含む代謝産物）濃度が既知であったランダムな人工混合物にのみ注目している。

図４に示す最終的なアルゴリズムは、２つの変形例において実施することができる。最上行に示す第１の変形例において、記録されたＮＭＲスペクトルから読み取った５つのセンサのピーク（又は基準ＮＭＲスピン系の実験による化学シフト値）１０が、サブステップｄ１）において、削減タイプの第１のサブモデル１Ｒに送り込まれ、サンプルの予測された代謝産物濃度、ｐＨ及びＴ値の出力１１（すなわち、この場合、３８の予測された特性）が得られる。これらの予測された特性に対して、フルタイプの第１のサブモデル１Ｆがサブステップｄ２）において適用されて、非基準ＮＭＲスピン系の３６の予測された化学シフト値δ_０の出力１２が得られる。基準ＮＭＲスピン系の実験による化学シフト値１０と共に、これらがサブステップｄ３）においてフルタイプの第２のサブモデル２Ｆに入力され、予測された特性１３が再び得られる。サブステップｄ４）において、これらがフルタイプの第１のサブモデル１Ｆに再び送り込まれ、２回目の反復の別の予測された化学シフト値の出力１４が得られる（ただし、希望するならば、サブステップｄ３）及びｄ４）の反復をさらに適用してもよいことに留意されたい）。得られる予測された化学シフト値は、最終的な予測された化学シフト値３０として使用してもよい。

以下の行に示す第２の代替の変形例において、記録されたＮＭＲスペクトルから読み取った５つのセンサのピーク（又は基準ＮＭＲスピン系の実験による化学シフト値）１０が、サブステップｄ１’）において、削減タイプの第２のサブモデル２Ｒに送り込まれ、非基準ＮＭＲスピン系の３６の予測された化学シフト値δ_０の出力２１が得られる。基準ＮＭＲスピン系の実験による化学シフト値１０と共に、これらがサブステップｄ２’）においてフルタイプの第２のサブモデル２Ｆに入力され、予測された特性２２が得られる。サブステップｄ３’）において、これらがフルタイプの第１のサブモデル１Ｆに再び送り込まれ、別の予測された化学シフト値の出力２３が得られる。示した例において、この出力２３が、基準ＮＭＲスピン系の実験による化学シフト値１０と共にサブステップｄ２’）及びｄ３’）の２回目の反復において使用されて、２回目の反復の予測された濃度の出力２４及び２回目の反復の予測された化学シフト値の出力２５が得られる（希望するならば、ステップｄ２’）及びｄ３’）の反復をさらに適用してもよい）。得られる予測された化学シフト値は、やはり、最終的な予測された化学シフト値３０として使用してもよい。

（任意選択で）さらに代謝産物濃度を測定するために、先述したアルゴリズムを、非基準ＮＭＲスピン系の化学シフト値３０が決定されている第１のステップａａ）又はａａ’）又はａａ’’）とみなすことができる。

粗い精度で十分な迅速な代謝産物濃度の推定が望まれる場合、ステップｂｂ’）において、非基準ＮＭＲスピン系の最終的な予測された化学シフト値３０を（基準ＮＭＲスピン系の実験による化学シフト値１０と共に）使用して、フルタイプの第２のサブモデル２Ｆをもう１回適用し、代謝産物濃度を含む予測された特性の出力３１を得ることができる（ただし、特定の濃度のみに関心がある場合、フルタイプの第２のサブモデル２Ｆの部分モデルのみの適用で十分であり得ることに留意されたい）。この手法は、濃度測定のためにさらに以下で用いる（特に図６〜図８を比較されたい）。ただし、希望するならば、ＮＭＲ不活性な代謝産物の濃度を導くためにこの手順を適用してもよいことに留意されたい。

幾分より正確な推定が望まれるが、ピーク積分又は線形フィッティングの手間は避けるべきである場合、ステップｂｂ）において、最終的な予測された化学シフト値３０を使用してＮＭＲスペクトル内の非基準ＮＭＲスピン系のピークを同定し、それらの実験による化学シフト値を読み取ることができる。この入力３２をステップｃｃ）において使用して、フルタイプの第２のサブモデル２Ｆをもう１回適用し、代謝産物濃度を含む予測された特性の出力３３を得てもよい（ただし、やはり、特定の濃度のみに関心がある場合、フルタイプの第２のサブモデル２Ｆの部分モデルのみの適用で十分であり得ることに留意されたい）。ただし、希望に応じて、ＮＭＲ不活性な代謝産物の濃度を導くためにこの手順も適用してもよいことに留意されたい。

最後に、高精度の化合物（又はＮＭＲ活性な代謝産物）濃度が望まれる場合、ステップｂｂ’’）において、最終的な予測された化学シフト値３０を使用してＮＭＲスペクトル内の前記化合物の少なくとも１つの（非基準）ＮＭＲスピン系のピークを同定し、同定された１つのピーク（又は複数のピーク）３４のサイズ及び形状から、例えば、ピーク積分又は線形フィッティングにより濃度情報を導くことができる。

アルゴリズムの予測−計算効率
ａ）人工尿混合物試験。

ランダムな物質／代謝産物（分子及びイオン）濃度値（乱数発生器により計算）及びｐＨ値を含む２０の人工尿混合物を調製し、それらのＮＭＲスペクトルを異なる温度で取得した。すべてのランダムな値が、適用したモデルの濃度、ｐＨ及びＴのマトリックスの限界内であった。２０のＮＭＲスペクトル内で、５つのセンサの信号が化学シフトのマトリックスの限界内にあった。

δ_Οの予測誤差分布を図５にまとめる。図中に示す通り、予測精度はほぼ完璧である。すなわち、３６すべての予測された^１Ｈスピン系のＮＭＲの位置は、±０．０００２ｐｐｍ以下の誤差を示す。人工尿及び実際の尿ではないサンプルからは小さい誤差が生じるが、これらによって、選んだ数学的−アルゴリズム的手法がＮＭＲピーク位置の予測について検証される。

さらに、すべてのイオン、クレアチニン、馬尿酸塩、アスパラギン酸塩、アスパラギン及び尿素の濃度、ｐＨ並びにＴの予測値が２〜４％未満の相対誤差を示す一方、すべての他の代謝産物濃度が５〜１５％の相対誤差で予測された。図６〜図８に示す通り、代謝産物濃度及びｐＨの相対的な予測誤差分布は、２０の人工尿試験混合物中の代謝産物濃度の広い分布と比べて非常に狭い。すなわち、提示されているアルゴリズムは、どのようなＮＭＲ信号の積分−デコンボリューションも行わずに、尿サンプルの代謝産物の濃度範囲に関する情報を提供することができる。

ｂ）実際の尿サンプルの試験。

自動信号予測のために、異なる６０の実際の尿サンプルを、アルゴリズムの入力ファイルを構成する５つのセンサの化学シフト（又は基準ＮＭＲ系の実験による化学シフト値）が、提示されている実施の形態の化学シフトのマトリックスの限界内にあるという条件で選択した。特に、入力ファイルの５つの値が化学シフトのマトリックスの上下限から非常に離れているときモデル外挿効率が低いため、この基準を設定した。提示されているアルゴリズムのこの制限は、アルゴリズムが極めて狭い代謝産物／物質濃度（文献の低い値及び平均値）、ｐＨ（６．８〜７．２）範囲で構築され、トレーニングされたことによる（ただし、ティーチングデータベースのより広い範囲では、この制限は克服されることに留意されたい）。

図９は、最も広い誤差分布を示した、６０の実際の尿サンプルのうちの２０のδ_Οの予測誤差分布を示し、図１０には、６０すべての実際の尿の生物流体による絶対的予測誤差をまとめる。δ_Οの予測誤差は≦｜０．００１５｜ｐｐｍであり、これは−使用した人工尿の代謝産物混合物の生成を考慮して−満足以上のものである。１Ｄ ^１Ｈ−ＮＭＲの生物流体のスペクトルによる他の半自動の標的代謝産物の検出法（例えば、ベイズ法の誤差：≦｜０．００２０｜）によれば、このアルゴリズムのδ_Οの予測値は既にさらに低い誤差範囲を示している。比較例を図１１に示す。図中の調査は、健康な人の尿のＮＭＲプロファイルにおけるＴＭＡＯ代謝産物の帰属である。ＮＭＲスペクトルは、ＣｈｅｎｏｍｘＮＭＲｐｒｏｆｉｌｅｒコンソール、２０１５年版にロードしている。（Ｃｈｅｎｏｍｘによる）手動の帰属は、縦線４０ａ，４０ｂによって限定されたスペクトル範囲を検索するようユーザに促す。この比較的広いスペクトル領域（０．０４ｐｐｍ）において、（「？」で示した）３つのピークがＴＭＡＯの^１Ｈ−ＮＭＲの一重項の候補である。ＴＭＡＯの帰属及び定量化のためにＢＱｕａｎｔ及びＢＡＴＭＡＮソフトウェアを使用すると、（領域３．２６〜３．３０ｐｐｍであれば）約１５〜２０分かかり、それらの帰属結果は、右側の矢印で示したＮＭＲピーク４１であった。本発明者らの自動化されたアルゴリズムの^１Η−ＮＭＲのΤΜΑΟ（（ＣＨ_３）_３ＮＯ）のδ_Ο予測値（１０秒で実行）を点線の縦線及び矢印で示す。

スパイクした結果による正しいＴＭＡＯの^１Ｈ−ＮＭＲピーク４２を左側の矢印及びレ点で示す。すべての自動化された手法（本発明の手法を除く。）が誤った肯定的な結果を示す一方、本発明の予測誤差は＋０．０００２ｐｐｍであり、平均的なラップトップを使用して数秒以内に計算された。

結論
本発明の方法は、迅速なδ_Οの「正確な」予測（これまでのところ≦｜０．００１５｜ｐｐｍ）を可能にする。さらに（ＮＭＲによる）イオン濃度並びに他の代謝産物濃度、ｐＨ及び温度の迅速な予測が、非常に小さい相対誤差（≦２％）で、数学的方法により、代謝産物のＮＭＲパターンフィッティング法なしで実現可能である。この方法は、実際に、高い計算能力を必要としない。この方法は、完全に自動化された方法に適切である。特定のＮＭＲスペクトル分解能、スキャンの数のような特定のＮＭＲプロトコル、又はさらに特定の緩衝能を有する特定のサンプル調製プロトコルを必要としない。ＴＳＰのみを参照化合物として必要とする。

材料及び実験方法
１）ＮＭＲサンプル調製
２６の尿（分子）の代謝産物をＳｉｇｍａから購入した。これらの代謝産物並びに検討した１０のイオンを抽出した塩を表４に一覧にした。各ＮＭＲサンプルの最終容量において１０％の一般的な尿の緩衝剤を使用した。緩衝剤は、１．５ＭＫＨ_２ＰＯ_４、２ｍＭＮａＮ_３及びＮＭＲの参照化合物として０．１％ＴＳＰを含み、これらはＤ_２Ｏ、９９．８％ ^２Ｈに溶解される。濃度４ＮのＨＣｌ又はＮａＯＨ溶液を加え、ｐＨ計で２９８Ｋで測定してＮＭＲサンプルのｐＨを調整した。

２）ＮＭＲ実験
すべてのサンプルの一次元（１Ｄ）１Ｈ−ＮＭＲスペクトルは、６００．１３ＭＨｚプロトンラーモア周波数で動作し、ｚ軸傾斜磁場コイルを含む５ｍｍＣＰＴＩ１Ｈ−１３Ｃ／３１Ｐ−２Ｈクライオプローブ、自動チューニング・マッチング（ＡＴＭ）及び自動サンプルチェンジャーを備えたＢｒｕｋｅｒ６００ＭＨｚスペクトロメーター（ＢｒｕｋｅｒＢｉｏＳｐｉｎ）を使用して取得した。ＰＴ１００熱電対により、サンプルにおいて約０．１Ｋのレベルで温度が安定化された。測定前に、サンプルを温度平衡のためにＮＭＲプローブヘッド内に少なくとも３分保持した。標準的なパルスシーケンス（ＮＯＥＳＹｐｒｅｓａｔ、Ｂｒｕｋｅｒ）を使用して水ピークを抑制し、６４の自由誘導減衰（ＦＩＤ）、６４ｋデータポイント、スペクトル幅１２，０１９Ｈｚ、取得時間２．７秒、緩和遅延４秒及び混合時間１００ｍｓを用いて一次元ＮＭＲスペクトルを取得した。ＮＯＥＳＹｐｒｅｓａｔパルスシーケンスは、Ｓａｕｄｅ，Ｓｌｕｐｓｋｙ及びＳｙｋｅｓ（２００６）に示されているように、水抑制に優れ、定量的な情報が得られるため、メタボロミック解析には標準である（Ａｒａｎｊｂａｒ，Ｏｔｔ，Ｒｏｏｎｇｔａ，＆Ｍｕｅｌｌｅｒ，２００６）。

３）計算プラットフォーム
このアルゴリズムはＭＡＴＬＡＢＲ２０１４ａコンピューティング環境において開発した。このアルゴリズムは、その適用にＭＡＴＬＡＢを必要とする。すべてのＭＡＲＳモデル−関数を、自由に利用できるＡＲＥＳｌａｂｔｏｏｌｂｏｘを使用して作成した（ＪｅｋａｂｓｏｎｓＧ．，ＡＲＥＳＬａｂ：ＡｄａｐｔｉｖｅＲｅｇｒｅｓｓｉｏｎＳｐｌｉｎｅｓｔｏｏｌｂｏｘｆｏｒＭａｔｌａｂ／Ｏｃｔａｖｅ，２０１５，ｈｔｔｐ：／／ｗｗｗ．ｃｓ．ｒｔｕ．ｌｖ／ｊｅｋａｂｓｏｎｓ／から入手可能）。アルゴリズムのすべての他の機能は本発明者らによって開発された。

参考文献
１．Ｈｏｌｍｅｓ，Ｅ．ｅｔａｌ．Ｈｕｍａｎｍｅｔａｂｏｌｉｃｐｈｅｎｏｔｙｐｅｄｉｖｅｒｓｉｔｙａｎｄｉｔｓａｓｓｏｃｉａｔｉｏｎｗｉｔｈｄｉｅｔａｎｄｂｌｏｏｄｐｒｅｓｓｕｒｅ．Ｎａｔｕｒｅ４５３，３９６−４００（２００８）；
２．Ｗｅｃｋｗｅｒｔｈ，Ｗ．，Ｌｏｕｒｅｉｒｏ，Ｍ．Ｅ．，Ｗｅｎｚｅｌ，Ｋ．＆Ｆｉｅｈｎ，Ｏ．Ｄｉｆｆｅｒｅｎｔｉａｌｍｅｔａｂｏｌｉｃｎｅｔｗｏｒｋｓｕｎｒａｖｅｌｔｈｅｅｆｆｅｃｔｓｏｆｓｉｌｅｎｔｐｌａｎｔｐｈｅｎｏｔｙｐｅｓ．Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵｎｉｔｅｄＳｔａｔｅｓＡｍ．１０１，７８０９−７８１４（２００４）；
３．Ｌａｒｉｖｅ，Ｃ．Ｋ．，Ｊｒ．，Ｇ．Ａ．Ｂ．＆Ｄｉｎｇｅｓ，Ｍ．Ｍ．ＮＭＲＳｐｅｃｔｒｏｓｃｏｐｙｆｏｒＭｅｔａｂｏｌｏｍｉｃｓａｎｄＭｅｔａｂｏｌｉｃＰｒｏｆｉｌｉｎｇ．Ａｎａｌ．Ｃｈｅｍ．８７，１３３−１４６（２０１５）；
４．Ａｓｔｌｅ，Ｗ．，ＤｅＩｏｒｉｏ，Ｍ．，Ｒｉｃｈａｒｄｓｏｎ，Ｓ．，Ｓｔｅｐｈｅｎｓ，Ｄ．＆Ｅｂｂｅｌｓ，Ｔ．ＡＢａｙｅｓｉａｎＭｏｄｅｌｏｆＮＭＲＳｐｅｃｔｒａｆｏｒｔｈｅＤｅｃｏｎｖｏｌｕｔｉｏｎａｎｄＱｕａｎｔｉｆｉｃａｔｉｏｎｏｆＭｅｔａｂｏｌｉｔｅｓｉｎＣｏｍｐｌｅｘＢｉｏｌｏｇｉｃａｌＭｉｘｔｕｒｅｓ．Ｊ．Ａｍ．Ｓｔａｔ．Ａｓｓｏｃ．１０７，１２５９−１２７１（２０１２）；
５．Ｇｏｍｅｚ，Ｊ．ｅｔａｌ．Ｄｏｌｐｈｉｎ：Ａｔｏｏｌｆｏｒａｕｔｏｍａｔｉｃｔａｒｇｅｔｅｄｍｅｔａｂｏｌｉｔｅｐｒｏｆｉｌｉｎｇｕｓｉｎｇ１Ｄａｎｄ２Ｄ１Ｈ−ＮＭＲｄａｔａ．Ａｎａｌ．Ｂｉｏａｎａｌ．Ｃｈｅｍ．０６，７９６７−７９７６（２０１４）；
６．Ｈａｏ，Ｊ．ｅｔａｌ．Ｂａｙｅｓｉａｎｄｅｃｏｎｖｏｌｕｔｉｏｎａｎｄｑｕａｎｔｉｆｉｃａｔｉｏｎｏｆｍｅｔａｂｏｌｉｔｅｓｉｎｃｏｍｐｌｅｘ１ＤＮＭＲｓｐｅｃｔｒａｕｓｉｎｇＢＡＴＭＡＮ．Ｎａｔ．Ｐｒｏｔｏｃ．９，１４１６−２７（２０１４）；
７．Ｊｉａｎｇ，Ｌ．，Ｈｕａｎｇ，Ｊ．，Ｗａｎｇ，Ｙ．＆Ｔａｎｇ，Ｈ．Ｅｌｉｍｉｎａｔｉｎｇｔｈｅｄｉｃａｔｉｏｎ−ｉｎｄｕｃｅｄｉｎｔｅｒｓａｍｐｌｅｃｈｅｍｉｃａｌ−ｓｈｉｆｔｖａｒｉａｔｉｏｎｓｆｏｒＮＭＲ−ｂａｓｅｄｂｉｏｆｌｕｉｄｍｅｔａｂｏｎｏｍｉｃａｎａｌｙｓｉｓ．Ａｎａｌｙｓｔ１３７，４２０９−４２１９（２０１２）；
８．Ｅｍｗａｓ，Ａ．−Ｈ．ｅｔａｌ．ＳｔａｎｄａｒｄｉｚｉｎｇｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｃｏｎｄｉｔｉｏｎｓｆｏｒｕｓｉｎｇｕｒｉｎｅｉｎＮＭＲ−ｂａｓｅｄｍｅｔａｂｏｌｏｍｉｃｓｔｕｄｉｅｓｗｉｔｈａｐａｒｔｉｃｕｌａｒｆｏｃｕｓｏｎｄｉａｇｎｏｓｔｉｃｓｔｕｄｉｅｓ：ａｒｅｖｉｅｗ．Ｍｅｔａｂｏｌｏｍｉｃｓ１１，８７２−８９４（２０１４）；
９．Ｗｉｓｈａｒｔ，Ｄ．Ｓ．ｅｔａｌ．ＨＭＤＢ：ｔｈｅＨｕｍａｎＭｅｔａｂｏｌｏｍｅＤａｔａｂａｓｅ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３５，Ｄ５２１−Ｄ５２６（２００７）；
１０．Ｂｏｕａｔｒａ，Ｓ．ｅｔａｌ．Ｔｈｅｈｕｍａｎｕｒｉｎｅｍｅｔａｂｏｌｏｍｅ．ＰＬｏＳＯｎｅ８，ｅ７３０７６（２０１３）；
１１．Ｒａｖａｎｂａｋｈｓｈ，Ｓ．ｅｔａｌ．Ａｃｃｕｒａｔｅ，Ｆｕｌｌｙ−ＡｕｔｏｍａｔｅｄＮＭＲＳｐｅｃｔｒａｌＰｒｏｆｉｌｉｎｇｆｏｒＭｅｔａｂｏｌｏｍｉｃｓ．ＰＬｏＳＯｎｅ１０，ｅ０１２４２１９（２０１５）；
１２．Ｘｉａ，Ｊ．，Ｂｊｏｒｎｄａｈｌ，Ｔ．Ｃ．，Ｔａｎｇ，Ｐ．＆Ｗｉｓｈａｒｔ，Ｄ．Ｓ．ＭｅｔａｂｏＭｉｎｅｒ−−ｓｅｍｉ−ａｕｔｏｍａｔｅｄｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｍｅｔａｂｏｌｉｔｅｓｆｒｏｍ２ＤＮＭＲｓｐｅｃｔｒａｏｆｃｏｍｐｌｅｘｂｉｏｆｌｕｉｄｓ．ＢＭＣＢｉｏｉｎｆｏｒｍａｔｉｃｓ９，１−１６（２００８）；
１３．Ｚｈｅｎｇ，Ｃ．，Ｚｈａｎｇ，Ｓ．，Ｒａｇｇ，Ｓ．，Ｒａｆｔｅｒｙ，Ｄ．＆Ｖｉｔｅｋ，Ｏ．Ｉｄｅｎｔｉｆｉｃａｔｉｏｎａｎｄｑｕａｎｔｉｆｉｃａｔｉｏｎｏｆｍｅｔａｂｏｌｉｔｅｓｉｎ１ＨＮＭＲｓｐｅｃｔｒａｂｙＢａｙｅｓｉａｎｍｏｄｅｌｓｅｌｅｃｔｉｏｎ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２７，１６３７−１６４４（２０１１）；
１４．Ｗｉｓｈａｒｔ，Ｄ．Ｓ．ｅｔａｌ．ＨＭＤＢ：ａｋｎｏｗｌｅｄｇｅｂａｓｅｆｏｒｔｈｅｈｕｍａｎｍｅｔａｂｏｌｏｍｅ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３７，Ｄ６０３−１０（２００９）；
１５．Ａｔｈｅｒｓｕｃｈ，Ｔ．Ｊ．，Ｍａｌｉｋ，Ｓ．，Ｗｅｌｊｉｅ，Ａ．，Ｎｅｗｔｏｎ，Ｊ．＆Ｋｅｕｎ，Ｈ．Ｃ．Ｅｖａｌｕａｔｉｏｎｏｆ１ＨＮＭＲＭｅｔａｂｏｌｉｃＰｒｏｆｉｌｉｎｇＵｓｉｎｇＢｉｏｆｌｕｉｄＭｉｘｔｕｒｅＤｅｓｉｇｎ．Ａｎａｌ．Ｃｈｅｍ．８５，６６７４−６６８１（２０１３）；
１６．Ｓｏｋｏｌｅｎｋｏ，Ｓ．ｅｔａｌ．Ｐｒｏｆｉｌｉｎｇｃｏｎｖｏｌｕｔｅｄｓｉｎｇｌｅ−ｄｉｍｅｎｓｉｏｎｐｒｏｔｏｎＮＭＲｓｐｅｃｔｒａ：Ａｐｌａｃｋｅｔｔ−ｂｕｒｍａｎａｐｐｒｏａｃｈｆｏｒａｓｓｅｓｓｉｎｇｑｕａｎｔｉｆｉｃａｔｉｏｎｅｒｒｏｒｏｆｍｅｔａｂｏｌｉｔｅｓｉｎｃｏｍｐｌｅｘｍｉｘｔｕｒｅｓｗｉｔｈａｐｐｌｉｃａｔｉｏｎｔｏｃｅｌｌｃｕｌｔｕｒｅ．Ａｎａｌ．Ｃｈｅｍ．８６，３３３０−３３３７（２０１４）；
１７．Ｆｒｉｅｄｍａｎ，Ｊ．Ｈ．Ｍｕｌｔｉｖａｒｉａｔｅａｄａｐｔｉｖｅｒｅｇｒｅｓｓｉｏｎｓｐｌｉｎｅｓ．Ａｎｎ．Ｓｔａｔ．１９，１−１４１（１９９１）。

Claims

ＮＭＲ分光法を用いて、流体クラスのサンプルに含まれる化合物に属するＮＭＲスピン系の化学シフト値を予測する方法であって、
ａ）前記流体クラスに含まれるキャプチャーされた物質の濃度、及び前記流体クラスに含まれると共に、前記キャプチャーされた物質の中にある化合物に属するキャプチャーされたＮＭＲスピン系の化学シフト値を含み、前記流体クラスのキャプチャーされた特性間の相関情報を表すモデルアプライアンスを提供するステップであって、前記モデルアプライアンスは、前記キャプチャーされたＮＭＲスピン系のサブセットであると共に、前記流体クラスに遍在する化合物に属する基準ＮＭＲスピン系の定義を含むステップと、
ｂ）前記流体クラスのサンプルのＮＭＲスペクトルを記録するステップと、
ｃ）前記モデルアプライアンスの前記定義された基準ＮＭＲスピン系に属する前記記録されたＮＭＲスペクトル内のピークを同定し、且つ前記記録されたＮＭＲスペクトルから前記ピークの実験による化学シフト値を決定するステップと、
ｄ）前記基準ＮＭＲスピン系の前記実験による化学シフト値（１０）に対して前記モデルアプライアンスを適用することによって、前記基準ＮＭＲスピン系に属さない前記キャプチャーされたＮＭＲスピン系のうちの少なくとも１つの化学シフト値（３０）を予測するステップと
を含むことを特徴とする方法。
前記モデルアプライアンスによって決定される化学シフト値が、平均を超える量の濃度のキャプチャーされた物質にとって有意であるキャプチャーされたＮＭＲスピン系から前記基準ＮＭＲスピン系が選ばれることを特徴とする請求項１に記載の方法。
前記基準ＮＭＲスピン系が、統計的相関分析法、特にＡＮＯＶＡ分解又はスピアマンの順位相関又はケンドールの順位相関又は疑似計算又は正準相関分析を用いて決定されることを特徴とする請求項１又は２に記載の方法。
前記モデルアプライアンスが、前記基準ＮＭＲスピン系のみの化学シフト値δ_ｉの関数ｆとしてキャプチャーされた特性ｘ_ｊを示す削減タイプの第１のサブモデル（１Ｒ）
ｘ_ｊ＝ｆ_ｊ（δ_１，…，δ_Ｒ）
（式中、ｊ：キャプチャーされた特性の添数（ｊ＝１，…，Ｃ；Ｃはキャプチャーされた特性の数）、並びにｉ：基準ＮＭＲスピン系の添数（ｉ＝１，…，Ｒ；Ｒは基準ＮＭＲスピン系の数））
を含むことを特徴とする請求項１から３のいずれか１項に記載の方法。
前記モデルアプライアンスは、前記基準ＮＭＲスピン系のみの化学シフト値δ_ｉの関数ｆとして非基準ＮＭＲスピン系の化学シフト値δ_ｋを示す削減タイプの第２のサブモデル（２Ｒ）
δ_ｋ＝ｆ_ｋ（δ_１，…，δ_Ｒ）
（式中、ｋ：非基準ＮＭＲスピン系の添数（ｋ＝１，…，Ｎ；Ｎはキャプチャーされた非基準ＮＭＲスピン系の数）、並びにｉ：基準ＮＭＲスピン系の添数（ｉ＝１，…，Ｒ；Ｒは基準ＮＭＲスピン系の数））
を含むことを特徴とする請求項１から４のいずれか１項に記載の方法。
前記モデルアプライアンスは、前記キャプチャーされた特性ｘ_ｊの関数ｆとして前記非基準ＮＭＲスピン系又はすべてのキャプチャーされたＮＭＲスピン系の化学シフト値δ_ｌを示すフルタイプの第１のサブモデル（１Ｆ）
δ_ｌ＝ｆ_ｌ（ｘ_１，…，ｘ_Ｃ）
（式中、ｌ：ＮＭＲスピン系の添数（ｌ＝１，…，Ｎ；Ｎは非基準ＮＭＲスピン系の数、又はｌ＝１，…，Ｓ；ＳはすべてのキャプチャーされたＮＭＲスピン系の数）、並びにｊ：キャプチャーされた特性の添数（ｊ＝１，…，Ｃ；Ｃはキャプチャーされた特性の数））
を含むことを特徴とする請求項１から５のいずれか１項に記載の方法。
前記モデルアプライアンスは、前記キャプチャーされたＮＭＲスピン系の化学シフト値δ_ｌの関数ｆとして前記特性ｘ_ｊを示すフルタイプの第２のサブモデル（２Ｆ）を含み、
ｘ_ｊ＝ｆ_ｊ（δ_１，…，δ_Ｓ）
（式中、ｊ：キャプチャーされた特性の添数（ｊ＝１，…，Ｃ；Ｃはキャプチャーされた特性の数）、並びにｌ：キャプチャーされたＮＭＲスピン系の添数（ｌ＝１，…，Ｓ；ＳはキャプチャーされたＮＭＲスピン系の数））
を含むことを特徴とする請求項１から６のいずれか１項に記載の方法。
ステップｄ）の間に、
ｄ１）前記削減タイプの第１のサブモデル（１Ｒ）が前記基準ＮＭＲスピン系の前記実験による化学シフト値（１０）に対して適用されて、予測された特性（１１）を得るサブステップと、
ｄ２）前記フルタイプの第１のサブモデル（１Ｆ）が先のサブステップｄ１）の前記予測された特性（１１）に対して適用されて、前記非基準ＮＭＲスピン系の予測された化学シフト値（１２）を得るサブステップと、
ｄ３）前記フルタイプの第２のサブモデル（２Ｆ）が前記基準ＮＭＲスピン系の前記実験による化学シフト値（１０）及び先のサブステップｄ２）において得られた前記非基準ＮＭＲスピン系の前記予測された化学シフト値（１２）に対して適用されて、予測された特性（１３）を得るサブステップと、
ｄ４）前記フルタイプの第１のサブモデル（１Ｆ）が、先のサブステップｄ３）において得られた前記予測された特性（１３）に対して適用されて、前記非基準ＮＭＲスピン系の予測された化学シフト値（１４）を得るサブステップと、
が適用され、
特に、サブステップｄ３）及びｄ４）のシーケンスが数回繰り返され、次いで、前記先のステップｄ４）において得られた前記非基準ＮＭＲスピン系の前記予測された化学シフト値（１４）から開始する
ことを特徴とする請求項４、６、及び７に記載の方法。
ステップｄ）の間に、
ｄ１’）前記削減タイプの第２のサブモデル（２Ｒ）が前記基準ＮＭＲスピン系の前記実験による化学シフト値（１０）に対して適用されて、前記非基準ＮＭＲスピン系の予測された化学シフト値（２１）を得るサブステップと、
ｄ２’）前記フルタイプの第２のサブモデル（２Ｆ）が前記基準ＮＭＲスピン系の前記実験による化学シフト値（１０）及び先のサブステップｄ１’）において得られた前記非基準ＮＭＲスピン系の前記予測された化学シフト値（２１）に対して適用されて、予測された特性（２２）を得るサブステップと、
ｄ３’）前記フルタイプの第１のサブモデル（１Ｆ）が先のサブステップｄ２’）において得られた前記予測された特性（２２）に対して適用されて、前記非基準ＮＭＲスピン系の予測された化学シフト値（２３）を得るサブステップと
が適用され、
特に、ステップｄ２’）及びｄ３’）のシーケンスが数回繰り返され、次いで、前記先のステップｄ３’）において得られた前記非基準ＮＭＲスピン系の前記予測された化学シフト値（２３）から開始する
ことを特徴とする請求項５、６、及び７に記載の方法。
前記モデルアプライアンスがティーチングデータベースから得られ、前記ティーチングデータベースは、前記流体クラスの複数のティーチングサンプルの各々について、
−前記キャプチャーされた物質の前記濃度の値を含む、前記キャプチャーされた特性の値と、
−前記各ティーチングサンプルの記録されたティーチングＮＭＲスペクトル、及び前記ティーチングＮＭＲスペクトル内のピークの前記キャプチャーされたＮＭＲスピン系への帰属、特に手動の帰属、並びにそれらの化学シフト値の決定により得られた前記キャプチャーされたＮＭＲスピン系の化学シフト値と
を含むことを特徴とする請求項１から９のいずれか１項に記載の方法。
前記キャプチャーされた特性が温度（Ｔ）を含み、且つ物質の濃度の各セットについて、少なくとも２つの異なる温度（Ｔ）のティーチングサンプルが含まれることを特徴とする請求項１０に記載の方法。
前記モデルアプライアンス、又は１つ又は複数のそのサブモデル（１Ｒ、２Ｒ、１Ｆ、２Ｆ）は、多変量統計アルゴリズムによる前記ティーチングデータベースから得られ、特に、前記多変量統計アルゴリズムは自己学習アルゴリズムであることを特徴とする請求項１０又は１１に記載の方法。
前記流体クラスが生物流体として選ばれ、特に、前記キャプチャーされた物質が代謝産物であることを特徴とする請求項１から１２のいずれか１項に記載の方法。
前記生物流体が、好ましくは尿、血清、汗、唾液又はＣＳＦから選択される体液、又は、好ましくは果汁、乳糜又は花蜜から選択される植物流体であることを特徴とする請求項１３に記載の方法。
前記流体クラスが、天然由来の生成物、特に、好ましくはワイン、蜂蜜又は調味料から選択される植物由来の生成物として選ばれることを特徴とする請求項１から１２のいずれか１項に記載の方法。
ＮＭＲ分光法によって、流体クラスのサンプルに含まれる少なくとも１つの物質の濃度を測定する方法であって、
ａａ）請求項１から１５のいずれか１項に記載の方法のステップａ）からｄ）に従って、前記キャプチャーされたＮＭＲスピン系の非基準ＮＭＲスピン系の前記化学シフト値（３０）を予測するステップと、
ｂｂ）前記予測された化学シフト値により、非基準ＮＭＲスピン系に属する前記記録されたＮＭＲスペクトル内のピークを同定し、且つ前記記録されたＮＭＲスペクトルから前記ピークの実験による化学シフト値（３２）を決定するステップと、
ｃｃ）前記基準ＮＭＲスピン系及び非基準ＮＭＲスピン系の前記実験による化学シフト値（１０、３２）に対して前記モデルアプライアンスを適用することによって、特に、請求項７に記載の前記フルタイプの第２のサブモデル（２Ｆ）を適用することによって、前記少なくとも１つの物質の濃度（３３）を計算するステップと
を含むことを特徴とする方法。
ＮＭＲ分光法によって、流体クラスのサンプルに含まれる少なくとも１つの物質の濃度を測定する方法であって、
ａａ’）請求項１から１５のいずれか一項に記載の方法のステップａ）からｄ）に従って、前記キャプチャーされたＮＭＲスピン系の非基準ＮＭＲスピン系の前記化学シフト値（３０）を予測するステップと、
ｂｂ’）前記基準ＮＭＲスピン系の前記実験による化学シフト値（１０）及びステップａａ’）において得られた前記非基準ＮＭＲスピン系の前記予測された化学シフト値（３０）に対して前記モデルアプライアンスを適用することによって、特に、請求項７に記載の前記フルタイプの第２のサブモデル（２Ｆ）を適用することによって、前記少なくとも１つの物質の濃度（３１）を計算するステップと
を含むことを特徴とする方法。
前記濃度（３１、３３）がＮＭＲ分光法によって決定される前記少なくとも１つの物質が、ＮＭＲ不活性な物質、特にイオンを含むことを特徴とする請求項１６又は１７に記載の方法。
流体クラスのサンプルに含まれる少なくとも１つの化合物の濃度を測定する方法であって：
ａａ’’）請求項１から１５のいずれか１項に記載の方法のステップａ）からｄ）にしたがって、前記化合物に属し、非基準ＮＭＲスピン系である少なくとも１つのＮＭＲスピン系の前記化学シフト値（３０）を予測するステップと、
ｂｂ’’）前記予測された化学シフト値（３０）により、前記少なくとも１つのＮＭＲスピン系に属する前記サンプルの前記記録されたＮＭＲスペクトル内の少なくとも１つのピークを同定するステップと、
ｃｃ’’）前記サンプルの前記記録されたＮＭＲスペクトル内の前記同定された少なくとも１つのピークの形状及び／又はサイズに基づいて、特に、ピーク積分及び／又は線形フィッティングによって前記化合物の濃度（３４）を計算するステップと
を含むことを特徴とする方法。