JP5415476B2 - NMR data processing apparatus and method - Google Patents
NMR data processing apparatus and method Download PDFInfo
- Publication number
- JP5415476B2 JP5415476B2 JP2011095717A JP2011095717A JP5415476B2 JP 5415476 B2 JP5415476 B2 JP 5415476B2 JP 2011095717 A JP2011095717 A JP 2011095717A JP 2011095717 A JP2011095717 A JP 2011095717A JP 5415476 B2 JP5415476 B2 JP 5415476B2
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- pca
- data
- nmr spectrum
- chart
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 146
- 238000000034 method Methods 0.000 title description 93
- 238000000513 principal component analysis Methods 0.000 claims description 343
- 238000004458 analytical method Methods 0.000 claims description 278
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 claims description 249
- 239000000126 substance Substances 0.000 claims description 160
- 238000001228 spectrum Methods 0.000 claims description 147
- 238000004364 calculation method Methods 0.000 claims description 127
- 238000011068 loading method Methods 0.000 claims description 113
- 230000010354 integration Effects 0.000 claims description 102
- 239000011159 matrix material Substances 0.000 claims description 42
- 238000000491 multivariate analysis Methods 0.000 claims description 35
- 230000004069 differentiation Effects 0.000 claims description 15
- 230000003595 spectral effect Effects 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000003672 processing method Methods 0.000 claims description 4
- 239000000523 sample Substances 0.000 description 146
- 238000005481 NMR spectroscopy Methods 0.000 description 86
- 238000003860 storage Methods 0.000 description 80
- 238000012937 correction Methods 0.000 description 57
- 230000008569 process Effects 0.000 description 57
- 238000013500 data storage Methods 0.000 description 32
- 238000012217 deletion Methods 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 201000010099 disease Diseases 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 238000005457 optimization Methods 0.000 description 13
- 238000007689 inspection Methods 0.000 description 11
- 238000003825 pressing Methods 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 230000008878 coupling Effects 0.000 description 10
- 238000010168 coupling process Methods 0.000 description 10
- 238000005859 coupling reaction Methods 0.000 description 10
- 239000003086 colorant Substances 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- 239000000090 biomarker Substances 0.000 description 8
- 238000011946 reduction process Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000010363 phase shift Effects 0.000 description 7
- 239000002904 solvent Substances 0.000 description 6
- 238000010183 spectrum analysis Methods 0.000 description 5
- 239000008280 blood Substances 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 239000002207 metabolite Substances 0.000 description 3
- 238000002705 metabolomic analysis Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000005160 1H NMR spectroscopy Methods 0.000 description 2
- HEDRZPFGACZZDS-MICDWDOJSA-N Trichloro(2H)methane Chemical compound [2H]C(Cl)(Cl)Cl HEDRZPFGACZZDS-MICDWDOJSA-N 0.000 description 2
- 230000008602 contraction Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000001431 metabolomic effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- FDRCDNZGSXJAFP-UHFFFAOYSA-M sodium chloroacetate Chemical compound [Na+].[O-]C(=O)CCl FDRCDNZGSXJAFP-UHFFFAOYSA-M 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000003363 endpoint correction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012950 reanalysis Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Landscapes
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Description
本発明は、NMR(核磁気共鳴)データを処理するための装置及び方法に関わり、特に、例えばメタボローム解析(メタボノミクスまたはメタボロミクス)のように多数のNMRスペクトルの多変量解析を行なう用途に好適なものである。 The present invention relates to an apparatus and method for processing NMR (nuclear magnetic resonance) data, and is particularly suitable for use in multivariate analysis of a large number of NMR spectra, such as metabolomic analysis (metabonomics or metabolomics). Is.
近年、ゲノムやプロテオーム科学の進展に伴って、代謝物全体(メタボローム又はメタボノーム)を網羅的に解析するメタボノミクス(メタボロミクスともいう)が注目を集めている。特に、NMR装置により測定される多数の生体サンプルのプロトンスペクトル(NMRスペクトル)を用い、多変量解析によってサンプル間のパターン分類を行うことで、例えば病態や未病に対する知見を得ようとする解析方法が、メタボノミクスにおいて採用される。 In recent years, with the progress of genome and proteome science, metabonomics (also referred to as metabolomics) that comprehensively analyzes the entire metabolite (metabolome or metabonome) has attracted attention. In particular, analysis methods for obtaining knowledge about disease states and non-diseases, for example, by performing pattern classification between samples by multivariate analysis using proton spectra (NMR spectra) of a large number of biological samples measured by an NMR apparatus Are employed in metabonomics.
すなわち、生体サンプルのプロトンスペクトルは、多種の低分子代謝物や生体高分子化合物を含むので多くのピークが重なり複雑なパターンを示す。また、微弱なピークも多くて、それをノイズと区別することが難しい。そのため、プロトンスペクトルに含まれる個々のピークを同定し構造解析することが困難である。そこで、メタボノミクスにおいては、多数の生体サンプルのプロトンスペクトルを測定し、測定された多数のプロトンスペクトルのデータを用いて多変量解析のような統計的解析を行ない、生体サンプル間の構成成分種や比率の相違をパターン(特徴量)として抽出するという解析方法が採用される。この方法により、代謝物の質的相違を捉えたり、経時変化を検出したりすることが可能になる。 That is, the proton spectrum of a biological sample contains a variety of low-molecular metabolites and biopolymer compounds, so that many peaks overlap and show a complicated pattern. Moreover, there are many weak peaks, and it is difficult to distinguish them from noise. Therefore, it is difficult to identify and analyze the individual peaks included in the proton spectrum. Therefore, in metabonomics, the proton spectra of a large number of biological samples are measured, and statistical analysis such as multivariate analysis is performed using a large number of measured proton spectrum data. An analysis method of extracting a difference in ratio as a pattern (feature amount) is adopted. This method makes it possible to detect qualitative differences in metabolites and to detect changes over time.
ところで、メタボノミクスを使用した薬物発見、疾患の処置及び診断のための方法が特許文献1に開示されている。ただし、特許文献1には、NMRスペクトルに関する開示はない。また、特許文献2及び3には、メタボノミクスのためのNMRスペクトルの処理に関する技術が開示されている。また、化学データの多変量解析の種々の手法が、非特許文献1に開示されている。
Incidentally,
一般的なメタボノミクスのプロセスは、NMR装置から出力される多数のサンプルのFID(Free Induction Decay:自由誘導減衰)データを得ること、多数のサンプルのFID信号をそれぞれNMRスペクトルに変換すること、及び、多数のサンプルのNMRスペクトルに関して多変量解析に代表される統計処理を行なうことが含まれる。メタボノミクスのプロセスに含まれる複雑なNMRスペクトルデータの処理は、通常、コンピュータにより実行されるが、信頼できる処理結果を得るためには、FID信号から得られるNMRスペクトルの精度を向上し、かつ、多数のNMRスペクトルを統計処理プログラムで効率よく分析できるようにするためのデータ加工技術が必要である。 A typical metabonomic process is to obtain FID (Free Induction Decay) data for a large number of samples output from the NMR instrument, to convert the FID signals of a large number of samples to NMR spectra, respectively, and , Including performing statistical processing represented by multivariate analysis on the NMR spectra of a large number of samples. Processing of complex NMR spectral data included in the metabonomics process is usually performed by a computer, but in order to obtain a reliable processing result, the accuracy of the NMR spectrum obtained from the FID signal is improved, and There is a need for data processing techniques to enable a large number of NMR spectra to be analyzed efficiently with a statistical processing program.
NMRスペクトルの精度を向上させるための従来の処理技術として、位相補正とベースライン補正がある。位相補正とベースライン補正は、いずれも、コンピュータにより自動的に行い得るが、しかし最終的には、人が手動で、コンピュータの表示スクリーンに表示されたNMRスペクトルのグラフを見ながら、補正パラメータを最も適当と思われる値に調整するための操作をコンピュータに加えるという方法で行われる。しかし、この従来の補正方法は、長い作業時間を要して非効率的であるとともに、補正結果の適正レベルが人に依存するので常に最適なNMRスペクトルを得ることが難しい。 Conventional processing techniques for improving the accuracy of NMR spectra include phase correction and baseline correction. Both phase correction and baseline correction can be performed automatically by the computer, but eventually the correction parameters can be adjusted manually by a person looking at the graph of the NMR spectrum displayed on the computer display screen. This is done by adding an operation to the computer to adjust the value to the most suitable value. However, this conventional correction method requires a long working time and is inefficient, and the appropriate level of the correction result depends on the person, so that it is difficult to always obtain an optimum NMR spectrum.
また、NMRスペクトルを統計処理プログラムで効率よく分析できるようにするために、従来、NMRスペクトルを統計処理プログラムにインプットする前に、NMRスペクトルにバケット積分を適用して、これをデータ量のより小さいヒストグラムに縮約するという処理が行われている。すなわち、NMRスペクトルのケミカルシフト軸(周波数軸)に沿った観測範囲が、一定幅(典型的には0.04ppm)の刻みで多数のバケット(ケミカルシフトの小区間)に分割され、バケット毎にNMRスペクトルの強度の積分(バケット積分)が行われ、その結果として、多数のバケットの積分値のセットからなるヒストグラムが、NMRスペクトルの縮約として得られる。各サンプルのNMRスペクトルがヒストグラムに変換されるので、全体でサンプル数×バケット数に相当する数の積分値が得られ、それらの積分値が統計処理プログラムにインプットされる。 In addition, in order to make it possible to analyze NMR spectra efficiently with a statistical processing program, conventionally, before inputting an NMR spectrum into a statistical processing program, bucket integration is applied to the NMR spectrum, which is smaller in data volume. A process of reducing to a histogram is performed. In other words, the observation range along the chemical shift axis (frequency axis) of the NMR spectrum is divided into a large number of buckets (chemical shift subsections) in steps of a constant width (typically 0.04 ppm). Integration of the intensity of the NMR spectrum (bucket integration) is performed, and as a result, a histogram consisting of a set of integral values of multiple buckets is obtained as a reduction of the NMR spectrum. Since the NMR spectrum of each sample is converted into a histogram, a total number of integral values corresponding to the number of samples × the number of buckets is obtained, and these integral values are input to the statistical processing program.
しかしながら、従来のバケット積分の処理方法で得られるヒストグラムは、必ずしも、NMRスペクトルの特徴を十分に良く反映したものではない。すなわち、NMRスペクトル上の重要な幾つかの強度ピークが、ヒストグラム上では矮小化又は稀釈化されてしまう場合がある。この現象は、バケット積分のプロセスにおいて、一つの強度ピークが分布するケミカルシフト領域が複数のバケットに分割され、その結果、その強度ピークが複数の小さい積分値に分散されるときに生じる。 However, the histogram obtained by the conventional bucket integration processing method does not necessarily reflect the characteristics of the NMR spectrum sufficiently well. That is, some important intensity peaks on the NMR spectrum may be dwarfed or diluted on the histogram. This phenomenon occurs when a chemical shift region in which one intensity peak is distributed is divided into a plurality of buckets in the bucket integration process, and as a result, the intensity peak is dispersed into a plurality of small integrated values.
上述した位相補正とベースライン補正に関わる問題、及びバケット積分に関わる問題に対しては、特許文献1−3はいずれも、格別有用な技術を提供していない。これらの問題は、メタボノミクスのためのNMRスペクトル処理だけに限らず、他の用途のためのNMRスペクトル処理においても同様に存在する。 None of Patent Documents 1-3 provide a particularly useful technique for the above-described problems related to phase correction and baseline correction, and problems related to bucket integration. These problems exist not only in NMR spectral processing for metabonomics, but also in NMR spectral processing for other applications.
また、統計処理プログラムにより行なわれる多変量解析の処理については、上述した特許文献には格別の提案はない。 In addition, regarding the multivariate analysis processing performed by the statistical processing program, there is no particular proposal in the above-described patent document.
ここで、非特許文献1に開示されているように、多変量解析と呼ばれる分析手法には多くの種類がある。代表的な分析手法の一つはPCA(Principal component Analysis:主成分分析)である。PCAでは、サンプルの成分である多数の変数の座標軸からなる多次元空間中で、サンプル間の相違(分散)が最も顕著に現れる少数本(例えば3本程度)の新しい座標軸が定義され、そして、新しい座標軸上での各サンプルの座標値が計算される。ここで、その新しい座標軸は「主成分軸」と呼ばれ、各主成分軸に沿った変数は「主成分」と呼ばれ、そして、各サンプルの各主成分軸上の座標値は「スコア」と呼ばれる。各主成分は、多数の変数の線形一次式で定義され、その線形一次式内の各変数項の係数は「ローディング」と呼ばれる。ある主成分についての各変数のローディングは、その主成分に対する各変量の寄与度合いつまり重みを表す。
Here, as disclosed in
このようなPCAの結果に基づいて、主成分空間上に多数のサンプルをプロットすることにより、それらサンプルの性格を視覚的に把握することが容易になる。また、主成分空間上でのサンプルの配置や相互間の距離などを利用して、多数のサンプルのクラス分けを行なうことができる。 By plotting a large number of samples on the principal component space based on such PCA results, it becomes easy to visually grasp the characteristics of these samples. In addition, it is possible to classify a large number of samples by using the arrangement of samples in the principal component space and the distance between them.
また、PCAを応用したSIMCA(Soft Independent Modeling of Class Analogy:部分空間法)も、メタボノミクスにおいて有用であると考えられる。SIMCAでは、異なるクラスのサンプルに対してクラス毎にPCAを行ない、クラス毎に主成分を決定し、そして、或る主成分がそれらのクラスを分類するためにどの程度有効であるかを評価することができる。 Also, SIMCA (Soft Independent Modeling of Class Analogy) using PCA is considered useful in metabonomics. SIMCA performs PCA on different classes of samples for each class, determines principal components for each class, and evaluates how effective a principal component is to classify those classes be able to.
このようなPCA及びSIMCAの解析結果を巧く利用することにより、サンプルから得られる知見を有効に生かして、例えばマーカ変数の検出やその他の目的をより容易且つ精度良く達成できるようになることが期待される。 By skillfully using such PCA and SIMCA analysis results, it will be possible to more easily and accurately achieve, for example, marker variable detection and other purposes by effectively utilizing the knowledge obtained from the sample. Be expected.
しかしながら、上記の期待を満足させるために、特に、メタボノミクスのような応用分野で高い有用性を発揮するために、PCA及びSIMCAを具体的にどのように実行し、どのように関連させ、そして、その解析結果をどのようなにユーザに対して表示するかというような活用技術については、まだ満足できるものが従来提供されていない。そのため、多変量解析は、統計数学の専門家以外の人々にとってはまだ敷居が高く、メタボノミクスなどの応用分野で、期待されながらも、その真価を発揮するほどには十分に活用されていないというのが現状である。 However, in order to meet the above expectations, in particular how PCA and SIMCA are specifically implemented, how they relate, and in order to be highly useful in applications such as metabonomics, and As for the utilization technique such as how to display the analysis result to the user, there has not been provided a satisfactory technique. Therefore, multivariate analysis is still a threshold for non-statistical mathematicians, and is expected to be used in application fields such as metabonomics, but is not fully utilized to demonstrate its true value. is the current situation.
従って、本発明の目的は、NMRスペクトルの解析処理の精度を高めることにある。 Therefore, an object of the present invention is to increase the accuracy of NMR spectrum analysis processing.
別の目的は、NMRスペクトルの解析処理の効率を高めることにある。 Another object is to increase the efficiency of the NMR spectrum analysis process.
別の目的は、NMRスペクトルをバケット積分によりヒストグラムに縮約するとき、NMRスペクトルのピークの特徴がヒストグラムに良く反映されるようにすることにある。 Another object is to make the characteristics of NMR spectrum peaks well reflected in the histogram when the NMR spectrum is reduced to a histogram by bucket integration.
さらに別の目的は、多数サンプルのNMRスペクトルの解析において、多変量解析を有効に活かすための処理技術を提供することにある。 Yet another object is to provide a processing technique for effectively utilizing multivariate analysis in the analysis of NMR spectra of a large number of samples.
さらにまた別の目的は、メタボノミクスなどの応用分野において、多変量解析処理を活用して、より精度の高い結果又は結論を導くことを容易にすることにある。 Yet another object is to facilitate the use of multivariate analysis processes to derive more accurate results or conclusions in application fields such as metabonomics.
本発明の一つの側面に従えば、NMRデータの処理装置は、サンプルのNMR特性を示す対象スペクトルデータを生成するスペクトル生成手段と、前記対象スペクトルデータに対し、不均等な幅をもつ多数のバケットからなるバケットセットを用いたバケット積分を実行することにより、前記対象スペクトルデータをヒストグラムデータに縮約するデータ縮約手段と、前記ヒストグラムデータを記憶又は出力する手段とを備える。 According to one aspect of the present invention, an NMR data processing apparatus includes a spectrum generating unit that generates target spectrum data indicating NMR characteristics of a sample, and a plurality of buckets having an unequal width with respect to the target spectrum data. And a means for storing or outputting the histogram data. The data reduction means reduces the target spectrum data to histogram data by executing bucket integration using a bucketset consisting of:
対象スペクトルデータのバケット積分を実行する際、適切に設定された不均等な幅をもつバケットセットを用いることにより、対象スペクトルデータがもつ重要なピークの情報を良好に維持したまま、対象スペクトルデータをバケット積分データのセットであるヒストグラムに縮約できる。そのため、そのヒストグラムを用いて行われるスペクトル解析の精度が向上する。 When performing bucket integration of the target spectrum data, by using a bucket set with an appropriately set unequal width, the target spectrum data can be stored while maintaining the important peak information of the target spectrum data well. It can be reduced to a histogram that is a set of bucket integral data. Therefore, the accuracy of spectrum analysis performed using the histogram is improved.
好適な実施形態では、対象スペクトルデータがもつ重要なピークの情報を良好に維持するために、指定された1以上のピーク領域のいずれもが複数バケットに分割されないように、不均等幅のバケットセットが設定されている。さらに、対象スペクトルデータから検出された1以上のピーク領域のいずれもが複数バケットに分割されないように、不均等幅のバケットセットが設定されている。 In a preferred embodiment, a non-uniform width bucket set is used so that none of the specified one or more peak areas is divided into multiple buckets in order to maintain the important peak information of the target spectrum data well. Is set. Furthermore, a non-uniform width bucket set is set so that none of the one or more peak areas detected from the target spectrum data is divided into a plurality of buckets.
好適な実施形態では、上記のような不均等幅のバケットセットを自ら設定するバケット設定手段が、NMRデータの処理装置に備えられる。このバケット設定手段は、複数の対象スペクトルデータを入力し、それらの複数の対象スペクトルデータが投影された投影スペクトルデータを生成し、投影スペクトルデータからピーク領域を検出し、そして、検出された1以上のピーク領域のいずれもが複数バケットに分割されないようにして各バケットを設定する。さらに、このバケット設定手段は、1以上のピーク領域を指定し、指定された1以上のピーク領域のいずれもが複数バケットに分割されないようにして各バケットを設定する。さらに、このバケット設定手段は、オペレータから入力された要求に応答して、各バケットを修正することもできる。 In a preferred embodiment, the NMR data processing apparatus is provided with bucket setting means for setting a bucket set having the non-uniform width as described above. The bucket setting means inputs a plurality of target spectrum data, generates projection spectrum data obtained by projecting the plurality of target spectrum data, detects a peak region from the projection spectrum data, and detects one or more detected ones or more Each bucket is set so that none of the peak areas are divided into a plurality of buckets. Further, the bucket setting means specifies one or more peak areas, and sets each bucket so that none of the specified one or more peak areas is divided into a plurality of buckets. Further, the bucket setting means can modify each bucket in response to a request input from the operator.
好適な実施形態では、上記対象スペクトルとして、サンプルのFIDデータから得られたNMRスペクトルデータに絶対値微分を施した結果である絶対値微分スペクトルデータが用いられる。ここで、NMRスペクトルデータの絶対値微分とは、NMRスペクトルの実部の周波数(ケミカルシフト)微分の二乗と、虚部の周波数(ケミカルシフト)微分の二乗との和の平方根である。このような絶対値微分スペクトルデータを用いてスペクトル解析を行うことで、面倒な位相補正やベースライン補正を行うことなしに、効率的に精度の良い解析結果を得ることが可能になる。 In a preferred embodiment, absolute value differential spectrum data, which is a result of performing absolute value differentiation on NMR spectrum data obtained from FID data of a sample, is used as the target spectrum. Here, the absolute value differentiation of NMR spectrum data is the square root of the sum of the square of the frequency (chemical shift) derivative of the real part of the NMR spectrum and the square of the frequency (chemical shift) derivative of the imaginary part. By performing spectrum analysis using such absolute value differential spectrum data, it is possible to efficiently obtain an accurate analysis result without performing troublesome phase correction and baseline correction.
本発明の別の側面に従うNMRデータの処理装置は、サンプルのFIDデータを取得する手段と、前記FIDデータからNMRスペクトルデータを生成する手段と、前記NMRスペクトルデータに絶対値微分を施して絶対値微分スペクトルデータを生成する手段と、前記絶対値微分スペクトルデータを記憶又は出力する手段とを備える。 An apparatus for processing NMR data according to another aspect of the present invention comprises means for acquiring FID data of a sample, means for generating NMR spectrum data from the FID data, and performing absolute value differentiation on the NMR spectrum data to obtain an absolute value. Means for generating differential spectrum data, and means for storing or outputting the absolute value differential spectrum data.
本発明のまた別の側面に従うNMRスペクトルの統計処理装置は、複数のサンプルのNMRヒストグラムデータからなる多変量データ行列を入力する多変量データ行列入力手段と、入力された前記多変量データ行列についてPCA解析計算を行なうPCA解析手段と、前記PCA解析計算の結果を受けて、複数種のPCA解析結果チャートをユーザインタフェース画面に表示するPCA解析結果表示手段と、前記ユーザインタフェース画面を用いてユーザ要求を入力するユーザ要求入力手段と、入力された前記ユーザ要求が1以上のサンプルを選択するものである場合、前記選択されたサンプルのNMRスペクトルのデータを入力して、入力された前記NMRスペクトルをケミカルシフト軸上に表したNMRスペクトルチャートを前記ユーザインタフェース画面に表示するNMRスペクトル連携手段とを備える。 According to still another aspect of the present invention, there is provided a statistical processing apparatus for NMR spectra, a multivariate data matrix input means for inputting a multivariate data matrix composed of NMR histogram data of a plurality of samples, and a PCA for the input multivariate data matrix. PCA analysis means for performing analysis calculation, PCA analysis result display means for receiving a plurality of types of PCA analysis result charts on a user interface screen in response to the result of the PCA analysis calculation, and a user request using the user interface screen When the user request input means for inputting and the input user request is to select one or more samples, the NMR spectrum data of the selected sample is input, and the input NMR spectrum is chemically converted. An NMR spectrum sequence for displaying an NMR spectrum chart on the shift axis on the user interface screen. And carrying means.
前記PCA解析結果チャートには少なくとも、複数の主成分に対する前記サンプルのスコアを表したスコアプロットと、変数たる所定の複数のケミカルシフト値の前記複数の主成分に対するローディングを表したローディングプロットと、前記所定の複数のケミカルシフト値の寄与率又はローディングをケミカルシフト軸上に表した寄与率/ローディングチャートとが含まれる。前記寄与率/ローディングチャートと前記NMRスペクトルチャートとは、それぞれの前記ケミカルシフト軸のスケールが一致するようにして、前記ケミカルシフト軸に直交する方向に並べられて表示されるようになっている。 The PCA analysis result chart includes at least a score plot that represents the score of the sample with respect to a plurality of principal components, a loading plot that represents loading with respect to the plurality of principal components of a predetermined plurality of chemical shift values as variables, and A contribution ratio / loading chart representing the contribution ratio or loading of a plurality of predetermined chemical shift values on the chemical shift axis is included. The contribution ratio / loading chart and the NMR spectrum chart are arranged and displayed in a direction perpendicular to the chemical shift axis so that the scales of the chemical shift axes coincide with each other.
好適な実施形態では、入力された前記ユーザ要求が前記寄与率/ローディングチャートを拡大するものである場合、前記PCA解析結果表示手段と前記NMRスペクトル連携手段が、前記寄与率/ローディングチャートと前記NMRスペクトルチャートとの間の前記ケミカルシフト軸のスケールの一致が保持されるようにして、前記寄与率/ローディングチャートと前記NMRスペクトルチャートとを拡大して表示する。 In a preferred embodiment, when the input user request is to enlarge the contribution ratio / loading chart, the PCA analysis result display means and the NMR spectrum cooperation means include the contribution ratio / loading chart and the NMR spectrum. The contribution ratio / loading chart and the NMR spectrum chart are enlarged and displayed so that the coincidence of the scale of the chemical shift axis with the spectrum chart is maintained.
また、好適な実施形態では、入力された前記ユーザ要求が選択された1以上のサンプルを削除するものである場合、前記PCA解析手段が、前記削除されたサンプル以外のサンプルのNMRヒストグラムデータからなる多変量データ行列についてPCA解析計算を再度実行し、前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する。 Further, in a preferred embodiment, when the input user request is to delete one or more selected samples, the PCA analysis means comprises NMR histogram data of samples other than the deleted samples. The PCA analysis calculation is executed again for the multivariate data matrix, and the PCA analysis result display means receives the result of the PCA analysis calculation executed again and displays the PCA analysis result chart again.
また、好適な実施形態では、入力された前記ユーザ要求が選択された1以上の変数たるケミカルシフト値を削除するものである場合、前記PCA解析手段が、前記削除されたケミカルシフト値以外のケミカルシフト値を用いてPCA解析計算を再度実行し、前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する。 Further, in a preferred embodiment, when the input user request is to delete the selected chemical shift value as one or more variables, the PCA analysis means includes a chemical other than the deleted chemical shift value. The PCA analysis calculation is executed again using the shift value, and the PCA analysis result display means receives the result of the PCA analysis calculation executed again and displays the PCA analysis result chart again.
本発明のさらにまた別の側面に従うNMRスペクトルの統計処理装置は、数のクラスに割り当てられた複数のサンプルのNMRヒストグラムデータからなる複数クラスの多変量データ行列を入力する多変量データ行列入力手段と、入力された前記複数クラスの多変量データ行列についてSIMCA解析計算を行なうSIMCA解析手段と、前記SIMCA解析計算の結果を受けて、複数種のSIMCA解析結果チャートをユーザインタフェース画面に表示するSIMCA解析結果表示手段と、前記ユーザインタフェース画面を用いてユーザ要求を入力するユーザ要求入力手段と、入力された前記ユーザ要求が1以上のサンプルを選択するものである場合、前記選択されたサンプルのNMRスペクトルのデータを入力して、入力された前記NMRスペクトルをケミカルシフト軸上に表したNMRスペクトルチャートを前記ユーザインタフェース画面に表示するNMRスペクトル連携手段とを備える。 An NMR spectrum statistical processing apparatus according to still another aspect of the present invention comprises a multivariate data matrix input means for inputting a multivariate data matrix of a plurality of classes composed of NMR histogram data of a plurality of samples assigned to a number of classes. SIMCA analysis means for performing SIMCA analysis calculation for the input multivariate data matrix of the plurality of classes, and SIMCA analysis results for receiving a result of the SIMCA analysis calculation and displaying a plurality of types of SIMCA analysis result charts on a user interface screen Display means, user request input means for inputting a user request using the user interface screen, and when the input user request is to select one or more samples, the NMR spectrum of the selected sample Enter the data, and the NMR spectrum showing the entered NMR spectrum on the chemical shift axis. And a NMR spectrum linkage means for displaying the chart on the user interface screen.
前記SIMCA解析結果チャートには少なくとも、前記複数のクラスに対する前記サンプルの距離を表したクーマンプロットと、変数たる所定の複数のケミカルシフト値のモデリング力又は識別力をケミカルシフト軸上に表したモデリング力/識別力チャートとが含まれる。前記モデリング力/識別力チャートと前記NMRスペクトルチャートとは、それぞれの前記ケミカルシフト軸のスケールが一致するようにして、前記ケミカルシフト軸に直交する方向に並べられて表示されるようになっている。 The SIMCA analysis result chart includes at least a Cooman plot representing the distance of the sample with respect to the plurality of classes, and a modeling ability representing the modeling power or discriminating power of a predetermined plurality of chemical shift values as variables on the chemical shift axis. / Discrimination power chart is included. The modeling force / discriminating power chart and the NMR spectrum chart are arranged and displayed in a direction orthogonal to the chemical shift axis so that the scales of the chemical shift axes coincide with each other. .
好適な実施形態では、入力された前記ユーザ要求が前記モデリング力/識別力チャートを拡大するものである場合、前記SIMCA解析結果表示手段と前記NMRスペクトル連携手段が、前記モデリング力/識別力チャートと前記NMRスペクトルチャートとの間の前記ケミカルシフト軸のスケールの一致が保持されるようにして、前記モデリング力/識別力チャートと前記NMRスペクトルチャートとを拡大して表示する。 In a preferred embodiment, when the input user request is for enlarging the modeling power / discrimination power chart, the SIMCA analysis result display means and the NMR spectrum cooperation means include the modeling power / discrimination power chart and The modeling power / discriminating power chart and the NMR spectrum chart are enlarged and displayed so that the coincidence of the scale of the chemical shift axis with the NMR spectrum chart is maintained.
また、好適な実施形態では、入力された前記ユーザ要求が選択された1以上のサンプルを削除するものである場合、前記SIMCA解析手段が、前記削除されたサンプル以外のサンプルのNMRヒストグラムデータからなる複数クラスの多変量データ行列についてSIMCA解析計算を再度実行し、前記SIMCA解析結果表示手段が、再度実行された前記SIMCA解析計算の結果を受けて、前記SIMCA解析結果チャートを改めて表示する。 Also, in a preferred embodiment, when the input user request is to delete one or more selected samples, the SIMCA analysis means comprises NMR histogram data of samples other than the deleted samples. The SIMCA analysis calculation is executed again for a plurality of classes of multivariate data matrices, and the SIMCA analysis result display means receives the result of the SIMCA analysis calculation executed again and displays the SIMCA analysis result chart again.
また、好適な実施形態では、入力された前記ユーザ要求が、所定の閾値より前記識別力又はモデリング力が高い変数たるケミカルシフト値を選択するとともに再計算を要求するものである場合、前記SIMCA解析手段が、前記選択されたケミカルシフト値だけを用いてSIMCA解析計算を再度実行し、前記SIMCA解析結果表示手段が、再度実行された前記SIMCA解析計算の結果を受けて、前記SIMCA解析結果チャートを改めて表示する。 In a preferred embodiment, the SIMCA analysis is performed when the input user request is to select a chemical shift value that is a variable having the discriminating power or modeling power higher than a predetermined threshold and to request recalculation. The means re-executes the SIMCA analysis calculation using only the selected chemical shift value, and the SIMCA analysis result display means receives the result of the re-executed SIMCA analysis calculation, and displays the SIMCA analysis result chart. Display again.
本発明のまた更に別の側面に従うNMRスペクトルの統計処理装置は、複数のサンプルのNMRヒストグラムデータからなる多変量データ行列についてPCA解析計算を行なうPCA解析手段と、前記PCA解析計算の結果を受けて、複数種のPCA解析結果チャートをユーザインタフェース画面に表示するPCA解析結果表示手段と、複数のクラスに割り当てられた複数のサンプルのNMRヒストグラムデータからなる複数クラスの多変量データ行列を入力する多変量データ行列入力手段と、入力された前記複数クラスの多変量データ行列についてSIMCA解析計算を行なうSIMCA解析手段と、前記SIMCA解析計算の結果を受けて、複数種のSIMCA解析結果チャートをユーザインタフェース画面に表示するSIMCA解析結果表示手段と、前記ユーザインタフェース画面を用いてユーザ要求を入力するユーザ要求入力手段とを備える。 According to still another aspect of the present invention, there is provided a statistical processing apparatus for NMR spectra, PCA analysis means for performing PCA analysis calculation on a multivariate data matrix composed of NMR histogram data of a plurality of samples, and receiving the result of the PCA analysis calculation. , PCA analysis result display means to display multiple types of PCA analysis result charts on the user interface screen, and multivariate to input multiclass multivariate data matrix consisting of NMR histogram data of multiple samples assigned to multiple classes Data matrix input means, SIMCA analysis means for performing a SIMCA analysis calculation on the input multivariate data matrix of the plurality of classes, and receiving a result of the SIMCA analysis calculation, a plurality of types of SIMCA analysis result charts on a user interface screen The user request is input using the SIMCA analysis result display means to display and the user interface screen. User request input means.
前記PCA解析結果チャートには少なくとも、複数の主成分に対する前記サンプルのスコアを表したスコアプロットと、変数たる所定の複数のケミカルシフト値の前記複数の主成分に対するローディングを表したローディングプロットと、前記所定の複数のケミカルシフト値の寄与率又はローディングをケミカルシフト軸上に表した寄与率/ローディングチャートとが含まれる。前記SIMCA解析結果チャートには少なくとも、前記複数のクラスに対する前記サンプルの距離を表したクーマンプロットと、変数たる所定の複数のケミカルシフト値のモデリング力又は識別力をケミカルシフト軸上に表したモデリング力/識別力チャートとが含まれる。 The PCA analysis result chart includes at least a score plot that represents the score of the sample with respect to a plurality of principal components, a loading plot that represents loading with respect to the plurality of principal components of a predetermined plurality of chemical shift values as variables, and A contribution ratio / loading chart representing the contribution ratio or loading of a plurality of predetermined chemical shift values on the chemical shift axis is included. The SIMCA analysis result chart includes at least a Cooman plot representing the distance of the sample with respect to the plurality of classes, and a modeling ability representing the modeling power or discriminating power of a predetermined plurality of chemical shift values as variables on the chemical shift axis. / Discrimination power chart is included.
前記ユーザ要求入力手段により入力された前記ユーザ要求が、前記モデリング力/識別力チャートに表示された前記識別力又はモデリング力が所定閾値より高い変数たるケミカルシフト値を選択するとともにPCA解析計算の再実行を要求するものである場合、前記PCA解析手段が、前記選択されたケミカルシフト値だけを用いてPCA解析計算を再度実行し、前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する。 The user request input by the user request input means selects a chemical shift value that is a variable in which the discriminating power or modeling power displayed in the modeling power / discriminating power chart is higher than a predetermined threshold and re-executes the PCA analysis calculation. In the case of requesting execution, the PCA analysis means executes the PCA analysis calculation again using only the selected chemical shift value, and the PCA analysis result display means executes the PCA analysis calculation executed again. Then, the PCA analysis result chart is displayed again.
好適な実施形態では、前記ユーザ要求入力手段により入力された前記ユーザ要求が、前記モデリング力/識別力チャートに表示された前記識別力又はモデリング力が所定閾値より高い変数たるケミカルシフト値を選択するとともに変数を追加したPCA解析計算の再実行を要求するものである場合、前記PCA解析手段が、前記選択されたケミカルシフト値を現在の変数たるケミカルシフト値に追加してなる変数を用いてPCA解析計算を再度実行し、前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する。 In a preferred embodiment, the user request input by the user request input means selects a chemical shift value as a variable in which the discriminating power or modeling power displayed in the modeling power / discriminating power chart is higher than a predetermined threshold. When the PCA analysis calculation requesting the re-execution of the PCA analysis calculation with the variable added thereto is used, the PCA analysis means uses the variable formed by adding the selected chemical shift value to the current chemical shift value. The analysis calculation is executed again, and the PCA analysis result display means receives the result of the PCA analysis calculation executed again and displays the PCA analysis result chart again.
また、好適な実施形態では、前記ユーザ要求入力手段により入力された前記ユーザ要求が、前記モデリング力/識別力チャートに表示された前記識別力又はモデリング力が所定閾値より高い変数たるケミカルシフト値を選択するとともにSIMCA解析計算の再実行を要求するものである場合、前記SIMCA解析手段が、前記選択されたケミカルシフト値だけを用いてPCA解析計算を再度実行し、前記SIMCA解析結果表示手段が、再度実行された前記SIMCA解析計算の結果を受けて、前記SIMCA解析結果チャートを改めて表示する。 In a preferred embodiment, the user request input by the user request input means is a chemical shift value that is a variable whose discrimination power or modeling power displayed in the modeling power / discrimination power chart is higher than a predetermined threshold. When selecting and requesting re-execution of the SIMCA analysis calculation, the SIMCA analysis means executes the PCA analysis calculation again using only the selected chemical shift value, and the SIMCA analysis result display means, In response to the result of the SIMCA analysis calculation executed again, the SIMCA analysis result chart is displayed again.
本発明は更に、上述した原理に基づくNMRデータの処理方法、NMRデータ処理のためのコンピュータプログラム、及びNMRスペクトルの統計処理のためのコンピュータプログラムも提供する。 The present invention further provides a method for processing NMR data based on the above-described principle, a computer program for processing NMR data, and a computer program for statistical processing of NMR spectra.
本発明のNMRデータの処理装置及び方法によれば、多数サンプルのNMRスペクトルの解析において、多変量解析を有効に活かすことができ、そのため、メタボノミクスなどの応用分野において、より精度の高い結果又は結論を導くことが容易になる。 According to the NMR data processing apparatus and method of the present invention, multivariate analysis can be effectively utilized in the analysis of NMR spectra of a large number of samples. Therefore, in an application field such as metabonomics, more accurate results or It is easier to draw conclusions.
本発明のNMRデータの処理装置及び方法によれば、NMRスペクトルに絶対値微分を適用することで、NMRスペクトルの解析処理の効率が向上する。 According to the NMR data processing apparatus and method of the present invention, the efficiency of NMR spectrum analysis processing is improved by applying absolute value differentiation to an NMR spectrum.
本発明のNMRスペクトルの統計処理装置によれば、多数サンプルのNMRスペクトルの解析において、多変量解析を有効に活かすことができる。 According to the statistical processing apparatus for NMR spectra of the present invention, multivariate analysis can be effectively utilized in the analysis of NMR spectra of a large number of samples.
本発明のNMRスペクトルの統計処理装置によれば、これをメタボノミクスなどの応用分野で利用することにより、多変量解析処理を活用して、より精度の高い結果又は結論を導くことが容易になる。 According to the statistical processing apparatus for NMR spectrum of the present invention, by using this in an application field such as metabonomics, it becomes easy to draw a more accurate result or conclusion by utilizing multivariate analysis processing. .
以下、図面を参照して本発明の実施形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本発明に従うNMRデータ処理装置の一実施形態の全体的な構成と機能を示す。 FIG. 1 shows the overall configuration and functions of an embodiment of an NMR data processing apparatus according to the present invention.
図1に示すように、本発明に従うNMRデータ処理装置としてのコンピュータシステム100が、NMR装置102と関連して用いられる。コンピュータシステム100は、プログラムされた1台コンピュータマシン(例えば、汎用のパーソナルコンピュータ、ワークステーション或いはメインフレームコンピュータマシンなど)であってもよいし、或は複数台のコンピュータマシンから構成されてもよい。なお、コンピュータシステムに代えて、1以上の専用ハードウェア回路、又は専用ハードウェア回路とコンピュータシステムとの組み合わせなどが、NMRデータ処理装置として用いられてもよい。
As shown in FIG. 1, a
コンピュータシステム100は、プロセッサ104と、プロセッサ104のためのコンピュータプログラム及びプロセッサ104により処理されるデータを格納するための記憶装置106とを有する。プロセッサ104は、記憶装置306に記憶されている所定のコンピュータプログラムを実行することによりNMRデータの処理を行う。NMRデータを処理する目的が異なれば、その処理の方法も当然に異なるが、ここでは、NMRデータの処理の一例として、メタボノミクスによりマーカ成分を確定することを目的として、多数のサンプルのNMRスペクトルを収集し、それらのスペクトルを統計的に解析する場合を取り上げて説明する。
The
プロセッサ104が行うNMRデータの処理は、大きくFIDデータ入力処理108、NMRスペクトル処理110、データ縮約処理112、積分結果データ保存/出力処理114、及び統計処理116に分けられる。FIDデータ入力処理108では、NMR装置102から出力される各サンプルのFID(Free Induction Decay:自由誘導減衰)データが入力され、それにより、多数のサンプルのFIDデータが収集されて記憶装置106に記憶される。NMRスペクトル処理110では、各サンプルのFIDデータがフーリエ変換によりNMRスペクトルデータに変換され、更にそのNMRスペクトルデータが本発明の原理に従った「絶対値微分法(Absolute
Differential Calculation Method)」により「絶対値微分NMRスペクトル(Absolute Differential NMR Spectrum」データに変換され、それにより、多数のサンプルの「絶対値微分NMRスペクトル」データが記憶装置106に記憶される。ここで、「絶対値微分法」及び「絶対値微分NMRスペクトル」という用語は、この明細書で説明の便宜上用いられる特殊な用語であり、その詳細は後に説明する。「絶対値微分NMRスペクトル」は、以下、「ADスペクトル」と略称する。
The processing of the NMR data performed by the
“Absolute Differential NMR Spectrum” data is converted by the “Differential Calculation Method”, whereby “absolute differential NMR spectrum” data of a large number of samples is stored in the
次のデータ縮約処理112では、本発明の原理に従った方法で「最適化バケットセット」が算出され、そして、その「最適化バケットセット」を用いて多数のサンプルのADスペクトルに「最適化バケット積分」が実行され、それにより、多数のサンプルのADスペクトルの縮約データであるヒストグラム(バケット積分データのセット)が生成される。ここで、「最適化バケットセット」及び「最適化バケット積分」という用語も、この明細書で説明の便宜上用いられる特殊な用語であり、その詳細は後に説明する。積分結果データ保存/出力処理114では、上記のデータ縮約処理112により生成された多数のサンプルのヒストグラムデータ(バケット積分データのセット)が、記憶装置106に記憶され、また必要に応じて外部へ出力される。統計処理116では、多数のサンプルのヒストグラムデータを用いて、処理目的に応じた統計処理、例えばマーカ成分を確定するための検出多変量解析、が行われる。そして、その統計処理の結果を表すデータが記憶装置106に記憶され、また必要に応じて外部へ出力される。
In the next
ここで、FIDデータ入力処理108、積分結果データ保存/出力処理114及び統計処理116には、それぞれ、公知の各種の処理方法が採用可能であるため、これらについての詳細な説明は省略する。以下では、絶対値微分法を用いたNMRスペクトル処理110と、最適化バケット積分によるデータ縮約114について、詳細且つ具体的に説明する。
Here, since various known processing methods can be employed for the FID
図2は、NMRスペクトル処理110の流れを示す。
FIG. 2 shows the flow of the
図2に示すように、ステップ120で、NMR装置102から取得されて記憶装置106に保存されている各サンプルのFIDデータが、記憶装置106から読み込まれる。ステップ122で、そのFIDデータに対してウィンドウ処理が行われ、そのFIDデータのSN比が改善され、またリップルが除去される。ステップ124で、ウィンドウ処理122を経たFIDデータに対してフーリエ変換処理が行われて、そのFIDデータがNMRスペクトルデータに変換される。ステップ126で、そのNMRスペクトルデータに対して絶対値微分演算が行われて、そのNMRスペクトルデータがADスペクトルデータ(絶対値微分NMRスペクトルデータ)に変換される。ステップ128で、そのNMRスペクトルデータとADスペクトルデータとが記憶装置106に保存され、また、必要に応じて外部へ出力される。多数のサンプルの各々について、上記のステップ120〜128の処理が行われ、それにより、多数のサンプルのNMRスペクトルデータとADスペクトルデータが記憶装置106に蓄積される。
As shown in FIG. 2, in
ステップ126の絶対値微分演算について、以下、具体的に説明する。
The absolute value differentiation operation in
絶対値微分の対象であるNMRスペクトルは、δをケミカルシフト、jを虚数記号としたとき、次式
NMRスペクトル=R(δ)+j・I(δ) …(1)
で表現することができる。ここで、R(δ)はNMRスペクトルの実部であり、I(δ)は虚部である。そして、NMRスペクトルを絶対値微分した結果であるADスペクトルは、次式
The NMR spectrum, which is the target of absolute value differentiation, has the following formula when δ is a chemical shift and j is an imaginary symbol:
NMR spectrum = R (δ) + j · I (δ) (1)
Can be expressed as Here, R (δ) is the real part of the NMR spectrum and I (δ) is the imaginary part. And the AD spectrum which is the result of absolute value differentiation of the NMR spectrum is
図3Aは、NMRスペクトルの一例の実部の波形を示し、図3BはこのNMRスペクトルの絶対値微分であるADスペクトルの波形を示す。 FIG. 3A shows the waveform of the real part of an example of an NMR spectrum, and FIG. 3B shows the waveform of an AD spectrum that is an absolute value derivative of the NMR spectrum.
図3Aに示されたNMRスペクトルの実部140から分かるように、このNMRスペクトルには位相ずれ(例えば、溶媒信号の部分142に位相ずれが顕著に表れている)が含まれ、かつ、そのベースライン成分は平坦ではなく歪んでいる。FIDデータから得られたNMRスペクトルは、殆ど例外なく、位相ずれと歪んだベースライン成分を含んでいる。従来技術によれば、NMRスペクトルに位相補正とベースライン補正が施される必要がある。
As can be seen from the
位相補正は位相ずれを除去するための操作である。位相ずれが含まれたNMRスペクトルでは、実部R(δ)と虚部I(δ)におけるピーク波形はそれぞれ図4Aに例示するような波形になる。位相補正では、位相ずれを低減して、図4Bに例示するような波形に整形する。また、ベースライン補正は、NMRスペクトルからベースライン成分を差し引くための補正である。図5Bに例示するように歪んだベースラインBLを、図5Bに例示するようなゼロで一定のベースラインBLに修正するのである。しかし、位相補正とベースライン補正は、オペレータにより手動で調整される必要があり、時間がかかり、かつ、オペレータの主観や技量のバイアスが入ってしまう。さらに、苦労して調整しても、十分満足できる結果に到達することが難しい。 Phase correction is an operation for removing a phase shift. In the NMR spectrum including the phase shift, the peak waveforms in the real part R (δ) and the imaginary part I (δ) are waveforms as illustrated in FIG. 4A. In the phase correction, the phase shift is reduced and shaped into a waveform as illustrated in FIG. 4B. Baseline correction is correction for subtracting the baseline component from the NMR spectrum. The distorted baseline BL as illustrated in FIG. 5B is corrected to a zero and constant baseline BL as illustrated in FIG. 5B. However, the phase correction and the baseline correction need to be manually adjusted by the operator, which is time consuming and introduces a bias in the subjectivity and skill of the operator. Furthermore, even if it is difficult to adjust, it is difficult to achieve a sufficiently satisfactory result.
これに対し、図3Bに例示されるように、NMRスペクトルの絶対値微分結果であるADスペクトル144においては、位相ずれが解消され、さらに、ベースラインもゼロ近傍でほぼ一定である。このことは、ADスペクトル144を用いれば、位相補正とベースライン補正が実質的に不要になることを意味する。その理由について具体的に説明する。
On the other hand, as illustrated in FIG. 3B, in the
NMRスペクトルの実部R(δ)と虚部I(δ)は、次式
R(δ)=A(δ)・cos(θ(δ)) …(3)
I(δ)=A(δ)・sin(θ(δ)) …(4)
で表現することができる。ここで、A(δ)は振幅であり、θ(δ)は位相である。位相θ(δ)は、大雑把にはケミカルシフトδの一次関数、
θ(δ)=K・δ+L …(5)
で表すことができ、ここで、KとLは一定の係数である。これらの式を用いて絶対値微分を計算すると、ADスペクトルは次式、
The real part R (δ) and imaginary part I (δ) of the NMR spectrum are
R (δ) = A (δ) · cos (θ (δ)) (3)
I (δ) = A (δ) ・ sin (θ (δ))… (4)
Can be expressed as Here, A (δ) is the amplitude, and θ (δ) is the phase. The phase θ (δ) is roughly a linear function of chemical shift δ,
θ (δ) = K · δ + L (5)
Where K and L are constant coefficients. Using these equations to calculate the absolute derivative, the AD spectrum is
上記(6)式から分かるように、ADスペクトルには位相θ(δ)の成分が含まれていない。また、(6)式において支配的な部分は第1項であるが、そこでは振幅A(δ)がケミカルシフトδで微分されており、この微分によりベースライン成分(これは、図5Aの例から分かるようにケミカルシフトδに対して緩やかな傾きで歪んでいる)は実質的にゼロになる。そのため、ADスペクトルでは、ベースライン成分はかなり小さく低減される。このように、絶対値微分という簡易な演算により、位相補正およびベースライン補正をすることなく高品位なスペクトルを得ることができる。 As can be seen from the above equation (6), the AD spectrum does not contain a component of phase θ (δ). In addition, the dominant part in the equation (6) is the first term, where the amplitude A (δ) is differentiated by the chemical shift δ, and the baseline component (this is the example of FIG. 5A). As can be seen from the above, the chemical shift δ is distorted with a gentle inclination), which is substantially zero. Therefore, the baseline component is reduced considerably in the AD spectrum. As described above, a high-quality spectrum can be obtained by a simple calculation called absolute value differentiation without performing phase correction and baseline correction.
また、NMRスペクトルには、図3Aに参照番号142で示すような溶媒(例えば軽水)信号の巨大なピークが存在する。その巨大な溶媒ピークの裾野部分は幅広く広がっており、これも、スペクトルの精度低下の主原因の一つである。しかし、ADスペクトルにおいては、ベースラインと同様に上記理由によって溶媒ピークの裾野部分も良好に低減されるので、溶媒ピークの影響を極めて小さくすることができる。
In addition, the NMR spectrum has a huge peak of a solvent (for example, light water) signal as indicated by
なお、ADスペクトルの一つの欠点は、NMRスペクトルの絶対的な定量性が失われること、特に、ブロードなピークの信号強度が微分により減衰してしまうことである。しかしながら、複数のNMRスペクトル相互間の相対的な関係(例えば、どのケミカルシフトδの位置にピークが現れるかという点での相対的関係)は、ADスペクトルにおいても保たれるため、メタボノミクスのように多数のNMRスペクトルを解析する目的においては、ADスペクトルは非常に有用な情報である。 One drawback of the AD spectrum is that the absolute quantification of the NMR spectrum is lost, and in particular, the signal intensity of a broad peak is attenuated by differentiation. However, the relative relationship between multiple NMR spectra (for example, the relative relationship in terms of which chemical shift δ appears at the peak) is maintained in the AD spectrum. For the purpose of analyzing a large number of NMR spectra, the AD spectrum is very useful information.
再び図2を参照して、ステップ126で上述したADスペクトルが生成された後、ステップ128でそのADスペクトルが記憶装置106に保存される。統計処理に必要な多数のサンプルのNMRスペクトルのそれぞれについて、図2に示す処理が繰り返され、その結果、多数のサンプルのADスペクトルが記憶装置106に蓄積される。その後、図1に示すように、最適化バケット積分を用いたデータ縮約処理112が実行される。
Referring again to FIG. 2, after the above-described AD spectrum is generated in
図6は、最適化バケット積分を用いたデータ縮約処理112の流れを示す。
FIG. 6 shows the flow of the
図6に示すように、ステップ170で、記憶装置106に蓄積された多数のADスペクトルのそれぞれについて、そのケミカルシフト(δ)軸スケールの基準点(δ基準点)(原点)が自動的に設定される。δ基準点の設定は公知の方法で行うことができ、それにより、いずれのADスペクトルについても、同じ特定物質のピークが現れるケミカルシフト軸上のポイントが基準点として設定される。
As shown in FIG. 6, in
その後、ステップ171で、多数のADスペクトルを共通のスペクトル上に投影する処理が行われる。このスペクトル投影処理171は、それらのADスペクトルのケミカルシフト軸のスケールを合わせた上で、ケミカルシフトδのポイント毎に全てのADスペクトルの最大値又は総和を計算するという処理である。その結果、多数のADスペクトルの最大値又は総和として1つの投影ADスペクトルが生成され、その投影ADスペクトルには、全てのADスペクトルに含まれる全てのピークが現れることになる。
Thereafter, in
図7A,Bは、このスペクトル投影処理171の原理を説明する図であり、図8は、このスペクトル投影処理171の流れを示す。
7A and 7B are diagrams for explaining the principle of the
スペクトル投影処理171では、図8に示すように、ステップ190で、多数のADスペクトルの中から一つのADスペクトルSaが選択される。例えば図7Aに示すようなスペクトルSaが選択される。このADスペクトルSaが、投影ADスペクトルSpに初期設定される。ステップ192で、別の一つのADスペクトルSbが選択される。例えば、図7Bに示すようなADスペクトルSbが選択される。
In the
ステップ194で、両スペクトルSbとSpのケミカルシフト軸スケールを一致させた上で(例えば、両スペクトルの基準点rbとraの差分(rb-ra)だけ、スペクトルSbのδスケール(ケミカルシフト軸スケール)をシフトさせて、基準点rbとraを一致させた上で)、両スペクトルSbとSpの強度の最大値又は和がδポイント毎に計算される。具体的には、
最大値: if(Sp > Sb(rb-ra)) Sp=Sa else Sp =Sb(rb-ra)
和: Sp = Sp+Sb (rb-ra)
という計算がδポイント毎に行われる。それにより、図7Cに示すように、投影ADスペクトルSpには、処理された複数のスペクトルSaとSbに含まれている全てのピークが投影されることになる。なお、最大値と和のうち、いずれか一方のみが計算されてもよいし、或いは、最大値と和の両方が別個の投影ADスペクトルとして計算されてもよい。
In
Maximum value: if (Sp> Sb (rb-ra)) Sp = Sa else Sp = Sb (rb-ra)
Sum: Sp = Sp + Sb (rb-ra)
Is calculated every δ points. Thereby, as shown in FIG. 7C, all peaks included in the processed spectra Sa and Sb are projected onto the projected AD spectrum Sp. Note that only one of the maximum value and the sum may be calculated, or both the maximum value and the sum may be calculated as separate projected AD spectra.
ステップ196により、処理対象である全てのADスペクトルについて、上述したステップ192と194が繰り返される。全てのADスペクトルについての繰り返し処理が終わると、その全てのADスペクトルに含まれる全てのピークが投影された投影ADスペクトルSpが完成する。ステップ198で、その投影ADスペクトルSpが記憶装置106に保存され、また、必要に応じて外部へ出力される。
Step 196 repeats
再び図6を参照する。上述したスペクトル投影処理171が終わると、ステップ172で、投影ADスペクトルのバケット積分が計算される。
Refer to FIG. 6 again. When the above-described
図9は、この投影ADスペクトルのバケット積分処理172の原理を説明する図であり、図10は、このバケット積分処理172の流れを示す。
FIG. 9 is a diagram for explaining the principle of the
図9において、参照番号200は、バケット積分が実行される1単位の積分範囲を示し、「バケット」と呼ばれる。バケット200は、このバケット積分処理172においては、規定された一定の幅W(例えば0.04ppm)をもつが、後の処理において、この幅Wが修正され最適化されることになる。参照番号202は、バケット積分を実行すべきケミカルシフトδの全範囲を示し、例えば0ppm〜約16ppmの範囲である。全範囲202は、例えば約200個のバケット200に分割される。このように全範囲202内に設定された多数のバケット200の集合を、以下、「バケットセット」という。また、参照番号204は、バケット積分を実行しない範囲を示し、「ダークリジョン」と呼ばれる。
In FIG. 9,
図10に示すように、バケット積分処理172では、ステップ210で、図9に示された全範囲202が多数の一定幅Wのバケット200に均等に分割され、そして、バケット200毎に投影ADスペクトルSpの積分値(すなわち、各バケットにおける投影ADスペクトルSpとケミカルシフト軸とにより挟まれた領域の面積)が計算される。それにより、バケット200の個数に相当する個数のバケット積分データの集合が得られる。この多数のバケット積分データの集合を、以下「積分データセット」という。この積分データセットは、投影ADスペクトルSpのバケット毎のピーク面積を示す一種のヒストグラムである。
As shown in FIG. 10, in the
その後、ステップ212で、ダークリジョン204に該当するバケットと、そのバケットセットのバケット積分データが、ステップ210で得られたバケットセットと積分データセットの中から削除される。ステップ214では、その積分データセットの総和が所定値になるように、その積分データセットがノーマライズされる。そして、ノーマライズされた積分データセット(ヒストグラムデータ)と、バケットセットに含まれる全てのバケットの位置(始点と終点)を表したバケットセット情報とが、記憶装置106に保存され、また、必要に応じて外部出力される。
Thereafter, in
再び図6を参照する。上述したバケット積分処理172が終わると、ステップ174で、自動積分ブロック設定に基づくバケットの自動修正処理が行われる。ここでは、公知技術である自動積分ブロック設定処理により、投影ADスペクトルSp上の種々のピークが自動的に検出され、検出された各ピークが複数のバケットにより分割されないようにバケットの位置と幅Wが修正される。以下では、「ピーク」という用語は、単一の孤立したピークだけでなく、一つのピークと看做せるような一塊の複数のピークを指す意味でも用いる。
Refer to FIG. 6 again. When the above-described
図11は、この自動積分ブロック設定に基づくバケットの自動修正処理174の原理を説明する図であり、図12は、このバケット自動修正処理174の流れを示す。
FIG. 11 is a diagram for explaining the principle of the bucket
このバケット自動修正処理174では、図12に示すように、ステップ230で、公知技術である自動積分ブロック設定処理が投影ADスペクトルSpに対して施される。それにより、投影ADスペクトルSp上の種々のピークが自動的に検出され、そして、検出されたピークが存在するケミカルシフトδ領域(以下、「ピーク領域」という)にそれぞれ1対1の関係で積分ブロック(積分区間)が自動的に設定される。例えば、図11Aに示されるように、ADスペクトルSp上に2つのピーク(例えば、左側のものは3つのピークの塊であり、右側は単一のピークである)が存在する場合、その2つのピークが自動的に検出され、そして、図11Bに例示するように、左側のピーク領域には一つの積分ブロック220xが設定され、また、右側のピーク領域には別の一つの積分ブロック220yが設定される。いずれの積分ブロック220x、220yも、対応するピーク領域をカバーしており、一つのピーク領域が複数の積分ブロックにより分割されることはない。
In this bucket
これに対し、図11Cに例示するように、現在のバケット200a、200b、200c、…は、図9を参照して既に説明したように、全範囲202を単純に一定幅W(例えばm0.04ppm)で均等分割したものであるから、一つのピーク領域を複数のバケットが分割しているおそれがある。図11A,Cに示す例では、左側のピーク領域が2つのバケット200bと200cにより分割されている。記憶装置106に現在保存されている積分データセット(ヒストグラム)は、このようなバケットセットを用いて計算されたものであるため、分割されたピークの情報が異なる積分データに分散され稀釈化されてしまっていおり、精度が良くない。そこで、この問題を解消するために、以下に述べる後続のステップが行われて、ピークを分割しないようにバケットセットが修正される。
On the other hand, as illustrated in FIG. 11C, the
すなわち、図12に示すように、ステップ232で、それぞれの積分ブロックの始点に最も近いバケットの終点が記憶装置106内のバケットセット情報からサーチされ、見つかったバケットの終点が、それぞれ対応する積分ブロックの始点と同一値に修正される。さらに、ステップ234で、それぞれの積分ブロックの終点に最も近いバケットの始点が記憶装置106内のバケットセット情報からサーチされ、見つかったバケットの始点が、それぞれ対応する積分ブロックの終点と同一値に修正される。例えば、図11B,C,Dに示された例では、左側の積分ブロック200xの始点s(x)に最も近いバケット200aの終点e(a)がその始点s(x)と同一値に修正され、また、右側の積分ブロック200yの始点s(y)に最も近いバケット200dの終点e(d)がその始点s(y)と同一値に修正される。また、左側の積分ブロック200xの終点e(x)に最も近いバケット200dの始点s(d)がその終点e(x)と同一値に修正され、右側の積分ブロック200yの終点e(y)に最も近いバケット200fの始点s(f)がその終点e(y)と同一値に修正される。
That is, as shown in FIG. 12, at
上記始点/終点の修正の後、ステップ236で、一つの積分ブロックを分割する複数のバケットがサーチされ、その複数のバケットが一つのバケットに統合される。例えば、図11B,C,Dに示された例では、上記始点/終点の修正の後は、左側の積分ブロック200xだけが2つのバケット200bと200cにより分割されるので、その2つのバケット200bと200cが一つのバケット200bcに統合される。
After the correction of the start point / end point, in
そして、ステップ238で、上述したステップ232〜236で修正された全てのバケットについてバケット積分が再計算される。そして、記憶装置106に現在記憶されている積分データセットのうち、該当するバケットの積分データが、再計算された積分データに置き換えられる。例えば図11Dに示された例の場合、バケット200a、200bc、200d、200e及び200fの全てに修正がなされたので、それらバケット200a、200bc、200d、200e及び200fのそれぞれについてバケット積分が再計算されて、再計算された積分データが、前の積分データに置き換えられる。
In
ステップ239では、以上のようにして修正された積分データセットと修正されたバケットセット情報とが記憶装置106に保存され、また、必要に応じて外部へ出力される。上記修正されたバケットセット情報によれば、自動積分ブロック設定処理によって投影ADスペクトルSpから自動的に検出された全てのピーク領域のいずれもが複数バケットにより分割されないように(つまり、一つのピーク領域は必ず一つのバケットによりカバーされる)ように、バケットセットが定義される。上記修正された積分データセットは、上記修正されたバケットセットに基づいているので、検出された全てのピークの情報は稀釈されておらず、よって、以前の積分データセットより精度が良い。
In
しかしながら、公知の自動積分ブロック設定処理により自動検出されたピークに基づいて設定されたケミカルシフトδ区間(積分区間)が必ずしも適切であるとはいえない。そこで、更にバケットデータセットと成分データセットを最適化するための処理が後続して行われる。すなわち、図6に示すように、上述した自動積分ブロック設定に基づくバケット自動修正処理174の後、更にバケットデータセットと成分データセットを最適化するために、指定ピーク情報に基づくバケット自動修正処理176と、バケットの手動修正処理178とが実行される。
However, the chemical shift δ interval (integration interval) set based on the peak automatically detected by the known automatic integration block setting process is not necessarily appropriate. Therefore, processing for further optimizing the bucket data set and the component data set is subsequently performed. That is, as shown in FIG. 6, after the bucket
まず、指定ピーク情報に基づくバケット自動修正処理176について説明する。
First, the bucket
この処理176では、既に同定されているNMRスペクトル(ADスペクトルではない)上の特定のピークが指定され、その指定されたピークのピーク領域をカバーするように積分ブロックが決定され、その積分ブロックに基づいて、指定ピークのピーク領域が複数バケットにより分割されないように、現在記憶されているバケットセットが修正される。指定されるピークは、典型的には、このスペクトル解析の用途においてマーカになり得るようなピークである。スペクトル解析の用途が異なればマーカも異なることになるから、用途に応じて、指定されるピークが異なってくる。
In this
ピークを指定するためのソースデータとしては、学会誌などで規定するNMRデータの一般的な発表フォーマット(Bull. Chem. Soc. Japan等)に従ったピーク定義データ用いることができる。そのようなフォーマットによるピーク定義データの一例を挙げると、
1H-NMR (CDCl3) δ: 8.06 (2H, t, J = 8.1 Hz, CH2), 7.24 (1H, s, CH3),…
というようなものである。このデータ例において、最初の「1H-NMR」は測定核名を示し、次の「(CDCl3)」は溶媒名を示し、次の「δ: 8.06」は1つ目のピークの中心のケミカルシフトを示し、次の「2H」は1つ目のピークのプロトン数を示し、次の「t」は1つ目のピークの分裂パターンを示し、次の「J = 8.1 Hz」は1つ目のピークのスピン結合定数を示し、次の「CH2」は1つ目のピークに関するコメントである。1つ目のピークの定義の後に、2つ目のピークの定義、3つ目のピークの定義、…が順次続く。ここで、ピークの分裂パターンには種々のものがあるが、代表的な分裂パターンは例えば以下の5種のパターン、
「s」:単一(singlet)
「d」:2分裂(doublet)
「t」:3分裂(triplet)
「q」:4分裂(qualtet)
「m」:多分裂(multiplet)
の組合せとなる。
As source data for designating a peak, peak definition data in accordance with a general presentation format (Bull. Chem. Soc. Japan, etc.) of NMR data defined in academic journals can be used. An example of peak definition data in such a format is
1H-NMR (CDCl3) δ: 8.06 (2H, t, J = 8.1 Hz, CH2), 7.24 (1H, s, CH3),…
It is something like that. In this data example, the first “1H-NMR” indicates the name of the measurement nucleus, the next “(CDCl 3)” indicates the name of the solvent, and the next “δ: 8.06” indicates the chemical shift at the center of the first peak. The next “2H” indicates the proton number of the first peak, the next “t” indicates the splitting pattern of the first peak, and the next “J = 8.1 Hz” indicates the first peak. The spin coupling constant of the peak is shown, and the next “CH2” is a comment regarding the first peak. The definition of the first peak is followed by the definition of the second peak, the definition of the third peak,. Here, there are various peak splitting patterns, but typical splitting patterns include, for example, the following five types of patterns:
“S”: single
"D": doublet
“T”: triplet
“Q”: qualtet
“M”: multiplet
It becomes a combination.
図13Aは3分裂ピークの例を示しており、図13Bは4分裂ピークの例を示している。 FIG. 13A shows an example of a three splitting peak, and FIG. 13B shows an example of a four splitting peak.
図13Aに示すように、3分裂ピークの場合、上述したようなフォーマットのピーク定義データにより、その中心のケミカルシフトδ(単位:ppm)と1つのスピン結合定数J(単位:Hz)が定義される。図示は省略するが、2分裂ピークの場合も、同様に、中心のケミカルシフトδと1つのスピン結合定数Jが定義される。単一ピークの場合は、中心のケミカルシフトδが定義されるが、スピン結合定数Jは当然に定義されない。また、図13Bに例示するように、4分裂ピークの場合、中心のケミカルシフトδと、広狭2つのスピン結合定数Ja、Jb(単位:Hz)が定義される。図示は省略するが、多分裂(5以上の分裂)ピークの場合、中心のケミカルシフトδと、分列数に応じた数の異なるスピン結合定数が定義される。なお、中心のケミカルシフトδが決め難い複数分裂ピークの場合、「δa−δb」というようにケミカルシフトδの範囲でピークが定義される場合もあり得る。 As shown in FIG. 13A, in the case of a three split peak, the center chemical shift δ (unit: ppm) and one spin coupling constant J (unit: Hz) are defined by the peak definition data in the format as described above. The Although illustration is omitted, in the case of the bisecting peak, similarly, the central chemical shift δ and one spin coupling constant J are defined. In the case of a single peak, the central chemical shift δ is defined, but the spin coupling constant J is not naturally defined. Further, as illustrated in FIG. 13B, in the case of a quadrilateral peak, a central chemical shift δ and two broad and narrow spin coupling constants Ja and Jb (unit: Hz) are defined. Although illustration is omitted, in the case of a multi-split (split of 5 or more) peak, a central chemical shift δ and a number of different spin coupling constants depending on the number of columns are defined. Note that in the case of a multiple split peak where the central chemical shift δ is difficult to determine, the peak may be defined in the range of the chemical shift δ, such as “δa−δb”.
図13A、Bに例示するように、各ピークのピーク領域(そのピークが位置するケミカルシフトδ区間)は、上述したピーク定義データに含まれる数値、特に中心のケミカルシフトδとスピン結合定数Jとに基づいて決定することができる。例えば図13Aに示す3分裂ピークの場合には、そのピーク領域240xの始点s(x)と終点e(x)は、
s(x)=δ−(J+PW/2)
e(x)=δ+(J+PW/2)
により、また、図13Bに示す4分裂ピークの場合には、そのピーク領域240yの始点s(y)と終点e(y)は、
s(y)=δ−(Jb+PW/2)
e(y)=δ+(Jb+PW/2)
により計算することができる。ここで、「PW」はピーク幅(単位:Hz)を指し、これはNMR装置の分解能やサンプルの状態などの幾つかの条件によって異なってくるので、その条件セットに応じた適当な値を予め設定しておけばよい。図示以外の分裂パターンの場合についても、中心ケミカルシフトδとスピン結合定数J(ここで、単一ピークの場合はJ=0とすればよい)を用いてピークが定義されていれば、上記と同様のやり方でピーク領域が決定できる。また、「δa−δb」というようにケミカルシフトδの範囲でピークが定義されている場合には、そのピーク領域の始点sと終点eは、
s=δa−PW/2
e=δb+PW/2
により計算することができる。
As illustrated in FIGS. 13A and 13B, the peak region of each peak (the chemical shift δ section where the peak is located) is a numerical value included in the above-described peak definition data, in particular, the chemical shift δ at the center, the spin coupling constant J, Can be determined based on For example, in the case of the triple split peak shown in FIG. 13A, the start point s (x) and end point e (x) of the
s (x) = δ− (J + PW / 2)
e (x) = δ + (J + PW / 2)
Further, in the case of the quadrilateral peak shown in FIG. 13B, the start point s (y) and the end point e (y) of the
s (y) = δ− (Jb + PW / 2)
e (y) = δ + (Jb + PW / 2)
Can be calculated. Here, “PW” refers to the peak width (unit: Hz), which differs depending on several conditions such as the resolution of the NMR apparatus and the state of the sample. Just set it up. For splitting patterns other than those shown, if the peak is defined using the central chemical shift δ and the spin coupling constant J (where J = 0 for a single peak), then A peak area can be determined in a similar manner. Further, when a peak is defined in the range of chemical shift δ such as “δa−δb”, the start point s and end point e of the peak region are
s = δa−PW / 2
e = δb + PW / 2
Can be calculated.
さて、本実施形態にかかるNMRデータ処理装置100は、指定ピークについて上述したようなフォーマットのピーク定義データを入力し、そのピーク定義データに基づいて、指定ピークのピーク領域を決定するために必要な情報(以下、「指定ピーク情報」という)を自動的に生成する。生成された指定ピーク情報は、後に何時でも利用できるように、記憶装置106に登録されることができる。
Now, the NMR
図14A,Bは、記憶装置106に登録される指定ピーク情報のデータ構造例を示す。
14A and 14B show examples of the data structure of designated peak information registered in the
図14Aに示すように、NMRスペクトル解析の異なる用途にそれぞれ対応した異なる指定ピーク情報セット250A、250B、250Cが、記憶装置106に登録されている。例えば、特定の疾病に罹患した者の血液に共通するマーカを確定しようとする用途と、特定種類の食品に共通するマーカを確定しようとする用途とでは、マーカとなり得るピークは異なるから、用途毎に異なるピークが指定されることになる。そのため、用途毎に別の指定ピーク情報セット250A、250B、250Cが登録される。指定ピーク情報セット250A、250B、250Cの各々には、指定された1以上のピークの各々のピーク指定情報が記録されている。各ピークのピーク指定情報には、そのピークを識別するためのピークIDと、そのピークのピーク領域を計算するためのケミカルシフト、分裂パターン及びスピン結合定数などの数値データが含まれている。これらの数値データは、NMRデータ処理装置100に入力された上述したようなフォーマットのピーク定義データの中から、NMRデータ処理装置100により自動抽出されたものである。
As shown in FIG. 14A, different designated peak information sets 250A, 250B, and 250C respectively corresponding to different uses of NMR spectrum analysis are registered in the
また、図14Bに例示するように、予め設定されたピーク幅PWを示すピーク幅セット252も、記憶装置106に登録されている。前述したように分解能やその他の条件が異なるとピーク幅PWが異なってくるため、ピーク幅セット252には、異なる条件セットに対応して異なるピーク幅PWが設定されている。
Further, as illustrated in FIG. 14B, a peak width set 252 indicating a preset peak width PW is also registered in the
ところで、変形例として、図14Aに例示された指定ピーク情報セット250A、250B、250Cには、ケミカルシフト、分裂パターン及びスピン結合定数などの数値データと共に、又はそれに代えて、それらの数値データに基づき上記計算方法により計算されたピーク領域を示すデータ(例えば、始点と終点の数値データ)が登録されてもよい。 As a modification, the designated peak information sets 250A, 250B, 250C illustrated in FIG. 14A are based on numerical data such as chemical shift, splitting pattern, and spin coupling constant, or instead of the numerical data. Data indicating the peak area calculated by the above calculation method (for example, numerical data of the start point and the end point) may be registered.
さて、以上のような指定ピーク情報を用いて、図6に示されたステップ176の、指定ピーク情報に基づくバケットの自動修正処理が、次の手順で行われる。
Now, using the designated peak information as described above, the bucket automatic correction processing based on the designated peak information in
図15は、このバケット自動修正処理176の流れを示す。
FIG. 15 shows the flow of this bucket
図15に示すように、ステップ260で、任意に指定された1以上のピークのそれぞれについてピーク定義情報が入力され、そのピーク定義情報に基づいて各指定ピークのピーク定義情報が生成される。或いは、予め記憶装置106に登録されている図14Aに例示されたような指定ピーク情報セット250A、250B、250Cの中から、今回の用途に対応した指定ピーク情報セットが選択され、その選択された指定ピーク情報セットからピーク毎の指定ピーク情報が読み込まれる。さらに、予め設定されている図14Bに例示されたような条件毎のピーク幅データの中から、今回の解析に最適なピーク幅データが読込まれる。
As shown in FIG. 15, in
そして、ステップ262で、各指定ピークの指定ピーク情報とピーク幅データに基づいて、上述したような計算方法により、各指定ピークのピーク領域が決定され、そのピーク領域がそのまま積分ブロックとして設定される。例えば、図13A,Bに例示された2種類のピークの場合、それらのピークのピーク領域240x及び240yがそれぞれ積分ブロックとして設定される。
In
その後、ステップ264で、図12に示した自動積分ブロック設定に基づくバケット修正処理174のステップ232〜238と同様の手順で、記憶装置106に記憶されている1度修正されたバケットセットが、指定ピークに対応する積分ブロックに応じて更に修正される。この2回目のバケット修正により、いずれの指定ピークのピーク領域も複数のバケットにより分割されないようになる(つまり、いずれの指定ピークのピーク領域の必ずいずれか一つのバケット内に入るようになる)。また、ここで修正がなされたバケットについては、投影ADスペクトルSpのバケット積分が再計算され、再計算されたバケットの積分データにより、記憶装置106に記憶されている対応するバケットの積分データが置き換えられる。
Thereafter, in
そして、ステップ239で、このように2度修正されたバケットセットと積分データセットが、記憶装置106に保存され、また、必要に応じて外部に出力される。
In
次に、図6に示されたステップ178の、バケットの手動修正処理について説明する。この処理178は、上述した2回の自動的なバケット修正だけでは満足できない場合、オペレータが手動でバケットを更に修正できるようにするためのものである。
Next, the bucket manual correction process in
図16A,Bはバケットの手動修正処理178の原理を示し、図17はバケットの手動修正処理178の流れを示す。
16A and 16B show the principle of the
この処理178において、記憶装置106に保存されている投影ADスペクトルSpと前述した2度の自動修正を終えたバケットセットが、NMRスペクトル処理装置100のディスプレイスクリーンに表示される。オペレータはその表示を見ながら、任意のバケットの始点又は終点に対する修正要求をNMRスペクトル処理装置100に入力する。例えば、図16Aに例示するように、或るバケット200jを修正したい場合、オペレータは、そのバケット200jを指定した上で、その始点を終点の修正要求として、新たな始点s(j)と新たな終点e(j)を入力する。すると、図17に示すように、ステップ270で、指定されたバケット200jの始点と終点が、オペレータから入力された始点s(j)と終点e(j)と同一値に修正される。また、ステップ272で、指定されたバケットの始点s(j)側の隣バケットの終点e(i)が指定バケットの始点s(j)と同一値に修正され、ステップ274で、指定バケットの終点e(j)側の隣バケットの始点s(k)が指定バケットの終点e(j)と同一値に修正される。その後、ステップ276で、修正されたバケット毎にバケット積分が再計算され、再計算された積分データにより、記憶装置106に記憶されている対応するバケットの積分データが置き換えられる。そして、ステップ278で、手動修正の終わったバケットセットと、そのバケットセットに基づいて上記のように修正された積分データセットとが、記憶装置106に保存され、また必要に応じて外部へ出力される。
In this
以上のように、図6のステップ172で、全バケットが一定幅(例えば0.04ppm)をもつ均等幅のバケットセットが初期的に設定され、その後、ステップ174と176と178の3段階のバケット修正が行われて、バケットにより幅の異なる不均等幅のバケットセットが完成する。なお、ステップ174と176と178の3つの修正段階は、必ずしもその全てが実行されなければならないわけではなく、いずれかの修正段階(例えば手動修正)が省略されても良い。いずれにしても、最終的に完成された不均等幅のバケットセットは「最適化バケットセット」と呼ばれる。
As described above, in
図18は、記憶装置106に保存された最適化バケットセットのデータ構造例を示す。
FIG. 18 shows an example data structure of an optimized bucketset stored in the
図18に示すように、スペクトル解析の異なる用途にそれぞれ対応して異なる最適化バケットセット280A、280B、280Cが、記憶装置106に記憶されている。用途が異なれば、既に説明したように指定ピークが異なり、また、処理対象のNMRスペクトル自体も異なるので、当然、出来上がる最適化バケットセットが異なるからである。最適化バケットセット280A、280B、280Cの各々には、用途を示す用途ID、ピーク幅PWを示す数値データ、ケミカルシフト軸スケールの基準点(原点)を示す数値データ、並びに、このバケットセットを構成する多数のバケットのバケット番号、始点及び終点のデータなどが登録されている。さらに、いずれかの指定ピークに対応するバケットには、その対応する指定ピークを指すピークIDも登録されている。
As illustrated in FIG. 18, different optimization bucket sets 280A, 280B, and 280C corresponding to different uses of spectrum analysis are stored in the
上述した3段階のバケット修正処理の説明から分かるように、最適化バケットセットにおいては、全てのバケットが均等な幅(例えば0.04ppm)をもってはおらず、それぞれに特有の不均等な幅をもっている。そして、投影ADスペクトルSpから自動的に検出された全てのピークについても、加えて、指定ピーク情報により指定された全てのピークについても、各ピークのピーク領域は必ずいずれか一つのバケットの中に入っており、いずれのピーク領域も複数バケットにより分割されてはいない。さらに、この最適化バケットセットの作成の基礎となった投影ADスペクトルSpには、解析対象である多数のADスペクトル上のほぼ全てのピークが投影されており、それらのピークのピーク領域が最適化バケットセット反映されている。さらに、解析用途のために重要であると考えられる既知の指定ピークのピーク領域も、最適化バケットセットに反映されている。従って、この最適化バケットセットを用いて、解析対象である多数のADスペクトルのそれぞれのバケット積分を行なうことにより、いずれのADスペクトルも、そこに含まれるほぼ全てのピークの情報が良好に維持された状態で、積分データセット(ヒストグラム)に変換されることになる。 As can be seen from the description of the three-stage bucket correction process described above, in the optimized bucketset, not all buckets have a uniform width (for example, 0.04 ppm), but have unique unequal widths. And for all peaks automatically detected from the projected AD spectrum Sp, in addition to all the peaks specified by the specified peak information, the peak area of each peak must be in any one bucket. And no peak area is divided by multiple buckets. Furthermore, almost all the peaks on the many AD spectra to be analyzed are projected on the projected AD spectrum Sp, which is the basis for creating this optimized bucket set, and the peak area of those peaks is optimized. The bucket set is reflected. Furthermore, the peak areas of known designated peaks that are considered important for analytical applications are also reflected in the optimized bucket set. Therefore, using this optimized bucket set, each bucket integration of a large number of AD spectra to be analyzed is performed, so that information on almost all the peaks contained in each AD spectrum is well maintained. In this state, it is converted into an integral data set (histogram).
再び図6を参照する。最適化バケットセットが完成すると、ステップ180の、多数ADスペクトルの最適化バケット積分処理が行われる。
Refer to FIG. 6 again. When the optimized bucket set is completed, an optimized bucket integration process of multiple AD spectra in
図19は、多数ADスペクトルの最適化バケット積分処理180の流れを示す。
FIG. 19 shows a flow of optimization
図19に示すように、ステップ290で、最適化バケットセットが記憶装置106から読込まれる。ステップ292で、解析対象である多数のADスペクトルの各々が記憶装置106から読込まれる。ステップ292で、読込まれたADスペクトルのケミカルシフト軸スケール(δスケール)が、最適化バケットセットのケミカルシフト軸スケール(δスケール)に合わされる(例えば、ADスペクトルの基準点が最適化バケットセットの基準点に一致するように、ADスペクトルのケミカルシフト軸スケールがシフトされる。)。そして、ステップ296で、そのADスペクトルのバケット積分が、最適化バケットセットを用いて実行され、ステップ298で、そのバケット積分で求まった積分データセット(ヒストグラムデータ)が記憶装置106に保存され、必要に応じて外部へ出力される。
As shown in FIG. 19, at
ステップ299により、解析対象の全てのADスペクトルについて、上述したステップ292〜298の処理が繰り返される。その結果、解析対象の全てのADスペクトルが、それぞれ積分データセット(ヒストグラムデータ)に縮約されて、記憶装置106に保存される。
In
再び図6を参照する。その後、ステップ182で、解析対象の全てのADスペクトルの最適化バケット積分データセット(ヒストグラムデータ)が、次の統計処理に渡すのに適したデータ形式に整えられた上で、記憶装置106に保存され、必要に応じて外部へ出力される。
Refer to FIG. 6 again. After that, in
以上図6に示された流れに沿って説明した処理が実行されることにより、図1に示された最適化バケット積分を用いたデータの縮約処理112と、積分結果データの保存/出力処理114が完了する。その後に、図1に示される統計処理116が実行される。この統計処理116では、解析対象の全てのADスペクトルの積分データセット(ヒストグラムデータ)が記憶装置106から読込まれ、それらの積分データセット(ヒストグラムデータ)を用いて、所定の統計処理(例えば多変量解析法の一つである主成分分析)が実行され、そして、マーカとなるピークの確定などの解析結果が生成され出力される。統計処理の具体的な手法としては、公知の種々の方法を用いることができる。例えば、後に詳述するように、本発明の原理に従う統計処理では、いずれも多変量解析法の一つである主成分分析(Principal component Analysis:PCA)と部分空間法(Soft Independent Modeling of Class Analogy:SIMCA)とが組み合わせて用いられる。既に説明するようなしたように、統計処理の材料であるADスペクトルの積分データセット(ヒストグラムデータ)には、ADスペクトル上の重要なピークの情報が良好に含まれているので、統計処理の結果は精度の高いものとなる。
6 is executed, the
図20は、本発明に従うNMRデータ処理装置の別の実施形態の全体的な構成と機能を示す。 FIG. 20 shows the overall configuration and function of another embodiment of the NMR data processing apparatus according to the present invention.
このNMRデータ処理装置300は、前述のNMRデータ処理装置100とは別の用途に使用される。すなわち、前述のNMRデータ処理装置100の用途は、多数のサンプルのNMRスペクトルを解析し統計的なデータを得ることであるのに対し、このNMRデータ処理装置300の用途は、基本的に一つのサンプルのNMRスペクトルを分析してそのサンプルの性質又は成分などを検査すること(例えば、或る人の血液のNMRスペクトルを分析して、その人が特定の疾病に罹患してないかどうか検査すること、あるいは、或る食品のNMRスペクトルを分析して、そこに如何なる物質が含有されているか検査すること、など)にある。このNMRデータ処理装置300も、前述のNMRデータ処理装置100と同様に、プログラムされたコンピュータシステムを用いて実現することができる。
The NMR
図20に示すように、NMRデータ処理装置300のプロセッサ304は、記憶装置306に記憶されている所定のコンピュータプログラムを実行することにより、FIDデータ入力処理308、NMRスペクトル処理310、最適化バケット積分を用いたデータ縮約処理312、ヒストグラム分析処理314、分析結果データ保存/出力処理316を行う。記憶装置306には、上記コンピュータプログラムの他に、予め、図18に例示したような用途別の最適化バケットセット280A、280B、280Cが記憶されている。さらに記憶装置306には、検査目的に対応した参照モデルデータが記憶されている。検査目的に対応した参照モデルデータとは、検査の判断を行う際に検査対象のNMRデータと対比される基準のデータである。例えば、人の血液からその人が特定の疾病に罹患してないかどうか検査するという用途の場合であれば、その特定の疾病に罹患している多数の人々の血液サンプルのNMRデータを前述のNMRデータ処理装置200で解析することによって確定されたマーカの情報が、参照モデルデータの一つとして採用することができる。
As shown in FIG. 20, the
FIDデータ入力処理312では、NMR装置102から出力される検査対象の一サンプルのFIDデータが入力され、記憶装置306に記憶される。NMRスペクトル処理310では、入力されたFIDデータに対して、図2に示されたと同様の流れの処理が行われて、そのFIDデータの絶対値微分であるADスペクトルが生成され、記憶装置306に記憶される。
In the FID
データ縮約処理312では、記憶装置306に予め記憶されている用途に応じた最適化バケットセットを用いた最適化バケット積分が、検査対象のADスペクトルに対して実行され、それにより、検査対象のADスペクトルが最適化された積分データセット(ヒストグラム)に縮約される。ヒストグラム分析処理314では、検査対象の積分データセット(ヒストグラム)が、記憶装置306に予め記憶されている用途に応じた参照モデルデータと対比され、対比結果に基づく判断がなされて検査結果が生成される。分析結果の保存/出力処理316では、生成された検査結果が記憶装置306に保存され、また外部へ出力される。
In the
図21は、図20に示された最適化バケット積分を用いたデータ縮約処理312の流れを示す。
FIG. 21 shows the flow of the
ステップ320で、検査対象のADスペクトルが記憶装置306から読込まれ、ステップ322で、用途に対応した最適化バケットセットが記憶装置306から読込まれる。ステップ324で、検査対象のADスペクトルのケミカルシフト軸スケール(δスケール)が最適化バケットセットのそれに一致させられる。その後、ステップ326で、最適化バケットセットを用いた最適化バケット積分が、検査対象のADスペクトルに対して実行され、検査対象の積分データセット(ヒストグラム)が求まる。ステップ328で、検査対象の積分データセット(ヒストグラム)が記憶装置306に保存され、必要に応じて外部へ出力される。
In
図22は、図20に示されたヒストグラムの分析処理314の流れを示す。
FIG. 22 shows the flow of the
ステップ330で、検査対象の積分データセット(ヒストグラム)が記憶装置306から読込まれる。ステップ332で、検査目的に対応した参照モデルデータが記憶装置306から読込まれる。ステップ334で、検査対象の積分データセット(ヒストグラム)と、検査目的に対応した参照モデルデータとが対比され、検査結果が判断される。ステップ336で、検査結果が記憶装置306に保存され、また外部へ出力される。
In
以上のようなサンプルの検査を用途とするNMRデータ処理においても、用途に応じて予め用意された最適化バケットセットを用いた最適化バケット積分がスペクトルに対して行われるので、スペクトルがもつピーク情報が良好に維持され、精度の高い検査結果を得ることができる。また、分析には、NMRスペクトルの絶対値微分であるADスペクトルが用いられるため、面倒な位相補正やベースライン補正が不要になり、処理効率が向上する。 Even in the NMR data processing for the sample inspection as described above, the optimization bucket integration using the optimization bucket set prepared in advance according to the application is performed on the spectrum, so the peak information that the spectrum has Is maintained well, and a highly accurate inspection result can be obtained. In addition, since an AD spectrum, which is an absolute value derivative of the NMR spectrum, is used for the analysis, troublesome phase correction and baseline correction become unnecessary, and processing efficiency is improved.
次に、本発明の一実施形態にかかるNMRスペクトルの統計処理装置について説明する。 Next, an NMR spectrum statistical processing apparatus according to an embodiment of the present invention will be described.
本発明の一実施形態にかかる統計処理装置は、図1に示したNMRデータ処理装置100内に統計処理部116として組み込まれており、そして、典型的には、既に説明した前処理部分(図1内の処理部108,110,112,114)と一緒にコンピュータプログラムとして具現化されている。しかし、これは説明のための一つの例示にすぎず、本発明に従うNMRスペクトルの統計処理装置は、既に説明した前処理部分からは分離された単独装置として構成されることもできる。
The statistical processing apparatus according to an embodiment of the present invention is incorporated as the
図22は、本発明の一実施形態にかかるNMRスペクトルの統計処理装置、すなわち、図1に示した統計処理部116、の機能的な構成を示す。
FIG. 22 shows a functional configuration of an NMR spectrum statistical processing apparatus according to an embodiment of the present invention, that is, the
図22に示すように、統計処理部116は、多変量解析部340と、ユーザ要求入力部342と、表示制御部344とを有する。
As illustrated in FIG. 22, the
多変量解析部340は、PCA解析部346とSIMCA解析部348とを有する。PCA解析部346は、記憶装置106に保存されている多数のサンプルのNMRスペクトルの積分データセット(以下、「NMRヒストグラム」という)を入力して、主成分分析(Principal component Analysis: PCA)による多変量解析を行なう。また、SIMCA解析部348は、記憶装置106に保存されている多数のサンプルのNMRヒストグラムを入力して、部分空間法(Soft Independent Modeling of Class Analogy:SIMCA)(以下、SIMCAという)による多変量解析を行なう。PCA解析部346とSIMCA解析部348の入力となる解析対象としての多数のサンプルのヒストグラムのデータは、記憶装置106内のPCAテーブル350に記録されている。PCAテーブル350の構成については、後に説明する。
The
記憶装置106内には、図1に示した積分結果データの保存/出力処理114により書き込まれた大量のサンプルのNMRヒストグラムデータ356がある。PCA解析部346とSIMCA解析部348は、それぞれ、その大量のサンプルのNMRヒストグラムデータ356の中から、任意の多数のサンプルのNMRヒストグラムのデータを解析対象として抽出してPCAテーブル350に登録することができる。多変量解析部340は、ユーザからの要求に応じてPCAテーブル350の更新も行なう。また、PCA解析部346とSIMCA解析部348は、それぞれ、PCA解析結果(例えば、サンプルのスコア及び変数のローディングなど)とSIMCA解析結果(サンプルの各クラスまでの距離、変数のモデリング力及び識別力など)を、解析結果データ352として、記憶装置106内に保存することができる。
In the
SIMCA解析部348とPCA解析部346は、後に詳述するように、前者による解析結果が後者の解析にフィードバックされるように連携して動作することができる。それにより、このような多変量解析を行なう目的、例えばメタボノミクスにおいてバイオマーカを探し当てる目的が、より容易に達成されるようになる。
As will be described later in detail, the
表示制御部344は、PCA解析部346からPCA解析結果(スコア及びローディングなど)を受け、また、SIMCA解析部348からとSIMCA解析結果(各クラスまでの距離、モデリング力及び識別力など)を受けて、そして、そのPCA解析結果とSIMCA解析結果を表示したグラフィカルユーザインタフェース(以下、「UI」という)346を作成し、そのUI346をコンピュータシステム100(図1)のディスプレイ装置(図示省略)に表示する。表示制御部344は、記憶装置106に記憶されている多数のサンプルのNMRスペクトルデータ350の中から、ユーザにより選択された1以上のサンプルのNMRスペクトルデータを読み込み、そのUI346上に、PCA解析結果とSIMCA解析結果と一緒に、ユーザにより選択されたサンプルのNMRスペクトルを表示する。なお、この実施形態では、表示されるNMRスペクトルデータは、元のNMRスペクトルデータではなく、それを絶対値微分して得られたADスペクトルデータであるが、これを以下では単に「NMRスペクトルデータ」と呼ぶ。
The
表示制御部344は、UI346上のPCA解析結果とSIMCA解析結果の表示とNMRスペクトルの表示とが連携するように、UI346上での両者の表示を制御する。それにより、オペレータは多変量解析結果とNMRスペクトルとの関連性が視覚的に容易に理解できるようになり、このような多変量解析を行なう目的、例えばメタボノミクスにおいてバイオマーカを探し当てる目的が、より容易に達成されるようになる。さらに、そのUI346上には、ユーザが各種の要求を入力するための各種の入力ボタンも表示される。そのUI346の詳細については、後に説明する。
The
ユーザ要求入力部342は、ユーザによりマウスまたはキーボードなどから上記UIに入力された各種の要求を受け、その入力要求を上述した多変量解析部340および表示制御部344に渡す。多変量解析部340および表示制御部344は、ユーザから入力された要求に応答して、後述するような各種の動作を行う。
The user
図24は、図23に示したPCAテーブル350の構成例を示す。 FIG. 24 shows a configuration example of the PCA table 350 shown in FIG.
既に述べたように、PCAテーブル350には、解析の対象となる多数のサンプルのNMRヒストグラムのデータが記録されている。すなわち、図24に示すように、PCAテーブル350には、ヒストグラムを作成するときに行なわれたバケット積分に関するバケット積分条件400が記録されており、これには、バケット積分が行なわれたケミカルシフトδの全範囲(図9に示した全範囲202に相当)、バケットの基本的な幅(図9に示した幅Wに相当)、自動積分ブロック設定でバケット幅の調整を行ったか否か、全範囲の合計積分値、及びダークリジョン((図9に示したダークリジョン204に相当)(図示の例では、5.3ppmから4.3ppmという1つのダークリジョンだけが登録されているが、複数のダークリジョンが登録され得る)が含まれる。
As described above, in the PCA table 350, NMR histogram data of a large number of samples to be analyzed are recorded. That is, as shown in FIG. 24, the PCA table 350 records a
また、PCAテーブル350には、解析対象のサンプルの数402、各サンプルを構成する多数の変数の数(つまり、バケットの数)404、及び、各サンプルのNMRスペクトルデータが格納されているフォルダ名406とファイル名408のセット(つまり、各サンプルのNMRスペクトルデータファイルのパス名)が記録されている。ここで、前述した図23では、図示の都合から、多数のサンプルのNMRスペクトルデータは纏めて1つのブロック354で示されているが、このブロック354は実際には、サンプル毎のNMRスペクトルデータを格納した多数のスペクトルデータファイルの集まりであり、それら多数のスペクトルデータファイルのパス名(フォルダ名406とファイル名408)がPCAテーブル350に記録されている。図24では、図示の都合から、3つのサンプルのスペクトルデータファイルのパス名しか示されていないが、実際には、サンプル数402に示された数のサンプルの全てのスペクトルデータファイルのパス名がPCAテーブル350に記録されている。
In the PCA table 350, the number of samples to be analyzed 402, the number of many variables (that is, the number of buckets) 404 constituting each sample, and the name of the folder storing the NMR spectrum data of each sample are stored. A set of 406 and file name 408 (that is, the path name of the NMR spectrum data file of each sample) is recorded. Here, in FIG. 23 described above, for the convenience of illustration, the NMR spectrum data of a large number of samples are collectively shown in one
さらに、PCAテーブル350には、UI346の画面上にプロットされるサンプル毎のマークの形状とカラーをそれぞれ指定したプロットタイプ410とプロットカラー412が定義されている。プロットタイプ410は、例えば、値「0」が×形マーク、値「1」が塗りつぶしの無い円形マーク、値「−1」が黒く塗りつぶされた円形マーク、…などを指定する。また、プロットカラー412は、3原色である赤(R)、緑(G)及び青(B)の明度(濃度)値のセットで定義される。後述するように、UI346上にはPCA解析結果の一つであるスコアプロットや、SIMCA解析結果の一つであるクーマンプロットが表示されるが、そのスコアプロットやクーマンプロット上では、各サンプルは、PCAテーブル350で指定された形状とカラーを持ったマークで表示されることになる。
Furthermore, the PCA table 350 defines a
さらに、PCAテーブル350には、サンプル毎のサンプルステータス414が登録されている。各サンプルのサンプルステータス414は、該当のサンプルが解析対象に含まれるか否かを示すものであり、例えば、値「0」が該当のサンプルが解析対象に含まれることを意味し、値「1」が該当のサンプルがユーザからの要求により解析対象から除外されたことを意味する。後に説明するように、PCAテーブル350に登録されているサンプルの全ては初期的には解析対象に含まれるのである(つまり、サンプルステータスが「0」である)が、ユーザは、UI346のスコアプロット上でクーマンプロット上で任意のサンプルを選択して、選択したサンプルを解析対象から除外することができ、そのようにして除外されたサンプルのサンプルステータスは「1」に変わる。サンプルステータスが「1」であるサンプルは、PCA解析やSIMCA解析において計算に入れられない。
Further, a
さらに、PCAテーブル350には、実質的な解析対象である多変量データ行列418が登録されている。この多変量データ行列418には、上記積分全範囲に含まれる全バケットのそれぞれの中点のケミカルシフト値(これは、多変量解析における変数つまり記述子に相当する)418と、サンプル毎のNMRヒストグラムのデータ(すなわち、サンプル毎の最適化バケット積分で得られた積分データのセットであり、解析対象である多変量データ行列の正味の部分である)420、それぞれのバケットの始点のケミカルシフト値422と終点のケミカルシフト値424、及び、それぞれのバケットのステータス426が登録されている。各バケットのステータス426は、そのバケット(つまり、その変数)を解析に使用するか否かを示すものであり、例えば、値「0」はそのバケットを解析に使用することを意味し、値「1」は解析に使用しないことを意味する。後述するように、UI346上に表示されるSIMCA解析結果の一つである識別力に基づいて、ユーザは任意のレベル以上に高い識別力をもつ変数(バケット)だけを選択し、選択されたバケットだけを用いて再度PCA解析やSIMCA解析を行なうことを要求することができる。全てのバケットは、初期的にはステータスが「0」であって、解析に使用されるようになっているが、上記のようにして特定のバケットだけが後の解析のために選択された場合、選択されなかったバケットのステータスは「1」に変わり、ステータスが「1」であるバケットは後の解析では使用されないことになる。
Furthermore, a
以上のような構成を持つPCAテーブル350を使用して、PCA解析とSIMCA解析が実行されることになる。 PCA analysis and SIMCA analysis are executed using the PCA table 350 having the above configuration.
図25は、図23に示した多変量解析部340のPCA解析部346とSIMCA解析部348並びに表示制御部344の機能をより詳細に示している。
FIG. 25 shows the functions of the
図25に示すように、PCA解析部346は、PCAモデル読込・追加・保存部360と、PCA計算部362とを有する。PCAモデル読込・追加・保存部360は、記憶装置106上の大量サンプルのNMRヒストグラムデータ356の中から、解析対象となる多数のサンプルのNMRヒストグラムデータを選んで、その選ばれた多数のサンプルのNMRヒストグラムデータに基づいてPCAテーブルの情報を新規に作成する機能や、記憶装置106上の大量サンプルのNMRヒストグラムデータ356の中から追加のサンプルのNMRヒストグラムデータを選んで、それをPCAテーブルの多変量データ行列に追加する機能をもつ。さらに、PCAモデル読込・追加・保存部360は、作成されたり追加されたり或は変更されたりしたPCAテーブルの情報を、記憶装置106にPCAテーブル350として保存する機能をもつ。PCA計算部362は、PCAモデル読込・追加・保存部360により用意されたPCAテーブルの情報を用いてPCA解析の計算を行ってPCAモデルを作成し、そのPCAモデルに基づいたPCA解析結果(例えば、各サンプルのスコアや、各変数(各バケット)のローディングなど)を出力する。なお、PCA解析の計算方法それ自体は周知であるから(例えば、非特許文献1を参照)、これについての詳細な説明はこの明細書では省略する。
As illustrated in FIG. 25, the
SIMCA解析部370は、PCAモデル読込・追加・保存部370と、SIMCA計算部370を有する。PCAモデル読込・追加・保存部370は、記憶装置106上の大量サンプルのNMRヒストグラムデータ356の中からユーザが第1と第2のクラスにそれぞれ割り当てたサンプルのNMRヒストグラムデータを読込んで、第1と第2の2つのクラスのPCAテーブルの情報を用意する機能や、記憶装置106上の大量サンプルのNMRヒストグラムデータ356の中からユーザがテストクラスに割り当てたサンプルのNMRヒストグラムデータを読込んで、テストクラスのPCAテーブルの情報を用意する機能をもつ。さらに、PCAモデル読込・追加・保存部370は、各クラスのPCAテーブルの情報を、記憶装置106に各クラスのPCAテーブル350として保存する機能をもつ。SIMCA計算部372は、PCAモデル読込・追加・保存部370により用意された複数のクラスのPCAテーブルの情報を用いてSIMCA解析の計算を行って各クラスのPCAモデルを作成し、それらのPCAモデルに基づいたSIMCA解析結果(例えば、各サンプルの各クラスからの距離や、各変数(各バケット)のモデリング力や識別力など)を出力する。SIMCA解析の計算には、クラス毎のPCA計算が含まれており、このクラス毎のPCA計算を行うために、SIMCA計算部372は、PCA解析部346のPCA計算部362を使用する。なお、SIMCA解析の計算方法それ自体は周知であるから(例えば、非特許文献1を参照)、これについての詳細な説明はこの明細書では省略する。
The
PCA解析部346とSIMCA解析部348は、解析データ記憶部364と解析データ保存部366とを有する。解析データ記憶部364は、PCA解析部346から出力されたPCA解析結果と、SIMCA解析部348から出力されたSIMCA解析結果を記憶する。解析データ保存部366は、解析データ記憶部364に記憶されたPCA解析結果とSIMCA解析結果を、記憶装置106上に解析結果データ352として保存する。
The
後に詳述するように、解析データ記憶部364に記憶されるSIMCA解析結果の中には、或るレベル以上に高い識別力をもつ変数(バケット又はそれに対応するケミカルシフト値)を選択する情報が含まれている。この変数選択情報は、解析データ記憶部364を通じて、PCA計算部362及びSIMCA計算部372にフィードバックされることができる。そして、PCA計算部362とSIMCA計算部372はそれぞれ、フィードバックされた変数選択情報に従って、選択された変数(つまり、或るレベル以上に高い識別力をもつバケット又はそれに対応するケミカルシフト値)だけを用いて、再度、PCA解析とSIMCA解析を行なって、修正されたPCA解析結果とSIMCA解析結果を再度出力することができるようになっている。これにより、より望ましいPCA解析結果とSIMCA解析結果を得ることができるようになる。
As will be described in detail later, in the SIMCA analysis result stored in the analysis
表示制御部344は、PCA解析画面制御部374と、SIMCA解析画面制御部376と、NMRスペクトル連携部378とを有する。PCA解析画面制御部374は、PCA計算部362から解析データ記憶部364に出力されたPCA解析結果を受けて、後に具体的に説明するように、UI346上にPCA解析結果を示した複数種のチャート(例えば、スコアプロット、ローディングプロット、寄与率チャート及びローディングチャート)(以下、「PCA解析結果チャート」と総称する)を表示し、また、UI346に入力されたユーザからの選択、拡大、削除及び初期化などの要求に応答して、UI346上のそれらのチャートを変化させる。SIMCA解析画面制御部376は、SIMCA計算部372から解析データ記憶部364に出力されたSIMCA解析結果を受けて、後に具体的に説明するように、SIMCA解析結果を示す複数種のチャート(例えば、クーマンプロット、モデリング力チャート及び識別力チャート)(以下、「SIMCA解析結果チャート」と総称する)をUI346上に表示し、また、UI346に入力されたユーザからの選択、拡大、削除及び初期化などの要求に応答して、UI346上のそれらのチャートを変化させる。
The
NMRスペクトル連携部378は、記憶装置106上の大量のサンプルのNMRスペクトルデータ354の中から、UI346上でユーザにより選択された1又は複数のサンプルのNMRスペクトルデータを読込んで、その選択されたサンプルのNMRスペクトルを示すチャートを、UI346上に上述したPCA解析結果チャートまたはSIMCA解析結果チャートと並べて表示する。
The NMR
以下では、図25に示した各部の機能を、UI346の画面例を参照しつつ説明する。
In the following, the function of each unit illustrated in FIG. 25 will be described with reference to a screen example of the
図26は、PCA解析結果を表示した場合におけるUI346の画面例を示す。図27は、SIMCA解析結果を表示した場合におけるUI346の画面例を示す。
FIG. 26 shows a screen example of the
図26と図27に示すように、この実施形態におけるUI346の画面430(以下、「UI画面」という)は、PCA解析結果とSIMCA解析結果とが交互に切り替え可能な別の画面に表示されるようになっているが、これは表示方法の一例にすぎない。十分に大型のディスプレイ装置を使用する場合のために、同一画面にPCA解析結果とSIMCA解析結果とを表示できるようになっていてもよい。
As shown in FIGS. 26 and 27, the
図26と図27に示すように、PCA解析結果とSIMCA解析結果のいずれを表示する場合にも、UI画面430には、コントロールパネル432があり、そこには、図1に示したステップ108〜114の前処理を制御するための各種要求をユーザが入力するための前処理コントロールパネル434と、PCA解析を制御するための各種要求をユーザが入力するためのPCAコントロールパネル436と、SIMCA解析を制御するための各種要求をユーザが入力するためのSIMCAコントロールパネル438とが図示のように配置される。
As shown in FIGS. 26 and 27, the
このUI画面430上のPCAコントロールパネル436の一番上の「PCA」選択ラジオボタンがユーザにより操作された(例えばクリックされた)場合には、それに応答して、図25に示したPCA解析画面制御部374が動作する。PCA解析画面制御部374は、解析データ記憶部364からPCA解析結果を受けて、UI画面430上に図26に示すように、複数のPCA解析結果チャート、すなわち、スコアプロット440、ローディングプロット442、寄与率プロット444及びローディングプロットを表示する。他方、SIMCAコントロールパネル438の一番上の「SIMCA」選択ラジオボタンが操作された場合には、それに応答して図25に示したSIMCA解析画面制御部376が動作する。SIMCA解析画面制御部376は、解析データ記憶部364からSIMCA解析結果を受けて、UI画面430上に図27に示すように、複数のSIMCA解析チャート、すなわち、クーマンプロット462、第1のクラスに対するモデリング力チャート464、第2のクラスに対するモデリング力チャート466及び識別力チャート468を表示する。
When the user selects (for example, clicks) the “PCA” selection radio button at the top of the
さらに、図26と図27に示すように、PCA解析結果とSIMCA解析結果のいずれを表示する場合にも、図25に示したNMRスペクトル連携部378が動作して、UI画面430上に、NMRスペクトルチャート450を表示する。NMRスペクトルチャート450には、ユーザに選択された1以上のサンプルのNMRスペクトルのグラフが表示される。ここで、注目すべき点は、PCA解析結果を表示した場合、図26に示すように、NMRスペクトルチャート450と寄与率チャート444とローディングチャート446とが、それぞれの横軸であるケミカルシフト軸のスケールが互に一致するようにして、ケミカルシフト軸に直交する縦軸方向に配列される点である。また、同様に、SIMCA解析結果を表示した場合、図27に示すように、NMRスペクトルチャート450と識別力チャート468とが、それぞれの横軸であるケミカルシフト軸のスケールが互に一致するようにして、ケミカルシフト軸に直交する縦軸方向に配列される。これにより、ユーザは、寄与率、ローディング又は識別力の大きい変数(バケット又はそれに対応するケミカルシフト値)とNMRスペクトルのピークとの相関関係が視覚的に容易に把握でき、例えばメタボノミクスにおいてバイオマーカを決定することがより容易になる。
Further, as shown in FIGS. 26 and 27, when displaying either the PCA analysis result or the SIMCA analysis result, the NMR
以下では、PCA解析を行なう場合と、SMCA解析を行なう場合とに分けて、それぞれの場合における動作をより具体的に説明する。まず、PCA解析を行なう場合について説明する。 In the following, the operation in each case will be described more specifically by dividing into the case of performing PCA analysis and the case of performing SMCA analysis. First, a case where PCA analysis is performed will be described.
まず、図26に示したUI画面430上のPCAコントロールパネル436内の「PCA」選択ラジオボタンが操作された上で「Open_Model」ボタンが操作されると、図25に示したPCAモデル読込・追加・保存部360が動作して、記憶装置106内の大量のサンプルのNMRヒストグラムデータ356の中から、ユーザに指定された複数のサンプルのNMRヒストグラムデータを選択して読み込み、図24に示したような、多変量データ行列やその他の情報をからなるPCAテーブルの情報を作成する。ユーザ指定されたサンプルの数がN個で、各サンプルのNMRスペクトルを構成する変数(バケット)の数がM個であるならば、PCAテーブルの情報に含まれる多変量データ行列はN×Mのデータ行列となる。
First, when the “PCA” selection radio button in the
PCAモデル読込・追加・保存部360は、作成したPCAテーブルの 情報をPCA計算部362に引渡す。PCA計算部362は、そのPCAテーブルの情報を用いてPCA解析の計算を行なって、そのPCAテーブルの情報に含まれている多変量データ行列についてのPCAモデルを算出する。ここで、PCA解析計算において計算される主成分の数は、UI画面430上のPCAコントロールパネル436の一番上の「PCA」選択ラジオボタンの右脇に置かれた入力ボックスにユーザが入力した数で決まる(図示の例では主成分数として「6」が設定されている)。PCA計算部362は、算出されたPCAモデルに基づくPCA解析結果として、各主成分に対する各サンプルのスコア、そのスコアの分散、各主成分に対する各変数のローディング及び各変数の寄与率(全主成分に対するローディングの絶対値の和)などを算出する。算出されたPCA解析結果は、解析データ記憶部364に記憶される。
The PCA model reading / adding / saving
PCA解析画面制御部374が、解析データ記憶部364から上記PCA解析結果を受け取る。PCA解析画面制御部374は、図26に示すように、各主成分に対する各サンプルのスコアに基づいて、スコアプロット440を作成してUI画面430上に表示し、各主成分に対する各変数のローディングに基づいて、ローディングプロット442とローディングチャート446を作成してUI画面430上に表示し、さらに、各変数の寄与率に基づいて、寄与率チャート444を作成してUI画面430上に表示する。
The PCA analysis
図26に示すように、スコアプロット440では、ユーザにより選択された2つの主成分に対するそれぞれのスコアをそれぞれX軸とY軸にとり、各サンプルのその2つの主成分に対するスコアがプロットされる。X軸とY軸に相当する主成分は、PCAコントロールパネル436内の「X」軸プルダウンメニュー及び「Y」軸プリダウンメニューからユーザにより選ばれた番号の主成分である(図示の例では、X軸が第「1」主成分(PCA1)、Y軸が第「2」主成分(PCA2)。)。プロットされるサンプルのマークの形状と色は、上記PCAテーブル情報の中のサンプル毎のプロットタイプとプロットカラー(図24の参照番号410、412に対応する情報)に従う。さらに、X軸とY軸には、対応する主成分番号とその分散も表示される(例:PC1(39.8%))。さらに、計算に使用されたサンプル数も表示される。
As shown in FIG. 26, in the
スコアプロット440上で、複数のサンプルマーク間の位置が近いほど、それらのサンプルは特徴的に互いにより似ており、他方、位置が遠いほどより違っていることを意味する。従って、スコアプロット440上に、例えば互いに分離された幾つかのサンプルマークの塊が存在するならば、分析対象のサンプルが、それぞれの塊に対応する特徴的に異なる幾つかのクラスに分けられたと判断することができる。
On the
また、各主成分におけるスコアの分散は、その値が大きいほど、その主成分がサンプルのクラス分けに寄与する度合いが高いことを意味する。例えば、X軸とY軸の主成分の分散の和が、或る値(例えば、60%程度)より大きければ、それらの主成分を用いたPCAモデルにおいてサンプルがかなり明確にクラス分けされ得ると判断することができる。 Further, the variance of the score in each principal component means that the larger the value, the higher the degree that the principal component contributes to the classification of samples. For example, if the sum of the variances of the principal components of the X and Y axes is greater than a certain value (for example, about 60%), the sample can be classified fairly clearly in the PCA model using those principal components. Judgment can be made.
PCAコントロールパネル436内の「Name」チェックボックスにユーザがチェックを入れると、PCA解析画面制御部374は、図28(スコアプロット440内の部分領域の拡大図)に示すように、スコアプロット440上の全てのサンプルマークの近傍に、対応するサンプルのNMRスペクトルのファイル名を表示する。マウスポインターが各サンプルの上に置かれた場合にも、スコアプロット440の右上に自動的に対応するファイル名が表示される。これにより、ユーザは、スコアプロット440上の各サンプルマークが、具体的にどのサンプルに該当するのかを容易に把握できる。
When the user checks the “Name” check box in the
図26に示すように、ローディングプロット442では、PCAコントロールパネル436内の「X」軸プルダウンメニュー及び「Y」軸プリダウンメニューで選択された2つの主成分におけるローディングをそれぞれX軸とY軸にとり、その2つの主成分に対する各変数(バケット又はそれに対応するケミカルシフト値)のローディングが、所定の形状とカラーをもつ変数マークでプロットされる。また、X軸とY軸には、対応する主成分願号とその分散が表示される(例:PC1(39.8%))。また、計算に使用された変数(バケット)の数も表示される。
As shown in FIG. 26, in the
ローディングプロット442上で、X軸とY軸の原点から遠くに存在する変数ほど、X軸とY軸にそれぞれ対応する主成分に対する寄与度が高い、つまり、サンプルのクラス分けに寄与する度合いが高いことを意味する。
On the
PCAコントロールパネル436内の「Name」チェックボックスにユーザがチェックを入れると、PCA解析画面制御部374は、図29(ローディングプロット442内の部分領域の拡大図)に示すように、ローディングプロット442上の全ての変数マークの近傍に、対応する変数(バケット)のケミカルシフト値(ppm)を表示する。また、マウスポインターが各変数マークの上に置かれた場合にも、ローディングプロット442の右上に自動的に対応するケミカルシフト値が表示される。これにより、ユーザは、ローディングプロット442上の各変数マークが、具体的にどの変数(ケミカルシフト値)に該当するのかを容易に把握できる。
When the user checks the “Name” check box in the
図26に示すように、寄与率チャート444では、ケミカルシフトを横軸にとり、各変数(ケミカルシフト値)の第1、2、3主成分に対するローディングの絶対値と残差(residual)成分の和が、棒グラフの形で表示される。第1、2、3主成分のスコアの分散と残差成分の分散も表示される。寄与率チャート444において、寄与率(棒グラフの高さ)が高い変数ほど、サンプルのクラス分けに寄与する度合いが高いと判断することができる。
As shown in FIG. 26, in the
図26に示すように、ローディングチャート446では、ケミカルシフトを横軸にとり、PCAコントロールパネル436内の「X」軸プルダウンメニューで選択された1つの主成分に対する各変数のローディングが、棒グラフの形で表示される。また、そのX軸に選択された主成分のスコアの分散も表示される。ローディングチャート446において、ローディングの絶対値(棒グラフの高さ)が高い変数ほど、その主成分に寄与する度合いが高いと判断することができる。
As shown in FIG. 26, in the
図26に示されたスコアプロット440、ローディングプロット442、寄与率プロット444及びローディングチャート446のそれぞれにおいて、選択、拡大/縮小、削除、初期化等の各種操作を行うことが可能である。
In the
まず、スコアプロット440の各種操作について説明する。
First, various operations of the
図30に示すように、スコアプロット440上の任意の1以上のサンプルマークをマウスのドラッグにより選択すると、PCA解析画面制御部374(図25)が、その選択範囲470をスコアプロット440上に表示する。これと連携して、NMRスペクトル連携部378(図25)が動作して、選択されたサンプルマークに対応するサンプルのNMRスペクトルデータを、PCMテーブルに登録されているそのサンプルのパス名とファイル名とを用いて、記憶装置106内のNMRスペクトルデータ354から読み込み、そして、選択されたサンプルのNMRスペクトルをNMRスペクトルチャート450上に表示する。NMRスペクトルチャート450には、表示されたNMRスペクトルのファイル名も表示される。
As shown in FIG. 30, when any one or more sample marks on the
NMRスペクトルチャート450上で、複数のNMRスペクトルは、ケミカルシフト軸スケールを互いに一致させるようにして、ケミカルシフト軸に直交する縦軸方向に並んで表示され、且つ、規定の異なる色で区別して表示されるので、相互間の識別および相関が一目で分かる。加えて、図26に示されているように、NMRスペクトルチャート450上の各NMRスペクトルと、寄与率チャート444とローディングチャート446とが、ケミカルシフト軸スケールを互いに一致させて、縦軸方向に並んで表示されるので、それらの間の相関も一目で分かる。
On the
ユーザがキーボードの「CTRL」キーを押しながら、スコアプロット440上の任意のサンプルマークをマウスにてドラッグして選択すると、PCA解析画面制御部374は、そのサンプルマークを選択範囲に追加し、又は、そのサンプルマークが既に選択されている場合には、そのサンプルマークを選択範囲から外す。これと連携して、NMRスペクトル連携部378が、選択範囲に追加されたサンプルマークに対応するサンプルのNMRスペクトルをNMRスペクトルチャート450上に追加表示したり、又は、選択範囲から外されたサンプルのNMRスペクトルをNMRスペクトルチャート450から消去する。
When the user drags and selects an arbitrary sample mark on the
図31Aに示すように、スコアプロット440上で選択されたサンプルマークに関し、ユーザが「Del」キーを押すなどの削除要求を行うと、PCA解析画面制御部374は、図31Bに示すように、そのサンプルマークをスコアプロット440上から消去し、これと連携して、NMRスペクトル連携部378が、その選択されたサンプルのNMRスペクトルをNMRスペクトルチャート450から消去する。同時に、PCA計算部362が、その削除要求のあったサンプルのPCAテーブル上でのサンプルステータス(図24の参照番号414に相当)を「0」(解析対象に含まれる)から「1」(解析対象に含まれない)に切り替え、そして、サンプルステータスが「0」(解析対象に含まれる)であるサンプルのNMRヒストグラムデータだけを用いて、PCA解析計算を再度行い、その再計算の結果を解析データ記憶部364に出力する。PCA解析画面制御部374は、解析データ記憶部364から再計算の結果を受けて、UI画面430上に、再計算の結果に基づくスコアプロット440、ローディングプロット442、寄与率チャート444及びローディングロット446を表示する(図31Bは、再計算後に表示されたスコアプロット440の例を示す)。
As shown in FIG. 31A, regarding the sample mark selected on the
例えば、スコアプロット440上に、解析目的からみて支障になる或いは寄与しないと考えられるサンプルが表示されていた場合、そのサンプルを上記のようにして解析対象から除外した上で再度PCA計算を行うことにより、より望ましい解析結果が得られることになる。
For example, on the
また、ユーザがキーボードの「Shift」キーを押しながら、スコアプロット440上の任意の部分領域をマウスにてドラッグし選択すると、PCA解析画面制御部374は、選択した部分領域を拡大してスコアプロット440上に表示する。その後、ユーザが拡大表示されたスコアプロット440の画面を選択して、キーボードの「Home」キーを押すと、PCA解析画面制御部374は、スコアプロット440上の拡大率を「1」に初期化し、全てのスコア範囲を表示する。
When the user drags and selects an arbitrary partial area on the
また、ユーザがPCMコントロールパネル436上の「Reset_score」ボタンを操作すると、PCA計算部362が、PCAテーブル内の上記サンプル削除機能により「1」となっていたサンプルステータスを初期値「0」し、このように初期化されたPCAテーブルの内容に基づいて再度PCA解析計算を行い、そして、PCA解析画面制御部374が、そのPCA解析計算の結果に基づいたスコアプロット440、ローディングプロット442、寄与率チャート444及びローディングロット446を改めて表示する。
When the user operates the “Reset_score” button on the
次に、ローディングプロット442の各種操作について説明する。
Next, various operations of the
図32に示すように、ユーザがローディングプロット442内の任意の1以上の変数マークをマウスでドラッグして選択すると、PCA解析画面制御部374が、その選択範囲472をローディングプロット442上に表示する。これと連携して、PCA解析画面制御部374は、寄与率チャート444及びローディングチャート446内の選択された変数マークに対応する変数(ケミカルシフト値)の棒グラフを、他の変数の棒グラフとは異なる所定の選択色で表示する(図中では、選択された変数の棒グラフを黒塗りで表示している。)。これにより、ローディングプロット442、寄与率チャート444及びローディングチャート446上での各変数(ケミカルシフト値)の識別と相関が一目で分かる。
As shown in FIG. 32, when the user selects one or more variable marks in the
ユーザがキーボードの「CTRL」キーを押しながら、ローディングプロット442上の任意の変数マークをマウスにてドラッグして選択すると、PCA解析画面制御部374は、その変数マークを選択範囲に追加し、又は、その変数マークが既に選択されている場合には、その変数マークを選択範囲から外す。これと連携して、PCA解析画面制御部374は、寄与率チャート444及びローディングチャート446上、選択範囲に追加された変数マークに対応する変数の棒グラフを追加的に選択色で表示したり、又は、選択範囲から外された変数の棒グラフの選択色表示を解除したりする。
When the user selects an arbitrary variable mark on the
また、図33Bに示すように、上記のようにして或る選択範囲476で選択された変数マークについて、ユーザが「Del」キーを押すなどの削除要求を行うと、PCA解析画面制御部374は、その変数マークをローディングプロット440上から消去する。同時に、PCA計算部362が、その削除要求のあった変数マークに対応する変数(バケット)のPCAテーブル上でのステータス(図24の参照番号426に相当)を「0」(解析に使用する)から「1」(解析に使用しない)に切り替え、そして、解析対象のサンプルのNMRヒストグラムデータ中の、ステータスが「0」(解析に使用する)である変数(バケット)に対応する積分値だけを使用して、PCA解析計算を再度行い、その再計算の結果を解析データ記憶部364に出力する。PCA解析画面制御部374は、解析データ記憶部364から再計算の結果を受けて、UI画面430上に、再計算の結果に基づくスコアプロット440、ローディングプロット442、寄与率チャート444及びローディングロット446を表示する(図33Bは、再計算後に表示されたローディングプロット442の例を示す。)。
Also, as shown in FIG. 33B, when the user makes a deletion request such as pressing the “Del” key for the variable mark selected in a
例えば、ローディングプロット440上に、解析目的からみて支障になる或いは寄与しないと考えられる変数が表示されていた場合、その変数を上記のようにして解析に使用する変数から除外した上で再度PCA計算を行うことにより、より望ましい解析結果が得られることになる。
For example, on the
また、ユーザが「Shift」キーを押しながら、ローディングプロット442上の任意の変数マークをマウスにてドラッグして選択すると、PCA解析画面制御部374は、ローディングプロット442上の選択範囲に相当する部分を拡大して表示する。この後、ユーザが拡大表示されたローディングプロット442を選択して、キーボードの「Home」キーを押すと、PCA解析画面制御部374は、ローディングプロット442の拡大率を「1」に初期化し、全てのケミカルシフト範囲を表示する。
If the user drags and selects an arbitrary variable mark on the
また、ユーザがPCMコントロールパネル436上の「Reset loading」ボタンを操作すると、PCA計算部362が、PCAテーブル内容の上記サンプル削除機能により「1」となっていたバケットのステータスを初期値「0」に戻し、このように初期化されたPCAテーブルの内容に基づいて再度PCA解析計算を行い、そして、PCA解析画面制御部374が、そのPCA解析計算の結果に基づいたスコアプロット440、ローディングプロット442、寄与率チャート444及びローディングロット446を改めて表示する。
When the user operates the “Reset loading” button on the
次に、寄与率チャート444とローディングチャート446の各種操作について説明する。
Next, various operations of the
ユーザが、寄与率チャート444又はローディングチャート446のケミカルシフト軸上の任意の変数(ケミカルシフト値)範囲をマウスにてドラッグして選択すると、PCA解析画面制御部374が、その選択範囲に属する変数のローディングチャート442上の変数マークと、寄与率チャート444及びローディングチャート446上の棒グラフを、選択範囲外の変数のそれと区別した所定の選択色で表示する。それにより、ローディングプロット442、寄与率チャート444及びローディングチャート446上での各変数(ケミカルシフト値)の識別と相関が一目で分かる。
When the user selects an arbitrary variable (chemical shift value) range on the chemical shift axis of the
また、上記のようにして寄与率チャート444又はローディングチャート446上で選択された変数(ケミカルシフト値)範囲について、ユーザが「Del」キーを押すなどの削除要求を行うと、PCA解析画面制御部374は、その選択範囲に属する変数の変数マークをローディングプロット440上から消去する。同時に、PCA計算部362が、その選択範囲に属する変数(バケット)のPCAテーブル上でのステータス(図24の参照番号426に相当)を「0」(解析に使用する)から「1」(解析に使用しない)に切り替え、そして、解析対象のサンプルのNMRヒストグラムデータ中の、ステータスが「0」(解析に使用する)である変数(バケット)に対応する積分値だけを使用して、PCA解析計算を再度行い、その再計算の結果を解析データ記憶部364に出力する。PCA解析画面制御部374は、解析データ記憶部364から再計算の結果を受けて、UI画面430上に、再計算の結果に基づくスコアプロット440、ローディングプロット442、寄与率チャート444及びローディングロット446を表示する。
When the user makes a deletion request such as pressing the “Del” key for the variable (chemical shift value) range selected on the
例えば、寄与率チャート444又はローディングチャート446上に、解析目的からみて支障になる或いは寄与しないと考えられる変数(ケミカルシフト値)範囲が在る場合、その範囲の変数を上記のようにして解析に使用する変数から除外した上で再度PCA計算を行うことにより、より望ましい解析結果が得られることになる。
For example, when there is a variable (chemical shift value) range on the
また、図34Aに示すように、ユーザが「Shift」キーを押しながら、ローディングチャート446又は寄与率チャート444のケミカルシフト軸上の任意の変数(ケミカルシフト値)範囲をマウスにてドラッグして選択すると、PCA解析画面制御部374は、図34Bに示すように、ローディングチャート446及び寄与率チャート444の中の選択された変数(ケミカルシフト値)範囲に相当する部分を拡大して表示する。これに連携して、NMRスペクトル連携部378が、NMRスペクトルチャート450の中の選択された変数(ケミカルシフト値)範囲に相当する部分を拡大して表示する。従って、どのような拡大率で表示した場合でも常に、ローディングチャート446と寄与率チャート444とNMRスペクトルチャート450はケミカルシフト軸スケールが一致した状態に維持され、それらの間の相関関係が一目で分かるようになっている。
Further, as shown in FIG. 34A, the user selects an arbitrary variable (chemical shift value) range on the chemical shift axis of the
このようにローディングチャート446及び寄与率チャート444並びにNMRスペクトルチャート450の拡大表示を行なった後、ユーザが拡大表示されたローディングチャート446又は寄与率チャート444を選択して、キーボードの「Home」キーを押すと、PCA解析画面制御部374とNMRスペクトル連携部378は、それらのチャート446、444、450の拡大率を「1」に初期化し、全てのケミカルシフト範囲を表示する。
After the
PCA解析を行なう場合、以上のような各種の操作がUI画面430上で行なうことができる。このような操作を逐次に行いながらPCA解析を進めていく過程の任意の段階で、ユーザがPCAコントロールパネル436内の「Add_Model」ボタンを操作すると、PCAモデル読込・追加・保存部360が、記憶装置106内の大量のサンプルのNMRヒストグラムデータ356の中から、ユーザに指定された追加のサンプルのNMRヒストグラムデータを選択して読み込み、これを現在処理中のPCAテーブル内の多変量データ行列に追加し、その多変量データ行列が追加されたPCAテーブルの情報をPCA計算部362に渡す。PCA計算部362は、その多変量データ行列が追加されたPCAテーブルの情報を用いてPCA解析計算を再実行する。PCA解析画面制御部374は、その再実行されたPCA解析計算の結果を、UI画面430に改めて表示する。
When performing PCA analysis, various operations as described above can be performed on the
また、上記のようにPCA解析を進めていく過程の任意の段階で、ユーザがPCAコントロールパネル436内の「Save_model」ボタンを操作すると、PCAモデル読込・追加・保存部360が、その時点で処理中の多変量データ行列を始めとするPCAテーブルの情報を、記憶装置106内にPCAテーブル350として保存する。
In addition, when the user operates the “Save_model” button in the
以上が、PCA解析を行なう場合の各部の動作である。上述した説明から分かるように、PCA解析を行なう場合、UI画面430上では、スコアプロット440、ローディングプロット442、寄与率チャート444、ローディングチャート446及びNMRスペクトルチャート450の全ての情報が有機的に結合されて表示され、そして、いずれかの操作が行われると、その操作結果が、それに関連する全てのチャートにリアルタイムに反映される。特に、解析対象からのサンプルの削除や変数の削除などを行なった後にPCA解析をすばやく再実行し、より精度の高い解析結果を導き出すことが容易である。また、UI画面430上では、PCA解析結果に連携してNMRスペクトルも表示される。そのため、PCA解析結果とNMRスペクトルの形状とを合わせて評価することができ、解析結果の意味づけを考察することがより容易になる。PCA解析過程で必要な操作を行った後の最終的に評価結果からPCAの再解析およびスペクトルの再処理をすばやく実行しより精度の高い解析結果を導き出すことが容易になる。
The above is the operation of each part when performing PCA analysis. As can be seen from the above description, when the PCA analysis is performed, all information of the
次に、SIMCA解析を行なう場合における動作について説明する。 Next, the operation when SIMCA analysis is performed will be described.
すなわち、まず、図26又は図27に示したUI画面430上のSIMCAコントロールパネル438内の「SIMCA」選択ラジオボタンが操作された上で「Model1」ボタンが操作されると、図25に示したSIMCA解析部348内のPCAモデル読込・追加・保存部370が動作して、記憶装置106内の大量のサンプルのNMRヒストグラムデータ356の中から、ユーザに指定された複数のサンプルのNMRヒストグラムデータを選択して読み込み、図24に示したような、多変量データ行列やその他の情報からなるPCAテーブルの情報を作成する。作成されたPCAテーブルの情報は、第1のクラスのPCAテーブル情報として扱われる。同様に、「Model2」ボタンが操作されると、PCAモデル読込・追加・保存部370が、記憶装置106内のNMRヒストグラムデータ356の中から、ユーザに指定された複数のサンプルのNMRヒストグラムデータを選択して読み込み、第2のクラスのPCAテーブルの情報を作成する。
That is, first, when the “
SIMCA解析を開始する場合には、少なくとも第1と第2クラスのPCAテーブルが定義される必要がある。更に、ユーザは、所望すればSIMCAコントロールパネル438内の「Model1」ボタンが操作されると、「Test_model」ボタンを操作することができる。「Test_model」ボタンが操作されると、PCAモデル読込・追加・保存部370が、記憶装置106内のNMRヒストグラムデータ356の中から、ユーザに指定された複数のサンプルのNMRヒストグラムデータを選択して読み込み、テストクラスのPCAテーブルの情報を作成する。
When starting the SIMCA analysis, at least first and second class PCA tables need to be defined. Further, if desired, the user can operate the “Test_model” button when the “Model1” button in the
PCAモデル読込・追加・保存部370は、作成した第1クラスと第2クラスのPCAテーブルの
情報をSIMCA計算部372に引渡す。テストクラスのPCAテーブルが更に作成された場合には、そのテストクラスのPCAテーブルの情報もSIMCA計算部372に引渡される。SIMCA計算部372は、それらのクラスのPCAテーブルの情報を用いて、PCA計算部362を呼び出してクラス毎のPCAモデルを算出させ、それらのクラスのPCAモデルを用いてSIMCA解析の計算を行なう。各種クラスのPCAモデルの主成分数は、SIMCAコントロールパネル438内の「SIMCA」選択ラジオボタンの右脇の入力ボックスにユーザが入力した数に従う。SIMCA計算部372は、SIMCA解析結果として、第1と第2の各クラスに対する各サンプルの距離、第1と第2の各クラスの残差標準偏差(RSD)、第1と第2の各クラスに対する各変数(ケミカルシシフト値)のモデリング力(modeling power)、及び各変数(ケミカルシシフト値)の識別力(discrimination power)などを算出する。算出されたSIMCA解析結果は、解析データ記憶部364に記憶される。
The PCA model reading / adding / saving
SIMCA解析画面制御部374が、解析データ記憶部364から上記SIMCA解析結果を受け取る。SIMCA解析画面制御部376は、図27に示すように、第1と第2の各クラスに対する各サンプルの距離に基づいてクーマンプロット460を作成してUI画面430上に表示し、第1と第2の各クラスに対する各変数(ケミカルシシフト値)のモデリング力に基づいて、第1クラスのモデリング力チャート462と第2クラスのモデリング力チャート464を作成してUI画面430上に表示し、さらに、各変数(ケミカルシシフト値)の識別力に基づいて、識別力チャート466を作成してUI画面430上に表示する。
The SIMCA analysis
図27に示すように、クーマンプロット460では、第1クラスと第2クラスからの距離をそれぞれX軸とY軸にとり、各サンプルのその2つのクラスまでの距離がプロットされる。プロットされるサンプルのマークの形状と色は、上記PCAテーブル情報の中のサンプル毎のプロットタイプとプロットカラー(図24の参照番号410、412に対応する情報)に従う。さらに、クーマンプロット460上には、第1クラスと第2クラスのそれぞれの残差標準偏差(RSD)の名称と値(例:RSD(1)0.5449)がX軸とY軸の近傍に表示され、かつ、それぞれのクラスの残差標準偏差(RSD)を示す直線(以下、「RSD」線という)480、482が表示される。
As shown in FIG. 27, in the
クーマンプロット460上でのサンプルマークの配置状態が、次のような明快分類状態に近い状態であるほど、サンプルがより明確に第1クラスと第2クラスに分類されたと判断することができる。すなわち、その明快分類状態とは、サンプルマークが2つの塊に分かれ、一方の塊が第1クラスのRSD線480とY軸との間に領域に存在し、他方の塊が第2クラスのRSD線482とX軸との間の領域に存在するという状態である。
It can be determined that the sample is more clearly classified into the first class and the second class as the arrangement state of the sample marks on the
SIMCAコントロールパネル438内の「Name」チェックボックスにユーザがチェックを入れると、SIMCA解析画面制御部374は、図28を参照して説明したスコアプロット440の場合と同様に、クーマンプロット460上の全てのサンプルマークの近傍に、対応するサンプルのNMRスペクトルのファイル名を表示する。マウスポインターが各サンプルの上に置かれた場合にも、クーマンプロット460の右上に自動的に対応するファイル名が表示される。これにより、ユーザは、クーマンプロット460の各サンプルマークが、具体的にどのサンプルに該当するのかを容易に把握できる。
When the user checks the “Name” check box in the
図27に示すように、第1クラスと第2クラスのモデリングチャート462、464では、ケミカルシフトを横軸にとり、各変数(ケミカルシフト値)の第1クラスと第2クラスについてのモデリング力(これは、それぞれのクラスのデータ構造を記述するための各変数の有効性を評価するための一つの指標である)が、棒グラフの形で表示される。各クラスのモデリングチャート462、464において、モデリング力(棒グラフの高さ)が高い変数ほど、各クラスのデータ構造を記述する有効性がより高いと判断することができる。 As shown in FIG. 27, in the modeling charts 462 and 464 of the first class and the second class, the chemical shift is taken on the horizontal axis, and the modeling power (this) for the first class and the second class of each variable (chemical shift value). Is an index for evaluating the effectiveness of each variable for describing the data structure of each class), and is displayed in the form of a bar graph. In the modeling charts 462 and 464 of each class, it can be determined that the variable having a higher modeling ability (height of the bar graph) is more effective in describing the data structure of each class.
図27に示すように、識別力チャート466では、ケミカルシフトを横軸にとり、各変数(ケミカルシフト値)の識別力(これは、第1と第2のクラスへの分類のための各変数の有効性を評価するための一つの指標である)が、棒グラフの形で表示される。識別力チャート466において、識別力(棒グラフの高さ)が高い変数ほど、第1と第2のクラスへの分類のための有効性がより高いと判断することができる。
As shown in FIG. 27, in the discriminating
図27に示されたクーマンプロット460、モデリングチャート462、464、識別力チャート466のそれぞれにおいて、選択、拡大/縮小、削除、初期化等の各種操作を行うことが可能である。
In the
まず、クーマンプロット460の各種操作について説明する。
First, various operations of the
図35に示すように、クーマンプロット460上の任意の1以上のサンプルマークをマウスのドラッグにより選択すると、SIMCA解析画面制御部376が、その選択範囲484をクーマンプロット460上に表示する。これと連携して、NMRスペクトル連携部378が動作して、選択されたサンプルマークに対応するサンプルのNMRスペクトルデータを、PCMテーブルに登録されているそのサンプルのパス名とファイル名とを用いて、記憶装置106内のNMRスペクトルデータ354から読み込み、そして、選択されたサンプルのNMRスペクトルをNMRスペクトルチャート450上に表示する。NMRスペクトルチャート450には、表示されたNMRスペクトルのファイル名も表示される。
As shown in FIG. 35, when any one or more sample marks on the
NMRスペクトルチャート450上で、複数のNMRスペクトルは、ケミカルシフト軸スケールを互いに一致させるようにして、ケミカルシフト軸に直交する縦軸方向に並んで表示され、且つ、規定の異なる色で区別して表示されるので、相互間の識別および相関が一目で分かる。加えて、図27に示されているように、NMRスペクトルチャート450上の各NMRスペクトルと識別力チャート466とが、ケミカルシフト軸スケールを互いに一致させて、縦軸方向に並んで表示されるので、それらの間の相関も一目で分かる。
On the
ユーザがキーボードの「CTRL」キーを押しながら、クーマンプロット460上の任意のサンプルマークをマウスにてドラッグして選択すると、SIMCA解析画面制御部376は、そのサンプルマークを選択範囲に追加し、又は、そのサンプルマークが既に選択されている場合には、そのサンプルマークを選択範囲から外す。これと連携して、NMRスペクトル連携部378が、選択範囲に追加されたサンプルマークに対応するサンプルのNMRスペクトルをNMRスペクトルチャート450上に追加表示したり、又は、選択範囲から外されたサンプルのNMRスペクトルをNMRスペクトルチャート450から消去する。
When the user selects an arbitrary sample mark on the
図36Aに示すように、クーマンプロット460上で選択されたサンプルマークに関し、ユーザが「Del」キーを押すなどの削除要求を行うと、SIMCA解析画面制御部376は、図36Bに示すように、そのサンプルマークをクーマンプロット460上から消去し、これと連携して、NMRスペクトル連携部378が、その選択されたサンプルのNMRスペクトルをNMRスペクトルチャート450から消去する。同時に、SIMCA計算部372が、その削除要求のあったサンプルの該当クラスのPCAテーブル上でのサンプルステータス(図24の参照番号414に相当)を「0」(解析対象に含まれる)から「1」(解析対象に含まれない)に切り替え、そして、サンプルステータスが「0」(解析対象に含まれる)であるサンプルのNMRヒストグラムデータだけを用いて、SIMCA解析計算を再度行い、その再計算の結果を解析データ記憶部364に出力する。SIMCA解析画面制御部376は、解析データ記憶部364から再計算の結果を受けて、UI画面430上に、再計算の結果に基づくクーマンプロット460、モデリングプロット462、464及び識別力チャート466を表示する(図36Bは、再計算後に表示されたクーマンプロット460の例を示す)。
As shown in FIG. 36A, when the user makes a deletion request such as pressing the “Del” key for the sample mark selected on the
例えば、クーマンプロット460上に、解析目的からみて支障になる或いは寄与しないと考えられるサンプルが表示されていた場合、そのサンプルを上記のようにして解析対象から除外した上で再度SIMCA計算を行うことにより、より望ましい解析結果が得られることになる。
For example, on the
また、ユーザがキーボードの「Shift」キーを押しながら、クーマンプロット460上の任意の部分領域をマウスにてドラッグし選択すると、SIMCA解析画面制御部376は、選択した部分領域を拡大してクーマンプロット460上に表示する。その後、ユーザが拡大表示されたクーマンプロット460の画面を選択して、キーボードの「Home」キーを押すと、SIMCA解析画面制御部376は、クーマンプロット460上の拡大率を「1」に初期化し、元の表示範囲の全部を表示する。
If the user drags and selects an arbitrary partial area on the
また、ユーザがSIMCAコントロールパネル438上の「Reset_score」ボタンを操作すると、SIMCA計算部372が、各クラスのPCAテーブル内の上記サンプル削除機能により「1」となっていたサンプルステータスを初期値「0」し、このように初期化されたPCAテーブルの内容に基づいて再度SIMCA解析計算を行い、そして、SIMCA解析画面制御部376が、そのSIMCA解析計算の結果に基づいたクーマンプロット460、モデリングプロット462、464及び識別力チャート466を改めて表示する。
When the user operates the “Reset_score” button on the
次に、モデリング力チャート462、464と識別力チャート466の各種操作について説明する。
Next, various operations of the
図37に示すように、識別力チャート466上で、ユーザが縦軸方向の任意の高さ位置(つまり、任意の識別力の値)をマウスでドラッグして閾値として指定すると、SMCA解析画面制御部376が、識別力チャート466上のその指定された閾値を示す閾値ライン486を表示するとともに、その指定された閾値より高い識別力を持つ変数のみを選択して、その選択された変数の棒グラフを、モデリング力チャート462、464及び識別力チャート466の全てにおいて、他の変数とは異なる所定の選択色で表示する。同時に、解析結果記憶部364が、選択された変数(すなわち、指定された閾値より識別力の高い変数)を特定する情報を記憶する。同様に、ユーザが第1クラス又は第2クラスモデリング力チャート462又は464上で、或るモデリング力の値を閾値として指定した場合にも、その閾値より高いモデリング力をもつ変数が他の変数とは異なる選択色で表示され、かつ、その選択された変数を特定する情報が解析結果記憶部364に記憶される。これにより、モデリング力チャート462、464、識別力チャート466及NMRスペクトルチャート450における選択された変数の識別や相関関係が一目で分かる。
As shown in FIG. 37, when the user drags an arbitrary height position in the vertical axis direction (that is, an arbitrary discriminating power value) as a threshold by dragging with the mouse on the discriminating
上記のようにして識別力又はモデリング力の高い変数が選択された後、ユーザがSIMCAコントロールパネル438内の「Set_D.P.」ボタンを操作すると、SIMCA計算部372が、解析データ記憶部364から選択された変数の特定情報を受け取り、各クラスのPCAテーブル情報中の選択されていない変数のステータスを「0」(解析に使用する)から「1」(解析に使用しない)に変更し、そして、選択された変数だけを用いて再度SIMCA計算を行なう。続いて、SIMCA解析画面制御部376が、図38に示すように、SIMCA再計算の結果を受けて、それに基づきクーマンプロット460、モデリングプロット462、464及び識別力チャート466を改めて表示する。このようにして識別力又はモデリング力の高い変数だけを用いてSIMCA解析を再度行うことで、より望ましい解析結果を得ることが可能になる。
After the variable having high discriminating power or modeling power is selected as described above, when the user operates the “Set_D.P.” Button in the
また、上記のようにして識別力又はモデリング力の高い変数が選択された後、ユーザがPCAコントロールパネル436内の「Set_D.P.」ボタンを操作すると、PCA計算部362が、解析データ記憶部364から選択された変数の特定情報を受け取り、SIMCA解析で使用されていた全クラスのPCAテーブル情報を統合して、全クラスのサンプルの多変量データ行列をもつPCA解析用のPCAテーブル情報を作成し、そのPCA解析用のPCAテーブル情報中の選択された変数のステータスを「0」(解析に使用する)とし、選択されてない変数のステータスを「1」(解析に使用しない)とする。そして、PCA計算部362は、その選択された変数だけを用いて、PCA解析用のPCAテーブル情報中の全クラスのサンプルの多変量データ行列についてPCA計算を再度行なう。続いて、PCA解析画面制御部374が、UI画面430を図27に示すようなSIMCA解析用のものから、図26に示すようなPCA解析用のもの切り替え、上述したPCA解析の再計算の結果に基づいたスコアプロット440、ローディングプロット442、寄与率チャート444及びローディングチャート446を改めて表示する。このようにして識別力又はモデリング力の高い変数だけを用いてPCA解析を再度行うことで、より望ましい解析結果を得ることが可能になる。
When a user operates the “Set_D.P.” Button in the
また、図27に示すようなSIMCA解析用のUI画面430において、ユーザが「Shift」キーを押しながら、モデリング力チャート462、464又は識別力チャート466中のケミカルシフト軸上の任意の変数(ケミカルシフト値)範囲をマウスにてドラッグして選択すると、SIMCA解析画面制御部376は、モデリング力チャート462、464及び識別力チャート466中の選択された変数(ケミカルシフト値)範囲に相当する部分を拡大して表示する。これに連携して、NMRスペクトル連携部378が、NMRスペクトルチャート450の中の選択された変数(ケミカルシフト値)範囲に相当する部分を拡大して表示する。従って、どのような拡大率で表示した場合でも常に、識別力チャート466とNMRスペクトルチャート450はケミカルシフト軸スケールが一致した状態に維持され、それらの間の相関関係が一目で分かるようになっている。
In addition, in the
このようにモデリング力チャート462、464、識別力チャート466及びNMRスペクトルチャート450の拡大表示を行なった後、ユーザが拡大表示されたモデリング力チャート462、464又は識別力チャート466を選択して、キーボードの「Home」キーを押すと、SIMCA解析画面制御部376とNMRスペクトル連携部378は、それらのチャート462、464、466の拡大率を「1」に初期化し、全てのケミカルシフト範囲を表示する。
After the
以上が、SIMCA解析を行なう場合の各部の動作である。上述した説明から分かるように、SIMCA解析を行なう場合、UI画面430上では、クーマンプロット460、モデリングプロット462、464、識別力チャート466及びNMRスペクトルチャート450の全ての情報が有機的に結合されて表示され、そして、いずれかの操作が行われると、その操作結果が、それに関連する全てのチャートにリアルタイムに反映される。特に、解析対象からのサンプルの削除や変数の選択などを行なった後にSIMCA解析をすばやく再実行し、より精度の高い解析結果を導き出すことが容易である。また、UI画面430上では、SIMCA解析結果に連携してNMRスペクトルも表示される。そのため、SIMCA解析結果とNMRスペクトルの形状とを合わせて評価することができ、解析結果の意味づけを考察することがより容易になる。
The above is the operation of each unit when performing SIMCA analysis. As can be understood from the above description, when the SIMCA analysis is performed, all information of the
また、SIMCA解析では、各変数についてモデリング力と識別力という二つの尺度が算出される。識別力は2つのクラスについてどの変数が分類に有効であるかを表している。下がって、識別力に基づいて分類に寄与する変数を抽出することができ、他の変数は分類にあまり寄与しないノイズと考えることができる。この実施形態では、上述したように分類に有効な変数のみを用いて再度PCA解析もしくはSIMCA解析を実行することができる。それにより、サンプルをより一層明確にクラス分けすることが可能となる。 In addition, in the SIMCA analysis, two measures are calculated for each variable: modeling ability and discriminating ability. The discriminating power represents which variable is effective for classification for the two classes. Based on the discriminating power, variables that contribute to classification can be extracted, and other variables can be considered as noise that does not contribute much to classification. In this embodiment, as described above, the PCA analysis or SIMCA analysis can be executed again using only the variables effective for classification. This makes it possible to classify the samples more clearly.
図39は、SIMCA解析で選択された識別力の高い変数を使ってSIMCA解析計算又はPCA解析計算を再実行するための処理手順を示す。 FIG. 39 shows a processing procedure for re-executing SIMCA analysis calculation or PCA analysis calculation using a variable having high discriminating power selected in SIMCA analysis.
図39に示すように、ステップ500でSIMCA解析が実施され、ステップ502で、識別力チャート466上で識別力の閾値が指定されると、ステップ504で、その閾値以上の識別力をもつ変数が抽出される。その後、ステップ506で、SIMCAコントロールパネル438上の「Set_D.P.」ボタンが操作されると、ステップ508で、抽出された変数だけを用いてSIMCA解析計算が再度実行され、SIMCA解析結果が表示される。
As shown in FIG. 39, when a SIMCA analysis is performed in
また、ステップ504の後、ステップ510で、PCAコントロールパネル436上の「Set_D.P.」ボタンが操作されると、ステップ512で、抽出された変数だけを用いて、SIMCA解析の対象となったサンプルについてPCA解析計算が再度実行され、PCA解析結果が表示される。また、ステップ504の後、ステップ514で、PCAコントロールパネル436上の「Add_D.P.」ボタンが操作されると、ステップ516で、現在の解析に使用することになっている変数に、抽出された変数を追加した上で、それらの変数を用いてSIMCA解析の対象となったサンプルについてPCA解析計算が再度実行され、PCA解析結果が表示される。
In addition, after
ところで、上述した「Add_D.P.」ボタンを用いた変数の追加機能は、例えば次のような用途に利用可能である。すなわち、クラスが3つ以上存在する場合、それぞれ2つのクラスの組合せを第1と第2のクラスとしてSIMCA解析を行って、分類に有効な変数を求め、その有効な変数を、上述した「Add_D.P.」ボタン操作で逐次に加算して行くことができる。すなわち、まず、最初に選んだ2つのクラスの組合せでSIMCA解析を実施して有効な変数を選択した後、PCAコントロールパネル436上の「Set_D.P.」ボタン操作で、その選択された変数を使用対象に設定する。次に、別の2つのクラスの組合せでSIMCA解析を実施して有効な変数を選択した後、PCAコントロールパネル436上の「ADD_D.P.」ボタン操作で、その選択された変数を、最初に選択された変数に追加する。以後、その他の2つのクラスの組み合わせのそれぞれについて、SIMCA解析を実施して有効な変数を選択した後上記「ADD_D.P.」ボタン操作を繰り返す。これにより、ぞれぞれのクラスの組み合わせで有効な変数が使用対象にセットされることになり、いずれのクラスの組み合わせにおいても有効ではないとされた変数だけが、使用対象から外される。
By the way, the variable addition function using the “Add_D.P.” Button described above can be used for the following purposes, for example. That is, when there are three or more classes, SIMCA analysis is performed with each combination of the two classes as the first and second classes to obtain a variable effective for classification, and the effective variable is defined as “Add_D” described above. .P. "Button can be added sequentially. That is, first, a SIMCA analysis is performed with the combination of the two classes selected first, and a valid variable is selected. Then, by operating the “Set_D.P.” Button on the
以上、図23〜図39を参照して、本発明の一実施形態にかかるNMRスペクトルの統計処理装置(図1に示した統計処理部116)の構成、機能、動作について説明した。以下では、このNMRスペクトルの統計処理装置を特定の用途に用いる場合の使用例を紹介する。
The configuration, function, and operation of the NMR spectrum statistical processing apparatus (the
図40は、メタボノミクスにおいてバイオマーカを決定する用途にこの統計処理装置を使用する場合の使用手順を示す。 FIG. 40 shows a procedure for using this statistical processing apparatus for the purpose of determining a biomarker in metabonomics.
図40に示すように、ステップ520で分析が開始される。この分析では、例えば、人からの採取物に基づいてその人が特定の疾病に罹っているか否かを判断するためのバイオマーカを決定したいという場合、既にその疾病に罹っている人々からの採取物と健康な人々からの採取物とが分析対象のサンプルとして選ばれる。クラス毎に、異なるカラーがプロットカラーとして指定される。まず、ステップ522で、分析対象の多数のサンプルについてPCA解析が行われる。ステップ524で、スコアプロット440などに示された第1主成分(PC1)と第2主成分(PC2)のスコアの分散の和が、ユーザが決めた或る閾値、例えば60%、を超えているかどうかが、ユーザにより判断される。もし、上記スコアの分散の和が閾値60%を超えているならば、ステップ526で、ユーザは、ステップ522で行ったPCA解析で得られたPCAモデルにおいて、サンプルは明快にクラス分けされていると判断する。その場合、ステップ528で、ユーザは、ローディングプロット442、寄与率チャート444、ローディングチャート446及びNMRスペクトルチャート450などを参照しながら、寄与率の高いケミカルシフト値又はそれに対応するNMRスペクトルのピークを選定し、それに基づきバイオマーカを決定する。
As shown in FIG. 40, analysis begins at
他方、ステップ524で、上記スコアの分散の和が閾値60%以下であるならば、ユーザは、ステップ522で行ったPCA解析で得られたPCAモデルでは、サンプルは明快にはクラス分けされていないと判断し、次に、ステップ532のSIMCA解析を実行する。SIMCA解析においては、ステップ534で、検査対象のサンプルが第1と第2の2つのクラスに分けられる。例えば、その疾病に罹っている人々から採取されたサンプルが第1のクラスに、健康な人々から採取されたサンプルが第2のクラスに割り当てられる。この2つのクラスについてSIMCA解析が実行され、そのSIMCA解析結果が表示されると、ユーザは、ステップ536で、識別力チャート466上で識別力の閾値を設定して、その閾値以上の識別力を持った変数を選択する。その後、ユーザは、PCAコントロールパネル436の「Set_D.P.」ボタンを操作する。それにより、ステップ522で、選択された変数だけを用いて、同じサンプルに対してPCA解析計算が再度実行される。その結果、前回のPCA解析計算の結果よりも、より明確にサンプルが分散したPCAモデルが得られ、バイオマーカの決定がより容易になる。
On the other hand, in
図41は、テストサンプルの性向を診断する用途に、本発明の一実施形態にかかるNMRスペクトルの統計処理装置(図1に示した統計処理部116)を使用する場合における使用手順の一例を示す。
FIG. 41 shows an example of a use procedure when the NMR spectrum statistical processing apparatus (the
図41に示すように、ステップ540で診断が開始される。この診断は、例えば、或る人々について特定の疾病に罹っているか否かを診断するものである。ステップ542で、2つの基本クラスつまり第1と第2のクラスが設定される。例えば、既に疾病に罹っている人々から採取されたサンプルが第1のクラスに、健康な人々から採取されたサンプルが第2のクラスに割り当てられる。また、ステップ544で、診断対象の人々から採取されたサンプルがテストクラスとして設定される。クラス毎に、異なるカラーがプロットカラーとして指定される。
As shown in FIG. 41, diagnosis is started at
その後、ステップ546で、それら3つのクラスのサンプルを統合した多変量データ行列についてPCA解析が実行される。また、ステップ548で、それら3つのクラスのサンプルについてSIMCA解析が行なわれる。SIMCA解析では、テストクラスのサンプルの第1のクラスと第2のクラスにそれぞれに対する距離が求まり、それがクーマンプロット440上に表現される。スコアププロット440でも、クーマンプロットでも、3つのクラスのサンプルはクラス別の異なるプロットカラーで表示されるので、それらの相関が一目で分かる。
Thereafter, in
ステップ550で、ユーザは、PCA解析結果とSIMCA解析結果を参照することで、テストサンプルである診断対象の人々と、第1クラスである当該疾病に罹っている人々と、第2クラスである健康な人々との間の相関を把握し、そこから、診断対象の人々が当該疾病に罹っているのか、健康であるのか、或は未定なのかなどの判断を下す。
In
以上、本発明の実施形態を説明したが、この実施形態は本発明の説明のための例示にすぎず、本発明の範囲をこの実施形態にのみ限定する趣旨ではない。本発明は、その要旨を逸脱することなく、その他の様々な態様でも実施することができる。例えば、上記の実施形態では、多変量解析結果であるスコアプロット、ローディング及びクーマンプロットを、UI画面上で2本の座標軸からなる二次元図形の形で表示したが、それに代えて又はそれと併用して、3本の座標軸からなる三次元図形として形成し、その三次元図形を任意の視線方向から表示できるようにすることもできる。また、本発明は、メタボノミクスだけでなく、それ以外の用途にも適用することができる。 As mentioned above, although embodiment of this invention was described, this embodiment is only the illustration for description of this invention, and is not the meaning which limits the scope of the present invention only to this embodiment. The present invention can be implemented in various other modes without departing from the gist thereof. For example, in the above embodiment, the score plot, loading, and Cooman plot, which are the results of multivariate analysis, are displayed in the form of a two-dimensional figure consisting of two coordinate axes on the UI screen, but instead of or in combination with it. It is also possible to form a three-dimensional figure composed of three coordinate axes so that the three-dimensional figure can be displayed from an arbitrary line-of-sight direction. Further, the present invention can be applied not only to metabonomics but also to other uses.
100、300 コンピュータシステム(NMRデータ処理装置)
102 NMR装置
104、304 プロセッサ
106、306 記憶装置
108、308 FIDデータ入力処理
110、310 NMRスペクトル処理
112、312 データ縮約処理
126 絶対値微分処理(ADスペクトル生成処理)
140 NMRスペクトル(実部)
144、Sa、Sb ADスペクトル
171 多数のADスペクトルの投影処理
172 投影ADスペクトルのバケット積分処理
174 自動積分ブロック設定に基づくバケットの自動修正処理
176 指定ピーク情報に基づくバケットの自動修正処理
178 バケットの手動修正処理
180 多数ADスペクトルの最適化バケット積分処理
Sp 投影ADスペクトル
200a−200f、200i−200k バケット
220x、220y 自動設定された積分ブロック
240x、240y 指定ピーク情報に基づくピーク領域
250A−250C 指定ピーク情報セット
280A−280C 最適化バケットセット
340 多変量解析部
342 ユーザ要求入力部
344 表示制御部
346 PCA解析部
348 SIMCA解析部
350 PCAテーブル
354 NMRスペクトルデータ
356 NMRヒストグラムデータ
360 PCAモデル読込・追加・保存部
362 PCA計算部
364 解析データ記憶部
366 解析結果保存部
370 PCAモデル読込・追加・保存部
372 SIMCA計算部
374 PCA解析画面制御部
376 SIMCA解析画面制御部
378 NMRスペクトル連携部
430 UI画面
440 スコアプロット
442 ローディングプロット
444 寄与率チャート
446 ローディングチャート
450 NMRスペクトルチャート
460 クーマンプロット
462、464 モデリング力プロット
466 識別力プロット
100, 300 Computer system (NMR data processor)
102
140 NMR spectrum (real part)
144, Sa,
Sp projected
Claims (14)
前記絶対値微分スペクトルデータに対し、不均等な幅をもつ多数のバケットからなるバケットセットを用いたバケット積分を実行することにより、前記絶対値微分スペクトルデータをヒストグラムデータに縮約するデータ縮約手段と、 Data reduction means for reducing the absolute value differential spectrum data to histogram data by executing bucket integration using a bucket set consisting of a large number of buckets having unequal widths on the absolute value differential spectrum data. When,
前記ヒストグラムデータからなる多変量データ行列に対して多変量解析を行う多変量解析手段と Multivariate analysis means for performing multivariate analysis on a multivariate data matrix comprising the histogram data;
を備え、With
δをケミカルシフト、jを虚数記号、R(δ)をNMRスペクトルの実部、I(δ)をNMRスペクトルの虚部とするとき、数式(1)及び数式(2)はそれぞれ、 When δ is a chemical shift, j is an imaginary number symbol, R (δ) is a real part of the NMR spectrum, and I (δ) is an imaginary part of the NMR spectrum, Equations (1) and (2) are respectively
NMRスペクトル=R(δ)+j・I(δ) …(1) NMR spectrum = R (δ) + j · I (δ) (1)
前記バケットの幅は、前記絶対値微分スペクトル中に含まれる個々のピーク領域が複数 The width of the bucket has a plurality of individual peak regions included in the absolute value differential spectrum.
のバケットに分割されることのないよう、予めピークを検出して、検出されたピークの幅The peak width is detected in advance so that it is not divided into buckets.
に応じて決定されるIs decided according to
NMRスペクトルの統計処理装置。NMR spectrum statistical processing device.
前記ヒストグラムデータからなる多変量データ行列を入力する多変量データ行列入力手段と、
入力された前記多変量データ行列についてPCA解析計算を行なうPCA解析手段と、
前記PCA解析計算の結果を受けて、複数種のPCA解析結果チャートをユーザインタフェース画面に表示するPCA解析結果表示手段と、
前記ユーザインタフェース画面を用いてユーザ要求を入力するユーザ要求入力手段と、
入力された前記ユーザ要求が1以上のサンプルを選択するものである場合、前記選択されたサンプルのNMRスペクトルのデータを入力して、入力された前記NMRスペクトルをケミカルシフト軸上に表したNMRスペクトルチャートを前記ユーザインタフェース画面に表示するNMRスペクトル連携手段と
を含み、
前記PCA解析結果チャートには少なくとも、複数の主成分に対する前記サンプルのスコアを表したスコアプロットと、変数たる所定の複数のケミカルシフト値の前記複数の主成分に対するローディングを表したローディングプロットと、前記所定の複数のケミカルシフト値の寄与率又はローディングをケミカルシフト軸上に表した寄与率/ローディングチャートとが含まれ、
前記寄与率/ローディングチャートと前記NMRスペクトルチャートとは、それぞれの前記ケミカルシフト軸のスケールが一致するようにして、前記ケミカルシフト軸に直交する方向に並べられて表示されるようになった、
NMRスペクトルの統計処理装置。
2. The apparatus according to claim 1, wherein the multivariate analysis means includes:
A multivariate data matrix input means for inputting a multivariate data matrix comprising the histogram data;
PCA analysis means for performing a PCA analysis calculation on the input multivariate data matrix;
PCA analysis result display means for receiving a result of the PCA analysis calculation and displaying a plurality of types of PCA analysis result charts on a user interface screen;
User request input means for inputting a user request using the user interface screen;
When the input user request is to select one or more samples, the NMR spectrum data of the selected sample is input, and the input NMR spectrum is represented on the chemical shift axis. and a NMR spectrum linkage means for displaying the chart on the user interface screen,
The PCA analysis result chart includes at least a score plot representing the score of the sample with respect to a plurality of principal components, a loading plot representing loading with respect to the plurality of principal components of a predetermined plurality of chemical shift values as variables, A contribution ratio / loading chart representing the contribution ratio or loading of a plurality of predetermined chemical shift values on the chemical shift axis, and
The contribution ratio / loading chart and the NMR spectrum chart are arranged and displayed in a direction perpendicular to the chemical shift axis so that the scales of the chemical shift axes coincide with each other.
NMR spectrum statistical processing device.
入力された前記ユーザ要求が前記寄与率/ローディングチャートを拡大するものである場合、
前記PCA解析結果表示手段と前記NMRスペクトル連携手段が、前記寄与率/ローディングチャートと前記NMRスペクトルチャートとの間の前記ケミカルシフト軸のスケールの一致が保持されるようにして、前記寄与率/ローディングチャートと前記NMRスペクトルチャートとを拡大して表示する、
NMRスペクトルの統計処理装置。
The apparatus of claim 2 .
If the input user request is to expand the contribution / loading chart,
The PCA analysis result display means and the NMR spectrum cooperation means maintain the coincidence of the scale of the chemical shift axis between the contribution rate / loading chart and the NMR spectrum chart, so that the contribution rate / loading An enlarged display of the chart and the NMR spectrum chart;
NMR spectrum statistical processing device.
入力された前記ユーザ要求が選択された1以上のサンプルを削除するものである場合、
前記PCA解析手段が、前記削除されたサンプル以外のサンプルのNMRヒストグラムデータからなる多変量データ行列についてPCA解析計算を再度実行し、
前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する、
NMRスペクトルの統計処理装置。
The apparatus of claim 2 .
If the input user request is to delete one or more selected samples,
The PCA analysis means executes the PCA analysis calculation again for a multivariate data matrix consisting of NMR histogram data of samples other than the deleted sample,
The PCA analysis result display means receives the result of the PCA analysis calculation executed again and displays the PCA analysis result chart again.
NMR spectrum statistical processing device.
入力された前記ユーザ要求が選択された1以上の変数たるケミカルシフト値を削除するものである場合、
前記PCA解析手段が、前記削除されたケミカルシフト値以外のケミカルシフト値を用いてPCA解析計算を再度実行し、
前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する、
NMRスペクトルの統計処理装置。
The apparatus of claim 2 .
If the input user request is to delete a chemical shift value as one or more selected variables,
The PCA analysis means executes the PCA analysis calculation again using a chemical shift value other than the deleted chemical shift value,
The PCA analysis result display means receives the result of the PCA analysis calculation executed again and displays the PCA analysis result chart again.
NMR spectrum statistical processing device.
前記ヒストグラムデータからなる複数クラスの多変量データ行列を入力する多変量データ行列入力手段と、
入力された前記複数クラスの多変量データ行列についてSIMCA解析計算を行なうSIMCA解析手段と、
前記SIMCA解析計算の結果を受けて、複数種のSIMCA解析結果チャートをユーザインタフェース画面に表示するSIMCA解析結果表示手段と、
前記ユーザインタフェース画面を用いてユーザ要求を入力するユーザ要求入力手段と、
入力された前記ユーザ要求が1以上のサンプルを選択するものである場合、前記選択されたサンプルのNMRスペクトルのデータを入力して、入力された前記NMRスペクトルをケミカルシフト軸上に表したNMRスペクトルチャートを前記ユーザインタフェース画面に表示するNMRスペクトル連携手段と
を含み、
前記SIMCA解析結果チャートには少なくとも、前記複数のクラスに対する前記サンプルの距離を表したクーマンプロットと、変数たる所定の複数のケミカルシフト値のモデリング力又は識別力をケミカルシフト軸上に表したモデリング力/識別力チャートとが含まれ、
前記モデリング力/識別力チャートと前記NMRスペクトルチャートとは、それぞれの前記ケミカルシフト軸のスケールが一致するようにして、前記ケミカルシフト軸に直交する方向に並べられて表示されるようになった、
NMRスペクトルの統計処理装置。
2. The apparatus according to claim 1, wherein the multivariate analysis means includes:
A multivariate data matrix input means for inputting a multivariate data matrix of a plurality class consisting of the histogram data,
SIMCA analysis means for performing SIMCA analysis calculation on the input multivariate data matrix of the plurality of classes;
A SIMCA analysis result display means for receiving a plurality of types of SIMCA analysis result charts on a user interface screen in response to the result of the SIMCA analysis calculation;
User request input means for inputting a user request using the user interface screen;
When the input user request is to select one or more samples, the NMR spectrum data of the selected sample is input, and the input NMR spectrum is represented on the chemical shift axis. and a NMR spectrum linkage means for displaying the chart on the user interface screen,
The SIMMA analysis result chart includes at least a Cooman plot representing the distance of the sample with respect to the plurality of classes, and a modeling force representing a modeling force or discriminating power of a plurality of predetermined chemical shift values as variables on the chemical shift axis. / Discrimination chart and
The modeling force / discriminating power chart and the NMR spectrum chart are arranged and displayed in a direction orthogonal to the chemical shift axis so that the scales of the chemical shift axes coincide with each other.
NMR spectrum statistical processing device.
入力された前記ユーザ要求が前記モデリング力/識別力チャートを拡大するものである場合、
前記SIMCA解析結果表示手段と前記NMRスペクトル連携手段が、前記モデリング力/識別力チャートと前記NMRスペクトルチャートとの間の前記ケミカルシフト軸のスケールの一致が保持されるようにして、前記モデリング力/識別力チャートと前記NMRスペクトルチャートとを拡大して表示する、
NMRスペクトルの統計処理装置。
The apparatus of claim 6.
If the input user request is to enlarge the modeling power / discrimination power chart,
The SIMCA analysis result display means and the NMR spectrum cooperation means maintain the matching of the scale of the chemical shift axis between the modeling force / discrimination power chart and the NMR spectrum chart so that the modeling force / Displaying the discrimination power chart and the NMR spectrum chart in an enlarged manner;
NMR spectrum statistical processing device.
入力された前記ユーザ要求が選択された1以上のサンプルを削除するものである場合、
前記SIMCA解析手段が、前記削除されたサンプル以外のサンプルのNMRヒストグラムデータからなる複数クラスの多変量データ行列についてSIMCA解析計算を再度実行し、
前記SIMCA解析結果表示手段が、再度実行された前記SIMCA解析計算の結果を受けて、前記SIMCA解析結果チャートを改めて表示する、
NMRスペクトルの統計処理装置。
The apparatus of claim 6.
If the input user request is to delete one or more selected samples,
The SIMCA analysis means performs SIMCA analysis calculation again on a multivariate data matrix of a plurality of classes consisting of NMR histogram data of samples other than the deleted sample,
The SIMCA analysis result display means receives the result of the SIMCA analysis calculation performed again and displays the SIMCA analysis result chart again.
NMR spectrum statistical processing device.
入力された前記ユーザ要求が、所定の閾値より前記識別力又はモデリング力が高い変数たるケミカルシフト値を選択するとともに再計算を要求するものである場合、
前記SIMCA解析手段が、前記選択されたケミカルシフト値だけを用いてSIMCA解析計算を再度実行し、
前記SIMCA解析結果表示手段が、再度実行された前記SIMCA解析計算の結果を受けて、前記SIMCA解析結果チャートを改めて表示する、
NMRスペクトルの統計処理装置。
The apparatus of claim 6.
When the input user request is to select a chemical shift value that is a variable whose discriminating power or modeling power is higher than a predetermined threshold and to request recalculation,
The SIMCA analysis means performs SIMCA analysis calculation again using only the selected chemical shift value,
The SIMCA analysis result display means receives the result of the SIMCA analysis calculation performed again and displays the SIMCA analysis result chart again.
NMR spectrum statistical processing device.
前記ヒストグラムデータからなる多変量データ行列についてPCA解析計算を行なうPCA解析手段と、
前記PCA解析計算の結果を受けて、複数種のPCA解析結果チャートをユーザインタフェース画面に表示するPCA解析結果表示手段と、
複数のクラスに割り当てられた複数のサンプルのNMRヒストグラムデータからなる複数クラスの多変量データ行列を入力する多変量データ行列入力手段と、
入力された前記複数クラスの多変量データ行列についてSIMCA解析計算を行なうSIMCA解析手段と、
前記SIMCA解析計算の結果を受けて、複数種のSIMCA解析結果チャートをユーザインタフェース画面に表示するSIMCA解析結果表示手段と、
前記ユーザインタフェース画面を用いてユーザ要求を入力するユーザ要求入力手段と、
を含み、
前記PCA解析結果チャートには少なくとも、複数の主成分に対する前記サンプルのスコアを表したスコアプロットと、変数たる所定の複数のケミカルシフト値の前記複数の主成分に対するローディングを表したローディングプロットと、前記所定の複数のケミカルシフト値の寄与率又はローディングをケミカルシフト軸上に表した寄与率/ローディングチャートとが含まれ、
前記SIMCA解析結果チャートには少なくとも、前記複数のクラスに対する前記サンプルの距離を表したクーマンプロットと、変数たる所定の複数のケミカルシフト値のモデリング力又は識別力をケミカルシフト軸上に表したモデリング力/識別力チャートとが含まれ、
前記ユーザ要求入力手段により入力された前記ユーザ要求が、前記モデリング力/識別力チャートに表示された前記識別力又はモデリング力が所定閾値より高い変数たるケミカルシフト値を選択するとともにPCA解析計算の再実行を要求するものである場合、
前記PCA解析手段が、前記選択されたケミカルシフト値だけを用いてPCA解析計算を再度実行し、
前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する、
NMRスペクトルの統計処理装置。
2. The apparatus according to claim 1, wherein the multivariate analysis means includes:
PCA analysis means for performing PCA analysis calculation on a multivariate data matrix comprising the histogram data;
PCA analysis result display means for receiving a result of the PCA analysis calculation and displaying a plurality of types of PCA analysis result charts on a user interface screen;
A multivariate data matrix input means for inputting a multivariate data matrix of a plurality of classes consisting of NMR histogram data of a plurality of samples assigned to a plurality of classes;
SIMCA analysis means for performing SIMCA analysis calculation on the input multivariate data matrix of the plurality of classes;
A SIMCA analysis result display means for receiving a plurality of types of SIMCA analysis result charts on a user interface screen in response to the result of the SIMCA analysis calculation;
User request input means for inputting a user request using the user interface screen;
Including
The PCA analysis result chart includes at least a score plot representing the score of the sample with respect to a plurality of principal components, a loading plot representing loading with respect to the plurality of principal components of a predetermined plurality of chemical shift values as variables, A contribution ratio / loading chart representing the contribution ratio or loading of a plurality of predetermined chemical shift values on the chemical shift axis, and
The SIMMA analysis result chart includes at least a Cooman plot representing the distance of the sample with respect to the plurality of classes, and a modeling force representing a modeling force or discriminating power of a plurality of predetermined chemical shift values as variables on the chemical shift axis. / Discrimination chart and
The user request input by the user request input means selects a chemical shift value that is a variable in which the discriminating power or modeling power displayed in the modeling power / discriminating power chart is higher than a predetermined threshold and re-executes the PCA analysis calculation. If it is a request for execution,
The PCA analysis means executes the PCA analysis calculation again using only the selected chemical shift value,
The PCA analysis result display means receives the result of the PCA analysis calculation executed again and displays the PCA analysis result chart again.
NMR spectrum statistical processing device.
前記ユーザ要求入力手段により入力された前記ユーザ要求が、前記モデリング力/識別力チャートに表示された前記識別力又はモデリング力が所定閾値より高い変数たるケミカルシフト値を選択するとともに変数を追加したPCA解析計算の再実行を要求するものである場合、
前記PCA解析手段が、前記選択されたケミカルシフト値を現在の変数たるケミカルシフト値に追加してなる変数を用いてPCA解析計算を再度実行し、
前記PCA解析結果表示手段が、再度実行された前記PCA解析計算の結果を受けて、前記PCA解析結果チャートを改めて表示する、
NMRスペクトルの統計処理装置。
The apparatus of claim 10 .
The PCA in which the user request input by the user request input means selects a chemical shift value that is a variable in which the discriminating power or modeling power displayed in the modeling power / discriminating power chart is higher than a predetermined threshold and adds a variable If it is a request to re-run the analysis calculation,
The PCA analysis means executes the PCA analysis calculation again using a variable obtained by adding the selected chemical shift value to the current chemical shift value.
The PCA analysis result display means receives the result of the PCA analysis calculation executed again and displays the PCA analysis result chart again.
NMR spectrum statistical processing device.
前記ユーザ要求入力手段により入力された前記ユーザ要求が、前記モデリング力/識別力チャートに表示された前記識別力又はモデリング力が所定閾値より高い変数たるケミカルシフト値を選択するとともにSIMCA解析計算の再実行を要求するものである場合、
前記SIMCA解析手段が、前記選択されたケミカルシフト値だけを用いてPCA解析計算を再度実行し、
前記SIMCA解析結果表示手段が、再度実行された前記SIMCA解析計算の結果を受けて、前記SIMCA解析結果チャートを改めて表示する、
NMRスペクトルの統計処理装置。
The apparatus of claim 10 .
The user request input by the user request input means selects a chemical shift value that is a variable in which the discriminating power or the modeling power displayed in the modeling power / discriminating power chart is higher than a predetermined threshold, and re-calculates SIMCA analysis calculation. If it is a request for execution,
The SIMCA analysis means performs the PCA analysis calculation again using only the selected chemical shift value,
The SIMCA analysis result display means receives the result of the SIMCA analysis calculation performed again and displays the SIMCA analysis result chart again.
NMR spectrum statistical processing device.
前記絶対値微分スペクトルデータに対し、不均等な幅をもつ多数のバケットからなるバケットセットを用いたバケット積分を実行することにより、前記絶対値微分スペクトルデータをヒストグラムデータに縮約するステップと、 Reducing the absolute value differential spectrum data into histogram data by performing bucket integration using a bucket set consisting of multiple buckets having unequal widths on the absolute value differential spectrum data;
前記ヒストグラムデータからなる多変量データ行列に対して多変量解析を行うステップと Performing a multivariate analysis on a multivariate data matrix comprising the histogram data;
を備え、With
δをケミカルシフト、jを虚数記号、R(δ)をNMRスペクトルの実部、I(δ)をNMRスペクトルの虚部とするとき、数式(1)及び数式(2)はそれぞれ、 When δ is a chemical shift, j is an imaginary number symbol, R (δ) is a real part of the NMR spectrum, and I (δ) is an imaginary part of the NMR spectrum, Equations (1) and (2) are respectively
NMRスペクトル=R(δ)+j・I(δ) …(1) NMR spectrum = R (δ) + j · I (δ) (1)
前記バケットの幅は、前記絶対値微分スペクトル中に含まれる個々のピーク領域が複数のバケットに分割されることのないよう、予めピークを検出して、検出されたピークの幅に応じて決定されるNMRデータの処理方法。 The width of the bucket is determined according to the detected peak width in advance so that individual peak areas included in the absolute value differential spectrum are not divided into a plurality of buckets. NMR data processing method.
前記絶対値微分スペクトルデータに対し、不均等な幅をもつ多数のバケットからなるバケットセットを用いたバケット積分を実行することにより、前記絶対値微分スペクトルデータをヒストグラムデータに縮約するステップを、コンピュータに実行させるためのプログラム部分と、 A step of reducing the absolute value differential spectrum data to histogram data by performing bucket integration using a bucket set consisting of a large number of buckets having unequal widths on the absolute value differential spectrum data. A program part to be executed by
前記ヒストグラムデータからなる多変量データ行列に対して多変量解析を行うステップを、コンピュータに実行させるためのプログラム部分と、 A program portion for causing a computer to execute a multivariate analysis on a multivariate data matrix comprising the histogram data;
を備え、With
δをケミカルシフト、jを虚数記号、R(δ)をNMRスペクトルの実部、I(δ)をNMRスペクトルの虚部とするとき、数式(1)及び数式(2)はそれぞれ、 When δ is a chemical shift, j is an imaginary number symbol, R (δ) is a real part of the NMR spectrum, and I (δ) is an imaginary part of the NMR spectrum, Equations (1) and (2) are respectively
NMRスペクトル=R(δ)+j・I(δ) …(1) NMR spectrum = R (δ) + j · I (δ) (1)
前記バケットの幅は、前記絶対値微分スペクトル中に含まれる個々のピーク領域が複数のバケットに分割されることのないよう、予めピークを検出して、検出されたピークの幅に応じて決定されるNMRデータの処理のための機械読み取り可能なコンピュータプログラム。 The width of the bucket is determined according to the detected peak width in advance so that individual peak areas included in the absolute value differential spectrum are not divided into a plurality of buckets. A machine-readable computer program for processing NMR data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011095717A JP5415476B2 (en) | 2005-05-02 | 2011-04-22 | NMR data processing apparatus and method |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005134495 | 2005-05-02 | ||
JP2005134495 | 2005-05-02 | ||
JP2011095717A JP5415476B2 (en) | 2005-05-02 | 2011-04-22 | NMR data processing apparatus and method |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005274503A Division JP5020491B2 (en) | 2005-05-02 | 2005-09-21 | NMR data processing apparatus and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011141298A JP2011141298A (en) | 2011-07-21 |
JP5415476B2 true JP5415476B2 (en) | 2014-02-12 |
Family
ID=44457211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011095717A Active JP5415476B2 (en) | 2005-05-02 | 2011-04-22 | NMR data processing apparatus and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5415476B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3000556B1 (en) * | 2012-12-28 | 2016-03-25 | Univ Aix Marseille | METHOD FOR PHASE AND / OR FREQUENCY CORRECTION OF AT LEAST ONE FREE INDUCTION DECREASE SIGNAL (FID) |
JP6458073B2 (en) * | 2017-03-30 | 2019-01-23 | 株式会社Jsol | Linear polynomial model creation system, creation method, and creation program for multilayer neural network (deep learning) |
JP6458072B2 (en) * | 2017-03-30 | 2019-01-23 | 株式会社Jsol | High contribution item extraction system, extraction method and extraction program for improving performance of multilayer neural network (deep learning) |
-
2011
- 2011-04-22 JP JP2011095717A patent/JP5415476B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011141298A (en) | 2011-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6007855B2 (en) | Graph display processing device | |
JP5348029B2 (en) | Mass spectrometry data processing method and apparatus | |
US8649580B2 (en) | Image processing method, image processing apparatus, and computer-readable recording medium storing image processing program | |
US7653509B2 (en) | Probability state models | |
JP5020491B2 (en) | NMR data processing apparatus and method | |
JP6096781B2 (en) | Biochemical data analysis system and method | |
JP7369279B2 (en) | Chromatography analysis system, chromatogram detection and analysis method, and electronic equipment | |
US20190362824A1 (en) | Condition specific sample analysis | |
JP5945365B2 (en) | Method for identifying substances from NMR spectra | |
JP5415476B2 (en) | NMR data processing apparatus and method | |
JP5088731B2 (en) | Multivariate analyzer and computer program | |
JP2024112965A (en) | Image Analysis Equipment | |
EP3006944A1 (en) | Information processing device and information processing method | |
JP2004309250A (en) | Data processor for chromatograph | |
JP2007212206A (en) | Mapping data display method, program and mapping data display device | |
KR102113834B1 (en) | Web service implementation method of db based on pls-da | |
Livengood et al. | OmicsVis: an interactive tool for visually analyzing metabolomics data | |
JP7040537B2 (en) | Imaging mass spectrometer | |
JP2003156460A (en) | Method and system for managing data | |
JP6876427B2 (en) | Report creation device, program, information storage medium, and report creation method | |
JP2020101374A (en) | Particle size display device, particle size display method and particle size display system | |
CN103714233A (en) | Univariable and multi-variable combined data analysis method | |
EP3001338B1 (en) | Information processing device and information processing method | |
JP7504783B2 (en) | Predictor creating device and predictor creating method | |
JPH04343051A (en) | Data analysis system of electron beam microanalyzer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110520 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20110824 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20111214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131022 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5415476 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |