JPWO2019150573A1 - Data analyzer - Google Patents

Data analyzer Download PDF

Info

Publication number
JPWO2019150573A1
JPWO2019150573A1 JP2019568538A JP2019568538A JPWO2019150573A1 JP WO2019150573 A1 JPWO2019150573 A1 JP WO2019150573A1 JP 2019568538 A JP2019568538 A JP 2019568538A JP 2019568538 A JP2019568538 A JP 2019568538A JP WO2019150573 A1 JPWO2019150573 A1 JP WO2019150573A1
Authority
JP
Japan
Prior art keywords
data
analysis
processing unit
statistical analysis
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019568538A
Other languages
Japanese (ja)
Other versions
JP6908136B2 (en
Inventor
真一 山口
真一 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of JPWO2019150573A1 publication Critical patent/JPWO2019150573A1/en
Application granted granted Critical
Publication of JP6908136B2 publication Critical patent/JP6908136B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode

Landscapes

  • Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

第1多変量解析処理部(24)は、一つの試料毎に、測定領域内の複数の測定点それぞれについて得られたマススペクトルデータを説明変数、特定の化合物を蛍光標識して撮影した蛍光画像において各測定点に対応する画素の画素値を被説明変数、とする一段階目のPLS回帰分析を実行し、回帰係数行列を求める。第2多変量解析処理部(25)は、複数の試料について得られた複数の1次元回帰係数行列を集約して説明変数とし、各試料の状態を示す情報として各試料の癌の重症度を示す情報を被説明変数とした二段階目のPLS回帰分析を実行し、再び回帰係数行列を求める。これにより、蛍光画像上の特定の化合物に類似した分布を示す化合物の中で癌の重症度に応じた量の変化を示す化合物等、従来手法では得られにくい新たな情報を取得することができる。The first multivariate analysis processing unit (24) uses the mass spectrum data obtained for each of the plurality of measurement points in the measurement region as an explanatory variable for each sample, and a fluorescent image taken by fluorescently labeling a specific compound. In, the first-stage PLS regression analysis is performed with the pixel value of the pixel corresponding to each measurement point as the explained variable, and the regression coefficient matrix is obtained. The second multivariate analysis processing unit (25) aggregates a plurality of one-dimensional regression coefficient matrices obtained for a plurality of samples into explanatory variables, and uses the severity of cancer of each sample as information indicating the state of each sample. Perform a second-stage PLS regression analysis with the information shown as the dependent variable, and find the regression coefficient matrix again. This makes it possible to obtain new information that is difficult to obtain by conventional methods, such as a compound showing a distribution similar to a specific compound on a fluorescence image and a compound showing a change in the amount according to the severity of cancer. ..

Description

本発明は、試料や被検体に対し測定や観察を行うことで得られたデータを解析するデータ解析装置に関し、特に、様々な条件の下で得られた多数の試料についての測定データに基づいてそれら試料についての有用な情報を引き出したり、同じ試料に対して異なる測定手法や観察手法で得られた複数の多次元的な測定データに基づいて該試料についての有用な情報を引き出したりするのに好適なデータ解析装置に関する。 The present invention relates to a data analyzer that analyzes data obtained by measuring or observing a sample or a subject, and in particular, based on measurement data of a large number of samples obtained under various conditions. To extract useful information about these samples, or to extract useful information about the same sample based on multiple multidimensional measurement data obtained by different measurement methods and observation methods. With respect to a suitable data analyzer.

近年、質量分析装置、クロマトグラフ装置、光学分析装置といった様々な分析装置で得られたデータの解析に、統計的解析手法の一つである多変量解析が盛んに利用されるようになってきている。例えば異なる複数の試料についてそれぞれ分析を行うことで得られた膨大なデータに基づいて試料間の相違を見つけたり、そうした相違に関連する要因を見つけたりする際に、多変量解析は非常に有用な手法である。
分析装置で得られるデータの解析に多変量解析を用いた一例を簡単に説明する。
In recent years, multivariate analysis, which is one of the statistical analysis methods, has been actively used for analysis of data obtained by various analysis devices such as mass spectrometers, chromatograph devices, and optical analyzers. There is. Multivariate analysis is very useful, for example, in finding differences between samples based on the vast amount of data obtained by analyzing different samples, and in finding factors related to such differences. It is a method.
An example of using multivariate analysis to analyze the data obtained by the analyzer will be briefly described.

近年、生体組織切片などの試料上の2次元的な測定領域内の多数の測定点それぞれについて質量分析を実行することが可能な質量分析装置が知られている。この種の質量分析装置はイメージング質量分析装置と呼ばれており、付設された光学顕微鏡によって試料の表面の微細な形態を観察しながら、同じ試料表面における特定の質量電荷比(m/z)を有するイオンの2次元的な強度分布を示す質量分析イメージング画像を取得することが可能である。 In recent years, a mass spectrometer capable of performing mass spectrometry for each of a large number of measurement points in a two-dimensional measurement region on a sample such as a biological tissue section has been known. This type of mass spectrometer is called an imaging mass spectrometer, and a specific mass-to-charge ratio (m / z) on the same sample surface can be measured while observing the fine morphology of the sample surface with an attached optical microscope. It is possible to acquire a mass spectrometric imaging image showing a two-dimensional intensity distribution of the ions.

特許文献1に記載のイメージング質量分析装置では、光学顕微鏡で得られた顕微画像を分析者が確認して着目する部位(関心領域)を特徴付ける色を指定すると、顕微画像においてその色を示す部位の分布に類似したイオン強度分布を示す質量電荷比が相関分析や回帰分析によって抽出される。それにより、質量電荷比に基づく化合物の特定が可能であれば、試料上で分析者が着目する部位と類似した分布を示す化合物を特定することができる。 In the imaging mass spectrometer described in Patent Document 1, when an analyst confirms a microscopic image obtained by an optical microscope and specifies a color that characterizes a region of interest (region of interest), the portion showing that color in the microscopic image A mass-to-charge ratio showing an ionic strength distribution similar to the distribution is extracted by correlation analysis or regression analysis. Thereby, if the compound can be specified based on the mass-to-charge ratio, the compound showing a distribution similar to the site of interest of the analyst on the sample can be specified.

もちろん、顕微画像で観測される分布と類似した分布を示す質量分析イメージング画像だけでなく、イオン強度分布が互いに類似している複数の質量電荷比も比較的容易に見つけることができる。これにより、同じ動態を示す複数の化合物を見いだしたり、同じ化合物に由来する複数の部分構造を見つけて化合物の構造を推定したりすることもできる。 Of course, not only mass spectrometric imaging images showing distributions similar to those observed in microscopic images, but also multiple mass-to-charge ratios with similar ionic strength distributions can be found relatively easily. This makes it possible to find a plurality of compounds showing the same dynamics, or to find a plurality of partial structures derived from the same compound and estimate the structure of the compound.

国際公開第2017/002226号パンフレットInternational Publication No. 2017/002226 Pamphlet 国際公開第2016/092608号パンフレットInternational Publication No. 2016/092608 Pamphlet

上記のような従来の解析は一つの試料についてのみの解析であるが、多数の試料についての解析結果を適切に結び付けることが可能であれば、癌などの特定の疾病の原因の究明やより的確な診断の研究などに非常に有用な情報が得られる可能性がある。例えば、癌の進行度合いが様々である多数の試料についての分析結果から、癌が進行したあとでなくその初期段階で特異的に発現する化合物を見つけたり、或いは治療の効果の程度を反映した化合物を見つけたりすることができる可能性がある。しかしながら、こうしたことを目的としたデータ解析を簡便に実現することができる手法は従来存在しなかった。 The conventional analysis as described above is an analysis of only one sample, but if it is possible to appropriately link the analysis results of a large number of samples, the cause of a specific disease such as cancer can be investigated and more accurately. There is a possibility that very useful information can be obtained for research on various diagnostics. For example, from the analysis results of a large number of samples with various degrees of cancer progression, a compound that is specifically expressed not after the cancer has progressed but at the initial stage thereof can be found, or a compound that reflects the degree of therapeutic effect. You may be able to find it. However, there has been no conventional method that can easily realize data analysis for this purpose.

また、そもそも一般に、多変量解析を行う従来のデータ解析装置により得られる解析結果は専門的な知識を有する者でないと把握することが難しく、十分に有用な情報をユーザに提供できていないという問題があった。 In addition, in general, it is difficult to grasp the analysis results obtained by a conventional data analysis device that performs multivariate analysis unless the person has specialized knowledge, and there is a problem that sufficiently useful information cannot be provided to the user. was there.

本発明はこうした課題を解決するために成されたものであり、その主たる目的の一つは、異なる種類の測定や観察などによって得られた複数のデータを比較したり関連付けたりする解析処理を行うことで、従来の解析手法では得られない有用な情報を取得することができるデータ解析装置を提供することである。 The present invention has been made to solve these problems, and one of its main purposes is to perform an analysis process for comparing and associating a plurality of data obtained by different types of measurements and observations. This is to provide a data analysis device capable of acquiring useful information that cannot be obtained by a conventional analysis method.

上記課題を解決するために成された本発明に係る第1の態様のデータ解析装置は、複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、該複数の試料についてそれぞれ前記所定の測定とは別の手法による測定を実行することで得られたデータを集約した第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
a)第1のデータ群を説明変数、第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
b)前記第1の統計的解析処理部で算出された複数の指標値を説明変数、前記複数の試料にそれぞれ関連する他の情報を被説明変数(目的変数)とする所定の統計的解析処理を実施し、前記指標値と前記他の情報との類似性又は相違性を示す複数の指標値を算出する第2の統計的解析処理部と、
c)前記第2の統計的解析処理部で算出された複数の指標値を用い、前記他の情報と前記第1のデータ群との関係、又は、前記他の情報と前記第2のデータ群との関係、を示すグラフを作成して表示する表示処理部と、
を備えることを特徴としている。
The data analysis apparatus of the first aspect according to the present invention, which has been made to solve the above problems, aggregates the data obtained for each predetermined parameter value by performing predetermined measurements on each of a plurality of samples. The plurality of data groups are analyzed by analysis processing based on the first data group and the second data group in which the data obtained by executing the measurement by a method different from the predetermined measurement for each of the plurality of samples. It is a data analysis device that seeks information on all samples in Japan.
a) Perform a predetermined statistical analysis process with the first data group as the explanatory variable and the second data group as the explained variable (objective variable), and show the similarity or difference of the data in both data groups. A first statistical analysis processing unit that calculates multiple index values,
b) Predetermined statistical analysis processing using a plurality of index values calculated by the first statistical analysis processing unit as explanatory variables and other information related to the plurality of samples as explained variables (objective variables). And a second statistical analysis processing unit that calculates a plurality of index values indicating the similarity or difference between the index value and the other information.
c) The relationship between the other information and the first data group, or the other information and the second data group, using a plurality of index values calculated by the second statistical analysis processing unit. A display processing unit that creates and displays a graph showing the relationship with
It is characterized by having.

本発明に係る第1の態様のデータ解析装置における典型的な実施形態として、
前記第1のデータ群は、複数の試料についてそれぞれイメージング質量分析を行うことで得られた、2次元的な測定領域内の複数の測定点それぞれにおける、質量電荷比を前記所定のパラメータとしたマススペクトルデータであり、
前記第2のデータ群は、複数の試料についてそれぞれイメージング質量分析とは異なる測定手法で得られた、2次元的な測定領域内の所定の信号強度の分布を示す画像データであり、
前記第1の統計的解析処理部は、試料毎に、前記第2のデータ群による一つ又は複数の画像と、前記第1のデータ群による各質量電荷比における信号強度の分布画像との類似性又は相違性を示す指標値を算出する構成とすることができる。
As a typical embodiment in the data analysis device of the first aspect according to the present invention,
The first data group is a mass having a mass-to-charge ratio as a predetermined parameter at each of a plurality of measurement points in a two-dimensional measurement region obtained by performing imaging mass spectrometry on a plurality of samples. Spectral data
The second data group is image data showing a predetermined signal intensity distribution in a two-dimensional measurement region obtained by a measurement method different from imaging mass spectrometry for a plurality of samples.
The first statistical analysis processing unit resembles one or more images of the second data group and a distribution image of the signal intensity at each mass-to-charge ratio of the first data group for each sample. It can be configured to calculate an index value indicating gender or difference.

上記「イメージング質量分析とは異なる測定手法」としては、ラマン分光測定、蛍光測定、様々な波長(テラヘルツ域、遠近赤外域、可視域、紫外域、X線域など)の電磁波の放出強度の測定や吸収測定、PET(Positron Emission Tomography)測定、MRI(Magnetic Resonance Imaging)測定、ESR(Electron Spin Resonance)測定、CT(Computed Tomography)測定、EPMA(Electron Probe MicroAnalyser)による表面分析などの各種の測定や分析、或いは、電子顕微鏡や光学顕微鏡による観察などのいずれかとすることができる。例えば第2のデータ群が上述したような光学的な測定手法で得られた画像データを含むものである場合、複数の波長それぞれにおいて異なる画像を構成する画像データであってもよいし特定の一つの波長における一つの画像を構成する画像データであってもよい。 The above-mentioned "measurement method different from imaging mass analysis" includes Raman spectroscopic measurement, fluorescence measurement, and measurement of electromagnetic emission intensity of various wavelengths (terahertz region, near-infrared region, visible region, ultraviolet region, X-ray region, etc.). And absorption measurement, PET (Positron Emission Tomography) measurement, MRI (Magnetic Resonance Imaging) measurement, ESR (Electron Spin Resonance) measurement, CT (Computed Tomography) measurement, surface analysis by EPMA (Electron Probe MicroAnalyser), etc. It can be either analyzed or observed with an electronic microscope or an optical microscope. For example, when the second data group includes the image data obtained by the optical measurement method as described above, the image data may be image data constituting different images at each of a plurality of wavelengths, or may be one specific wavelength. It may be the image data constituting one image in.

いま例えば第2のデータ群が一つのカラー画像をモノクロ化した光学顕微画像を構成する画像データ、つまりは測定点に対応する画素の画素値を示すデータ群である場合、第1の統計的解析処理部は、試料毎に、その試料における画素値データと画像と、各質量電荷比の信号強度の分布を示す分布画像との類似性又は相違性を示す指標値を計算する。この第1の統計的解析処理部による所定の統計的解析処理は例えば、部分最小二乗回帰(PLS回帰)分析とするとよい。 Now, for example, when the second data group is image data constituting an optical microscopic image obtained by monochromeizing one color image, that is, a data group showing pixel values of pixels corresponding to measurement points, the first statistical analysis For each sample, the processing unit calculates an index value indicating the similarity or difference between the pixel value data and the image in the sample and the distribution image showing the distribution of the signal intensity of each mass charge ratio. The predetermined statistical analysis processing by the first statistical analysis processing unit may be, for example, partial least squares regression (PLS regression) analysis.

上記データに対しPLS回帰分析を適用することにより、上記指標値として質量電荷比毎に回帰係数を求めることができる。一つの試料について求まる質量電荷比毎の回帰係数を係数行列とすれば、複数の試料について複数の係数行列が求まる。 By applying the PLS regression analysis to the above data, the regression coefficient can be obtained for each mass-to-charge ratio as the index value. If the regression coefficient for each mass-to-charge ratio obtained for one sample is used as a coefficient matrix, a plurality of coefficient matrices can be obtained for a plurality of samples.

本発明に係る第1の態様のデータ解析装置ではさらに第2の統計的解析処理部が、この複数の係数行列を説明変数、複数の試料にそれぞれ関連する他の情報を被説明変数とする所定の統計的解析処理を実施する。ここで、「複数の試料にそれぞれ関連する他の情報」とは数値化可能な状態であれば特にその内容を問わず、解析の目的等に応じて適宜の情報を用いることができる。また、第2の統計的解析処理部による所定の統計的解析処理は第1の統計的解析処理部による統計的解析処理と同じ手法でもよいし、それとは異なる手法でもよい。具体的には例えば、部分最小二乗回帰(PLS回帰)分析又は主成分回帰分析を用いるとよい。 In the data analysis apparatus of the first aspect according to the present invention, the second statistical analysis processing unit further uses the plurality of coefficient matrices as explanatory variables and other information related to the plurality of samples as explained variables. Perform statistical analysis processing of. Here, "other information related to each of a plurality of samples" is not particularly limited as long as it can be quantified, and appropriate information can be used according to the purpose of analysis and the like. Further, the predetermined statistical analysis processing by the second statistical analysis processing unit may be the same method as the statistical analysis processing by the first statistical analysis processing unit, or may be a different method. Specifically, for example, partial least squares regression (PLS regression) analysis or principal component regression analysis may be used.

例えば複数の試料が特定の疾病に罹患した被検体から採取された生体組織切片であり、試料毎にその疾病の進行度合や重篤度合などが他の情報として与えられている場合、第2の統計的解析処理部でPLS回帰分析を行うことで、第1の統計的解析処理部で得られた試料毎の回帰係数と疾病の進行度合との類似性を示す回帰係数を求めることができる。この場合、この回帰係数は、光学顕微画像に現れている特定の分布と類似した分布を示す質量電荷比、つまりは化合物と、疾病の進行度合いとの関連性を示している。表示処理部は例えばその関連性を示す適宜の形式のグラフを作成して表示部の画面上に表示する。これにより、ユーザは例えば、光学顕微画像に現れている特定の分布と類似した分布を示す特定の化合物が疾病の進行度合に関連しているか否かを簡便に且つ視覚的に確認することができる。 For example, when a plurality of samples are biological tissue sections collected from a subject suffering from a specific disease and the degree of progression or severity of the disease is given for each sample as other information, the second By performing PLS regression analysis in the statistical analysis processing unit, it is possible to obtain a regression coefficient indicating the similarity between the regression coefficient for each sample obtained by the first statistical analysis processing unit and the degree of disease progression. In this case, this regression coefficient indicates the mass-to-charge ratio showing a distribution similar to the specific distribution appearing in the optical microscopic image, that is, the relationship between the compound and the degree of disease progression. For example, the display processing unit creates a graph of an appropriate format showing the relevance and displays it on the screen of the display unit. Thereby, for example, the user can easily and visually confirm whether or not a specific compound having a distribution similar to the specific distribution appearing in the optical microscopic image is related to the degree of disease progression. ..

上記本発明に係る第1の態様のデータ解析装置では、複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、同じ複数の試料についてそれぞれ別の手法による測定を実行することで得られたデータを集約した第2のデータ群と、について一段階目の統計的解析処理を実行し、その結果と同じ複数の試料にそれぞれ関連する他の情報である第3のデータとについて、二段階目の統計的解析処理を実施していた。これに対し、一段階目の統計的解析処理で得られた結果を分かり易く或いはより大局的に表現するために二段階目の統計的解析処理を実施するようにしてもよい。 In the data analysis apparatus of the first aspect according to the present invention, the same plurality as the first data group in which the data obtained for each predetermined parameter value by performing predetermined measurements on each of a plurality of samples are aggregated. The second data group, which aggregates the data obtained by performing measurements by different methods for each of the samples, and the first-stage statistical analysis process are performed on the same samples, respectively. A second stage of statistical analysis was performed on the third data, which is other relevant information. On the other hand, the second-stage statistical analysis process may be performed in order to express the result obtained by the first-stage statistical analysis process in an easy-to-understand or broader manner.

即ち、本発明に係る第2の態様のデータ解析装置は、複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、該複数の試料についてそれぞれ前記所定の測定とは別の手法による測定を実行することで得られたデータ又は該複数の試料にそれぞれ関連する他の情報であるデータを集約した第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
a)第1のデータ群を説明変数、第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
b)前記第1の統計的解析処理部で算出された複数の指標値を、より低次元の情報に集約するための所定の統計的解析処理を実施する第2の統計的解析処理部と、
c)前記第2の統計的解析処理部による結果に基づき、前記第2のデータ群と前記第1のデータ群における各パラメータ値との関係を示すグラフを作成して表示する表示処理部と、
を備えることを特徴としている。
That is, the data analysis apparatus of the second aspect according to the present invention includes a first data group that aggregates data obtained for each predetermined parameter value by performing predetermined measurements on a plurality of samples, respectively. A second data group in which data obtained by performing measurements by a method different from the predetermined measurement for each of the plurality of samples or data which is other information related to the plurality of samples is aggregated. It is a data analysis device that obtains information on the plurality of samples in general by analysis processing based on the above.
a) Perform a predetermined statistical analysis process with the first data group as the explanatory variable and the second data group as the explained variable (objective variable), and show the similarity or difference of the data in both data groups. A first statistical analysis processing unit that calculates multiple index values,
b) A second statistical analysis processing unit that performs a predetermined statistical analysis processing for aggregating a plurality of index values calculated by the first statistical analysis processing unit into lower-dimensional information.
c) A display processing unit that creates and displays a graph showing the relationship between the second data group and each parameter value in the first data group based on the result of the second statistical analysis processing unit.
It is characterized by having.

本発明に係る第2の態様のデータ解析装置では上記第1の態様のデータ解析装置と同様に、第1の統計的解析処理部による所定の統計的解析処理は例えば、部分最小二乗回帰分析とするとよい。一方、第2の統計的解析処理部による所定の統計的解析処理は、主成分分析、因子分析、クラスター分析などを用いることができる。 In the data analysis device of the second aspect according to the present invention, similarly to the data analysis device of the first aspect, the predetermined statistical analysis process by the first statistical analysis processing unit is, for example, partial minimum square regression analysis. You should do it. On the other hand, as the predetermined statistical analysis processing by the second statistical analysis processing unit, principal component analysis, factor analysis, cluster analysis and the like can be used.

本発明に係る第2の態様のデータ解析装置において、例えば試料は生体由来の試料であり、第1のデータ群は、複数の試料についてそれぞれ得られたマススペクトルデータ、第2のデータ群は試料毎の状態を示す情報であるものとする。こうしたデータに対し第1の統計的解析処理部によりPLS回帰分析を実行すると、質量電荷比値とその試料毎の状態の関連性の強さの程度を示す指標値として、それぞれの回帰係数を算出することができる。そして、こうして得られた複数の回帰係数について主成分分析を行い、表示処理部がその結果に基づいてスコアプロット又はローディングプロットを作成すると、試料毎の状態と質量電荷比値との関係が俯瞰的に観察できるようになる。 In the data analysis apparatus of the second aspect according to the present invention, for example, the sample is a sample derived from a living body, the first data group is mass spectrum data obtained for each of a plurality of samples, and the second data group is a sample. It shall be the information indicating each state. When PLS regression analysis is performed on such data by the first statistical analysis processing unit, each regression coefficient is calculated as an index value indicating the degree of relevance between the mass-to-charge ratio value and the state of each sample. can do. Then, when the principal component analysis is performed on the plurality of regression coefficients obtained in this way and the display processing unit creates a score plot or a loading plot based on the results, the relationship between the state of each sample and the mass-to-charge ratio value is overlooked. You will be able to observe it.

本発明に係るデータ解析装置によれば、例えば、異なる種類の測定や観察などによって得られた複数のデータを比較したり関連付けたりすることで、従来の解析手法では得られない有用な情報を取得することができる。具体的には例えば、癌などの特定の疾病が進行したあとでなくその初期段階で特異的に発現する化合物を見つけたり、或いはそうした疾病に対する治療の効果の程度を反映した化合物を見つけたりすることができる可能性がある。 According to the data analysis apparatus according to the present invention, for example, by comparing or associating a plurality of data obtained by different types of measurement or observation, useful information that cannot be obtained by a conventional analysis method can be obtained. can do. Specifically, for example, finding a compound that is specifically expressed at an early stage of a specific disease such as cancer, not after it has progressed, or finding a compound that reflects the degree of therapeutic effect on such a disease. May be possible.

本発明に係るデータ解析装置を用いたイメージング質量分析システムの一実施例の概略構成図。The schematic block diagram of an Example of the imaging mass spectrometric system using the data analysis apparatus which concerns on this invention. 本実施例のイメージング質量分析システムにおけるデータ解析処理の概念図。The conceptual diagram of the data analysis processing in the imaging mass spectrometry system of this Example. 本実施例のイメージング質量分析システムにおけるデータ解析の手順を示すフローチャート。The flowchart which shows the procedure of data analysis in the imaging mass spectrometry system of this Example. 本実施例のイメージング質量分析システムにおけるデータ解析の変形例の説明図。The explanatory view of the modification of the data analysis in the imaging mass spectrometry system of this Example. 本発明に係るデータ解析装置を用いた質量分析システムの一実施例の概略構成図。The schematic block diagram of an Example of the mass spectrometry system using the data analysis apparatus which concerns on this invention. 本実施例の質量分析システムにおけるデータ解析処理の概念図。The conceptual diagram of the data analysis processing in the mass spectrometry system of this Example.

[第1実施例]
本発明に係るデータ解析装置を用いたイメージング質量分析システムの一実施例について、添付図面を参照して説明する。
図1は本実施例のイメージング質量分析システムの概略構成図である。
このシステムは、光学顕微観察部11とイメージング質量分析部12を含む測定部1、データ解析部2、入力部3、及び表示部4、を含む。
[First Example]
An embodiment of an imaging mass spectrometric system using the data analysis apparatus according to the present invention will be described with reference to the accompanying drawings.
FIG. 1 is a schematic configuration diagram of the imaging mass spectrometry system of this embodiment.
This system includes a measuring unit 1 including an optical microscopic observation unit 11 and an imaging mass spectrometric unit 12, a data analysis unit 2, an input unit 3, and a display unit 4.

光学顕微観察部11は試料上の測定領域についての光学的な顕微観察画像を取得するものである。一方、イメージング質量分析部12は、同じ試料上の測定領域を細かく区分した微小領域(測定点)毎にそれぞれ所定の質量電荷比範囲に亘る質量分析を実施し、それぞれマススペクトルデータを収集するものである。 The optical microscopic observation unit 11 acquires an optical microscopic observation image of the measurement region on the sample. On the other hand, the imaging mass spectrometric unit 12 performs mass spectrometry over a predetermined mass-to-charge ratio range for each minute region (measurement point) in which the measurement region on the same sample is finely divided, and collects mass spectrum data for each. Is.

データ解析部2は、光学顕微観察部11で取得される光学顕微画像データ及びイメージング質量分析部12で取得されるマススペクトルデータを受け取るデータ入力部21と、受け付けられたデータを格納するデータ格納部22と、演算データ前処理部23と、第1多変量解析処理部24と、第2多変量解析処理部25と、解析結果表示処理部26と、を機能ブロックとして備える。
なお、一般に、データ解析部2の実体はパーソナルコンピュータ又はより高性能なコンピュータであるワークステーションであり、そのコンピュータにインストールされた専用の解析ソフトウェアを該コンピュータで実行することにより各部の機能が実現されるものとすることができる。
The data analysis unit 2 includes a data input unit 21 that receives optical microscopic image data acquired by the optical microscopic observation unit 11 and mass spectrum data acquired by the imaging mass analysis unit 12, and a data storage unit that stores the received data. 22, a calculation data preprocessing unit 23, a first multivariate analysis processing unit 24, a second multivariate analysis processing unit 25, and an analysis result display processing unit 26 are provided as functional blocks.
In general, the substance of the data analysis unit 2 is a personal computer or a workstation which is a higher-performance computer, and the functions of each unit are realized by executing the dedicated analysis software installed on the computer on the computer. Can be.

図2は本実施例のイメージング質量分析システムにおける特徴的なデータ解析処理の概念図、図3はそのデータ解析処理の手順を示すフローチャートである。
ここでは、多数の被検体(例えばマウス)の同じ生体組織(例えば肝臓)からそれぞれ切り出された切片を試料とする。この多数の試料は異なる被検体の同じ生体組織のほぼ同じ部位の切片である。被検体は癌を発症しているが、その癌の進行の程度(重症度)は様々であり、その重症度は予め数値化されて試料毎に既知であるものとする。
FIG. 2 is a conceptual diagram of a characteristic data analysis process in the imaging mass spectrometry system of this embodiment, and FIG. 3 is a flowchart showing a procedure of the data analysis process.
Here, a section cut out from the same biological tissue (for example, liver) of a large number of subjects (for example, mouse) is used as a sample. This large number of samples are sections of approximately the same site of the same biological tissue of different subjects. Although the subject has developed cancer, the degree of progression (severity) of the cancer varies, and the severity is quantified in advance and is known for each sample.

測定部1では、各試料についてそれぞれ、イメージング質量分析部12により、測定領域内の多数の測定点のマススペクトルデータ(これをMSイメージングデータという)を取得する。また、上記各試料とそれぞれ同じであるとみなせる試料(同じ被検体、同じ生体組織において連続した切片である試料)に対し特定のタンパク質についての蛍光標識を行ったうえで光学顕微観察部11で撮影を行い、蛍光画像データを取得する。データ入力部21はこうして取得された同じであるとみなせる試料についてのMSイメージングデータと蛍光画像データとをまとめ、さらに該試料の癌の重症度を示す情報を付加して、具体的には一つのデータファイルとしてデータ格納部22に格納する。したがって、データ格納部22には、試料の数(同じであるとみなせる二つの試料を一つとする)と同数のデータファイルが格納される。 The measurement unit 1 acquires mass spectrum data (this is referred to as MS imaging data) of a large number of measurement points in the measurement region by the imaging mass spectrometric analysis unit 12 for each sample. In addition, a sample that can be regarded as the same as each of the above samples (a sample that is the same subject and a continuous section in the same biological tissue) is fluorescently labeled with a specific protein and then photographed by the optical microscopic observation unit 11. To acquire fluorescent image data. The data input unit 21 summarizes the MS imaging data and the fluorescent image data of the sample that can be regarded as the same obtained in this way, and further adds information indicating the severity of the cancer of the sample, specifically one. It is stored in the data storage unit 22 as a data file. Therefore, the data storage unit 22 stores the same number of data files as the number of samples (two samples that can be regarded as the same are one).

上述したように複数の試料についてのMSイメージングデータ及び蛍光画像データがデータ格納部22に格納されている状態で、以下のようにして解析処理が実施される。
ユーザが入力部3から処理対象のデータ等を指示すると、データ解析部2において演算データ前処理部23は、データ格納部22から処理対象である一つの試料についてのMSイメージングデータ及び蛍光画像データを読み出す(ステップS1)。上述したようにそれらデータが一つのデータファイルに格納されている場合には、そのデータファイルを読み出せばよい。
As described above, the analysis process is performed as follows with the MS imaging data and the fluorescence image data of the plurality of samples stored in the data storage unit 22.
When the user instructs the data to be processed from the input unit 3, the arithmetic data preprocessing unit 23 in the data analysis unit 2 inputs the MS imaging data and the fluorescent image data of one sample to be processed from the data storage unit 22. Read (step S1). When those data are stored in one data file as described above, the data file may be read.

演算データ前処理部23は、予め設定されている条件に従って蛍光画像の各画素のデータを単純な画素値データに変換する。例えばヘマトキリシン・エオジン(HE)等による蛍光画像ではその蛍光色の強度値が画素値としてデータ化される。また、演算データ前処理部23は、必要に応じて、蛍光顕微画像上とMSイメージング画像上における同じ対象物の像の大きさ、向き、歪みなどを修正する位置合わせ処理と解像度を合わせる解像度調整処理を実行する(ステップS2)。 The calculation data preprocessing unit 23 converts the data of each pixel of the fluorescence image into simple pixel value data according to preset conditions. For example, in a fluorescent image using hematoquilicin / eosin (HE) or the like, the intensity value of the fluorescent color is converted into data as a pixel value. Further, the arithmetic data preprocessing unit 23 adjusts the resolution to match the resolution with the alignment process for correcting the size, orientation, distortion, etc. of the image of the same object on the fluorescence microscopic image and the MS imaging image, if necessary. The process is executed (step S2).

位置合わせ処理では、具体的には、例えば顕微画像を基準としてMSイメージング画像について拡大・縮小、回転、さらには、所定のアルゴリズムに従った変形を行うことで両画像における試料上での位置関係をおおむね一致させる。この位置合わせには例えば特許文献1に記載の手法を利用することができる。 In the alignment process, specifically, for example, the MS imaging image is enlarged / reduced, rotated, and further deformed according to a predetermined algorithm based on the microscopic image to obtain the positional relationship between the two images on the sample. Approximately match. For this alignment, for example, the method described in Patent Document 1 can be used.

また、光学顕微観察部11における撮像の解像度(位置分解能)は通常、撮像用カメラの解像度で決まるのに対し、MSイメージング画像の解像度はイオン化のために試料に照射されるレーザ光のスポット径によって決まる。そのため、MSイメージング画像の解像度は光学画像の解像度に比べて低いことが多い。そこで、後述する画像の多変量解析を行うために、両画像の解像度を揃える解像度調整処理を実施する。解像度を揃える簡単な方法は、解像度が高いほうの画像の解像度を落として低解像である画像に合わせる方法である。こうした方法としては例えばビニング処理が有用である。また、解像度が低いほうの画像の解像度を上げることで高解像である画像に合わせるようにしてもよい。そのためには、低解像の画像に対しアップサンプリング処理を行って画素数をみかけ上合わせたあとに、或る画素に隣接する又は近接する複数の画素値を利用した補間処理によって、アップサンプリングによって新たに挿入された画素の画素値を算出して埋めればよい。 Further, the resolution (positional resolution) of imaging in the optical microscopic observation unit 11 is usually determined by the resolution of the imaging camera, whereas the resolution of the MS imaging image is determined by the spot diameter of the laser beam irradiated to the sample for ionization. It is decided. Therefore, the resolution of the MS imaging image is often lower than the resolution of the optical image. Therefore, in order to perform multivariate analysis of images, which will be described later, a resolution adjustment process for aligning the resolutions of both images is performed. A simple method of aligning the resolutions is to reduce the resolution of the higher resolution image to match the lower resolution image. For example, a binning process is useful as such a method. Further, the resolution of the image having the lower resolution may be increased to match the image having a higher resolution. For that purpose, after upsampling a low-resolution image to apparently match the number of pixels, upsampling is performed by interpolation processing using a plurality of pixel values adjacent to or close to a certain pixel. The pixel value of the newly inserted pixel may be calculated and filled.

上述した位置合わせ処理及び解像度調整処理によって、蛍光画像から求めた輝度値分布の画像とMSイメージング画像との間で、2次元的に同じ位置にある画素同士を対応付けることができる。そのあと、第1多変量解析処理部24は、一つの試料についてのMSイメージングデータに基づいて作成された2次元行列を説明変数(X)、蛍光画像の画素値データに基づいて作成された1次元行列を被説明変数(Y)としてPLS回帰分析を実行する。2次元行列は、質量電荷比値を一つの方向、測定点(画素)の位置を上記一つの方向に直交する他の方向にとり、信号強度値を要素とする行列である。PLS回帰分析により、Y=Bpis・X+B0 で示される回帰モデルが作成される。ここで、Bpisは回帰係数である。回帰係数は質量電荷比毎に求まり、蛍光画像のパターン、つまりはタンパク質の空間分布と類似している質量電荷比又はその分布と反転した分布を示す質量電荷比では、回帰係数Bplsの絶対値が大きくなる。この回帰係数は1次元行列となる(ステップS3)。By the alignment processing and the resolution adjustment processing described above, it is possible to associate pixels at the same position two-dimensionally between the image of the brightness value distribution obtained from the fluorescence image and the MS imaging image. After that, the first multivariate analysis processing unit 24 created a two-dimensional matrix created based on the MS imaging data for one sample with the explanatory variable (X) and the pixel value data of the fluorescent image. PLS regression analysis is performed with the dimension matrix as the dependent variable (Y). The two-dimensional matrix is a matrix in which the mass-to-charge ratio value is taken in one direction and the position of the measurement point (pixel) is taken in the other direction orthogonal to the one direction, and the signal strength value is an element. The PLS regression analysis creates a regression model represented by Y = Bpis · X + B 0 . Here, Bpis is a regression coefficient. The regression coefficient is obtained for each mass-to-charge ratio, and the absolute value of the regression coefficient Bpls is the absolute value of the regression coefficient Bpls in the pattern of the fluorescent image, that is, the mass-to-charge ratio showing a mass-to-charge ratio similar to the spatial distribution of proteins or a distribution inverted from the distribution. growing. This regression coefficient becomes a one-dimensional matrix (step S3).

データ解析部2では、処理対象である全ての試料についてのデータ処理を実施したか否かを判定し(ステップS4)、未処理の試料があればステップS4からS1に戻る。したがって、ステップS1〜S4の処理を繰り返すことで、処理対象として指定された全ての試料についてのデータに基づく回帰係数行列が求まる。回帰係数行列の数は試料の総数と同数である。この回帰係数行列中の一つの回帰係数の値は、該当する質量電荷比におけるイオン強度の分布(つまりはその質量電荷比に対応する化合物の分布)と蛍光画像中で蛍光標識された化合物の分布の類似性を示している。したがって、一つの試料において蛍光標識された化合物の分布に類似した分布を示す化合物を調べたい場合には、ここまでの処理で十分である。 The data analysis unit 2 determines whether or not data processing has been performed on all the samples to be processed (step S4), and if there are unprocessed samples, the process returns from steps S4 to S1. Therefore, by repeating the processing of steps S1 to S4, a regression coefficient matrix based on the data for all the samples designated as the processing target can be obtained. The number of regression coefficient matrices is the same as the total number of samples. The value of one regression coefficient in this regression coefficient matrix is the distribution of ionic strength at the corresponding mass-to-charge ratio (that is, the distribution of compounds corresponding to that mass-to-charge ratio) and the distribution of fluorescently labeled compounds in the fluorescent image. Shows the similarity of. Therefore, when it is desired to investigate a compound having a distribution similar to that of a fluorescently labeled compound in one sample, the treatment up to this point is sufficient.

本実施例のイメージング質量分析システムでは、さらに、図2に示すように、第2多変量解析処理部25が、試料数と同数である回帰係数行列を説明変数(X)、各試料についての付随的な情報として与えられている癌の重症度を示す情報を被説明変数(Y)としたPLS回帰分析を実行する。癌の重症度は、或る時点での癌の重症の程度を表す指標値である。試料毎に重症度の情報が与えられているので、この重症度合いの行列は要素数が試料数と同数の1次元行列である。このPLS回帰分析ではステップS3の処理と同様に、その要素数が試料数と同数の1次元行列である回帰係数行列が得られる(ステップS5)。この回帰係数行列中の回帰係数は、重症度合いと蛍光画像の分布に類似した化合物との関係性の程度を示している。即ち、このときの回帰係数の絶対値が大きくなる質量電荷比に対応する化合物は、癌の重症度合いとの関連性が強いと推定される。 In the imaging mass analysis system of this embodiment, as shown in FIG. 2, the second multivariate analysis processing unit 25 further sets a regression coefficient matrix, which is the same number as the number of samples, as an explanatory variable (X), and accompanies each sample. PLS regression analysis is performed with the information indicating the severity of the cancer given as the specific information as the dependent variable (Y). The severity of cancer is an index value indicating the degree of severity of cancer at a certain point in time. Since the severity information is given for each sample, this severity matrix is a one-dimensional matrix having the same number of elements as the number of samples. In this PLS regression analysis, as in the process of step S3, a regression coefficient matrix having the same number of elements as the number of samples is obtained (step S5). The regression coefficients in this regression coefficient matrix indicate the degree of severity and the degree of association between compounds similar to the distribution of fluorescence images. That is, it is presumed that the compound corresponding to the mass-to-charge ratio in which the absolute value of the regression coefficient at this time becomes large is strongly related to the severity of cancer.

解析結果表示処理部26は、ステップS5で求まった回帰係数行列に基づいて、予め決められた適宜のグラフを作成し、これを表示部4の画面上に表示する(ステップS6、S7)。例えば、最も簡単なグラフとしては、ステップS5で求まった回帰係数行列に基づき、横軸を質量電荷比、縦軸を係数値(ただし正負の極性あり)としたマススペクトル様のグラフを作成するとよい。これにより、蛍光標識された化合物と類似した2次元分布を示す化合物の中で、癌の重症度と関連性の強い化合物(化合物に対応する質量電荷比)を一目で確認することができる。 The analysis result display processing unit 26 creates a predetermined appropriate graph based on the regression coefficient matrix obtained in step S5, and displays this on the screen of the display unit 4 (steps S6 and S7). For example, as the simplest graph, it is preferable to create a mass spectrum-like graph in which the horizontal axis is the mass-to-charge ratio and the vertical axis is the coefficient value (however, there are positive and negative polarities) based on the regression coefficient matrix obtained in step S5. .. As a result, among the compounds showing a two-dimensional distribution similar to the fluorescently labeled compound, the compound strongly related to the severity of cancer (mass-to-charge ratio corresponding to the compound) can be confirmed at a glance.

なお、上記処理では、蛍光画像を単純な画素値データに変換していたが、蛍光画像がカラー画像又は複数の波長成分を含む画像であっても、同様の処理が可能である。この場合には、一つの試料に対して蛍光画像は一つではなく、波長の数だけ蛍光画像が存在することになる。蛍光画像が一つのみの場合には、ステップS3におけるPLS回帰分析の被説明変数(Y)は一つ(1次元行列が一つ)のみであったが、蛍光画像が複数ある場合、ステップS3におけるPLS回帰分析の被説明変数(Y)が複数になる。したがって、このときのPLS回帰分析はPLS2アルゴリズムを用いればよい。 In the above processing, the fluorescence image is converted into simple pixel value data, but the same processing can be performed even if the fluorescence image is a color image or an image containing a plurality of wavelength components. In this case, there is not one fluorescent image for one sample, and there are as many fluorescent images as there are wavelengths. When there was only one fluorescent image, there was only one explained variable (Y) in the PLS regression analysis in step S3 (one one-dimensional matrix), but when there are multiple fluorescent images, step S3 There are a plurality of explained variables (Y) in the PLS regression analysis in. Therefore, the PLS regression analysis at this time may use the PLS2 algorithm.

このときに得られる回帰係数は図4(a)に示すような各波長における各質量電荷比の係数、つまりは2次元的な表形式のものとなる。そこで、これを図4(b)に示すように、質量電荷比と波長とを合わせた1次元の配列に並び替え、ステップS5において、試料の数だけ用意した1次元配列の係数行列を説明変数(X)、癌の重症度を示す情報を被説明変数(Y)としたPLS回帰分析を実行すればよい。
当然のことながら、こうして得られる回帰係数行列は、質量電荷比と波長との組に対する係数の行列である。
The regression coefficient obtained at this time is a coefficient of each mass-to-charge ratio at each wavelength as shown in FIG. 4A, that is, a two-dimensional tabular form. Therefore, as shown in FIG. 4B, this is rearranged into a one-dimensional array in which the mass-to-charge ratio and the wavelength are combined, and in step S5, the coefficient matrix of the one-dimensional array prepared for the number of samples is used as an explanatory variable. (X), PLS regression analysis may be performed with the information indicating the severity of cancer as the dependent variable (Y).
As a matter of course, the regression coefficient matrix thus obtained is a matrix of coefficients for the set of mass-to-charge ratio and wavelength.

また、上記例において、蛍光画像に代えて、試料中の特定の化合物の分布が可視化されるような別の測定手法による画像を用いてもよい。
例えば、特定の波長を有する光やX線などの電磁波の吸収の度合いや放射強度の分布を示すデータ、ラマン散乱光や蛍光などの強度分布を示すデータや染色画像データ、PET(陽電子放出断層撮影)、CT(コンピュータ断層撮影)、MRI(核磁気共鳴画像)、ESR(電子スピン共鳴)などにより撮影された画像データ、放射線同位体標識を利用した画像データ、EPMAやSPM(Scanning Probe Microscope)などで取得された表面凹凸画像データなどを2次元画像データとして用いることができる。
Further, in the above example, instead of the fluorescence image, an image obtained by another measurement method such that the distribution of a specific compound in the sample can be visualized may be used.
For example, data showing the degree of absorption of electromagnetic waves such as light having a specific wavelength and X-rays and distribution of radiation intensity, data showing intensity distribution such as Raman scattered light and fluorescence, stained image data, PET (positron emission tomography). ), CT (computer tomography), MRI (magnetic resonance imaging), ESR (electron spin resonance), etc., image data using radioisotope labeling, EPMA, SPM (Scanning Probe Microscope), etc. The surface unevenness image data acquired in the above can be used as the two-dimensional image data.

[第2実施例]
第1実施例では、複数の試料からそれぞれ得られたMSイメージングデータ(測定領域内の複数の測定点それぞれで得られたマススペクトルデータ)について多変量解析を行っていたが、一つの試料から一つのマススペクトルデータが得られる場合にも本発明を適用することができる。この実施例による質量分析システムの概略構成図を図5に示す。このシステムは、イメージング質量分析部100、データ解析部200、入力部300、及び表示部400、を含み、データ解析部200は、イメージング質量分析部100で得られたマススペクトルデータを受け取るデータ入力部201と、受け付けられたデータを格納するデータ格納部202と、平均マススペクトル算出部203と、第1多変量解析処理部204と、第2多変量解析処理部205と、解析結果表示処理部206と、を機能ブロックとして備える。
[Second Example]
In the first embodiment, multivariate analysis was performed on MS imaging data (mass spectrum data obtained at each of a plurality of measurement points in a measurement region) obtained from a plurality of samples, but one from one sample. The present invention can also be applied when one mass spectrum data can be obtained. A schematic configuration diagram of the mass spectrometry system according to this embodiment is shown in FIG. This system includes an imaging mass analysis unit 100, a data analysis unit 200, an input unit 300, and a display unit 400, and the data analysis unit 200 is a data input unit that receives mass spectrum data obtained by the imaging mass analysis unit 100. 201, data storage unit 202 for storing received data, average mass spectrum calculation unit 203, first multivariate analysis processing unit 204, second multivariate analysis processing unit 205, and analysis result display processing unit 206. And are provided as functional blocks.

本実施例による質量分析システムにおける解析の例として、非アルコール性脂肪性肝炎と食事との関連について調べる場合の例について説明する。図6は本実施例の質量分析システムにおける特徴的なデータ解析処理の概念図である。 As an example of the analysis in the mass spectrometry system according to this example, an example of investigating the relationship between non-alcoholic steatohepatitis and diet will be described. FIG. 6 is a conceptual diagram of characteristic data analysis processing in the mass spectrometry system of this embodiment.

試料は、特別な餌(以下「特別餌」という)を与えることで非アルコール性脂肪性肝炎(NASH=Non Alcoholic SteatoHepatitis)を発症させたマウスの肝臓、及び、通常の餌(以下「通常餌」という)を与えたマウスの肝臓(コントロール試料)であり、それぞれ給餌期間が4週、8週、16週と3段階に異なる、合計6種類である。なお、経験的に特別餌の給餌期間が長いほどNASHの炎症の重症度は上がることが分かっているため、給餌期間4週、8週、16週をそれぞれ重症度:1、2、3と記すこととする。また、NASHを発症していない状態を重症度:0と記すこととする。 The samples are the liver of a mouse that has developed non-alcoholic steatohepatitis (NASH) by feeding a special diet (hereinafter referred to as "special diet"), and the normal diet (hereinafter "normal diet"). The livers (control samples) of the mice fed with (), and the feeding period is 4 weeks, 8 weeks, 16 weeks, respectively, and there are a total of 6 types. Since it is empirically known that the longer the feeding period of the special diet is, the more severe the inflammation of NASH is, the 4th, 8th, and 16th weeks of the feeding period are described as severity: 1, 2, and 3, respectively. I will do it. In addition, the state in which NASH has not developed is described as severity: 0.

上記6種類の試料についてそれぞれイメージング質量分析部100で質量分析を実行し、測定点毎にマススペクトルデータを取得する。データ解析部200において平均マススペクトル算出部203は、試料毎に、全ての測定点におけるマススペクトルデータの平均を計算することで平均マススペクトルを算出する。これにより、試料数と同数の平均マススペクトルが得られる。こうして得られた平均マススペクトルを構成するデータをPLS回帰分析の説明変数(X)とする。 Mass spectrometry is executed by the imaging mass spectrometer 100 for each of the above six types of samples, and mass spectrum data is acquired for each measurement point. In the data analysis unit 200, the average mass spectrum calculation unit 203 calculates the average mass spectrum by calculating the average of the mass spectrum data at all the measurement points for each sample. As a result, the same number of average mass spectra as the number of samples can be obtained. The data constituting the average mass spectrum thus obtained is used as an explanatory variable (X) for PLS regression analysis.

一方、重症度の進行に応じた化合量の変化のパターンを被説明変数(Y)とするが、化合物量がどのように変化するのか不明であるため、ここでは、次の5種類のパターンを想定する。
Y1=(1,2,3):重症度に比例して化合物量が増加又は減少
Y2=(1,2,1):給餌期間の途中で一時的に化合物量が増加又は減少
Y3=(1,0,0):給餌期間の初期にのみ化合物が存在する、又は給餌期間の初期にのみ化合物が存在しない
Y4=(0,1,0):給餌期間の途中にのみ化合物が存在する、又は給餌期間の途中にのみ化合物が存在しない
Y5=(0,0,1):給餌期間の末期にのみ化合物が存在する、又は給餌期間の末期にのみ化合物が存在しない
On the other hand, the pattern of change in the amount of compounding according to the progression of severity is set as the explained variable (Y), but since it is unclear how the amount of compound changes, the following five types of patterns are used here. Suppose.
Y1 = (1,2,3): Compound amount increases or decreases in proportion to severity Y2 = (1,2,1): Compound amount increases or decreases temporarily during the feeding period Y3 = (1) , 0,0): Compound is present only at the beginning of the feeding period, or compound is not present only at the beginning of the feeding period Y4 = (0,1,0): Compound is present only in the middle of the feeding period, or Compound is not present only in the middle of the feeding period Y5 = (0,0,1): Compound is present only at the end of the feeding period, or is not present only at the end of the feeding period.

複数の平均マススペクトル(X)に対してそれぞれY1〜Y5の特性値(Y)を設定し、PLS回帰のためのデータセットを作成する。そして第1多変量解析処理部204はこうして作成されたデータセット毎にPLS回帰分析を実行し、回帰係数Bplsを算出する。したがって、この回帰係数Bplsは、特性値毎で質量電荷比値毎に求まる。つまり、特性値毎に、質量電荷比毎の回帰係数を並べた1次元行列が求まる。ただし、この結果だけを見ても、特性値(Y1〜Y5)と各質量電荷比との全体像を把握することは難しい。 Characteristic values (Y) of Y1 to Y5 are set for each of a plurality of average mass spectra (X), and a data set for PLS regression is created. Then, the first multivariate analysis processing unit 204 executes PLS regression analysis for each data set thus created, and calculates the regression coefficient Bpls. Therefore, this regression coefficient Bpls can be obtained for each characteristic value and for each mass-to-charge ratio value. That is, a one-dimensional matrix in which the regression coefficients for each mass-to-charge ratio are arranged for each characteristic value can be obtained. However, it is difficult to grasp the overall picture of the characteristic values (Y1 to Y5) and each mass-to-charge ratio only by looking at this result.

そこで次に、第2多変量解析処理部205は、全ての特性値についての回帰係数行列を対象として主成分分析を実施する。よく知られているように、主成分分析を行うことで、解析結果としてスコアプロットとローディングプロットを求めることができる。この場合、スコアプロットでは、二つの主成分(通常は第1主成分及び第2主成分)を直交する軸とするグラフ上に、特性値Y1〜Y5が位置付けられる。また、ローディングプロットでは、同じく二つの主成分を直交する軸とするグラフ上に、各質量電荷比値が位置付けられる。解析結果表示処理部206はこうしたグラフを作成して表示部400の画面上に表示する。これにより、ユーザは、特性値と特徴的な質量電荷比値との関係を俯瞰的に把握することができる。 Therefore, next, the second multivariate analysis processing unit 205 performs principal component analysis on the regression coefficient matrix for all the characteristic values. As is well known, by performing principal component analysis, score plots and loading plots can be obtained as analysis results. In this case, in the score plot, the characteristic values Y1 to Y5 are positioned on the graph having the two principal components (usually the first principal component and the second principal component) as orthogonal axes. Further, in the loading plot, each mass-to-charge ratio value is positioned on a graph having two principal components as orthogonal axes. The analysis result display processing unit 206 creates such a graph and displays it on the screen of the display unit 400. As a result, the user can grasp the relationship between the characteristic value and the characteristic mass-to-charge ratio value from a bird's-eye view.

なお、上記実施例はいずれも本発明の一例にすぎず、上記記載した以外の点において、本発明の趣旨の範囲で適宜変形、修正、追加などを行っても本願特許請求の範囲に包含されることは明らかである。 It should be noted that all of the above examples are merely examples of the present invention, and in points other than those described above, even if appropriate modifications, modifications, additions, etc. are made within the scope of the present invention, they are included in the claims of the present application. It is clear that.

1…測定部
11…光学顕微観察部
12、100…イメージング質量分析部
2、200…データ解析部
21、201…データ入力部
22、202…データ格納部
23…演算データ前処理部
203…平均マススペクトル算出部
24、204…第1多変量解析処理部
25、205…第2多変量解析処理部
26、206…解析結果表示処理部
3、300…入力部
4、400…表示部
1 ... Measuring unit 11 ... Optical microscopic observation unit 12, 100 ... Imaging mass analysis unit 2, 200 ... Data analysis unit 21, 201 ... Data input unit 22, 202 ... Data storage unit 23 ... Calculation data preprocessing unit 203 ... Average mass Spectrum calculation units 24, 204 ... 1st multivariate analysis processing unit 25, 205 ... 2nd multivariate analysis processing unit 26, 206 ... Analysis result display processing unit 3, 300 ... Input unit 4, 400 ... Display unit

いま例えば第2のデータ群が一つのカラー画像をモノクロ化した光学顕微画像を構成する画像データ、つまりは測定点に対応する画素の画素値を示すデータ群である場合、第1の統計的解析処理部は、試料毎に、その試料における画素値データによる画像と、各質量電荷比の信号強度の分布を示す分布画像との類似性又は相違性を示す指標値を計算する。この第1の統計的解析処理部による所定の統計的解析処理は例えば、部分最小二乗回帰(PLS回帰)分析とするとよい。
Now, for example, when the second data group is image data constituting an optical microscopic image obtained by monochromeizing one color image, that is, a data group showing pixel values of pixels corresponding to measurement points, the first statistical analysis For each sample, the processing unit calculates an index value indicating the similarity or difference between the image based on the pixel value data in the sample and the distribution image showing the distribution of the signal intensity of each mass charge ratio. The predetermined statistical analysis processing by the first statistical analysis processing unit may be, for example, partial least squares regression (PLS regression) analysis.

Claims (7)

複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、該複数の試料についてそれぞれ前記所定の測定とは別の手法による測定を実行することで得られたデータを集約した第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
a)第1のデータ群を説明変数、第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
b)前記第1の統計的解析処理部で算出された複数の指標値を説明変数、前記複数の試料にそれぞれ関連する他の情報を被説明変数(目的変数)とする所定の統計的解析処理を実施し、前記指標値と前記他の情報との類似性又は相違性を示す複数の指標値を算出する第2の統計的解析処理部と、
c)前記第2の統計的解析処理部で算出された複数の指標値を用い、前記他の情報と前記第1のデータ群との関係、又は、前記他の情報と前記第2のデータ群との関係、を示すグラフを作成して表示する表示処理部と、
を備えることを特徴とするデータ解析装置。
A first data group in which data obtained for each predetermined parameter value is aggregated by performing predetermined measurements on a plurality of samples, and measurement by a method different from the predetermined measurement for each of the plurality of samples. This is a data analysis device that obtains information on the plurality of samples in general by an analysis process based on the second data group that aggregates the data obtained by executing the above.
a) Perform a predetermined statistical analysis process with the first data group as the explanatory variable and the second data group as the explained variable (objective variable), and show the similarity or difference of the data in both data groups. A first statistical analysis processing unit that calculates multiple index values,
b) Predetermined statistical analysis processing using a plurality of index values calculated by the first statistical analysis processing unit as explanatory variables and other information related to the plurality of samples as explained variables (objective variables). And a second statistical analysis processing unit that calculates a plurality of index values indicating the similarity or difference between the index value and the other information.
c) The relationship between the other information and the first data group, or the other information and the second data group, using a plurality of index values calculated by the second statistical analysis processing unit. A display processing unit that creates and displays a graph showing the relationship with
A data analysis device characterized by comprising.
請求項1に記載のデータ解析装置において、
前記第1のデータ群は、複数の試料についてそれぞれイメージング質量分析を行うことで得られた、2次元的な測定領域内の複数の測定点それぞれにおける、質量電荷比を前記所定のパラメータとしたマススペクトルデータであり、
前記第2のデータ群は、複数の試料についてそれぞれイメージング質量分析とは異なる測定手法で得られた、2次元的な測定領域内の所定の信号強度の分布を示す画像データであり、
前記第1の統計的解析処理部は、試料毎に、前記第2のデータ群による一つ又は複数の画像と、前記第1のデータ群による一つの質量電荷比における信号強度の分布画像との類似性又は相違性を示す指標値を算出することを特徴とするデータ解析装置。
In the data analysis apparatus according to claim 1,
The first data group is a mass obtained by performing imaging mass spectrometry on a plurality of samples, respectively, with the mass-to-charge ratio at each of the plurality of measurement points in the two-dimensional measurement region as the predetermined parameter. Spectral data
The second data group is image data showing a predetermined signal intensity distribution in a two-dimensional measurement region obtained by a measurement method different from imaging mass spectrometry for a plurality of samples.
The first statistical analysis processing unit includes one or a plurality of images from the second data group and a distribution image of signal intensity at one mass-to-charge ratio according to the first data group for each sample. A data analysis device characterized by calculating an index value indicating similarity or difference.
請求項2に記載のデータ解析装置であって、
前記第1の統計的解析処理部による所定の統計的解析処理は部分最小二乗回帰分析であることを特徴とするデータ解析装置。
The data analysis apparatus according to claim 2.
A data analysis apparatus characterized in that a predetermined statistical analysis process by the first statistical analysis processing unit is partial least squares regression analysis.
請求項2に記載のデータ解析装置であって、
前記第2の統計的解析処理部による所定の統計的解析処理は部分最小二乗回帰分析又は主成分回帰分析であることを特徴とするデータ解析装置。
The data analysis apparatus according to claim 2.
A data analysis apparatus characterized in that the predetermined statistical analysis processing by the second statistical analysis processing unit is partial least squares regression analysis or principal component regression analysis.
複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、該複数の試料についてそれぞれ前記所定の測定とは別の手法による測定を実行することで得られたデータ又は該複数の試料にそれぞれ関連する他の情報であるデータを集約した第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
a)第1のデータ群を説明変数、第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
b)前記第1の統計的解析処理部で算出された複数の指標値を、より低次元の情報に集約するための所定の統計的解析処理を実施する第2の統計的解析処理部と、
c)前記第2の統計的解析処理部による結果に基づき、前記第2のデータ群と前記第1のデータ群における各パラメータ値との関係を示すグラフを作成して表示する表示処理部と、
を備えることを特徴とするデータ解析装置。
A first data group in which data obtained for each predetermined parameter value is aggregated by executing a predetermined measurement for each of a plurality of samples, and a measurement by a method different from the predetermined measurement for each of the plurality of samples. Data analysis for obtaining information on the plurality of samples in general by analysis processing based on a second data group that aggregates the data obtained by executing the above or other information related to the plurality of samples. It ’s a device,
a) Perform a predetermined statistical analysis process with the first data group as the explanatory variable and the second data group as the explained variable (objective variable), and show the similarity or difference of the data in both data groups. A first statistical analysis processing unit that calculates multiple index values,
b) A second statistical analysis processing unit that performs a predetermined statistical analysis processing for aggregating a plurality of index values calculated by the first statistical analysis processing unit into lower-dimensional information.
c) A display processing unit that creates and displays a graph showing the relationship between the second data group and each parameter value in the first data group based on the result of the second statistical analysis processing unit.
A data analysis device characterized by comprising.
請求項5に記載のデータ解析装置であって、
前記第1の統計的解析処理部による所定の統計的解析処理は部分最小二乗回帰分析であることを特徴とするデータ解析装置。
The data analysis apparatus according to claim 5.
A data analysis apparatus characterized in that a predetermined statistical analysis process by the first statistical analysis processing unit is partial least squares regression analysis.
請求項5に記載のデータ解析装置であって、
前記第2の統計的解析処理部による所定の統計的解析処理は主成分分析、因子分析又はクラスター分析であることを特徴とするデータ解析装置。
The data analysis apparatus according to claim 5.
A data analysis apparatus characterized in that the predetermined statistical analysis processing by the second statistical analysis processing unit is principal component analysis, factor analysis or cluster analysis.
JP2019568538A 2018-02-05 2018-02-05 Data analyzer Active JP6908136B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/003757 WO2019150573A1 (en) 2018-02-05 2018-02-05 Data analysis device

Publications (2)

Publication Number Publication Date
JPWO2019150573A1 true JPWO2019150573A1 (en) 2020-10-22
JP6908136B2 JP6908136B2 (en) 2021-07-21

Family

ID=67479214

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019568538A Active JP6908136B2 (en) 2018-02-05 2018-02-05 Data analyzer

Country Status (2)

Country Link
JP (1) JP6908136B2 (en)
WO (1) WO2019150573A1 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11709156B2 (en) 2017-09-18 2023-07-25 Waters Technologies Corporation Use of vapor deposition coated flow paths for improved analytical analysis
US11709155B2 (en) 2017-09-18 2023-07-25 Waters Technologies Corporation Use of vapor deposition coated flow paths for improved chromatography of metal interacting analytes
JP7004073B2 (en) 2018-05-30 2022-01-21 株式会社島津製作所 Imaging data processing equipment
WO2021049011A1 (en) * 2019-09-13 2021-03-18 株式会社島津製作所 Analysis device
US11918936B2 (en) 2020-01-17 2024-03-05 Waters Technologies Corporation Performance and dynamic range for oligonucleotide bioanalysis through reduction of non specific binding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014175211A1 (en) * 2013-04-22 2014-10-30 株式会社島津製作所 Imaging mass spectrometry data processing method and imaging mass spectrometer
WO2017002226A1 (en) * 2015-07-01 2017-01-05 株式会社島津製作所 Data processing device
JP2017224283A (en) * 2016-06-09 2017-12-21 株式会社島津製作所 Big data analytical method and mass analytical system using the same

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014175211A1 (en) * 2013-04-22 2014-10-30 株式会社島津製作所 Imaging mass spectrometry data processing method and imaging mass spectrometer
WO2017002226A1 (en) * 2015-07-01 2017-01-05 株式会社島津製作所 Data processing device
JP2017224283A (en) * 2016-06-09 2017-12-21 株式会社島津製作所 Big data analytical method and mass analytical system using the same

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
新間秀一: "イメージング質量顕微鏡を用いたがんの不均一性の解析", 実験医学, vol. 36/2, JPN6018014059, 1 February 2018 (2018-02-01), pages 211 - 217, ISSN: 0004456243 *

Also Published As

Publication number Publication date
WO2019150573A1 (en) 2019-08-08
JP6908136B2 (en) 2021-07-21

Similar Documents

Publication Publication Date Title
JP6908136B2 (en) Data analyzer
JP6477878B2 (en) Data processing device
JP5971184B2 (en) Imaging mass spectrometry data processing method and imaging mass spectrometer
JP6927416B2 (en) Imaging data processing equipment and imaging data processing program
JP5246026B2 (en) Mass spectrometry data processor
JP2011191222A (en) Mass analysis data processing method and apparatus
US20120133671A1 (en) Method and System for Processing Mass Analysis Data
JP7004073B2 (en) Imaging data processing equipment
WO2019150575A1 (en) Imaging mass spectrometry data interpretation device
JP6179600B2 (en) Mass spectrometry data analyzer
JP6477833B2 (en) Data processing device
CN111587374B (en) Data processing device for imaging mass spectrometry
US11211235B2 (en) Imaging mass spectrometry data processing device
Guo Chemometrics and statistical analysis in raman spectroscopy-based biological investigations
DE102014224916A1 (en) Method for the computer-aided analysis of one or more tissue sections of the human or animal body
WO2019186998A1 (en) Data analysis device and data analysis system
WO2021095210A1 (en) Imaging analysis device and imaging data interpretation method
WO2019150574A1 (en) Imaging mass spectrometry device

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200302

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210614

R151 Written notification of patent or utility model registration

Ref document number: 6908136

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151