JP5088731B2 - 多変量解析装置及びコンピュータプログラム - Google Patents

多変量解析装置及びコンピュータプログラム Download PDF

Info

Publication number
JP5088731B2
JP5088731B2 JP2007235895A JP2007235895A JP5088731B2 JP 5088731 B2 JP5088731 B2 JP 5088731B2 JP 2007235895 A JP2007235895 A JP 2007235895A JP 2007235895 A JP2007235895 A JP 2007235895A JP 5088731 B2 JP5088731 B2 JP 5088731B2
Authority
JP
Japan
Prior art keywords
sample
variable
group
data
variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007235895A
Other languages
English (en)
Other versions
JP2009066088A (ja
Inventor
直 根本
一郎 安藤
正子 藤原
和紀 有福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jeol Resonance Inc
Original Assignee
Jeol Resonance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jeol Resonance Inc filed Critical Jeol Resonance Inc
Priority to JP2007235895A priority Critical patent/JP5088731B2/ja
Publication of JP2009066088A publication Critical patent/JP2009066088A/ja
Application granted granted Critical
Publication of JP5088731B2 publication Critical patent/JP5088731B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Magnetic Resonance Imaging Apparatus (AREA)

Description

本発明は、データの多変量解析を主とした各種分析を行うための装置及びコンピュータプログラムに関する。本発明は、広く様々な解析用途に適用可能であるが、その一例として、医学、創薬、食品又は生命科学などのための生命データの解析がある。
医学、創薬、食品又は生命科学などの研究を例にとると、例えば、フェノーム、メタボノーム、プロテオーム、トランスクリプトーム、ゲノムなどの種々の研究分野が存在する。研究分野により研究対象となるサンプルの種類及びサンプルから取得される生命データの種類(例えば、データの表す事象又はデータの構造など)は当然に異なる。サンプルから目的の生命データを最初に取得するための一次分析装置として、NMR(核磁気共鳴分析)装置、MS(質量分析)装置、DNAアレイ、MRI(磁気共鳴画像)装置などの種々のものがある。
NMR装置、MS装置及びDNAアレイでそれぞれ分析することによりNMRスペクトル、MSスペクトル、DNAスペクトルなど、サンプルに含まれる成分物質の異なる事象(核磁気共鳴、質量電荷比、DNAなど)に関するスペクトルデータが得られる。また、MRI装置を用いると、MRI画像と、CSI(ケミカル・シフト・イメージング)により得られるそのMR画像中の多数の部位(ボクセル)にそれぞれ対応する多数のCSIスペクトルデータ(NMRスペクトルデータの一種である)のセットが得られるが、MR画像とCSIスペクトルデータとではデータ構造が異なる(後者は多変量解析の対象となり得るが、後者は通常なり得ない)。
生命データを例えば統計数学の手法を用いて2次的に解析するための装置として、従来、特定の研究分野のための特定種類の生命データの解析に適するように構成されたものが知られている。例えば、特許文献1には、メタボノミクスのためのNMRスペクトルの多変量解析に適したデータ処理装置が開示されている。
従来、上述した各分野での研究の多くは、他分野での研究からは独立して行われ、そこでは、その分野独自の視点から特定種類の生命データが選択され、その特定種類の生命データついて、その分野独自の視点に基づく方法による解析と判断が行われる。
特開2006−337354号公報
研究分野、研究目的又は研究者が異なると、取り扱われる生命データの種類(事象又はデータ構造)が異なったり、解析方法や判断方法が異なったりする。また、研究者の違いによる判断のばらつきもある。各分野の研究では、他の研究分野での研究成果、他種類の生命データの解析結果、又は、他の解析方法による解析結果を、積極的に取り入れて活用するということはあまり行われていない。
しかし、フェノーム、メタボノーム、プロテオーム、トランスクリプトーム、ゲノムなどの異なる分野で研究対象とされる異なるレベルの生命現象は、生体内で独立して存在しているわけではなく、複雑な(そして、多くは未知の)因果関係で互いに結ばれている筈である。また、同一、類似又は関連するサンプルに関して、NMR装置、MS装置、DNAアレイ及びMRI装置などの異なる一次分析装置から得られた生命データの間に、何らかの(そして、多くは未知の)関連性が存在するであろう。
従って、もし、一人の研究者(又は一つの研究者グループ)が、複数の異なる分野の生命データ、又は複数の異なる種類の生命データを、総合的に又は相補的に解析することができたならば、より確度の高い新規なマーカが発見できたり、異分野の生命現象間又は異種類の生命データ間の未知の相関関係が解明されるなど、より有益で新規な研究成果が得られる可能性が高い。これを行うことは、取り扱うべきデータの種類が多く且つデータ数が膨大であるために、従来の解析装置では不可能である。
同様の問題は、生命データ以外の他の用途分野のデータの解析においても、存在するであろう。
従って、本発明の目的は、研究者が、異種類のデータを総合的に又は相補的に解析することを、支援することにある。
本発明の別の目的は、研究者が、得られた全ての情報(例えば、生命データの解析結果、解析対象の生命データとは別途に入手された付加的なデータ、その他関連する各種の知見など)から、着目の挙動の特徴や、異分野又は異種類の情報間の相関関係を視覚的に把握して、総合的な判断を下すことを、支援することにある。
本発明の一つの側面に従う多変量解析装置は、
サンプル群の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記対象データ群を記憶する対象データ記憶手段と、
前記対象データ群を用いて多変量解析を行う多変量解析手段と、前記対象データ群を用いて特徴抽出処理を行う特徴抽出手段とを有する計算・制御手段と、
前記多変量解析の結果と前記特徴抽出処理の結果をグラフィカル・ユーザ・インタフェース(以下、GUIと略称する)に可視的に表示する表示手段と
を備え、
前記計算・制御手段の前記多変量解析手段は、前記多変量解析によって判明した前記サンプル群の特性と前記複数の変数の特性とを表す複数の多変量解析チャートを生成し、
前記表示手段は、前記複数のチャートを前記GUI上に表示し、
前記計算・制御手段の前記特徴抽出手段は、前記サンプル群中の任意のサンプルサブ群又は前記複数の変数中の任意の変数を指定し、前記対象データ群に基づいて、前記指定されたサンプルサブ群に特徴的な変数、若しくは前記指定された変数に特徴的なサンプルサブ群、又は、前記対象データ記憶手段に他のサンプル群の対象データ群も記憶されている場合には前記他のサンプル群中で前記指定されたサンプルサブ群に関連するサンプルサブ群、を検出し、
前記表示手段は、前記指定されたサンプルサブ群又は前記指定された変数と、前記検出された特徴的な変数、若しくは前記検出された特徴的なサンプルサブ群、又は前記検出された関連するサンプルサブ群を、前記GUI上でハイライトして表示する。
本発明の多変量解析装置の一実施形態においては、
前記多変量解析手段が行う前記多変量解析には、主成分解析が含まれ、
前記GUI上に表示される前記複数の多変量解析チャートには、
A. 所定の主成分軸からなる座標空間にて、前記サンプル群のそれぞれのサンプルが、所定の主成分についてのスコアに応じた座標にプロットされたサンプル・プロット・チャート、
B. 所定の主成分軸からなる座標空間にて前記複数の変数が、所定の主成分についてのローディングに応じた座標にプロットされた変数プロット・チャート、
C. 前記複数の変数の所定の主成分ついての寄与率が図示された寄与率チャート、及び
D. 前記複数の変数の所定の主成分についてのローディングの和が図示されたローディング・チャート、
のうちの少なくとも二つが含まれ、
前記表示手段は、前記指定されたサンプルサブ群又は前記検出された関連するサンプルサブ群を、前記サンプル・プロット・チャート上でハイライトして表示し、前記検出されたマーカ変数を、前記変数プロット・チャート、前記寄与率チャート、及び前記ローディング・チャートの内の少なくとも一つのチャート上でハイライトして表示する。
本発明の多変量解析装置の一実施形態においては、前記計算・制御手段の前記特徴抽出手段は、
前記サンプル群中から任意のサンプルサブ群を指定するサンプル指定手段と、
前記対象データ群がもつ前記変数の値に基づいて、前記指定されたサンプルサブ群に共通する1以上の特徴的な変数を、前記複数の変数中からマーカ変数として検出するマーカ変数検出手段と、
を有し、
前記表示手段は、前記指定されたサンプルサブ群と前記検出されたマーカ変数とを前記GUI上でハイライトして表示する。
上記実施形態においては、さらに、前記マーカ変数検出手段は、前記サンプル群の対象データ群全体での各変数の値の分布を求め、求められた前記対象データ群全体での各変数の値の分布と、前記指定されたサンプルサブ群の対象データがもつ各変数の値とに基づいて、前記指定されたサンプルサブ群に共通する1以上の特徴的な変数を検出する。
上記実施形態においては、またさらに、前記多変量解析手段が行う前記多変量解析には、主成分解析が含まれ、前記マーカ変数検出手段は、前記検出されたマーカ変数に対して、前記主成分解析で得られた寄与率に基づいたフィルタリングを行なって、より確度の高いマーカ変数に絞り込む。
本発明の多変量解析装置の一実施形態においては、
前記計算・制御手段の前記特徴抽出手段は、
前記複数の変数中から任意の変数をマーカ変数として指定するマーカ変数指定手段と、
前記サンプル群の対象データ群がもつ各変数の値に基づいて、前記指定されたマーカ変数に共通する1以上の特徴的なサンプルサブ群を検出する特徴サンプル検出手段と
を有し、
前記表示手段は、前記指定されたマーカ変数と前記検出された特徴的なサンプルサブ群とを前記GUI上でハイライトして表示する。
上記実施形態においては、さらに、前記特徴サンプル検出手段は、前記対象データ群全体での前記指定されたマーカ変数の各々の値の分布を求め、求まった前記対象データ群全体での前記指定されたマーカ変数の各々の値の分布と、各サンプルの対象データがもつ前記指定されたマーカ変数の各々の値とに基づいて、前記特徴的なサンプルサブ群を検出する。
上記実施形態においては、またさらに、前記多変量解析手段が行う前記多変量解析には、主成分解析が含まれ、前記特徴サンプル検出手段は、前記指定されたマーカ変数に対して、前記主成分解析で得られた寄与率に基づいたフィルタリングを行なって、より確度の高いマーカ変数に絞り込む。
本発明の多変量解析装置の一実施形態においては、
前記サンプル群の1種類以上の付加データ群を記憶する付加データ記憶手段をさらに備え、
前記計算・制御手段の前記特徴抽出手段は、
前記1種類以上の付加データ群中から任意の種類の付加データ群を指定する付加データ指定手段と、
前記指定された種類の付加データ群の値に基づいて、前記指定された種類の付加データ群に共通する1以上の特徴的なサンプルサブ群を、前記サンプル群中から検出する特徴サンプル検出手段と、
前記対象データ群がもつ各変数の値に基づいて、前記検出された特徴的なサンプルサブ群に共通する1以上の特徴的な変数を、前記複数の変数中からマーカ変数として検出するマーカ変数検出手段と、
を有し、
前記表示手段は、前記検出された特徴的なサンプルサブ群と前記検出されたマーカ変数とを前記GUI上でハイライトして表示する。
上記実施形態においては、さらに、
前記特徴サンプル検出手段は、前記指定された種類の付加データ群全体での前記付加データの値の分布を求め、求まった前記付加データ群全体での前記付加データの値の分布と、各サンプルの付加データがもつ値とに基づいて、前記特徴的なサンプルサブ群を検出し、
前記マーカ変数検出手段は、前記対象データ群全体での各変数の値の分布を求め、求められた前記対象データ群全体での各変数の値の分布と、前記検出された特徴的なサンプルサブ群の対象データがもつ各変数の値とに基づいて、前記指定されたサンプルサブ群に共通する1以上の特徴的な変数を検出する。
本発明の多変量解析装置の一実施形態においては、
前記サンプル群の1種類以上の付加データ群を記憶する付加データ記憶手段をさらに備え、
前記計算・制御手段の前記多変量解析手段は、前記多変量解析として少なくとも主成分解析を行い、前記主成分解析の結果に基づいて、所定の1以上の主成分軸からなる座標空間にて、前記サンプル群のそれぞれのサンプルが、所定の主成分についてのスコアに応じた座標にプロットされたサンプル・プロット・チャートを、前記多変量解析チャートの一つとして作成し、
前記表示手段は、前記サンプル・プロット・チャートを前記GUI上に表示し、
前記計算・制御手段の前記特徴抽出手段は、
前記所定の1以上の主成分軸中から任意の主成分軸を指定し、且つ、前記1種類以上の付加データ群中から任意の種類の付加データ群を指定する付加データ指定手段と、
前記主成分解析の結果と前記指定された種類の付加データ群の値とに基づいて、前記サンプル・プロット・チャート中の前記指定された主成分軸を前記指定された種類の付加データ群の値に対応する座標軸に置換してなる置換サンプル・プロット・チャートを作成する主成分軸置換手段と
を有し、
前記表示手段は、前記置換サンプル・プロット・チャートを前記GUI上に表示する。
本発明の多変量解析装置の一実施形態においては、
前記対象データ記憶手段は、
第1のサンプル群の第1の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記第1の対象データ群と、
第2のサンプル群の第2の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記第2の対象データ群と
を記憶し、前記第1と第2のサンプル群間で互いに共通性のあるサンプル同士を関連づけており、
前記計算・制御手段の前記多変量解析手段は、前記第1の対象データ群を用いた第1の多変量解析と前記第2の対象データ群を用いた第2の多変量解析とを行ない、前記第1の多変量解析の結果を示す1以上の第1のチャートと、前記第2の多変量解析の結果を示す1以上の第2のチャートとを作成し、
前記表示手段は、前記第1のチャートと前記第2のチャートとを前記GUI上に表示し、
前記計算・制御手段の前記特徴抽出手段は、
前記第1のサンプル群中から任意の第1のサンプルサブ群を指定するサンプル指定手段と、
前記第1と第2のサンプル群間の関連付けに基づいて、前記指定された第1のサンプルサブ群に共通性のある第2のサンプルサブ群を、前記第2のサンプル群中から検索する関連サンプル検索手段と、
を有し、
前記表示手段は、前記指定された第1のサンプルサブ群と前記検出された第2のサンプルサブ群とを前記GUI上でハイライトして表示する。
上記実施形態においては、さらに、
前記計算・制御手段の前記特徴抽出手段は、
前記第1の対象データ群がもつ各変数の値に基づいて、前記指定された第1のサンプルサブ群に共通する1以上の特徴的な変数を、前記第1の対象データ群がもつ前記複数の変数中から、第1のマーカ変数として検出する第1のマーカ変数検出手段と、
前記第2の対象データ群がもつ各変数の値に基づいて、前記検索された第2のサンプルサブ群に共通する1以上の特徴的な変数を、前記第2の対象データ群がもつ前記複数の変数中から、第2のマーカ変数として検出する第2のマーカ変数検出手段と
をさらに備え、
前記表示手段は、前記検出された第1と第2のマーカ変数を前記GUI上でハイライトして表示する。
本発明の多変量解析装置の一実施形態においては、
前記対象データ記憶手段は、
第1のサンプル群の第1の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記第1の対象データ群と、
第2のサンプル群の第2の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記第2の対象データ群と
を記憶し、前記第1と第2のサンプル群間で互いに共通性のあるサンプル同士を関連づけており、
前記計算・制御手段の前記多変量解析手段は、前記第1の対象データ群を用いた第1の多変量解析と前記第2の対象データ群を用いた第2の多変量解析とを行ない、前記第1の多変量解析の結果を示す1以上の第1のチャートと、前記第2の多変量解析の結果を示す1以上の第2のチャートとを作成し、
前記表示手段は、前記第1のチャートと前記第2のチャートとを前記GUI上に表示し、
前記計算・制御手段の前記特徴抽出手段は、
前記第1の対象データ群がもつ前記複数の変数中から任意の変数をマーカ変数として指定するマーカ変数指定手段と、
前記第1の対象データ群がもつ各変数の値に基づいて、前記指定されたマーカ変数に共通する1以上の特徴的な第1のサンプルサブ群を、前記第1のサンプル群中から検出する特徴サンプル検出手段と、
前記第1と第2のサンプル群間の関連付けに基づいて、前記検出された第1のサンプルサブ群に共通性のある第2のサンプルサブ群を、前記第2のサンプル群中から検索する関連サンプル検索手段と、
を有し、
前記表示手段は、前記指定されたマーカ変数と前記検出された第1の特徴的なサンプルサブ群と前記検索された第2の特徴的なサンプルサブ群とを前記GUI上でハイライトして表示する。
上記実施形態においては、さらに、
前記計算・制御手段の前記特徴抽出手段は、
前記第2の対象データ群がもつ各変数の値に基づいて、前記検索された第2のサンプルサブ群に共通する1以上の特徴的な変数を、前記第2の対象データ群がもつ前記複数の変数中から、関連マーカ変数として検出する第2のマーカ変数検出手段と
をさらに備え、
前記表示手段は、前記指定されたマーカ変数と前記検出された第1の特徴的なサンプルサブ群と前記検索された第2の特徴的なサンプルサブ群だけでなく、前記検出された関連マーカ変数も、前記GUI上でハイライトして表示する。
本発明の多変量解析装置の一実施形態においては、前記サンプル群のそれぞれのサンプルに関連付けられた複数のデータ部分を有する別構造データを記憶した別構造データ記憶手段を更に備え、
前記計算・制御手段は、前記別構造データを図示した別構造データ・チャートを作成する手段をさらに有し、
前記表示手段は、前記複数の多変量解析チャートだけでなく前記別構造データ・チャートも前記GUI上に表示し、
前記計算・制御手段の前記特徴抽出手段は、
前記別構造データの前記複数のデータ部分中から任意のデータ部分を指定するデータ部分指定手段と、
前記サンプル群中から、前記指定されたデータ部分に関連付けられたサンプルサブ群を検出する関連サンプル検出手段と、
前記対象データ群がもつ各変数の値に基づいて、前記検出されたサンプルサブ群に共通する1以上の特徴的な変数を、前記複数の変数中からマーカ変数として検出するマーカ変数検出手段と、
を有し、
前記表示手段は、前記指定されたデータ部分と前記検出されたサンプルサブ群と前記検索されたマーカ変数とを前記GUI上でハイライトして表示する。
本発明の多変量解析装置の一実施形態においては、
前記サンプル群のそれぞれのサンプルに関連付けられた複数のデータ部分を有する別構造データを記憶した別構造データ記憶手段を更に備え、
前記計算・制御手段は、前記別構造データを図示した別構造データ・チャートを作成する手段をさらに有し、
前記表示手段は、前記複数の多変量解析チャートだけでなく前記別構造データ・チャートも前記GUI上に表示し、
前記計算・制御手段の前記特徴抽出手段は、
前記サンプル群中から任意のサンプルサブ群を指定するサンプル指定手段と、
前記別構造データの前記複数のデータ部分中から、前記指定されたサンプルサブ群に関連付けられたデータ部分を検出する関連データ部分検出手段と、
前記対象データ群がもつ各変数の値に基づいて、前記指定されたサンプルサブ群に共通する1以上の特徴的な変数を、前記複数の変数中からマーカ変数として検出するマーカ変数検出手段と、
を有し、
前記表示手段は、前記指定されたサンプルサブ群と前記検出されたデータ部分と前記検索されたマーカ変数とを前記GUI上でハイライトして表示する。
本発明の多変量解析装置の一実施形態においては、
前記サンプル群のそれぞれのサンプルに関連付けられた複数のデータ部分を有する別構造データを記憶した別構造データ記憶手段を更に備え、
前記計算・制御手段は、前記別構造データを図示した別構造データ・チャートを作成する手段をさらに有し、
前記表示手段は、前記複数の多変量解析チャートだけでなく前記別構造データ・チャートも前記GUI上に表示し、
前記計算・制御手段の前記特徴抽出手段は、
前記複数の変数中から、任意の変数をマーカ変数として指定するマーカ変数指定手段と、
前記対象データ群がもつ各変数の値に基づいて、前記指定されたマーカ変数に共通する1以上の特徴的なサンプルサブ群を、前記サンプル群中から検出する特徴サンプル検出手段と、
前記別構造データの前記複数のデータ部分中から、前記検出された特徴的なサンプルサブ群に関連付けられたデータ部分を検出する関連データ部分検出手段と、
を有し、
前記表示手段は、前記指定されたマーカ変数と前記検出された特徴的なサンプルサブ群と前記検出されたデータ部分とを前記GUI上でハイライトして表示する。
本発明はまた、コンピュータを上述の多変量解析装置として機能させるためのコンピュータプログラムも提供する。
本発明によれば、研究者にとり、異種類の事象又は次元のデータを総合的に又は相補的に解析することが容易になる。
以下、図面を参照して、本発明の一実施形態にかかる多変量解析装置について説明する。
図1は、本実施形態に係る多変量解析装置の全体的な処理の流れを示す。
本実施形態に係る多変量解析装置は、その機能の少なくとも一部は典型的には図1に示す処理をコンピュータに行わせるためのコンピュータプログラムがインストールされたコンピュータによって実現される。しかし、変形例として、本発明の多変量解析装置の少なくとも一部の機能が、専用のワーヤードロジック回路によって実現されてもよい、
図1に示すように、本実施形態に係る多変量解析装置は、元データ入力処理100、元データ処理102、多変量解析処理104及び特徴抽出処理106を行うことができる。
元データ入力処理100では、外部の任意の1以上の種類のセンシング装置(例えば、生命データの場合であれば、NMR分析装置、MS装置、DNAアレイ、MRI装置、X線CT撮影装置、又は各種の生化学検査装置など)を用いて取得された、多数のサンプルについての元データが、この多変量解析装置に入力される。
元データ処理102では、入力された各サンプルの元データに基づいて、その元データが表す実態をユーザに視覚的に確認させるためのデータ(以下、「実態データ」という)と、多変量解析の直接の対象となるデータ(以下、「対象データ」という)とが生成される。実態データは、例えば、NMRスペクトルデータ、MSスペクトルデータ、DNAスペクトルデータ、MRI画像データ、X線CT画像データなどであり、他方、対象データは、例えば、上記各種のスペクトルデータを縮約することで得られる所定個数の変数値からなるヒストグラムデータである。各サンプルの実態データと対象データは、この多変量解析装置に記憶される。
元データ処理102の具体的な処理としては、公知のものが使用できる。例えば、元データが、NMR装置から得られたFID(自由誘導減衰)データである場合、例えば、フーリエ変換によりFIDデータを所定形式の実態データとしてのNMRスペクトルデータに変換する処理、及び、バケット積分によりNMRスペクトルデータを所定形式の対象データとしてのNMRヒストグラムデータに縮約する処理などがある。また、例えば、元データがMS装置又はDNAアレイ装置から得られたスペクトルデータである場合、そのスペクトルデータを所定形式の実態データとしてのスペクトルデータに変換する処理、そのスペクトルデータを所定形式の対象データとしてのヒストグラムデータに縮約する処理などがある。また、例えば、元データがMRI装置から得られたMRI画像及びそのMRI画像中の多数のボクセルにそれぞれ対応する多数のCSIスペクトルデータ(NMRスペクトルデータ)のセットである場合、そのMRI画像を所定形式の実態データとしてのMRI画像に変換する処理、及びボクセル毎のCSIスペクトルデータを、バケット積分により所定形式の対象データとしてのCSIヒストグラムデータに変換する処理などがある。
多変量解析処理104では、データ処理102で得られた多数のサンプル(サンプル群)の対象データ群(ヒストグラムデータ群)を用いて多変量解析が行われ、その解析結果がこのディスプレイスクリーンに表示される。多変量解析の具体的な手法としては、PCA(主成分)解析やSIMCA解析など公知のものが使用できる。例えば、後に具体的に説明するように、主成分解析を行ない、その解析結果に基づいて、サンプル・プロット・チャート、変数プロット・チャート、寄与率チャート、ローディング・チャート、及びスペクトル・チャートなどを作成し、それらをこの多変量解析装置のディスプレイスクリーンに表示するという作業を行うことができる。
特徴抽出処理106では、多変量解析処理104で得られた解析結果に基づいて、特徴抽出分析が行われる。この特徴抽出処理106は、後に詳細に説明する。
本実施形態では、上述した処理100〜106の全てを、一つのコンピュータプログラムが行う。とりわけ、元データ処理102と多変量解析処理104とを一つのコンピュータプログラムが行うことにより、多変量解析処理104による多変量解析結果と、元データ処理102により記憶された実態データ(例えば、上述した各種のスペクトルデータやMRI画像データなど)との間にリンクを設定することができ、それにより、例えば、PCA解析を行った場合、その結果として表示されたサンプル・プロット・チャート上の或るサンプルをユーザが指定することで、そのサンプルの実態データ(例えば、NMRスペクトルデータ)を読み出して、その実態データの画像(例えば、スペクトル・チャート)をサンプル・プロット・チャートと一緒に表示するというように、ユーザは、同じディスプレイスクリーン上で、多変量解析結果と同時にその解析結果に関連する所望のサンプルの実態データ(つまり、そのサンプルの元データの実質内容)を視覚で確認することができる。
従って、本実施形態に従う多変量解析装置は、「混合物系」サンプルの解析の全般に適しており、例えば、代謝物診断、毒性予測、マーカー検索創薬、コンビケム、食品、ポリマーなどの種々の分野・市場で利用可能である。さらに、それ以外の解析目的にも、本実施形態に従う多変量解析装置は、適用可能である。
以下では、医学や生命科学等の研究分野における生命データの解析に使用される場合を例に挙げて、本実施形態に従う多変量解析装置の構成と機能について、より詳細に説明する。
この多変量解析装置がもつ基本機能は、次のとおりである。すなわち、この多変量解析装置は、任意の種類の生命データを入力することができ、入力された生命データに関して、多変量解析を主たるツールとして用いて複数種類の特徴抽出分析(図1の特徴抽出処理106)を行うことができる。その複数種類の特徴分析抽出には、
(1) 1事象のデータの解析結果に基づく特徴変数及び相関の検出、
(2) 複数事象のデータの解析結果に基づく特徴変数及び相関の検出、及び
(3) 異構造のデータの解析結果に基づく特徴変数及び相関の検出
がある。
図1に示した参照番号100〜106の全ての処理に対するユーザによる操作及びユーザへの表示は、1つのディスプレイスクリーン上に表示された1つのユーザーインターフェイスを用いて実現される。
図2は、この多変量解析装置の基本的な構成を示す。
図2に示すように、この多変量解析装置110は、計算・制御モジュール112と表示モジュール114を有する。計算・制御モジュール112は、図1に示したような処理を行う。表示モジュール114は、グラフィカルなユーザインタフェースを作成してそれをディスプレイスクリーンに表示し、計算・制御モジュール112の処理結果を、そのユーザインタフェース上に表示する。計算・制御モジュール112は、表示されたグラフィカルなユーザインタフェースに対するマウスやキーボードによるユーザの操作によって入力される要求115に応答して、要求され処理を行う。
計算・制御モジュール112は、図1に示された元データ入力処理100及び元データ処理102を行ったとき、それらの処理で得られた各種の実態データ(例えば、NMRスペクトルデータ、MSスペクトルデータ、DNAスペクトルデータ、CSIスペクトルデータ、及びMRI画像データ等)116、118を、多変量で解析装置110内の記憶装置に保存する。図2には、2種類の実態データ116、118が示されているが、その一方の種類の実態データ116は、所定の標準的なデータ構造(例えば、スペクトルデータという構造)をもつもの(例えば、NMRスペクトルデータ、MSスペクトルデータ、DNAスペクトルデータ、CSIスペクトルデータなど)を指し、他方の種類の実態データ118は、それ以外のデータ構造をもつもの(例えば、MRI画像データ、X線CT画像データなど)を指している。この実施形態では、一つの例示として、1サンプルの1事象の実態データが、1ファイル(図2において、参照番号116又は118が付された1つのブロック)として管理される。例えば、NMR装置で1サンプルを検査して得られたMNRスペクトルデータが、1ファイルとして管理される。
さらに、計算・制御モジュール112は、図1に示された元データ処理102を行ったとき、1以上の解析テーブル120を作成し、多変量解析装置110内の記憶装置に保存する。この実施形態では、一つの例示として、1事象について1つの解析テーブル120が作成される。例えば、NMRについて1つの解析テーブル120が作成され、MSについて別の一つの解析テーブル120が作成される。各解析テーブル120には、対応する1つの事象に関する対象データ群が登録されている。計算・制御モジュール112は、解析テーブル120を用いて、その基本的な解析動作を行なう。
図2中で点線矢印で示すように、各解析テーブル120に登録された個々の対象データと、それに対応する個々の実態データ116又は118とは、各解析テーブル120内に記述されるリンク情報(例えば、フォルダ名やファイル名などのディレクトリ名、或いは、識別符号のようなキーワードなど)により関連づけられている。計算・制御モジュール112は、或る解析テーブル120にアクセスしているとき、その解析テーブル120に登録された個々の対象データのリンク情報を用いて、個々の対象データに対応する個々の実態データ116又は118にアクセスすることができる。
また、複数の解析テーブル120間において、共通性のあるサンプル(例えば、同じサンプル、又は同じサンプルソースから得られた異なるサンプル(例えば同じ人間から得られた血液サンプルと尿サンプル))の対象データ同士も、それぞれに同じキーワードを割り当てることによって、相互に関連づけられている。計算・制御モジュール112は、複数の解析テーブル120にアクセスしているとき、同じキーワードが付された対象データをそれぞれの解析テーブル120から検索することで、互いに共通性のあるサンプルの対象データを見つけ出すことができる。
計算・制御モジュール112は、ユーザインタフェースからの要求115に応答して、要求された事象の解析テーブル120に記述された対象データ群を用いて、図1に示された多変量解析処理104と特徴抽出処理106を行ことができる。表示モジュール114は、計算・制御モジュール112による多変量解析処理104の結果(例えば、サンプル・プロット・チャート、変数プロット・チャート、スペクトル・チャート、寄与率チャート及びローディング・チャートなど)及び特徴抽出処理106の結果(例えば、特徴変数や相関)を、ディスプレイスクリーン上に視覚的に表示する。
図3は、解析テーブル120のフォーマットを示す。
図3に示された解析テーブル120において、インデックス・コメント欄122には、この解析テーブル120に登録されたデータ群についてのモデル名称や任意コメントが記載される。
データ処理条件欄124には、多変量解析の対象となる及び解析の対象外となる変数の範囲(例えば、NMRヒストグラムの場合のケミカルシフトの範囲)などの解析条件が記述される。
データ解析条件欄126では、「PCA」フィールドにPCA解析におけるモデル次数、「SIMCA」フィールドにSIMCA解析におけるモデル次数、「X」フィールドにX軸に表示するPC(主成分)軸の次数、「Y」フィールドにY軸に表示するPC軸の次数、「Mean_centering」フィールドにミーン・センタリング処理の有無、及び「Auto_scaling」フィールドにオート・スケーリング処理の有無が記述される。
データ・サイズ欄128では、「Sample」フィールドに、この解析テーブル120に登録されたサンプル(対象データ)の総数、「Variable」欄に、対象データ群がもつ変数の総数が記述される。
データ・スケール欄130には、この解析テーブル120に登録された対象データ群がもつ各変数のスケール(バケット積分のバケットの範囲)が記述される。
実態データ・ファイル欄132には、この解析テーブル120に登録された各対象データに対応する実態データのディレクトリ(保存先のフォルダー名とファイル名)が記述される。
プロット・タイプ欄134には、ディスプレイスクリーン(例えば、PCA解析結果のサンプル・プロット・チャート)上に各サンプル(対象データ)のマーク(ドット)を表示するときのそのマークの形状が記述され、プロット・カラー欄136には、そのマークの表示カラーが記述される。
キーワード欄138には、この解析テーブル120に登録された各サンプル(対象データ)を識別するためのキーワードが記述される。
付加データ欄140には、この解析テーブル120に登録された各サンプル(対象データ)に関する付加データ(例えば、別途に入手されたそのサンプルについての各種の生化学データ(体重、血圧など))が記述される。
プロット・ステータス欄142には、この解析テーブル120に登録された各サンプル(対象データ)の状態(例えば、「0」は通常、「1」は削除を意味する)が記述される。
対象データ欄144には、この解析テーブル120に登録された対象データ(変数値の列であるヒストグラムデータ)が記述される。図3では、1行が1サンプルの対象データに対応する。
次に、この多変量解析装置110がディスプレイスクリーンに表示するグラフィカルなユーザインタフェース(GUI)の構成について説明する。
前述したように、この多変量解析装置110が行う複数種類の特徴分析抽出には、
(1) 1事象のデータの解析結果に基づく特徴変数及び相関の検出、
(2) 複数事象のデータの解析結果に基づく特徴変数及び相関の検出、及び
(3) 異構造のデータの解析結果に基づく特徴変数及び相関の検出
がある。
図4は、「1事象のデータの解析結果に基づく特徴変数及び相関の検出」を行う場合のGUIの例を示し、図5は、「複数事象のデータの解析結果に基づく特徴変数及び相関の検出」を行う場合のGUIの例を示し、図6は、「異構造のデータの解析結果に基づく特徴変数及び相関の検出」を行う場合のGUIの例を示す。いずれの例も、変量解析としてPCA解析を行った場合である。
図4〜図6に示すように、どの場合にも、GUIは複数のウィンドウを有している。どの場合にも表示される共通のウィンドウは、ユーザがこの多変量解析装置110に対して要求を入力するためのコントロールパネル150である。その他のウィンドウには、以下に具体的に説明するように、多変量解析によって判明したサンプル群の特性(例えば、PCA解析を行った場合、それぞれのサンプルのそれぞれのPC(主成分)に対するスコア)及び変数の特性(例えば、PCA解析を行った場合、それぞれ変数のそれぞれのPC(主成分)に対するろーーディング及び寄与率)をそれぞれ図示したチャートや、特定のサンプルのスペクトルを図示したチャートなどが表示される。これらのチャートはいずれも、図2に示された計算・制御モジュール112により作成され、表示モジュール114によりGUI上の複数のウィンドウに表示される。これらのチャートのどれを表示し、どれを表示しないかを、ユーザが選択することができる。
図4に示すように、PCA解析を用いて「1事象のデータの解析結果に基づく特徴変数及び相関の検出」を行った場合、GUIに含まれるウィンドウには、例えば、サンプル・プロット・ウィンドウ152、変数プロット・ウィンドウ154、寄与率チャート・ウィンドウ156、ローディング・チャート・ウィンドウ158、スペクトル・チャート・ウィンドウ160及びビュー・ナビゲータ・ウィンドウ162などがある。
サンプル・プロット・ウィンドウ152には、PCA解析の結果として作成されるサンプル・プロット・チャートが表示される。サンプル・プロット・チャートとは、ユーザにより指定された1個以上3個以下のPC(主成分)にそれぞれ対応する座標軸(以下、PC軸という)から構成される座標空間(図示の例は、3本のPC軸による3次元空間)において、それぞれのサンプルが、上記1個以上3個以下のPCについてのスコアに応じた座標にプロットされているチャートである。図4に例示したような3次元のサンプル・プロット・チャートが表示される場合には、この多変量解析装置110は、その3次元のサンプル・プロット・チャートを複数のPC軸回りに回転させて、ユーザがその3次元空間サンプル・プロット・チャートをあらゆる視線方向から観察することを可能にする。それにより、ユーザは、例えば、サンプル群全体がいくつかのサブ群に分かれているというような、サンプルの分布の様子を的確に把握することができる。
変数プロット・ウィンドウ154には、PCA解析の結果として作成される変数プロット・チャートが表示される。変数プロット・チャートとは、ユーザにより指定された1個以上3個以下のPCにそれぞれ対応する座標軸(以下、PC軸という)から構成される座標空間(図示の例は、2本のPC軸による2次元空間)において、それぞれの変数が、上記1個以上3個以下のPCについてのローディングに応じた座標にプロットされているチャートである。
寄与率チャート・ウィンドウ156には、PCA解析の結果として作成される寄与率チャートが表示される。寄与率チャートとは、それぞれの変数の、ユーザ指定された1個以上3個以下のPCについての寄与率を、横軸が変数に対応し縦軸が寄与率に対応するグラフ(例えば棒グラフ)の形で表したチャートである。
ローディング・チャート・ウィンドウ158には、PCA解析の結果として作成されるローディング・チャートが表示される。ローディング・チャートとは、それぞれの変数の、ユーザ指定された1個以上3個以下のPCについてのローディングの絶対値と残差成分との和を、横軸が変数に対応し縦軸がローディングに対応したグラフ(例えば棒グラフ)の形で表したチャートである。
スペクトル・チャート・ウィンドウ160には、スペクトル・チャートが表示される。スペクトル・チャートとは、1以上のサンプルの実態データ(スペクトル)を、横軸が変数に対応し縦軸が変数値に対応したグラフ(例えば折れ線グラフ)の形で表したチャートである。
寄与率チャート・ウィンドウ156とローディング・チャート・ウィンドウ158とスペクトル・チャート・ウィンドウ160は、互いに横軸のスケールが一致するようにして配置される。
ビュー・ナビゲータ・ウィンドウ162には、寄与率チャート156とローディング・チャート158とスペクトル・チャート160に現在表示されている横軸の範囲(変数の範囲)が、全体範囲内のどの部分に該当するかを、スペクトル・チャート160に表示されたスペクトルの一つの全体像の中で特定して示したビュー・ナビゲータが、表示される。
図5に示すように、PCA解析を用いて「複数事象のデータの解析結果に基づく特徴変数及び相関の検出」を行った場合には、各事象について、図4に示されたウィンドウと同種のウィンドウの全部または一部が表示される。
例えば、図5に示されたGUI例は、同じサンプル群又は異なるサンプル群の3種の事象(A、B、C)のデータを解析した場合に対応し、そこでは、各事象について、一例として、サンプル・プロット・ウィンドウ152(152A、B、C)と寄与率チャート・ウィンドウ156(156A、B、C)とスペクトル・チャート・ウィンドウ160(160A、B、C)とビュー・ナビゲータ・ウィンドウ162(162A、B、C)が表示されている。どのような種類のウィンドウのセットを表示するかは、ユーザが選択できる。
図5の例から分かるように、全ての事象について、同じ種類のウィンドウが表示され、それらが同じ位置関係で配置される。同じサンプル群について異なる事象のデータが解析された場合、スペクトル・チャート・ウィンドウ160(160A、B、C)には、ユーザ選択された1以上の同じサンプルについての異なる事象の実態データを表示することができる。ユーザにとり、複数の事象の解析結果や実態データを対比することが可能であり、それにより、複数の事象間の相関関係を見つけたり、複数の事象の視点から総合的又は相補的に判断して確度の高いマーカを見つけ出したりすることが容易になる。
図6に示すように、「異構造のデータの解析結果に基づく特徴変数及び相関の検出」を行った場合には、多変量解析の対象となった標準構造のデータ(例えば、スペクトルデータ)についての多変量解析結果(図4に示されたウィンドウと同種のウィンドウの全部又は一部)と、多変量解析の対象とならなかった別構造の実態データ(例えば画像データ)の内容を表示したウィンドウとが表示される。
例えば、図6に示されたGUI例は、MRI画像データと、そのMRI画像内の多数のボクセル(個々のボクセルがサンプルとして取り扱われる)のCSIスペクトルデータとを解析した場合に対応し、そこには、MRI画像データを表示した別構造データ・ウィンドウ164と、多数のボクセルのCSIスペクトルデータを多変量解析(例えばPCA解析)した結果としてのサンプル・プロット・ウィンドウ152、変数プロット・ウィンドウ154、寄与率チャート・ウィンドウ156、ローディング・チャート・ウィンドウ158、スペクトル・チャート・ウィンドウ160及びビュー・ナビゲータ・ウィンドウ162が表示される。
別構造データ・ウィンドウ164に表示されたMRI画像データ中の任意の場所をユーザがポインティングデバイスで指定すると、その指定された場所に対応するボクセル(サンプル)のCSIスペクトルデータが、スペクトル・チャート・ウィンドウ160に表示される。
ユーザにとり、異なる構造のデータ間の相関関係を見つけたり、異なる構造のデータの視点から総合的又は相補的に判断して確度の高いマーカを見つけ出したりすることが容易になる。
次に、上述した3種類の特徴抽出機能、すなわち
(1) 「1事象のデータの解析結果に基づく特徴変数及び相関の検出」機能、
(2) 「複数事象のデータの解析結果に基づく特徴変数及び相関の検出」機能、及び
(3) 「異構造のデータの解析結果に基づく特徴変数及び相関の検出」機能
各々について、より具体的に説明する。
1 「1事象のデータの解析結果に基づく特徴変数及び相関の検出」機能
この機能には、複数のサブ機能が含まれ、各サブ機能は、コントロール・パネル150へのユーザの操作の仕方に応じて選択される。それらサブ機能には、「特定サンプルの特徴変数の抽出によるマーカ変数の検出」、「指定マーカ変数による特徴サンプルの検出」、「分析データと付加データとの相補的な解析#1」、「分析データと付加データとの相補的な解析#2」などがある。以下、各サブ機能について説明する。
1.1 「特定サンプルの特徴変数の抽出によるマーカ変数の検出」サブ機能
多変量解析などの統計的手法により、解析されたサンプル群全体の傾向を見ることが可能である。もし、このサンプル群全体が複数のサブ群に分れているようであるならば、ユーザが考える解析プロセスの次の課題の一つは、「分割されたサンプルサブ群毎に、どのような特徴があるのか、つまり、特にどの変数がそのサブ群を特徴づけるのに寄与しているのか?」であろう。この課題を解決するために、このサブ機能は、ユーザが任意に指定したサンプルのサブ群のデータと、その他のサンプルのデータとを比較して、指定されたサンプルサブ群を他のサンプルから分離するのに寄与している可能性のある幾つかの特徴変数を抽出し、更に寄与率を用いてノイズ情報を除去して、より確度の高い特徴変数を抽出する。このサブ機能により、指定されたサンプルサブ群の特異的な特徴変数が導き出される。
図7は、このサブ機能の処理の流れを示し、図8は、このサブ機能の処理をGUIを用いて説明している。以下、図7に示す各ステップを、図8を一緒に参照しつつ説明する。
1.1.1 ステップ170:サンプルのサブ群の指定
多変量解析装置110は、或る事象の或るサンプル群の対象データ群を、対応する解析テーブル120から読み込み、多変量解析、例えばPCA解析、を行ない、そして、その解析結果を一つのGUI上に表示する。そのGUIにおけるそのサンプル群が表示されたウィンドウ、例えば図8に示すようなPCA解析で得られたサンプル・プロット・チャートを表したサンプル・プロット・ウィンドウ152中から、ユーザが、マウスなどのポインティング・デバイスを用いて、興味のある任意のサンプル(例えば、他のサンプルから分離されているサンプルのサブ群)178を指定する。すると、多変量解析装置110は、指定されたサンプルサブ群178を、サンプル・プロット・ウィンドウ152上でハイライト表示する。さらに、多変量解析装置110は、そのサンプル群の解析テーブル120を参照し、その解析テーブル120に記述されたリンクを用いて、指定されたサンプルの実態データ(スペクトルデータ)を読み出し、そして、図8に示すように、それらの実態データに基づいて指定されたサンプルのスペクトルを、スペクトル・ウィンドウ160に表示する。
1.1.2 ステップ172:指定サンプルサブ群に共通する特徴変数の抽出
ステップ170で指定されたサンプルに共通する特徴的ないくつかの変数が、多変量解析装置110により計算される。ここで、或るサンプルに「特徴的な変数(特徴変数)」とは、そのサンプルがもつその変数の値が、他のサンプルがもつその変数の値と比べて、明らかに大きいもしくは小さいと判断される変数である。そのような変数の判別方法として、統計的ないろいろな手法が採用できるが、本実施形態では、以下に説明するような平均値を利用した方法を採用する。
d次元の(つまりd個の変数をもつ)対象データをそれぞれもつn個のサンプル群は次のようにn×dの多変量データ行列Xとして表わすことができる。行列X内の各行が各サンプルの対象データに対応する。
Figure 0005088731
この行列Xにおけるk列目(k番目の変数)のサンプル群全体での平均値xk_avgは次式で示される。
Figure 0005088731

ここで、k列目(k番目の変数)のサンプル群全体内での最小値をxk_min、最大値をxk_maxとする。また、特徴的か否かを判別するために設定される閾値レベルを、それぞれxk_min_th、xk_max_thとする。このサンプル群におけるk列目(k番目の変数)の値の分布は、例えば図9Aまたは図9Bに示されるようになる。
特徴変数として抽出したい変数は、xk_minとxk_min_thの間の領域またはxk_max_thとxk_maxとの間の領域(これらの領域を以下「特徴領域」という)に入る値をもつものである。変数によって、その値の分布は、図9Aのように正規分布に近い形を示す場合もあるし、図9Bに例示するようにかなり偏った形を示す場合もある。特徴変数を抽出するということは、図9Bのように特徴領域に集中するグループに明確に分けられた分布を持つ変数を導き出すという意味がある。
図9Bに示すように、そのサンプル群中から指定されたサンプル(指定サンプルサブ群)178の全てに共通して、特定の変数が何れかの特徴領域に所属した場合、その変数は、その指定サンプルサブ群に共通する特徴変数といえるから、そのような特徴変数が抽出される。
従って、指定サブ群の全てに共通してその変数がいずれかの特徴領域に入るか否かをチェックする処理を、行列Xの全行(全変数)について実行し、そのチェック結果がイエスであった変数の実を抽出することにより、その指定サンプルサブ群に共通する特徴変数が抽出される。
1.1.3 ステップ174:寄与率によるフィルタリング
このステップ174では、上記ステップ172で得られた特徴変数の各々について、その変数が、指定サンプルサブ群をそれ以外のサンプルから差別化するという点で本当に意味のある変数であるかどうかを、寄与率のような別のパラメータを用いて評価をする。特にノイズのようにランダムで偶発的に選択された変数を、事前に求められた寄与率などの事前パラメータを用いて検出し、それを除去する。具体的には、或る変数の寄与率があるレベル以下であれば、その変数を除去する。結果として、上記観点で本当に意味のある(より確度の高い)特徴変数のみが絞り込まれる。このような特徴変数をそれぞれ以下「マーカ変数」という。
1.1.4 ステップ176:特徴変数の表示
このステップ176では、上記ステップ174で抽出されたマーカ変数を、GUI上で視覚的に識別できるようにハイライトして表示する。例えば、図8に例示するように、スペクトル・チャート・ウィンドウ160、寄与率チャート・ウィンドウ156、ローディング・チャート・ウィンドウ158を通じて、抽出されたマーカ変数に対してのみ所定カラーの帯180が付され、また、変数プロット・ウィンドウ154で、それらのマーカ変数が他の変数とは異なるカラーのドット182で表示される。それにより、ユーザはGUI上で、それらのマーカ変数を視覚的に容易に識別可能である。好ましくは、マーカ変数が、図9Aに示された最大値に近い(つまり、指定サンプルサブ群がもつその変数の値が、他のサンプルのそれより明らかに大きい)のか、もしくは最小値に近い(つまり、指定サンプルサブ群がもつその変数の値が、他のサンプルのそれより明らかに小さい)のかを、異なるカラーを使って区別して表示する(例えば、前者に付された帯180のカラーはオレンジ、後者に付された帯180のカラーはブルー)。これにより、ユーザは、指定サンプルサブ群の量的な特徴を視覚的に容易に把握できる。
1.2 「指定マーカ変数による特徴サンプルの検出」サブ機能
前述の「特定サンプルの特徴変数の抽出によるマーカ変数の検出」サブ機能は、指定サンプルサブ群に共通するマーカ変数を探索する手法である。他方、「指定マーカの有意差検定によるサンプル特徴分布検出」サブ機能は、前述のサブ機能と逆のアプローチにより、指定されたマーカ変数がどのサンプルサブ群に特異的に影響を与えているかを探索する手法である。このサブ機能では、指定されたマーカ変数を寄与率によりフィルタリングし、その後、指定されたマーカ変数が特徴的に表れているサンプルサブ群を抽出する。
図10は、このサブ機能の処理の流れを示し、図11は、このサブ機能の処理をGUIを用いて説明している。以下、図10に示す各ステップを、図11を一緒に参照しつつ説明する。
1.2.1 ステップ190:マーカ変数の指定
多変量解析装置110は、或る事象の或るサンプル群の対象データ群を、対応する解析テーブル120から読み込み、多変量解析、例えばPCA解析、を行ない、そして、その解析結果を一つのGUI上に表示する。そのGUI上で変数が表示されているウィンドウ、例えば変数プロット・ウィンドウ154上で、ユーザが、興味ある任意の任意の1以上の変数198を、マーカ変数として指定する(寄与率プロット・ウィンドウ156またはローディング・チャート・ウィンドウ158でマーカ変数を指定してもよい。)。図11に示された例では、ユーザは、変数プロット・ウィンドウ154上で他の変数から分離されて孤立しているような1又は複数の変数198に興味を持ち、その変数198をマーカ変数として指定している。
1.2.2 ステップ192:寄与率によるフィルタリング
上記ステップ190で指定された変数について、その変数に意味があるかどうかが、寄与率等の別のパラメータを用いて評価される。特にノイズのようにランダムで偶発的に指定された変数が、事前に求められた寄与率等による評価結果に基づいて検出され、マーカ変数から除外される。具体的には、寄与率などのパラメータの値が或るレベル以下である変数を排除することで、本当に意味のある変数のみがマーカ変数として絞り込まれる。
絞り込まれたマーカ変数が、GUI上で視覚的に識別できるように、ハイライトされて表示され。例えば、図11に例示するように、スペクトル・チャート・ウィンドウ160、寄与率チャート・ウィンドウ156、ローディング・チャート・ウィンドウ158を通じて、それらのマーカ変数に対してのみ所定カラーの帯200が付され、また、変数プロット・ウィンドウ154で、それらのマーカ変数が他の変数とは異なるカラーのドットで表示される。
1.2.3 ステップ194:指定マーカ変数に共通する特徴サンプルサブ群の抽出
上記ステップ192で決定されたマーカ変数に共通する特徴的な1以上のサンプル(サンプルサブ群)が検出される。ここで、或るマーカ変数に「特徴的なサンプル」とは、そのサンプルがもつそのマーカ変数の値が、他のサンプルがもつそのマーカ変数の値と比べて、明らかに大きいもしくは小さいと判断されるサンプルである。判別方法として種々の統計的な手法が採用できるが、本実施形態は、次に説明するような平均値を利用した方法を採用する。
すなわち、サンプル群の対象データ群全部に基づいて、サンプル群全体における、各マーカ変数の値の分布が計算される。或るマーカ変数について、例えば図12に示すような値の分布が得られる。各マーカ変数の値の分布に基づいて、図9Aと図9Bを参照して説明したのと同様な方法で、そのマーカ変数について最小値xk_min側の特徴領域(xk_minとxk_min_thの間の領域)と最大値xk_max側の特徴領域(xk_max_thとxk_maxとの間の領域)が決定される。そして、それぞれのサンプルの対象データがもつそのマーカ変数の値に基づいて、そのマーカ変数の値が何れかの特徴領域に入る(すなわち、そのサンプルがもつそのマーカ変数の値が、他のサンプルより明らかに大きいまたは小さい)サンプル202、204を抽出する。この処理を全てのマーカ変数について行い、全てのマーカ変数の値が何れかの特徴領域に入るサンプルだけを絞り込むことで、それらのマーカ変数に共通する特徴サンプルサブ群が抽出される。
1.2.4 ステップ196:特徴サンプルサブ群の表示
上記ステップ194で最終的に抽出された特徴サンプル202、204が、GUIのサンプル・プロット・ウィンドウ152上に、視覚的に識別できるようにハイライトされて表示される。また、それら特徴サンプルの実態データが読み出され、それらのスペクトルがスペクトル・チャート・ウィンドウ160上に表示される。好ましくは、それぞれの特徴サンプル202、204のもつ指定マーカ変数の値が最大値に近いのか、もしくは最小値に近いのかが、視覚的に区別できるように、前者の特徴サンプル202と後者の特徴サンプル204とが異なる色で表示される。例えば、サンプル・プロット・ウィンドウ152上で、前者の特徴サンプル202の表にカラーがオレンジであり、後者の特徴サンプル204の表示カラーがブルーである。さらに、例えば、サンプル・プロット・ウィンドウ152上で、特徴サンプル202、204の各々がもつマーカ変数の値も表示される。これにより、指定したマーカ変数の量的な特徴が視覚的に容易に把握できる。
1.3 「分析データと付加データとの相補的な解析#1」サブ機能
従来行われているほとんどの解析手法は、一つの観点から(例えば、一つの事象に関して、一つの一次分析装置を用いて)分析して得られたデータを基に、一意的な結論を求めようとしている。しかし、多くの異なる観点から分析を行って様々な関連する情報、データを収集し、それらの情報(知見)を総合的または相補的に解釈してこそ、より正しい結論が導き出される筈である。また、それぞれの観点から得られた情報(知見)同士の相関を見ることにより、新たな知見を得ることができるであろう。このサブ機能は、ある観点での分析データから得られた結果と、それに関連する別の1以上の観点での情報(付加データ)とを有機的に結合し、それらの相関が一つのGUIにて視覚的に理解できるように提示する機能である。このサブ機能は、指定された付加データに特徴的なサンプルを自動的に抽出し、そして、それらのサンプルに特異なマーカ変数を自動的に見つけ出す機能である。これにより、ユーザは、付加データと変数との相関関係を視覚的に容易に把握することができる。なお、付加データは、図3に示された解析テーブル120内の付加データ欄140に予め登録されている。
図13は、このサブ機能の処理の流れを示し、図14は、このサブ機能の処理をGUIを用いて説明している。以下、図13に示す各ステップを、図14を一緒に参照しつつ説明する。この説明では、付加データとして、或る種類の生化学データを用いた場合を例にとる。
1.3.1 ステップ210:付加データ(生化学データ)の指定
多変量解析装置110は、或る事象の或るサンプル群の対象データ群を、対応する解析テーブル120から読み込み、多変量解析、例えばPCA解析、を行ない、そして、その解析結果を一つのGUI上に表示する。ユーザは、そのGUIのコントロール・パネル150上の付加データ選択メニュー220を用いて、興味ある任意の種類の付加データ(例えば生化学データの一種である体重差データ)を選択する。
1.3.2 ステップ212:特定サンプルサブ群の抽出
解析テーブル120から、サンプル群全体の指定生化学データの値が読み出される。上述の1.2.3項で説明したステップ194で指定マーカ変数について行われた方法(図12を参照して説明した方法)と同様の方法で、指定された生化学データの各々についてサンプル群全体での値の分布が計算され、それらの分布に基づいて、指定された生化学データに共通する特徴的なサンプル(サンプルサブ群)220、222が抽出される。指定生化学データの値が最大値に近い特徴サンプル220と、最小値に近い特徴サンプル222とが、区別できるように別のカラーで、サンプル・プロット・ウィンドウ152上で表示される。特徴サンプル220、222の実態データが読み出され、それらのスペクトルが、スペクトル・チャート・ウィンドウ160上に表示される。
1.3.3 ステップ214:特徴サンプルサブ群における特徴変数の抽出
1.1.2項で説明したステップ172と同様な方法で、上記ステップ212で抽出された特徴サンプルサブ群に共通する特徴的な変数が抽出される。
1.3.4 ステップ216:寄与率によるフィルタリング
1.1.3項で説明したステップ174と同様な方法によるフィルタリングが、上記ステップ214で抽出された特徴変数に対して適用されて、マーカ変数が決定される。マーカ変数は、スペクトル・チャート・ウィンドウ160、寄与率チャート・ウィンドウ156及びローディング・チャート・ウィンドウ158を通じて、視覚的に区別できるように、例えば所定カラーの帯224によりハイライトされて表示される。
1.3.5 マーカ変数の表示
1.1.4項で説明したステップ176と同様な方法で、マーカ変数が、視覚的に識別できように他の変数とは別のカラーで、変数プロット・ウィンドウ154上に表示される。これらのマーカ変数は、指定された付加データ(生化学データ)との相関が、他の変数より高いと推定することができる。
1.4 「分析データと付加データとの相補的な解析#2」サブ機能
このサブ機能は、1.3項で説明したサブ機能と同様に、ある観点での分析データから得られた結果と、それに関連する別の1以上の観点での情報(付加データ)とを有機的に結合し、それらの相関が一つのGUIにて視覚的に理解できるように提示する機能である。このサブ機能は、PC(主成分)解析で得られたPC(主成分)と、指定された付加データとを座標軸とする座標空間に、サンプル群をプロットして、GUI上に表示する機能である。
図15は、このサブ機能の処理の流れを示し、図16は、このサブ機能の処理をGUIを用いて説明している。以下、図15に示す各ステップを、図16を一緒に参照しつつ説明する。この説明では、付加データとして、或る種類の生化学データを用いた場合を例にとる。
1.4.1 ステップ230:付加データ(生化学データ)の指定
多変量解析装置110は、或る事象の或るサンプル群の対象データ群を、対応する解析テーブル120から読み込み、多変量解析、例えばPCA解析、を行ない、そして、その解析結果を一つのGUI上に表示する。ユーザは、そのGUIのコントロール・パネル150上の3つの座標軸(x、y、z軸)選択メニュー234を用いて、少なくとも1つの任意の座標軸に、興味ある任意の種類の付加データ(例えば生化学データの一種である体重差データ)を指定し、残りの座標軸に、PC(主成分)解析で得られた任意のPCを指定する。図15に示された例では、x軸に生化学データの一つである体重差が指定され、y軸とz軸には或る同じPCが指定されている(y軸とz軸に異なるPCを指定しても、勿論よい。)。
1.4.2 ステップ232:PC軸の置換
多変量解析装置110は、解析対象のサンプル群の解析テーブル120から、サンプル群の指定付加データのデータを読み込み、そして、サンプル・プロット・ウィンドウ152に表示されている座標空間を構成する複数のPC軸の内、ユーザに指定されたPC軸を、ユーザに指定された付加データの値に対応する座標軸(以下、付加データ軸という)に置き換える。そして、その付加データ軸と残りのPC軸とから構成される座標空間に、そのサンプル群をプロットし直したサンプル・プロット・チャートを作成し、そして、そのサンプル・プロット・チャートを、サンプル・プロット・ウィンドウ152に表示する。図15に例示された例では、x軸に体重差が指定され、y軸とz軸には同一のPCが指定されている(つまり、座標軸が実質的に2本である)ため、サンプル・プロット・ウィンドウ152には2次元(縦軸が体重差、横軸が指定PC)のサンプル・プロット・チャートが表示されているが、x、y、zの3軸にそれぞれ異なる成分が指定されていれば、3次元のサンプル・プロット・チャートが表示されることになる。
このチャートを見ることで、ユーザは、任意の付加データと任意のPC(又は変数)との間の相関関係が視覚的に把握することが容易になる。例えば、図15に示されたサンプル・プロット・ウィンドウ152では、他のサンプル群から分離して孤立したサンプルのサブ群36が存在するが、このサンプルサブ群236は、体重差(縦軸)の特定値と指定PC(横軸)のスコアの特定値の近傍領域に集まっている。このことから、体重差と、このサンプルサブ群236に特徴的な何らかの変数との間に、意味のある関連性が存在するかもしれないという推測が得られる。そこで、ユーザは、前記1.1のサブ機能を使って、このサンプルサブ群236に共通するマーカ変数を検出してもよい。
2 「複数事象のデータの解析結果に基づく特徴変数及び相関の検出」機能
この機能には、「異事象の分析データ間の相関およびマーカ変数の検出」サブ機能及び「指定マーカ変数における異事象での挙動の抽出」サブ機能が含まれる。以下、これらのサブ機能について説明する。
2.1 「異事象の分析データ間の相関およびマーカ変数の検出」サブ機能
このサブ機能は、ある現象を理解するために、利用可能な複数の分析・評価法を活用して異なる事象の観点からデータを収集し分析して、その現象の全体像を探索することを容易にする。一般的に、それ一つで万能であるという分析法・評価法は存在しないので、研究者は、各手法の得手・不得手を理解した上で、各手法で得られたデータ(情報)を処理し解析し、そして、最終的に研究者の頭の中で、異なる手法で得られた情報を総合的・相補的に組み合わせながら一つの結論(推論)を導き出している。このサブ機能は、各種の手法から得られた異なる事象のデータ(情報)を、一つのGUI上で、相互の相関が把握しやすいように表示する機能である。このサブ機能は、特に、異事象間で共通性のあるサンプル(サンプルのデータ)をピックアップし、それら異事象間で共通性のあるサンプルに特異的なマーカ変数を検出し表示する。それにより、ユーザは、異なる手法で得られた情報を総合的・相補的に組み合わせることが容易になる。
図17は、このサブ機能の処理の流れを示し、図18は、このサブ機能の処理をGUIを用いて説明している。以下、図17に示す各ステップを、図18を一緒に参照しつつ説明する。
2.1.1 ステップ240:サンプルサブ群の指定
多変量解析装置110は、複数の異なる事象の対象データ群を、それぞれの事象の解析テーブル120から読み込み、事象毎に多変量解析、例えばPCA解析、を行ない、そして、それら複数の事象の解析結果を一つのGUI上に表示する。例えば、図17に示したGUI上には、メタボローム、プロテオーム、ゲノムの観点からの3種類の事象A〜Cについて、PCA解析結果として、サンプル・プロット・ウィンドウ152A〜152C、スペクトル・チャート・ウィンドウ160A〜160C及び寄与率チャート・ウィンドウ156A〜156Cなどが、3事象を通じて同じ配置で、表示されている。
ユーザは、任意の1事象、例えば事象A、についてのサンプル群が表示されているウィンドウ、例えばサンプル・プロット・ウィンドウ152A上で、興味ある任意のサンプル(サンプルサブ群)250を指定する。すると、上記1.1.1で説明したステップ170と同様の方法で、指定されたサンプルサブ群250は、その事象Aのサンプル・プロット・ウィンドウ152A上でハイライト表示され、また、指定されたサンプルサブ群250の実態データのスペクトルが、その事象Aのスペクトル・チャート・ウィンドウ162A上に表示される。
2.1.2 ステップ242:異事象データの連結
多変量解析装置110は、事象A、B、Cの解析テーブル120に登録されている各サンプルに割り当てられたキーワード(要するに、異事象A、B、Cのサンプル群間で、共通性のあるサンプル同士を関連づけるリンク情報)を頼りに、上記ステップ240で事象Aに関し指定されたサンプルサブ群250のデータと共通性のある他の事象B、Cのサンプルサブ群252、254のデータを検索する。ここで、異事象間で「共通性のある」サンプルのデータとは、例えば、同じサンプルソース(例えば、同じ人)から得られた異種類のサンプル(例えば血液、細胞、染色体)を分析したデータ、あるいは、同じサンプル(例えば、或る混合物)を異なる一次分析装置(例えば、NMR装置、MS装置、DNAアレイなど)で分析して得たデータなどを意味する。
そして、多変量解析装置110は、検索された共通性のあるサンプルサブ群252、254のデータを、それぞれの事象B、Cのサンプル・プロット・ウィンドウ152B、152C上にハイライト表示し、さらに、それら共通性のあるサンプルサブ群252、254の実態データから得られたスペクトルを、それぞれの事象B、Cのスペクトル・チャート・ウィンドウ160B、160C上に表示する。これにより、異なる事象A、B、Cに関する共通性のあるサンプルサブ群のデータが相互に関連づけられる。
このように異なる事象A、B、C間で共通性のあるサンプルのデータを関連付ける処理を行うために、図19に示すように、それらの事象A、B、Cの解析テーブル120A、120B、120Cを通じて、共通性のあるサンプルデータには、キーワードとして、同じ文字列もしくは番号が割り当てられている。例えば、図19の例では、事象AのサンプルAと、事象BのサンプルFと、事象CのサンプルJとは、互いに共通性のあるサンプルである。
図19に矢印で例示するように、一つの事象Aの解析テーブル120Aにて、ユーザにより指定されたサンプル名を検索し、検索されたサンプル名に割り当てられたキーワードを読み、そして、別の事象B、Cの解析テーブル120B、120Cから、そのキーワードが割り当てられたサンプル名を調べることで、異なる事象A、B、C間で共通性のあるサンプルが識別できる。
2.1.3 ステップ244A、B、C〜248A、B、C:事象毎のマーカ変数の検出と表示
上述1.1.2項から1.1.4項で説明したと同様の方法で、事象A、B、Cのそれぞれについて、指定サンプルサブ群(事象A)及びそれに関連付けられたサンプルサブ群(事象B、C)に共通する特徴変数の抽出、寄与率によるフィルタリング、及びマーカ変数の表示の処理が行われる。その結果、図18に例示するように、それらの事象A、B、Cにおいて検出されたマーカ変数256、258、259がハイライト表示される。
ユーザは、異なる事象A、B、C間で共通性あるサンプルに特異的なマーカ変数を視覚的に容易に確認でき、事象A、B、Cのマーカ変数間に何らかの意味ある関連性(例えば因果関係)が存在する可能性を容易に知ることができる。これにより、例えばメタボローム、プロテオーム及びゲノムなどの異レベルの研究分野間、あるいは、例えばNMR装置、MS装置、DNAアレイなどの異種類の一次分析装置で得られたデータ間の相関関係を解き明かして、新たな知見を得ようとする研究が、より容易に行える。
2.2 「指定マーカ変数における異事象での挙動の抽出」サブ機能
このサブ機能も、上記2.1のサブ機能と同様、ある現象を理解するために、利用可能な複数の分析・評価法を活用して異なる事象の観点からデータを収集し分析して、その現象の全体像を探索することを容易にする。このサブ機能は、特に、特定の事象における特定のマーカ変数が指定されると、そのマーカ変数により特徴付けられるサンプルのサブ群をその特定事象と他の事象のサンプル群からピックアップし、そして、それら異事象のサンプルに特異的なマーカ変数を検出し表示する。それにより、ユーザは、異なる手法で得られた情報を総合的・相補的に組み合わせることが容易になる。
図20は、このサブ機能の処理の流れを示し、図21は、このサブ機能の処理をGUIを用いて説明している。以下、図20に示す各ステップを、図21を一緒に参照しつつ説明する。
2.2.1 ステップ260:マーカ変数の指定
多変量解析装置110は、上記2.1のサブ機能の場合と同様、複数の異なる事象の対象データ群を、それぞれの事象の解析テーブル120から読み込み、事象毎に多変量解析、例えばPCA解析、を行ない、そして、それら複数の事象の解析結果を一つのGUI上に表示する。例えば、図21に示したGUI上には、3種類の事象A〜Cについて、PCA解析結果として、サンプル・プロット・ウィンドウ152A〜152C、スペクトル・チャート・ウィンドウ160A〜160C及び寄与率チャート・ウィンドウ156A〜156Cなどが、3事象を通じて同じ配置で、表示されている。
ユーザは、任意の1事象、例えば事象A、について変数が表示されているウィンドウ、例えば寄与率チャート・ウィンドウ156A上で、興味ある任意の変数280をマーカ変数として指定する(変数プロット・ウィンドウ154またはローディング・チャート・ウィンドウ158を表示して、いずれかのウィンドウでマーカ変数を指定してもよい。)。
2.2.2 ステップ262〜266:特徴サンプルサブ群の抽出
上述1.2.2項〜1.2.4項で説明した方法と同様な方法で、上記1つの事象Aに関して、指定マーカ変数の寄与率によるフィルタリング、フィルタリングで絞り込まれたマーカ変数に共通する特徴サンプルサブ群の抽出、及び抽出された特徴サンプルサブ群の表示が行われる。図21に例示されるように、寄与率によるフィルタリングで絞り込まれたマーカ変数280は、視覚的に容易に識別できるようにハイライト表示される。また、図21に例示されるように、マーカ変数280の分布の最大値に近い特徴領域にそのマーカ変数280を有する特徴サンプルサブ群282と、同分布の最小値に近い特徴領域にそのマーカ変数280を有する特徴サンプルサブ群284とが抽出され、そして、その2種類の特徴サンプルサブ群282、284は視覚的に区別できるように、サンプル・プロット・ウィンドウ152A上で異なるカラーでハイライト表示される。さらに、その特徴サンプルサブ群282、284の実態データから得られたスペクトルが、スペクトル・チャート・ウィンドウ160Aに表示される。
2.2.3 ステップ268:異事象データの連結
上述2.1.2項で説明した方法と同様の方法で、上記ステップ262〜264で事象Aに関して抽出された特徴サンプルサブ群282、284のデータと共通性のある他の事象B、Cのサンプルサブ群286、282;290、292のデータが検索される。そして、検索された共通性のあるサンプルサブ群286、282;290、292のデータは、それぞれの事象B、Cのサンプル・プロット・ウィンドウ152B、152C上で、同様にハイライト表示される。さらに、それら共通性のあるサンプルサブ群286、282;290、292の実態データから得られたスペクトルが、それぞれの事象B、Cのスペクトル・チャート・ウィンドウ160B、160C上に表示される。これにより、異なる事象A、B、Cに関する同じサンプルサブ群のデータが相互に関連づけられる。
2.3.4 ステップ270B、C〜274B、C:他事象のマーカ変数の検出と表示
上述1.1.2項から1.1.4項で説明したと同様の方法で、上記ステップ268で検索された他事象B、Cのサンプルサブ群286、282;290、292のそれぞれについて、そのサンプルサブ群に共通する特徴変数の抽出、寄与率によるフィルタリング、及びマーカ変数の表示の処理が行われる。その結果、図21に例示するように、他事象B、Cにおいて検出されたマーカ変数294、296がハイライト表示される。
ユーザは、ハイライト表示された事象A、B、Cのマーカ変数間に何らかの意味ある関連性(例えば因果関係)が存在する可能性を容易に知ることができる。
3 「異構造のデータの解析結果に基づく特徴変数及び相関の検出」機能
この機能は、上述した異事象のデータの解析の概念をさらに発展させたもので、前述の機能で取り扱われたような多変量解析に適した構造をもつデータ(又は、そのような構造のデータから把握される現象)と、それとは別の構造をもつデータ(例えば、画像データ、又は、そのような別構造のデータから把握される現象)との間の相関を調べ、特徴抽出することにより、今までに得ることのできなかった全く新たな情報を得ることを容易にする。以下では、具体例として、MRI装置のCSI(Chemical Shift Imaging)機能により得られるCSIスペクトルデータ(多変量解析に適した構造のデータ)と、そのMRI装置から得られるMRI画像データ(別構造のデータ)とを用いた解析法を説明する。ここで、CSIスペクトルデータは、大まかにいえば、MRI画像中の多数の部位(ボクセル)の各々のケミカルなスペクトルデータ(NMRスペクトルデータの一種)である。
この例では、多変量解析装置110は、MRI画像データ(図2に示された別構造の実態データ118に相当する)とCSIで得られたそのMRI画像中の多数部位のスペクトルデータ(図2に示された解析テーブル120中の対象データ群に相当する)とを入力し、入力された多数部位のスペクトルデータに多変量解析、例えばPCA解析、を適用し、そして、その多変量解析結果とMRI画像中の位置情報との相関を導き出す。
従来、特定のスペクトルの特徴として抽出される特定の物質・成分に専ら着目して、その多寡または増減に基づいて評価を行っている。これに対し、この機能によれば、個々のスペクトルの物質・成分だけでなく、別構造データが表すスペクトル全体のパターン(例えば、MRI画像)を認識して、その全体パターン中から特徴抽出を行うことにより、今までとは全く違う解釈を得ることが可能になる。特に、今まで困難であった異常部位の特定や異常原因の究明・診断の可能性が出てくる。
この機能には、「異構造データ間の相関の検出#1」サブ機能、「異構造データ間の相関の検出#2」サブ機能、及び「異構造データ間の相関の検出#3」サブ機能がある。以下、これらのサブ機能について説明する。
3.1 「異構造データ間の相関の検出#1」サブ機能
図22は、このサブ機能の処理の流れを示し、図23は、このサブ機能の処理をGUIを用いて説明している。以下、図22に示す各ステップを、図23を一緒に参照しつつ説明する。
3.1.1 ステップ300:特定サンプルの指定
多変量解析装置110は、MRI画像データ(図2に示された別構造の実態データ118に相当)を読み込み、MRI画像データに基づきMRI画像を作成してこれをGUI上に表示する。また、多変量解析装置110は、GUI上に表示されたMRI画像中の多数の部位つまりボクセル(以下、サンプルという)のCSIヒストグラム・データ群(図2に示される対象データ群)を読み込み、CSIヒストグラム・データ群の多変量解析、例えばPCA解析、を行ない、そして、その解析結果を同じGUI上に表示する。例えば、図23に例示したGUI上には、別構造データ・ウィンドウ164にMRI画像が表示され、また、サンプル・プロット・ウィンドウ152、変数プロット・ウィンドウ154、寄与率チャート・ウィンドウ156及びローディング・チャート・ウィンドウ158に、そのMRI画像内の多数のサンプル(ボクセル)のスペクトルデータのPCA解析結果を表示されている。
ユーザは、このGUIの別構造データ・ウィンドウ164に表示されたMRI画像上で、興味ある任意のサンプル(ボクセル)312を指定する。
3.1.2 ステップ302:異構造データの連結
多変量解析装置110は、上記ステップ300で指定されたサンプル(ボクセル)のMRI画像上での位置情報(識別番号)と、解析テーブル120のキーワードとを用いて、指定されたサンプル(ボクセル)のMRI画像上の位置と、そのサンプル(ボクセル)の対象データの多変量解析結果とを相互に関連づけて連結する。
すなわち、図24に例示するように、CSIスペクトルの解析テーブル120には、予め、各サンプル(ボクセル)のキーワードとして、各サンプルのMRI画像上での位置情報(識別番号)が登録されている。多変量解析装置110は、ユーザが指定したMRI画像上の位置から、指定されたサンプル(ボクセル)のMRI画像上での位置情報(識別番号)を割り出し、図24で矢印で示すように、割り出された位置情報(識別番号)に相当するキーワードをもつサンプル(ボクセル)の対象データを解析テーブル120から検索し、そして、指定されたサンプル(ボクセル)のMRI画像上での位置と、検索されたサンプル(ボクセル)の対象データとをGUI上で可視的に関連付ける。
上記の関連付けは、例えば、次のようになされる。すなわち、図23に例示するように、別構造データ・ウィンドウ164上のMRI画像上で、指定されたサンプル(ボクセル)312がハイライトされて表示され、かつ、サンプル・プロット・ウィンドウ152上で、上記のようにして検索されたサンプル(対象データ)314がハイライトされて表示される。また、検索されたサンプル(ボクセル)314のCSIスペクトル・データ(図2に示された標準構造の実態データ116に相当)が読み出され、それに基づいて、検索されたサンプル(ボクセル)314のスペクトルの画像が生成されて、それらのスペクトル画像がスペクトル・チャート・ウィンドウ160に表示される。
3.1.3 ステップ304〜308:マーカ変数の検出と表示
前述した1.1.2項から1.1.4項で説明したと同様の方法で、検索されたサンプル(ボクセル)(つまり、指定されたサンプルサブ群)314に共通する特徴変数が抽出され、それらについて寄与率等によるフィルタリングが行われ、それにより、最終的に指定されたサンプル(ボクセル)に特異なマーカ変数が検出され、検出されたマーカ変数が図23に例示するようにハイライトされて表示される。
3.2 「異構造データ間の相関の検出#2」サブ機能
図25は、このサブ機能の処理の流れを示し、図26は、このサブ機能の処理をGUIを用いて説明している。以下、図25に示す各ステップを、図26を一緒に参照しつつ説明する。
3.2.1 ステップ320:特定サンプルの指定
上述した3.1項の「異構造データ間の相関の検出#1」サブ機能の場合と同様に、MRI画像とMRI画像中の多数のサンプル(ボクセル)の対象データ群(CSIヒストグラム・データ群)の多変量解析結果がGUI上に表示されている状態において、ユーザは、このGUIのサンプル・プロット・ウィンドウ152上で、興味ある任意のサンプル(ボクセル)330を指定する。
3.2.2 ステップ322:異構造データの連結
多変量解析装置110は、上記ステップ320で指定されたサンプル(ボクセル)330の解析テーブル120上のキーワードと、MRI画像上での位置情報(識別番号)とを用いて、指定されたサンプル(ボクセル)の対象データの多変量解析結果と、それらのサンプル(ボクセル)のMRI画像上の位置とを相互に関連づけて連結する。
すなわち、図27に例示するように、指定されたサンプル(ボクセル)のキーワードを解析テーブル120から読み、そのキーワードに相当する位置情報(識別番号)をもつMRI画像上のサンプル(ボクセル)を割り出し、そして、指定されたサンプル(ボクセル)の対象データと、割り出されたMRI画像上のサンプル(ボクセル)とをGUI上で可視的に関連付ける。
上記の関連付けは、例えば、次のようになされる。すなわち、図26に例示するように、サンプル・プロット・ウィンドウ152上で、指定されたサンプル(対象データ)330がハイライトされて表示され、かつ、別構造データ・ウィンドウ164上で、上記のようにして割り出されたMRI画像上のサンプル(ボクセル)332がハイライトされて表示される。また、指定されたサンプル(ボクセル)330に対応するCSIスペクトル・データ(図2に示された標準構造の実態データ116に相当)が読み出され、それに基づいて、それらのサンプル(ボクセル)のスペクトルの画像が生成されて、それらのスペクトル画像がスペクトル・チャート・ウィンドウ160に表示される。
3.2.3 ステップ324〜328:マーカ変数の検出と表示
前述した1.1.2項から1.1.4項で説明したと同様の方法で、指定されたサンプル(対象データ)(指定されたサンプルサブ群)330に共通する特徴変数が抽出され、それらについて寄与率等によるフィルタリングが行われ、それにより、最終的に指定されたサンプル(対象データ)に特異なマーカ変数が検出され、検出されたマーカ変数が図26に例示するようにハイライトされて表示される。
3.3 「異構造データ間の相関の検出#3」サブ機能
図28は、このサブ機能の処理の流れを示し、図29は、このサブ機能の処理をGUIを用いて説明している。以下、図28に示す各ステップを、図29を一緒に参照しつつ説明する。
3.3.1 ステップ340:マーカ変数の指定
上述した3.1項の「異構造データ間の相関の検出#1」サブ機能の場合と同様に、MRI画像とMRI画像中の多数のサンプル(ボクセル)の対象データ群(CSIヒストグラム・データ群)の多変量解析結果がGUI上に表示されている状態において、ユーザは、このGUIの変数プロット・ウィンドウ154上で、興味ある任意の任意の1以上の変数360を、マーカ変数として指定する(寄与率プロット・ウィンドウ156またはローディング・チャート・ウィンドウ158でマーカ変数を指定してもよい。)。
3.3.2 ステップ342〜346:特徴サンプルサブ群の抽出と表示
前述の1.2.2項から1.2.3項で説明されたのと同様の方法で、指定されたマーカ変数360に対する寄与率等によるフィルタリングが行われ、フィルタリングで絞り込まれたマーカ変数に共通する特徴サンプルサブ群364、366(マーカ変数の値が最小値に近い特徴サンプルサブ群364と、最大値に近い特徴サンプルサブ群366)が抽出され、そして、抽出された特徴サンプルサブ群364、366がサンプル・プロット・ウィンドウ152上でハイライトされて表示される。このとき、マーカ変数の値が最小値に近い特徴サンプルサブ群364と、最大値に近い特徴サンプルサブ群366とは、一目で区別できるよう、例えば異なるカラーで表示される。また、抽出された特徴サンプルサブ群364、366のスペクトルの画像が、スペクトル・チャート・ウィンドウ160上に表示される。
2.3.3 ステップ348:異構造データの連結
前述の3.2.2項で説明されたのと同様の方法で、上記ステップ346で抽出された特徴サンプルサブ群364、366に対応するMRI画像上の対応する特徴サンプルサブ群(ボクセルのサブ群)368、370が割り出され、そして、抽出された特徴サンプルサブ群364、366の対象データと、割り出されたMRI画像上の特徴サンプルサブ群(ボクセルのサブ群)368、370とがGUI上で可視的に関連付けられ連結される。
2.3.4 ステップ350:別構造データ上の関連サンプルサブ群の表示
上記ステップ348での関連付けの結果として、MRI画像上の特徴サンプル(ボクセル)サブ群(ボクセルのサブ群)368、370が、別構造データ・ウィンドウ164上でハイライトされて表示される。このとき、マーカ変数の値が最小値に近い特徴サンプルサブ群368と、最大値に近い特徴サンプルサブ群370とは、一目で区別できるように例えば異なるカラーで表示される。
以上のような「異構造データ間の相関の検出#1」〜「異構造データ間の相関の検出#3」のサブ機能を活用することで、ユーザは、各種スペクトル・データのように多変量解析の対象になり得る構造のデータと、画像データのように多変量解析の対象にならない構造のデータとの間の相関を可視的に認識することができ、その結果、これらの異構造のデータを補完的又は統合的に観察し分析して新しい知見を見つけ出すことが、より容易になる。
以上、本発明の好適な一実施形態を説明したが、これは本発明の説明のための例示であり、本発明の範囲をその実施形態にのみ限定する趣旨ではない。本発明は、その要旨を逸脱することなしに、上述の実施形態とは異なる種々の態様で実施することができる。
例えば、本発明は、実施形態で例示したような生命データだけでなく、それ以外の種々のデータの解析に適用できる。
本発明の一実施形態に係る多変量解析装置の全体的な処理の流れを示すフローチャート。 この多変量解析装置の基本的な構成を示すブロック図。 解析テーブル120のフォーマットを示す図。 「1事象のデータの解析結果に基づく特徴変数及び相関の検出」を行う場合のGUIの例を示す図。 「複数事象のデータの解析結果に基づく特徴変数及び相関の検出」を行う場合のGUIの例を示す図。 「異構造のデータの解析結果に基づく特徴変数及び相関の検出」を行う場合のGUIの例を示す。 「特定サンプルの特徴変数の抽出によるマーカ変数の検出」サブ機能の処理の流れを示ずフローチャート。 同サブ機能の処理をGUIを用いて説明する図。 特徴変数を抽出する処理を説明するための変数値の分布を示す図。 「指定マーカ変数による特徴サンプルの検出」サブ機能処理の流れを示ずフローチャート。 同サブ機能の処理をGUIを用いて説明する図。 特徴サンプルを抽出する処理を説明するための変数値の分布を示す図。 「分析データと付加データとの相補的な解析#1」サブ機能の処理の流れを示すフローチャート。 同サブ機能の処理をGUIを用いて説明する図。 「分析データと付加データとの相補的な解析#2」サブ機能の処理の流れを示すフローチャート。 同サブ機能の処理をGUIを用いて説明する図。 「異事象の分析データ間の相関およびマーカ変数の検出」サブ機能の処理の流れを示すフローチャート。 同サブ機能の処理をGUIを用いて説明する図。 異事象間で共通性あるサンプルのデータを検索する処理を説明する図。 「指定マーカ変数における異事象での挙動の抽出」サブ機能の処理の流れをすフローチャート。 同サブ機能の処理をGUIを用いて説明する図。 「異構造データ間の相関の検出#1」サブ機能の処理の流れを示すフローチャート。 同サブ機能の処理をGUIを用いて説明する図。 異構造データを関連付ける処理を説明する図。 「異構造データ間の相関の検出#2」サブ機能の処理の流れを示すフローチャート。 同サブ機能の処理をGUIを用いて説明する図。 異構造データを関連付ける処理を説明する図。 「異構造データ間の相関の検出#3」サブ機能の処理の流れを示すフローチャート。 同サブ機能の処理をGUIを用いて説明する図。
符号の説明
110 多変量解析装置
112 計算・制御モジュール
114 表示モジュール
115 UIからの要求
116 標準構造の実態データ
118 別構造の実態データ
120 解析テーブル
150 コントロール・パネル
152 サンプル・プロット・ウィンドウ
154 変数プロット・ウィンドウ
156 寄与率チャート・ウィンドウ
158 ローディング・チャート・ウィンドウ
160 スペクトル・チャート・ウィンドウ
162 ビュー・ナビゲータ・ウィンドウ
164 別構造データ・ウィンドウ

Claims (17)

  1. サンプル群の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記対象データ群を記憶する対象データ記憶手段と、
    前記対象データ群を用いて多変量解析を行う多変量解析手段と、前記対象データ群を用いて特徴抽出処理を行う特徴抽出手段とを有する計算・制御手段と、
    前記多変量解析の結果と前記特徴抽出処理の結果をグラフィカル・ユーザ・インタフェース(以下、GUIと略称する)に可視的に表示する表示手段と
    を備え、
    前記計算・制御手段の前記多変量解析手段は、前記多変量解析によって判明した前記サンプル群の特性と前記複数の変数の特性とを表す複数の多変量解析チャートを生成し、
    前記表示手段は、前記複数のチャートを前記GUI上に表示し、
    前記計算・制御手段の前記特徴抽出手段は、
    前記サンプル群中から任意のサンプルサブ群を指定するサンプル指定手段と
    前記サンプル群の対象データ群全体での各変数の値の分布を求め、求められた前記対象データ群全体での各変数の値の分布と、前記指定されたサンプルサブ群の対象データがもつ各変数の値とに基づいて、前記指定されたサンプルサブ群に共通する1以上の特徴的な変数を、前記複数の変数中からマーカ変数として検出するマーカ変数検出手段と、を有し、
    前記表示手段は、前記指定されたサンプルサブ群と前記検出されたマーカ変数を前記GUI上でハイライトして表示する、
    多変量解析装置。
  2. 請求項1記載の多変量解析装置において、
    前記多変量解析手段が行う前記多変量解析には、主成分解析が含まれ、
    前記GUI上に表示される前記複数の多変量解析チャートには、
    A. 所定の主成分軸からなる座標空間にて、前記サンプル群のそれぞれのサンプルが、所定の主成分についてのスコアに応じた座標にプロットされたサンプル・プロット・チャート、
    B. 所定の主成分軸からなる座標空間にて前記複数の変数が、所定の主成分についてのローディングに応じた座標にプロットされた変数プロット・チャート、
    C. 前記複数の変数の所定の主成分ついての寄与率が図示された寄与率チャート、及び
    D. 前記複数の変数の所定の主成分についてのローディングの和が図示されたローディング・チャート、
    のうちの少なくとも二つが含まれ、
    前記表示手段は、前記指定されたサンプルサブ群を、前記サンプル・プロット・チャート上でハイライトして表示し、前記検出されたマーカ変数を、前記変数プロット・チャート、前記寄与率チャート、及び前記ローディング・チャートの内の少なくとも一つのチャート上でハイライトして表示する、
    多変量解析装置。
  3. 請求項記載の多変量解析装置において、
    前記多変量解析手段が行う前記多変量解析には、主成分解析が含まれ、
    前記マーカ変数検出手段は、前記検出されたマーカ変数に対して、前記主成分解析で得られた寄与率に基づいたフィルタリングを行なって、より確度の高いマーカ変数に絞り込む、
    多変量解析装置。
  4. 請求項1〜のいずれか一項記載の多変量解析装置において、
    前記計算・制御手段の前記特徴抽出手段は、
    前記複数の変数中から任意の変数をマーカ変数として指定するマーカ変数指定手段と、
    前記サンプル群の対象データ群がもつ各変数の値に基づいて、前記指定されたマーカ変数に共通する1以上の特徴的なサンプルサブ群を検出する特徴サンプル検出手段と
    を有し、
    前記表示手段は、前記指定されたマーカ変数と前記検出された特徴的なサンプルサブ群とを前記GUI上でハイライトして表示する、
    多変量解析装置。
  5. 請求項記載の多変量解析装置において、
    前記特徴サンプル検出手段は、前記対象データ群全体での前記指定されたマーカ変数の各々の値の分布を求め、求まった前記対象データ群全体での前記指定されたマーカ変数の各々の値の分布と、各サンプルの対象データがもつ前記指定されたマーカ変数の各々の値とに基づいて、前記特徴的なサンプルサブ群を検出する、
    多変量解析装置。
  6. 請求項又は記載の多変量解析装置において、
    前記多変量解析手段が行う前記多変量解析には、主成分解析が含まれ、
    前記特徴サンプル検出手段は、前記指定されたマーカ変数に対して、前記主成分解析で得られた寄与率に基づいたフィルタリングを行なって、より確度の高いマーカ変数に絞り込む、
    多変量解析装置。
  7. 請求項1〜のいずれか一項記載の多変量解析装置において、
    前記サンプル群の1種類以上の付加データ群を記憶する付加データ記憶手段をさらに備え、
    前記計算・制御手段の前記特徴抽出手段は、
    前記1種類以上の付加データ群中から任意の種類の付加データ群を指定する付加データ指定手段と、
    前記指定された種類の付加データ群の値に基づいて、前記指定された種類の付加データ群に共通する1以上の特徴的なサンプルサブ群を、前記サンプル群中から検出する特徴サンプル検出手段と、
    前記対象データ群がもつ各変数の値に基づいて、前記検出された特徴的なサンプルサブ群に共通する1以上の特徴的な変数を、前記複数の変数中からマーカ変数として検出するマーカ変数検出手段と、
    を有し、
    前記表示手段は、前記検出された特徴的なサンプルサブ群と前記検出されたマーカ変数とを前記GUI上でハイライトして表示する、
    多変量解析装置。
  8. 請求項記載の多変量解析装置において、
    前記特徴サンプル検出手段は、前記指定された種類の付加データ群全体での前記付加データの値の分布を求め、求まった前記付加データ群全体での前記付加データの値の分布と、各サンプルの付加データがもつ値とに基づいて、前記特徴的なサンプルサブ群を検出し、
    前記マーカ変数検出手段は、前記対象データ群全体での各変数の値の分布を求め、求められた前記対象データ群全体での各変数の値の分布と、前記検出された特徴的なサンプルサブ群の対象データがもつ各変数の値とに基づいて、前記指定されたサンプルサブ群に共通する1以上の特徴的な変数を検出する、
    多変量解析装置。
  9. 請求項1〜のいずれか一項記載の多変量解析装置において、
    前記サンプル群の1種類以上の付加データ群を記憶する付加データ記憶手段をさらに備え、
    前記計算・制御手段の前記多変量解析手段は、前記多変量解析として少なくとも主成分解析を行い、前記主成分解析の結果に基づいて、所定の1以上の主成分軸からなる座標空間にて、前記サンプル群のそれぞれのサンプルが、所定の主成分についてのスコアに応じた座標にプロットされたサンプル・プロット・チャートを、前記多変量解析チャートの一つとして作成し、
    前記表示手段は、前記サンプル・プロット・チャートを前記GUI上に表示し、
    前記計算・制御手段の前記特徴抽出手段は、
    前記所定の1以上の主成分軸中から任意の主成分軸を指定し、且つ、前記1種類以上の付加データ群中から任意の種類の付加データ群を指定する付加データ指定手段と、
    前記主成分解析の結果と前記指定された種類の付加データ群の値とに基づいて、前記サンプル・プロット・チャート中の前記指定された主成分軸を前記指定された種類の付加データ群の値に対応する座標軸に置換してなる置換サンプル・プロット・チャートを作成する主成分軸置換手段と
    を有し、
    前記表示手段は、前記置換サンプル・プロット・チャートを前記GUI上に表示する、
    多変量解析装置。
  10. 請求項1〜のいずれか一項記載の多変量解析装置において、
    前記対象データ記憶手段は、
    第1のサンプル群の第1の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記第1の対象データ群と、
    第2のサンプル群の第2の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記第2の対象データ群と
    を記憶し、前記第1と第2のサンプル群間で互いに共通性のあるサンプル同士を関連づけており、
    前記計算・制御手段の前記多変量解析手段は、前記第1の対象データ群を用いた第1の多変量解析と前記第2の対象データ群を用いた第2の多変量解析とを行ない、前記第1の多変量解析の結果を示す1以上の第1のチャートと、前記第2の多変量解析の結果を示す1以上の第2のチャートとを作成し、
    前記表示手段は、前記第1のチャートと前記第2のチャートとを前記GUI上に表示し、
    前記計算・制御手段の前記特徴抽出手段は、
    前記第1のサンプル群中から任意の第1のサンプルサブ群を指定するサンプル指定手段と、
    前記第1と第2のサンプル群間の関連付けに基づいて、前記指定された第1のサンプルサブ群に共通性のある第2のサンプルサブ群を、前記第2のサンプル群中から検索する関連サンプル検索手段と、
    を有し、
    前記表示手段は、前記指定された第1のサンプルサブ群と前記検出された第2のサンプルサブ群とを前記GUI上でハイライトして表示する、
    多変量解析装置。
  11. 請求項10記載の多変量解析装置において、
    前記計算・制御手段の前記特徴抽出手段は、
    前記第1の対象データ群がもつ各変数の値に基づいて、前記指定された第1のサンプルサブ群に共通する1以上の特徴的な変数を、前記第1の対象データ群がもつ前記複数の変数中から、第1のマーカ変数として検出する第1のマーカ変数検出手段と、
    前記第2の対象データ群がもつ各変数の値に基づいて、前記検索された第2のサンプルサブ群に共通する1以上の特徴的な変数を、前記第2の対象データ群がもつ前記複数の変数中から、第2のマーカ変数として検出する第2のマーカ変数検出手段と
    をさらに備え、
    前記表示手段は、前記検出された第1と第2のマーカ変数を前記GUI上でハイライトして表示する、
    多変量解析装置。
  12. 請求項1〜11のいずれか一項記載の多変量解析装置において、
    前記対象データ記憶手段は、
    第1のサンプル群の第1の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記第1の対象データ群と、
    第2のサンプル群の第2の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記第2の対象データ群と
    を記憶し、前記第1と第2のサンプル群間で互いに共通性のあるサンプル同士を関連づけており、
    前記計算・制御手段の前記多変量解析手段は、前記第1の対象データ群を用いた第1の多変量解析と前記第2の対象データ群を用いた第2の多変量解析とを行ない、前記第1の多変量解析の結果を示す1以上の第1のチャートと、前記第2の多変量解析の結果を示す1以上の第2のチャートとを作成し、
    前記表示手段は、前記第1のチャートと前記第2のチャートとを前記GUI上に表示し、
    前記計算・制御手段の前記特徴抽出手段は、
    前記第1の対象データ群がもつ前記複数の変数中から任意の変数をマーカ変数として指定するマーカ変数指定手段と、
    前記第1の対象データ群がもつ各変数の値に基づいて、前記指定されたマーカ変数に共通する1以上の特徴的な第1のサンプルサブ群を、前記第1のサンプル群中から検出する特徴サンプル検出手段と、
    前記第1と第2のサンプル群間の関連付けに基づいて、前記検出された第1のサンプルサブ群に共通性のある第2のサンプルサブ群を、前記第2のサンプル群中から検索する関連サンプル検索手段と、
    を有し、
    前記表示手段は、前記指定されたマーカ変数と前記検出された第1の特徴的なサンプルサブ群と前記検索された第2の特徴的なサンプルサブ群とを前記GUI上でハイライトして表示する、
    多変量解析装置。
  13. 請求項12記載の多変量解析装置において、
    前記計算・制御手段の前記特徴抽出手段は、
    前記第2の対象データ群がもつ各変数の値に基づいて、前記検索された第2のサンプルサブ群に共通する1以上の特徴的な変数を、前記第2の対象データ群がもつ前記複数の変数中から、関連マーカ変数として検出する第2のマーカ変数検出手段と
    をさらに備え、
    前記表示手段は、前記指定されたマーカ変数と前記検出された第1の特徴的なサンプルサブ群と前記検索された第2の特徴的なサンプルサブ群だけでなく、前記検出された関連マーカ変数も、前記GUI上でハイライトして表示する、
    多変量解析装置。
  14. 請求項1記載の多変量解析装置において、
    前記サンプル群のそれぞれのサンプルに関連付けられた複数のデータ部分を有する別構造データを記憶した別構造データ記憶手段を更に備え、
    前記計算・制御手段は、前記別構造データを図示した別構造データ・チャートを作成する手段をさらに有し、
    前記表示手段は、前記複数の多変量解析チャートだけでなく前記別構造データ・チャートも前記GUI上に表示し、
    前記計算・制御手段の前記特徴抽出手段は、
    前記別構造データの前記複数のデータ部分中から任意のデータ部分を指定するデータ部分指定手段と、
    前記サンプル群中から、前記指定されたデータ部分に関連付けられたサンプルサブ群を検出する関連サンプル検出手段と、
    前記対象データ群がもつ各変数の値に基づいて、前記検出されたサンプルサブ群に共通する1以上の特徴的な変数を、前記複数の変数中からマーカ変数として検出するマーカ変数検出手段と、
    を有し、
    前記表示手段は、前記指定されたデータ部分と前記検出されたサンプルサブ群と前記検索されたマーカ変数とを前記GUI上でハイライトして表示する、
    多変量解析装置。
  15. 請求項1〜14のいずれか一項記載の多変量解析装置において、
    前記サンプル群のそれぞれのサンプルに関連付けられた複数のデータ部分を有する別構造データを記憶した別構造データ記憶手段を更に備え、
    前記計算・制御手段は、前記別構造データを図示した別構造データ・チャートを作成する手段をさらに有し、
    前記表示手段は、前記複数の多変量解析チャートだけでなく前記別構造データ・チャートも前記GUI上に表示し、
    前記計算・制御手段の前記特徴抽出手段は、
    前記サンプル群中から任意のサンプルサブ群を指定するサンプル指定手段と、
    前記別構造データの前記複数のデータ部分中から、前記指定されたサンプルサブ群に関連付けられたデータ部分を検出する関連データ部分検出手段と、
    前記対象データ群がもつ各変数の値に基づいて、前記指定されたサンプルサブ群に共通する1以上の特徴的な変数を、前記複数の変数中からマーカ変数として検出するマーカ変数検出手段と、
    を有し、
    前記表示手段は、前記指定されたサンプルサブ群と前記検出されたデータ部分と前記検索されたマーカ変数とを前記GUI上でハイライトして表示する、
    多変量解析装置。
  16. 請求項1〜15のいずれか一項記載の多変量解析装置において、
    前記サンプル群のそれぞれのサンプルに関連付けられた複数のデータ部分を有する別構造データを記憶した別構造データ記憶手段を更に備え、
    前記計算・制御手段は、前記別構造データを図示した別構造データ・チャートを作成する手段をさらに有し、
    前記表示手段は、前記複数の多変量解析チャートだけでなく前記別構造データ・チャートも前記GUI上に表示し、
    前記計算・制御手段の前記特徴抽出手段は、
    前記複数の変数中から、任意の変数をマーカ変数として指定するマーカ変数指定手段と、
    前記対象データ群がもつ各変数の値に基づいて、前記指定されたマーカ変数に共通する1以上の特徴的なサンプルサブ群を、前記サンプル群中から検出する特徴サンプル検出手段と、
    前記別構造データの前記複数のデータ部分中から、前記検出された特徴的なサンプルサブ群に関連付けられたデータ部分を検出する関連データ部分検出手段と、
    を有し、
    前記表示手段は、前記指定されたマーカ変数と前記検出された特徴的なサンプルサブ群と前記検出されたデータ部分とを前記GUI上でハイライトして表示する、
    多変量解析装置。
  17. サンプル群の対象データ群であって、個々の対象データが複数の変数の値をもつ、前記対象データ群を記憶する対象データ記憶手段と、
    前記対象データ群を用いて多変量解析を行う多変量解析手段と、前記対象データ群を用いて特徴抽出処理を行う特徴抽出手段とを有する計算・制御手段と、
    前記多変量解析の結果と前記特徴抽出処理の結果をグラフィカル・ユーザ・インタフェース(以下、GUIと略称する)に可視的に表示する表示手段と
    を備え、
    前記計算・制御手段の前記多変量解析手段は、前記多変量解析によって判明した前記サンプル群の特性と前記複数の変数の特性とを表す複数の多変量解析チャートを生成し、
    前記表示手段は、前記複数のチャートを前記GUI上に表示し、
    前記計算・制御手段の前記特徴抽出手段は、前記サンプル群中から任意のサンプルサブ群を指定し、前記サンプル群の対象データ群全体での各変数の値の分布を求め、求められた前記対象データ群全体での各変数の値の分布と、前記指定されたサンプルサブ群の対象データがもつ各変数の値とに基づいて、前記指定されたサンプルサブ群に共通する1以上の特徴的な変数を、前記複数の変数中からマーカ変数として検出し、
    前記表示手段は、前記指定されたサンプルサブ群と、前記検出されたマーカ変数を、前記GUI上でハイライトして表示する、
    多変量解析装置として、コンピュータを機能させるコンピュータプログラム。
JP2007235895A 2007-09-11 2007-09-11 多変量解析装置及びコンピュータプログラム Expired - Fee Related JP5088731B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007235895A JP5088731B2 (ja) 2007-09-11 2007-09-11 多変量解析装置及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007235895A JP5088731B2 (ja) 2007-09-11 2007-09-11 多変量解析装置及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2009066088A JP2009066088A (ja) 2009-04-02
JP5088731B2 true JP5088731B2 (ja) 2012-12-05

Family

ID=40602992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007235895A Expired - Fee Related JP5088731B2 (ja) 2007-09-11 2007-09-11 多変量解析装置及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5088731B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5330456B2 (ja) * 2010-07-09 2013-10-30 株式会社東芝 医用画像診断装置及び制御方法
JP5780089B2 (ja) * 2011-09-28 2015-09-16 富士通株式会社 計算方法、計算プログラムおよび計算装置
JP6021272B2 (ja) 2014-07-08 2016-11-09 京セラドキュメントソリューションズ株式会社 情報処理システムおよび情報処理方法
WO2019202728A1 (ja) * 2018-04-20 2019-10-24 ヒューマン・メタボローム・テクノロジーズ株式会社 データ解析装置及びデータ解析方法
US20220359176A1 (en) * 2019-09-13 2022-11-10 Shimadzu Corporation Analysis device
WO2023008447A1 (ja) * 2021-07-28 2023-02-02 パナソニックIpマネジメント株式会社 情報表示方法、情報表示装置およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3104985B2 (ja) * 1990-10-23 2000-10-30 株式会社東芝 磁気共鳴診断装置
JP5020491B2 (ja) * 2005-05-02 2012-09-05 株式会社 Jeol Resonance Nmrデータの処理装置及び方法

Also Published As

Publication number Publication date
JP2009066088A (ja) 2009-04-02

Similar Documents

Publication Publication Date Title
KR101106201B1 (ko) 임상검사분석장치, 임상검사분석방법 및 그 방법을 컴퓨터에 실행시키는 프로그램을 저장하는 컴퓨터 판독 가능한 기록매체
JP5088731B2 (ja) 多変量解析装置及びコンピュータプログラム
JP4860575B2 (ja) クロマトグラフィー質量分析の分析結果表示方法及び表示装置
JP5767471B2 (ja) テストの網羅性を評価する装置及び方法
US20220237796A1 (en) Quality Control of Automated Whole-slide Analyses
JP5527232B2 (ja) 質量分析データ処理方法及び装置
JP6438651B2 (ja) 散在するログを探索して表示する方法及びシステム
US10089518B2 (en) Graphical user interface for analysis of red blood cells
CN108090032A (zh) 逻辑回归模型的可视化解释方法及装置
JP5771060B2 (ja) 検体分析装置及びデータ処理装置
JP6295474B2 (ja) 分光学的探索アプリケーションにおいて対象の標準物質をタグ付けする方法
EP3797420A1 (en) Condition specific sample analysis
JP5272822B2 (ja) 代謝物解析用データ処理装置
US8504301B2 (en) Sample analyzer, method for displaying analysis result information of a sample and computer program product
JP6973640B2 (ja) イメージング質量分析データ処理装置
JP5020491B2 (ja) Nmrデータの処理装置及び方法
JP5415476B2 (ja) Nmrデータの処理装置及び方法
JP2011192059A (ja) テキスト解析システムおよびテキスト解析方法
JP5297750B2 (ja) 検査結果表示装置、検査結果表示システム、検査結果表示方法及びコンピュータプログラム
KR102113834B1 (ko) Pls-da를 기반으로 하는 db의 웹서비스 구현 방법
JP3395627B2 (ja) 生体の粒子画像の分類方法
WO2018061240A1 (ja) 計装図データ生成装置、計装図検索システム及びプログラム
US20230195279A1 (en) Viewer for analysis, display system, display method, and display program
JP5818250B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP4007608B2 (ja) データの意味と価値に基づくコンピュータ処理用操作ボタンの生成方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100226

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100604

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20110705

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120814

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120904

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees