WO2019202728A1 - データ解析装置及びデータ解析方法 - Google Patents

データ解析装置及びデータ解析方法 Download PDF

Info

Publication number
WO2019202728A1
WO2019202728A1 PCT/JP2018/016277 JP2018016277W WO2019202728A1 WO 2019202728 A1 WO2019202728 A1 WO 2019202728A1 JP 2018016277 W JP2018016277 W JP 2018016277W WO 2019202728 A1 WO2019202728 A1 WO 2019202728A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
control unit
data analysis
multivariate
case
Prior art date
Application number
PCT/JP2018/016277
Other languages
English (en)
French (fr)
Inventor
山本 博之
Original Assignee
ヒューマン・メタボローム・テクノロジーズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヒューマン・メタボローム・テクノロジーズ株式会社 filed Critical ヒューマン・メタボローム・テクノロジーズ株式会社
Priority to PCT/JP2018/016277 priority Critical patent/WO2019202728A1/ja
Priority to PCT/JP2019/016848 priority patent/WO2019203352A1/ja
Priority to JP2020514463A priority patent/JP7175521B2/ja
Publication of WO2019202728A1 publication Critical patent/WO2019202728A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models

Abstract

データ解析装置(50)は、多変量統計による複数の変量を含む多変量データ(D1~D3)を解析する。データ解析装置は、制御部(51)と、記憶部(52)とを備える。制御部は、多変量データの解析を実行する。記憶部は、制御部によって解析された情報を記憶する。制御部は、多変量統計の対象とする事例毎に、当該事例の多変量データにおいて所定条件を満たす変量の組を示す変量情報(Dn)を、記憶部に蓄積する。制御部は、事例毎に蓄積した変量情報に基づいて、別々の事例の間の関連性を示す関連性情報を生成する。

Description

データ解析装置及びデータ解析方法
 本発明は、メタボロミクスにおけるメタボロームデータ等の、多変量統計における多変量データを解析するデータ解析装置、データ解析方法及びプログラムに関する。
 近年、様々な分野において大規模に蓄積された各種データ即ちビッグデータを用いることが検討されている。例えば、人工知能の研究で用いられる機械学習の手法を用いてビッグデータを解析することにより、新たな発見を得ることが期待されている。メタボロミクスの分野においても、メタボロームデータの蓄積が始められている。例えば、非特許文献1,2は、測定の生データまたは解析後のデータの蓄積を目的として構築されるデータベースを開示している。
Kale NS, Haug K, Conesa P, Jayseelan K, Moreno P, Rocca-Serra P, Nainala VC, Spicer RA, Williams M, Li X, Salek RM, Griffin JL, Steinbeck C., "MetaboLights: An Open-Access Database Repository for Metabolomics Data." Curr Protoc Bioinformatics. (2016), 24;53:14.13.1-18. Sud M, Fahy E, Cotter D, Azam K, Vadivelu I, Burant C, Edison A, Fiehn O, Higashi R, Nair KS, Sumner S, Subramaniam S., "Metabolomics Workbench: An international repository for metabolomics data and metadata, metabolite standards, protocols, tutorials and training, and analysis tools." Nucleic Acids Res. (2016), 4;44(D1):D463-70.
 一方、メタボロミクスでは、蓄積されたメタボロームデータをビッグデータとしてどのように解析するのかについては、具体的な研究の進展が殆ど得られていない。従来技術によると、メタボロミクスのような分野では蓄積されたデータを活用し難いという課題があった。
 本発明の目的は、メタボロミクス等の多変量統計において蓄積されるデータを活用し易くすることができるデータ解析装置及び方法を提供することにある。
 本発明に係るデータ解析装置は、多変量統計による複数の変量を含む多変量データを解析する。データ解析装置は、制御部と、記憶部とを備える。制御部は、多変量データの解析を実行する。記憶部は、制御部によって解析された情報を記憶する。制御部は、多変量統計の対象とする事例毎に、当該事例の多変量データにおいて所定条件を満たす変量の組を示す変量情報を、記憶部に蓄積する。制御部は、事例毎に蓄積した変量情報に基づいて、別々の事例の間の関連性を示す関連性情報を生成する。
 本発明に係るデータ解析方法は、コンピュータが、多変量統計による複数の変量を含む多変量データを解析する方法である。本方法は、コンピュータの制御部が、多変量統計の対象とする事例毎に、当該事例の多変量データにおいて所定条件を満たす変量の組を示す変量情報を、コンピュータの記憶部に蓄積するステップを含む。本方法は、事例毎に蓄積した変量情報に基づいて、別々の事例の間の関連性を示す関連性情報を生成するステップを含む。
 本発明に係るデータ解析装置及び方法によると、事例毎に変量情報を蓄積して関連性情報を生成することにより、多変量統計において蓄積されるデータを活用し易くすることができる。
実施形態1に係るデータ解析装置の概要を説明するための図 実施形態1に係るデータ解析装置の構成を示すブロック図 データ解析装置の動作を説明するためのフローチャート メタボロームデータのデータ構造を例示する図 データ解析装置によるネットワークグラフの表示例を示す図 ノードデータを抽出する処理を説明するためのフローチャート ノードデータのデータ構造を例示する図 類似度を算出する処理を説明するためのフローチャート 類似度の算出におけるクロス集計表を例示する図 類似度の算出における重み付きグラフ隣接行列を説明するための図
 以下、添付の図面を参照して本発明に係るデータ解析装置、データ解析方法及びプログラムの実施の形態を説明する。なお、以下の各実施形態において、同様の構成要素については同一の符号を付している。
(実施形態1)
 実施形態1では、本発明に係るデータ解析方法をメタボロミクスに適用する適用例を説明する。
1.構成
 実施形態1に係るデータ解析方法が実行されるデータ解析装置の構成について、以下説明する。
1-1.概要
 本実施形態に係るデータ解析方法及び装置の概要について、図1を用いて説明する。図1は、本実施形態に係るデータ解析装置5の概要を説明するための図である。
 図1は、複数のメタボロームデータD1~D3を収集して、本実施形態のデータ解析装置5において解析する例を示している。各々のメタボロームデータD1~D3は、例えば互いに異なる研究論文において、別々の試験で測定されたり、解析されたりして得られたことを想定している。メタボロームデータD1~D3は、変量が生体の代謝物である多変量データの一例である。多変量データは、例えば3つ以上の変量を用いる多変量統計における変量毎のデータ値を含む。
 例えば、メタボロームデータD1は、代謝物の名称(即ち代謝物名)M11,M12,M13と、各々の測定値とを関連付けて記録している。同様に、メタボロームデータD2は、代謝物名M21~M24等及び測定値を記録し、メタボロームデータD3は、代謝物名M31~M32及び測定値を記録している。以下では、別々のメタボロームデータD1~D3において同じ代謝物を対象とする場合、各々の代謝物名M11~M13,M21~M24,M31~M32には、同じ代謝物名が含まれることとする。また、測定値等のデータ値は、絶対定量値に限らず、相対定量値の場合もある。
 上記のような複数のメタボロームデータD1~D3が収集された場合の従来の解析手法としては、収集したメタボロームデータD1~D3間で共通する代謝物のデータを抽出することによって、解析対象のデータを統合する手法が考えられる。このような手法によると、統合したデータに対しては、主成分分析によって可視化等が行える。
 しかしながら、例えば別々の試験によるメタボロームデータD1,D2,D3の間で、対象とする代謝物は合致しないことが想定される。この場合、統合するデータ数を増やすほどデータ間で共通の代謝物が減り、最終的にはタンパク質構成アミノ酸等のごく少数の代謝物に収束してしまう虞がある。また、上記の従来手法によると、利用可能なデータが、絶対定量値が計算された代謝物のデータのみに限定されてしまう。
 さらに、メタボロームデータが現行、ビッグデータとして活用し難い理由の一つとして、メタボロミクスでは、他のオミックスと比較して測定技術が未成熟であり、まだ新しい測定機器及び測定方法が開発され続けている点も挙げられる。この点については将来的に、測定機器及び測定方法が統一されることによって解決される可能性もある。しかし、少なくとも現状では、様々な測定機器及び測定法によって得られたメタボロームデータが混在しており、ビッグデータ化を困難にしている。
 そこで、本実施形態に係るデータ解析装置5は、測定で得られた半定量データを含めて収集されるメタボロームデータD1~D3において、群間比較の事例(即ち比較群)毎に顕著な変動を有する代謝物の代謝物名をデータとするデータベース50を構築する(以下「メタボロミクスDB50」という)。代謝物名は、定性データであり、収集されたメタボロームデータD1~D3の測定機器又は測定法が異なっていたとしても得られる。また、メタボロミクスDB50によると、相対定量値及び絶対定量値のいずれであっても適用可能であり、ビッグデータ化することが可能になる。
 以上のようなメタボロミクスDB50を用いて、本実施形態のデータ解析装置5は、別々の事例同士で関連し得ると期待される関連性を可視化する。このような可視化において、2つの比較群間の類似度を用いることにより、当該2つの比較群間で共通する代謝物の情報を全て利用することができる。本実施形態のデータ解析装置5及び方法によると、異なる試験で測定された代謝物が2群間で一部共通しているだけで、対応するメタボロームデータD1~D3を合わせて解析可能なプラットフォームを提供することができる。
1-2.装置構成
 本実施形態に係るデータ解析装置5の構成について、図2を用いて説明する。図2は、データ解析装置5の構成を示すブロック図である。
 データ解析装置5は、例えばPC(パーソナルコンピュータ)などの情報処理装置で構成される。データ解析装置5は、図2に示すように、制御部51と、記憶部52と、操作部53と、表示部54と、機器インタフェース55と、ネットワークインタフェース56とを備える。
 制御部51は、例えばソフトウェアと協働して所定の機能を実現するCPUやMPU等を含み、データ解析装置5の全体動作を制御する。制御部51は、記憶部52に格納されたデータやプログラムを読み出して種々の演算処理を行い、各種の機能を実現する。例えば、制御部51は、本実施形態に係るデータ解析方法をデータ解析装置5に行わせるための命令群を含んだプログラムを実行する。上記のプログラムは、インターネット等の通信ネットワークから提供されてもよいし、可搬性を有する記録媒体に格納されていてもよい。
 また、制御部51は、所定の機能を実現するように設計された専用の電子回路や再構成可能な電子回路などのハードウェア回路であってもよい。制御部51は、CPU、MPU、GPU、マイコン、DSP、FPGA、ASIC等の種々の半導体集積回路で構成されてもよい。
 記憶部52は、データ解析装置5の機能を実現するために必要なプログラム及びデータを記憶する記録媒体であり、例えばハードディスク(HDD)や半導体記憶装置(SSD)を備える。例えば、記憶部52は、メタボロミクスDB50などを格納する。また、記憶部52は、例えば、DRAMやSRAM等の半導体デバイスを備えてもよく、データを一時的に記憶するとともに制御部51の作業エリアとしても機能する。
 操作部53は、ユーザが操作を行うユーザインタフェースである。操作部53は、例えば、キーボード、タッチパッド、タッチパネル、ボタン、スイッチ、及びこれらの組み合わせで構成される。操作部53は、ユーザによって入力される諸情報を取得する取得部の一例である。
 表示部54は、例えば、液晶ディスプレイや有機ELディスプレイで構成される。表示部54は、例えば操作部53から入力された情報など、種々の情報を表示する。
 機器インタフェース55は、データ解析装置5に他の機器を接続するための回路(モジュール)である。機器インタフェース55は、所定の通信規格にしたがい通信を行う取得部の一例である。所定の規格には、USB、HDMI(登録商標)、IEEE1395、WiFi、Bluetooth(登録商標)等が含まれる。
 ネットワークインタフェース56は、無線または有線の通信回線を介してデータ解析装置5をネットワークに接続するための回路(モジュール)である。ネットワークインタフェース56は、所定の通信規格に準拠した通信を行う取得部の一例である。所定の通信規格には、IEEE802.3,IEEE802.11a/11b/11g/11ac等の通信規格が含まれる。
 以上の説明では、PC等で構成されるデータ解析装置5の一例を説明した。データ解析装置5はこれに限定されず、種々の情報処理装置(即ちコンピュータ)であってもよい。例えば、データ解析装置5は、ASPサーバなどの一つ又は複数のサーバ装置であってもよい。また、コンピュータクラスタ或いはクラウドコンピューティングなどにおいて、本開示に係るデータ解析方法が実現されてもよい。
 例えば、データ解析装置5は、外部から通信ネットワークを介して入力されたメタボロームデーD1~D3(図1)をネットワークインタフェース56により取得して、本実施形態のデータ解析方法を実行してもよい。データ解析装置5は、ネットワークインタフェース56から外部に、データ解析方法の解析結果を送信してもよい。
2.動作
 以上のように構成されるデータ解析装置5の動作について、以下説明する。
2-1.全体動作
 本実施形態に係るデータ解析装置5がデータ解析方法を実行する動作について、図1,3~5を用いて説明する。
 図3は、データ解析装置5の動作を説明するためのフローチャートである。図4は、メタボロームデータD1のデータ構造を例示する図である。図5は、データ解析装置5によるネットワークグラフ50nの表示例を示す図である。図3のフローチャートに示す各処理は、本実施形態のデータ解析方法を行うためのプログラムに従って、データ解析装置5の制御部51によって実行される。
 まず、制御部51は、各種取得部53,55,56を介して、メタボロームデータD1~D3を取得する(S1)。例えば、ユーザは操作部53を操作することにより、メタボロームデータD1~D3をデータ解析装置5に入力できる。また、メタボロームデータD1~D3は、機器インタフェース55或いは通信インタフェース56を介して取得されてもよい。
 ステップS1において、制御部51は、複数のメタボロームデータD1~D3を取得し得る。また、制御部51は、1つのメタボロームデータD1を取得してもよく、例えば他のメタボロームデータD2,D3に関する情報が予め蓄積されたメタボロミクスDB50への追加を行ってもよい。図4を用いて、メタボロームデータD1のデータ構造の一例を説明する。
 図4に例示するメタボロームデータD1は、「代謝物名」と「サンプル」とを関連付けたデータ値(図中「XX」で示す)として、各々の代謝物名M31~M33が示す代謝物についてのサンプルa1~b5毎の測定値をそれぞれ記録している。「サンプル」は、統計的な母集団に含まれるサンプルであり、例えばメタボロミクスにおいて代謝物の測定対象となる各種の生体または検体等である。
 図4の例のメタボロームデータD1は、「群」によって「サンプル」を分類しており、一部のサンプルa1~a5はA群に分類され、別のサンプルb1~b5はB群に分類されている。「群」は、サンプル間で共通する特徴あるいは測定時の各種条件などによって規定されるサンプルの集合である。A群及びB群のような2群としては、例えば、特定の疾患を有する疾患群及び疾患を有しない健常群、あるいは所定の実験に関する実験群及び対照群などが挙げられる。なお、1つのメタボロームデータD1に含まれる群の個数は2群に限らず、3群以上であってもよい。
 図3に戻り、制御部51は、取得したメタボロームデータD1~D3から、群間で顕著な差が認められる代謝物の「代謝物名」等を示す情報を、ノードデータとして抽出する(S2)。1つのノードデータは、後述するネットワークグラフ50nにおける1つのノードNに対応する(図5参照)。ステップS2において、制御部51は、特定の2群を比較する群間比較の一事例(すなわち比較群)毎に、ノードデータを生成する。
 例えば、制御部51は、図4の例のメタボロームデータD1に基づいて、A群とB群との比較結果を示すノードデータを生成する。制御部51は、A群とB群との比較群に対応する1つのノードNを示す情報(例えば管理番号「N10」)と、生成したノードデータとを関連付けて、メタボロミクスDB50に記録する(以下、管理番号「N10」のノードNを「ノードN10」等と略記する場合がある)。ステップS2では、ステップS1で取得されたデータに応じて、複数のノードデータが生成されてもよい。ステップS2の処理の詳細については後述する。
 次に、制御部51は、複数のノードNに対応する複数のノードデータに基づいて、各ノードデータ中の代謝物の組が類似する度合いを示す類似度を算出する(S3)。類似度は、本実施形態における関連性情報の一例である。
 例えば、制御部51は、メタボロームデータD1(図4)中のA群とB群との比較群に対応するノードデータと、予めメタボロミクスDB50に蓄積されたノードデータとの間の類似度を算出する。これにより、A群とB群とを比較した事例と、過去の試験の種々の事例との関連性をスコア化することができる。類似度のスコアには、例えばノードデータ間の正相関又は負相関に応じた正負を設定可能である。ステップS3の処理の詳細については後述する。
 次に、制御部51は、メタボロミクスDB50のノードデータ及び類似度に基づいて、例えば図5に示すように、ネットワークグラフ50nを生成し、表示部54に表示させる(S4)。制御部51は、ネットワークグラフ50nの表示により(S4)、図3に示す処理を終了する。
 以上の処理によると、メタボロームデータD1~D3を収集することにより、メタボロミクスDB50を構築して、ネットワークグラフ50nとして可視化することができる。図5を用いて、ネットワークグラフ50nについて説明する。
 図5は、図1の例のメタボロームデータD1,D2,D3からノードデータを抽出してメタボロミクスDB50が構築された場合におけるネットワークグラフ50nの表示例を示している。ネットワークグラフ50nは、複数のノードNと、ノードN間を接続するエッジEとを含む。図5では、3つのメタボロームデータD1,D2,D3の各々から複数のノードN10~N14,N20~N25,N30~N32に対応するノードデータが抽出された場合を例示している。
 図5に例示するように、ネットワークグラフ50nは、例えば別々の論文から得られたノードデータに基づくノードN10~N14,N20~N25,N30~N32の色付け等を異ならせて、各々の管理番号N10~N32と共に表示できる。例えば、制御部51は、メタボロミクスDB50において、抽出元のメタボロームデータD1,D2,D3を示す属性情報等を用いて、各ノードNに対応するノードデータを管理する。
 ステップS4において、制御部51は、ノードNのペア毎に算出された類似度に基づいて、ネットワークグラフ50nにおいて当該ペアのノードN間のエッジEをそれぞれ設定する。図5の例において、各々のエッジEは、対応するスコアの大きさが大きいほど太い線幅を有すると共に、当該スコアの正負に応じて異なる線種を有する。
 以上のようなネットワークグラフ50nによると、別々の論文等のノードN間を接続するエッジEに基づき、異なる試験結果の事例同士が正に相関したり負に相関したりする関連性を可視化することができる。なお、制御部51は、例えばステップS3の算出結果に基づいて、互いに関連性が低いと考えられるノードN間をエッジEで接続しないようにネットワークグラフ50nを生成可能である。
 以上の説明では、代謝物の測定値が記録されたメタボロームデータD1(図4)の一例を説明した。メタボロームデータD1~D3に記録されるデータ値は、特に代謝物の測定値に限らず、例えば各種の解析結果を示す値であってもよい。メタボロームデータD1~D3は、絶対定量値で規定される定量データであってもよいし、相対定量値で規定される半定量データであってもよい。
2-1-1.ノードデータを抽出する処理(S2)
 図3のステップS2の処理の詳細について、図6~7を用いて説明する。
 図6は、ノードデータを抽出する処理(S2)を説明するためのフローチャートである。図7は、ノードデータDnのデータ構造を例示する図である。
 まず、制御部51は、図3のステップS1において取得したメタボロームデータD1~D3から、群間比較の対象とする2群を認識する(S11)。例えば、制御部51は、図4のメタボロームデータD1におけるA群とB群とを認識する。
 次に、制御部51は、取得したメタボロームデータD1のうちの認識した2群のデータに基づいて、代謝物毎の2群間の比、すなわち群間比Rを取得する(S12)。制御部51は、例えば代謝物名「M11」等の1つの代謝物の群間比Rとして、A群中のサンプルa1~a5にわたる当該代謝物の測定値の平均値と、B群中のサンプルb1~b5にわたる測定値の平均値との間の比率を算出する。制御部51は、2群のデータ中の全ての代謝物について同様の計算を行って、各代謝物の群間比Rを取得する。
 次に、制御部51は、取得した代謝物毎の群間比Rに基づいて、群間比Rが所定の第1しきい値R1を上回る代謝物を判定する(S13)。第1しきい値R1は、1よりも大きい値に設定され、例えばR1=1.5に設定される。第1しきい値R1は、一方の群(例えばA群)中の平均値が他方の群(例えばB群)中の平均値よりも顕著に大きい条件を満たす代謝物(変量)の判定基準を示す。ステップS13の判定条件は、本実施形態における第1条件の一例である。
 また、制御部51は、群間比Rが所定の第2しきい値R2を下回る代謝物を判定する(S14)。第2しきい値R2は、一方の群中の平均値が他方の群中の平均値よりも顕著に小さい条件の判定基準を示す。第2しきい値R2は、1よりも小さい値に設定され、例えばR2=0.67(又は1/R1)に設定される。ステップS14の判定条件は、本実施形態における第2条件の一例である。ステップS13,S14の処理の順番は特に限定されず、並列的に実行されてもよい。
 次に、制御部51は、第1及び第2しきい値R1,R2による判定結果に基づいて、認識した2群の群間比較の結果を示すノードデータDnを作成する(S15)。ステップS15において作成されるノードデータDnの一例を図7に示す。
 図7の例のノードデータDnは、R>R1の代謝物のリストと、R<R2の代謝物のリストとを含む。ステップS15において、制御部51は、第1しきい値R1を上回る代謝物の代謝物名と、第2しきい値R2を下回る代謝物の代謝物名とをそれぞれリストアップする。制御部51は、リストアップした代謝物名と、「A群/B群」などの認識した2群を示す情報とを関連付けて、ノードデータDnを作成する。認識した2群を示す情報によると、作成したノードデータDnに対応する群間比較の一事例を把握することができる。ノードデータDnは、群間比較において変動する代謝物の組を示す変量情報の一例である。
 図6に戻り、制御部51は、図3のステップS1において取得したメタボロームデータD1において、上記のように群間比較を行った2群とは別の組み合わせで比較し得る2群があるか否かを判断する(S16)。例えば、メタボロームデータD1において1つの健常群に対して複数の疾患群が含まれている場合、各疾患群と健常群とを比較し得る。
 制御部51は、別の組み合わせの2群があると判断すると(S16でNO)、該当する2群を新たに認識して、ステップS11以降の処理を実行する。これにより、制御部51は、取得されたメタボロームデータD1において有り得る全ての比較群のノードデータDnを作成する(S11~S15)。
 一方、制御部51は、別の組み合わせの2群がないと判断すると(S16でYES)、ノードデータDnの抽出を完了し、例えばメタボロミクスDB50への記録を行う(S17)。例えば、制御部51は、作成したノードデータDnと、管理番号(例えば「N10」)等の管理情報とを関連付けて、記憶部52のメタボロミクスDB50に記録する(S17)。管理情報は、メタボロミクスDB50においてノードN毎に蓄積されるノードデータDnを管理するために適宜、設定可能である。
 制御部51は、メタボロミクスDB50への記録を行うと(S17)、図3のステップS2の処理を終了し、ステップS3の処理に進む。
 以上の処理によると、取得したメタボロームデータD1~D3から、群間比較で顕著に変動する条件を満たす代謝物の代謝物名の組をノードデータDnに抽出して、メタボロミクスDB50に蓄積することができる。
 上記のステップS12の説明では、メタボロームデータD1に基づいて群間比Rを算出する例を説明したが、ステップS12の処理は上記の例に限らない。例えば、取得されたメタボロームデータに予め群間比Rがデータ値として記録されている場合、制御部51は、当該メタボロームデータから群間比Rを取得する(S12)。
 また、上述した群間比Rの計算では、群中のサンプルにわたる平均値を用いた。平均値の代わりに、中央値、最頻値などの各種の統計値が用いられてもよい。また、平均値の計算方法は、相加平均、相乗平均、又は各種の重み付け平均などであってもよい。
2-2.類似度を算出する処理(S3)
 図3のステップS3の処理の詳細について、図8~10を用いて説明する。
 図8は、類似度を算出する処理(S3)を説明するためのフローチャートである。図9は、類似度の算出におけるクロス集計表D60を例示する図である。図10は、重み付きグラフ隣接行列D62を説明するための図である。
 まず、制御部51は、メタボロミクスDB50における複数のノードNの中から、類似度の算出対象とする1ペアのノードNを選択する(S21)。例えば、制御部51は、ノードN10とノードN30とを選択する(図5参照)。
 次に、制御部51は、選択した1ペアのノードN10,N30の双方のノードデータDnに基づいて、ノードデータDn中の代謝物を要素とするクロス集計を行う(S22)。例えば、制御部51は、双方のノードデータDn中の代謝物名に基づいて共通する代謝物を特定して、クロス集計表60を作成する。クロス集計表60の一例を図9に示す。
 図9の例では、1ペアのノードN10,N30の双方のノードデータDnに含まれる代謝物の総数が25個であって、そのうちR>R1である代謝物の個数が、一方のノードN10では8個であり、他方のノードN30では17個である例のクロス集計表D60を示している。クロス集計表D60は、2×2の行列状に、一方のノードN10に関してR>R1又はR<R2を満たし、且つ他方のノードN30に関してR>R1又はR<R2を満たす代謝物の個数を示す。
 本例において、ノードN10ではR>R1である一方、ノードN30ではR<R2である代謝物の個数は、図9の(1,2)成分に示す「7」である。同様に、ノードN10ではR<R2である一方、ノードN30ではR>R1である代謝物の個数は、(2,1)成分に示す「16」である。以上の各成分に含まれる代謝物の組の一例を図9に示す。また、本例において、双方のノードN10,N30においてR>R1又はR<R2である代謝物の個数は、クロス集計表D60の対角成分に示すように、どちらも「1」である。
 図8のステップS22において、制御部51は、選択した1ペアのノードN10,N30による2つのノードデータDn中の代謝物名を比較して、クロス集計表D60の各成分に対応する代謝物の個数を計数する。クロス集計表D60の対角成分又は非対角成分の偏りは、2つのノードN10,N30に対応する事例同士の正相関又は負相関に対応し得るが、統計的に有意ではない場合もある。
 以上のような選択したノードN10,N30のペアの代謝物に関するクロス集計の集計結果について、制御部51はカイ2乗検定を行う(S23)。例えば、制御部51は、作成したクロス集計表D60に基づいてカイ2乗値を計算し、自由度1のカイ2乗分布に基づいて、計算したカイ2乗値に対応するp値を算出する。
 ステップS23において、制御部51は、例えばクロス集計表D60に基づくオッズ比(以下「x」とする)等を算出してもよい。例えば、制御部51は、図9の例においてオッズ比xを0.0089(=(1×1)/(7×16))、p値を0.00029というように算出する。
 制御部51は、所定の有意水準αに基づいて、選択中の1ペアのノードN10,N30に関するカイ2乗検定において有意差が認められるか否かを判断する(S24)。有意水準αは、例えばα=0.05に設定される。この場合、算出されたp値がp<0.05になると、制御部51は有意差が認められると判断する(S24でYES)。有意差が認められる場合、選択中の1ペアのノードが示す事例間に関連性が有り得ると考えられる。
 制御部51は、有意差が認められると判断すると(S24でYES)、選択中の1ペアのノードN10,N30に関して、接続フラグを「1」に設定する(S25)。接続フラグは、ネットワークグラフ50n(図5)において、ノードN間をエッジEで接続することを「1」で示し、接続しないことを「0」で示すフラグである。制御部51は、有意差が認められないと判断すると(S24でNO)、選択中の1ペアのノードN10,N30に関して、接続フラグを「0」に設定する(S26)。
 次に、制御部51は、メタボロミクスDB50における全てのノードNのペア間で、ノードデータDnのクロス集計による有意差の検定が行われたか否かを判断する(S27)。有意差の検定が行われていないノードNのペアがある場合(S27でNO)、制御部51は、未検定のノードNのペアについてステップS21以降の処理を行う。
 この際、制御部51は、例えば各ペアのノードNに関する接続フラグを、ノードNの個数分のサイズを有する正方行列であるグラフ隣接行列の行列要素として管理する。図10(a)に、一例のグラフ隣接行列D61を示す。グラフ隣接行列D61は、図10(a)に示すように、対角成分がゼロの対称行列を構成する。グラフ隣接行列D61の非対角成分は、それぞれ行番号及び列番号に対応するノードNのペアの接続フラグを示す。
 全てのノードNのペア間で有意差の検定が行われると(S27でYES)、制御部51は、例えばグラフ隣接行列(図10(a))に基づいて、接続フラグが「1」のペアのノードN間の類似度を算出する(S28)。例えば、制御部51は、クロス集計によるオッズ比xに基づいて、log(x)を類似度として算出する。
 次に、制御部51は、算出した類似度による重み付きグラフ隣接行列D62を生成する(S29)。ステップS28で生成される重み付きグラフ隣接行列D62の一例を図10(b)に示す。例えば、制御部51は、図10(a)のグラフ隣接行列D61において「1」の行列要素に、対応するノードN間の類似度で重み付けを行って、図10(b)に示すように重み付きグラフ隣接行列D62を生成する。重み付きグラフ隣接行列D62は、記憶部52においてメタボロミクスDB50に関連付けて記録されてもよいし、一体的に格納されてもよい。
 制御部51は、生成した重み付きグラフ隣接行列(S29)を適宜、保存して、図3のステップS3を終了し、ステップS4に進む。
 以上の処理によると、メタボロミクスDB50における各ノードN間で、関連性が有り得ると考えられるペア間の類似度が、重み付きグラフ隣接行列(図10(b))として管理される。図3のステップS4において、制御部51は、生成した重み付きグラフ隣接行列D62に基づいて、「0」でない行列要素に対応するペアのノードN間を、行列要素の値(即ち類似度)に応じたエッジEで接続するように、ネットワークグラフ50nを生成する(図5参照)。
 上記のステップS22において、ペアのノードN双方のノードデータDnから共通する代謝物を特定する際に、制御部51は適宜、代謝物名の辞書を用いて、同一の代謝物に対する言い換え表現などを同一視するように特定を行ってもよい。
2-2.実施例
 以上のような本実施形態のデータ解析方法を実施した一例について、以下説明する。
 本実施例においては、癌メタボロームに関連する複数の論文からメタボロームデータを収集し、本実施形態のデータ解析方法を行って、新たな生物学的な発見の可能性を模索することを検討した。メタボロームデータの収集元としては、後述する論文1~16(の補足データ)を用いた。解析結果のネットワークグラフ50nにおいて、ノードNの総数(即ち比較群の総数)は、93個であった。
 本実施例では、論文15についての1ノード(以下「ノードN15」とする)と論文16についての1ノード(以下「ノードN16」とする)間のエッジEが、負の相関において顕著に確認された。ノードN15は、論文15において腎臓におけるがん組織/正常組織という群間比較の事例であった。ノードN16は、論文16においてホジキンリンパ腫の血球由来の培養細胞である(L428細胞+Tetra-O-Methyl Nordihydroguaiaretic Acid)/L428細胞という群間比較の事例であった。ノードN15,N16間の類似度(log(オッズ比))は、「-6.8」であった。
 上記の負相関は、ノードN15における“癌で高値”の物質群(代謝物の組)と、ノードN16における“コントロール(薬剤投与前)で高値”の物質群とが共通していること(又はその逆)を示しており、いずれも癌と非癌で共通する物質群が利用されている。このような結果は、腎臓がんと血球由来のがん培養細胞のような全く異なるサンプル種の群間比較でも、同一の代謝物群が変動していることを示しており、共通の生物学的なメカニズムが働いていることの示唆と考えられる。このような示唆に基づき生物学的な解釈を追考研究することによって、新たなメカニズムの解明等の発見に到る可能性が期待できる。
 また、本実施例では、論文12についての1ノード(以下「ノードN12」とする)とノードN16間のエッジEが、正の相関において顕著に確認された。ノードN12は、論文12におけるWild type Jurkat T細胞についての放射線照射2時間後/0時間の群間比較の事例であった。ノードN12,N16間の類似度(log(オッズ比))は、「4.2」であった。ノードN12,N16間の正の相関について、上記T細胞に放射線を照射すると癌に近くなることの示唆であるというような予想を行うことができる。以上のように、本実施形態のデータ解析方法は、新たな生物学的な発見の可能性を模索することに利用できる。
 本実施例において用いた論文1~16を以下に示す。
論文1:Brunelli L, Caiola E, Marabese M, Broggini M, Pastorelli R., "Capturing the metabolomic diversity of KRAS mutants in non-small-cell lung cancer cells.", Oncotarget. 2014 Jul 15;5(13):4722-31.
論文2:Wojakowska A, Chekan M, Marczak L, Polanski K, Lange D, Pietrowska M, Widlak P., "Detection of metabolites discriminating subtypes of thyroid cancer: Molecular profiling of FFPE samples using the GC/MS approach.", Mol Cell Endocrinol. 2015 Dec 5;417:149-57.
論文3:Armitage EG, Kotze HL, Allwood JW, Dunn WB, Goodacre R, Williams KJ., "Metabolic profiling reveals potential metabolic markers associated with Hypoxia Inducible Factor-mediated signalling in hypoxic cancer cells.", Sci Rep. 2015 Oct 28;5:15649.
論文4:Amano Y, Mandai M, Yamaguchi K, Matsumura N, Kharma B, Baba T, Abiko K, Hamanishi J, Yoshioka Y, Konishi I., "Metabolic alterations caused by HNF1β expression in ovarian clear cell carcinoma contribute to cell survival.", Oncotarget. 2015 Sep 22;6(28):26002-17.
論文5:Ganti S, Taylor SL, Abu Aboud O, Yang J, Evans C, Osier MV, Alexander DC, Kim K, Weiss RH., "Kidney tumor biomarkers revealed by simultaneous multiple matrix metabolomics analysis.", Cancer Res. 2012 Jul 15;72(14):3471-9. doi: 10.1158/0008-5472.CAN-11-3105.
論文6:Roe B, Kensicki E, Mohney R, Hall WW., "Metabolomic profile of hepatitis C virus-infected hepatocytes.", PLoS One. 2011;6(8):e23641.
論文7:Yoshie T1, Nishiumi S, Izumi Y, Sakai A, Inoue J, Azuma T, Yoshida M., "Regulation of the metabolite profile by an APC gene mutation in colorectal cancer.", Cancer Sci. 2012 Jun;103(6):1010-21.
論文8:Quijano C, Cao L, Fergusson MM, Romero H, Liu J, Gutkind S, Rovira II, Mohney RP, Karoly ED, Finkel T., "Oncogene-induced senescence results in marked metabolic and bioenergetic alterations.", Cell Cycle. 2012 Apr 1;11(7):1383-92. doi: 10.4161/cc.19800.
論文9:Ganti S, Taylor SL, Abu Aboud O, Yang J, Evans C, Osier MV, Alexander DC, Kim K, Weiss RH., "Kidney tumor biomarkers revealed by simultaneous multiple matrix metabolomics analysis.", Cancer Res. 2012 Jul 15;72(14):3471-9.
論文10:Poisson LM, Munkarah A, Madi H, Datta I, Hensley-Alford S, Tebbe C, Buekers T, Giri S, Rattan R., "A metabolomic approach to identifying platinum resistance in ovarian cancer.", J Ovarian Res. 2015 Mar 26;8:13.
論文11:Makinoshima H, Takita M, Saruwatari K, Umemura S, Obata Y, Ishii G, Matsumoto S, Sugiyama E, Ochiai A, Abe R, Goto K, Esumi H, Tsuchihara K.," Signaling through the Phosphatidylinositol 3-Kinase (PI3K)/Mammalian Target of Rapamycin (mTOR) Axis Is Responsible for Aerobic Glycolysis mediated by Glucose Transporter in Epidermal Growth Factor Receptor (EGFR)-mutated Lung Adenocarcinoma.", J Biol Chem. 2015 Jul 10;290(28):17495-504.
論文12:Miller TW, Soto-Pantoja DR, Schwartz AL, Sipes JM, DeGraff WG, Ridnour LA, Wink DA, Roberts DD., "CD47 Receptor Globally Regulates Metabolic Pathways That Control Resistance to Ionizing Radiation.", J Biol Chem. 2015 Oct 9;290(41):24858-74.
論文13:Meller S, Meyer HA, Bethan B, Dietrich D, Maldonado SG, Lein M, Montani M, Reszka R, Schatz P, Peter E, Stephan C, Jung K, Kamlage B, Kristiansen G., "Integration of tissue metabolomics, transcriptomics and immunohistochemistry reveals ERG- and gleason score-specific metabolomic alterations in prostate cancer.", Oncotarget. 2016 Jan 12;7(2):1421-38.
論文14:Salony, Sole X, Alves CP, Dey-Guha I, Ritsma L, Boukhali M, Lee JH, Chowdhury J, Ross KN, Haas W, Vasudevan S, Ramaswamy S., "AKT Inhibition Promotes Nonautonomous Cancer Cell Survival.", Mol Cancer Ther. 2016 Jan;15(1):142-53.
論文15:Hakimi AA, Reznik E, Lee CH, Creighton CJ, Brannon AR, Luna A, Aksoy BA, Liu EM, Shen R, Lee W, Chen Y, Stirdivant SM, Russo P, Chen YB, Tickoo SK, Reuter VE, Cheng EH, Sander C, Hsieh JJ.," An Integrated Metabolic Atlas of Clear Cell Renal Cell Carcinoma.", Cancer Cell. 2016 Jan 11;29(1):104-16. 
論文16:Kimura K, Huang RC.," Tetra-O-Methyl Nordihydroguaiaretic Acid Broadly Suppresses Cancer Metabolism and Synergistically Induces Strong Anticancer Activity in Combination with Etoposide, Rapamycin and UCN-01.", PLoS One. 2016 Feb 17;11(2):e0148685.
3.まとめ
 以上のように、本実施形態に係るデータ解析装置5は、メタボロミクスによる変量の代謝物を示す複数の代謝物名M11~M13,M21~M24,M31~M32を含むメタボロームデータD1~D3(多変量データ)を解析する。データ解析装置5は、制御部51と、記憶部52とを備える。制御部51は、メタボロームデータD1~D3の解析を実行する。記憶部52は、制御部51によって解析された情報を記憶する。制御部51は、多変量統計の対象とする事例に対応するノードN毎に、当該事例のメタボロームデータD1において所定条件を満たす変量の組を示す変量情報として、代謝物名の組を含むノードデータDnを記憶部52に蓄積する。制御部51は、ノードN毎に蓄積したノードデータDnに基づいて、別々の事例のノードN間の関連性を示す関連性情報としてエッジEを含むネットワークグラフ50nを生成する。
 以上のデータ解析装置5によると、群間比較の事例毎に代謝物名のリストを含むノードデータDnを蓄積することにより、ノードデータDnが蓄積されたメタボロミクスDB50をネットワークグラフ50nとして可視化する等、メタボロミクス等の多変量統計において蓄積されるデータを活用し易くすることができる。
 本実施形態において、事例は、複数のサンプルをそれぞれ含む複数の群によって規定される。変量情報(ノードデータDn)は、一事例の多変量データにおいて群間の比較に基づき設定された所定条件を満たす変量の組(例えば代謝物リスト)を示す(図7参照)。所定条件としては、比較対象の群間で顕著な変量を判定する条件を設定可能である。
 また、本実施形態において、変量情報は、所定の第1条件(例えばR>R1)を満たす第1組の変量と、第1条件とは異なる第2条件(例えばR<R2)を満たす第2組の変量とを示す(図7参照)。制御部51は、2つの変量情報における第1及び第2組の変量に関するクロス集計のオッズ比xに基づいて、関連性情報を生成する(S22,S29)。
 また、本実施形態において、データ解析装置5は、画像を表示する表示部54をさらに備える。制御部51は、事例毎の変量情報に対応するノードNと、事例間の関連性情報に対応するエッジEとを含むネットワークグラフ50nを表示部54に表示させる。データ解析装置5は、表示部54とは別体で提供されてもよい。
 また、本実施形態において、ネットワークグラフ54においては、所定の仮説検定における有意差を有する事例のノードN間が、エッジEを介して接続される(S24~S26)。これにより、有意差を有しない事例のノードN間はエッジEで接続しないようにすることができる。仮説検定は、例えばクロス集計表D60におけるカイ2乗検定であり、p値が所定の有意水準α以上である場合にエッジEが接続される。
 また、本実施形態に係るデータ解析方法は、データ解析装置5のようなコンピュータが、多変量統計による複数の変量を含む多変量データを解析する方法である。本方法は、コンピュータの制御部51が、多変量統計の対象とする事例毎に、当該事例の多変量データにおいて所定条件を満たす変量の組を示す変量情報を、コンピュータの記憶部52に蓄積するステップ(S2)を含む。本方法は、事例毎に蓄積した変量情報に基づいて、別々の事例の間の関連性を示す関連性情報を生成するステップ(S3)を含む。
 以上のデータ解析方法によると、メタボロミクス等の多変量統計において蓄積されるデータを活用し易くすることができる。本実施形態によると、本データ解析方法をコンピュータに実行させるためのプログラムを提供できる。
(他の実施形態)
 また、上記の実施形態1では、変量情報の一例のノードデータDnにおいて、代謝物名をリストアップした。本実施形態においては、代謝物名の代わりに、代謝物(或いは変量)を識別する各種の識別情報を用いて、変量情報が構成されてもよい。
 また、上記の各実施形態では、メタボロミクスへのデータ解析方法の適用例を説明した。本実施形態に係るデータ解析方法はメタボロミクスに限らず、種々の多変量統計に適用可能であり、例えば各種のゲノム、オミックス解析及び計量化学に適用できる。この場合においても、ノードデータDnにおける代謝物リストの代わりに各々の多変量統計における変量の組を示す変量情報を蓄積することにより、各種多変量統計において蓄積されるデータを活用し易くすることができる。
 また、上記の実施形態1では、新たな生物学的な発見およびメカニズム解明のためにデータ解析方法を行う実施例を説明した。本実施形態のデータ解析方法は上記の解析に限らず、例えば、変動する代謝物群の名前の一致に基づき論文検索を行うシステム、バイオマーカ探索における再現性の確認、およびドラッグリポジショニングなどにも適用可能である。

Claims (8)

  1.  多変量統計による複数の変量を含む多変量データを解析するデータ解析装置であって、
     前記多変量データの解析を実行する制御部と、
     前記制御部によって解析された情報を記憶する記憶部とを備え、
     前記制御部は、
     多変量統計の対象とする事例毎に、当該事例の多変量データにおいて所定条件を満たす変量の組を示す変量情報を、前記記憶部に蓄積し、
     前記事例毎に蓄積した変量情報に基づいて、別々の事例の間の関連性を示す関連性情報を生成する
    データ解析装置。
  2.  前記事例は、複数のサンプルをそれぞれ含む複数の群によって規定され、
     前記変量情報は、前記事例の多変量データにおいて群間の比較に基づき設定された所定条件を満たす変量の組を示す
    請求項1に記載のデータ解析装置。
  3.  前記変量情報は、所定の第1条件を満たす第1組の変量と、前記第1条件とは異なる第2条件を満たす第2組の変量とを示し、
     前記制御部は、2つの変量情報における第1及び第2組の変量に関するクロス集計のオッズ比に基づいて、前記関連性情報を生成する
    請求項1又は2に記載のデータ解析装置。
  4.  画像を表示する表示部をさらに備え、
     前記制御部は、前記事例毎の変量情報に対応するノードと、前記事例間の関連性情報に対応するエッジとを含むネットワークグラフを前記表示部に表示させる
    請求項1~3のいずれか1項に記載のデータ解析装置。
  5.  前記ネットワークグラフにおいては、所定の仮説検定における有意差を有する事例のノード間が、前記エッジを介して接続される
    請求項4に記載のデータ解析装置。
  6.  前記多変量データは、前記変量が生体の代謝物を示すメタボロームデータを含む
    請求項1~5のいずれか1項に記載のデータ解析装置。
  7.  コンピュータが、多変量統計による複数の変量を含む多変量データを解析するデータ解析方法であって、
     前記コンピュータの制御部が、
     多変量統計の対象とする事例毎に、当該事例の多変量データにおいて所定条件を満たす変量の組を示す変量情報を、前記コンピュータの記憶部に蓄積するステップと、
     前記事例毎に蓄積した変量情報に基づいて、別々の事例の間の関連性を示す関連性情報を生成するステップと
    を含むデータ解析方法。
  8.  請求項7に記載のデータ解析方法をコンピュータに実行させるためのプログラム。
PCT/JP2018/016277 2018-04-20 2018-04-20 データ解析装置及びデータ解析方法 WO2019202728A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2018/016277 WO2019202728A1 (ja) 2018-04-20 2018-04-20 データ解析装置及びデータ解析方法
PCT/JP2019/016848 WO2019203352A1 (ja) 2018-04-20 2019-04-19 データ解析装置及びデータ解析方法
JP2020514463A JP7175521B2 (ja) 2018-04-20 2019-04-19 データ解析装置及びデータ解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/016277 WO2019202728A1 (ja) 2018-04-20 2018-04-20 データ解析装置及びデータ解析方法

Publications (1)

Publication Number Publication Date
WO2019202728A1 true WO2019202728A1 (ja) 2019-10-24

Family

ID=68238804

Family Applications (2)

Application Number Title Priority Date Filing Date
PCT/JP2018/016277 WO2019202728A1 (ja) 2018-04-20 2018-04-20 データ解析装置及びデータ解析方法
PCT/JP2019/016848 WO2019203352A1 (ja) 2018-04-20 2019-04-19 データ解析装置及びデータ解析方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/016848 WO2019203352A1 (ja) 2018-04-20 2019-04-19 データ解析装置及びデータ解析方法

Country Status (2)

Country Link
JP (1) JP7175521B2 (ja)
WO (2) WO2019202728A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111508612A (zh) * 2020-04-08 2020-08-07 哈尔滨工业大学 一种基于疾病和文献关联的代谢物预测方法
JP7437003B2 (ja) 2019-07-01 2024-02-22 ヒューマン・メタボローム・テクノロジーズ株式会社 データ解析装置および方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191706A (ja) * 1993-12-27 1995-07-28 Nkk Corp 因果モデルの同定方法及び制御用知識の学習方法
JP2007034700A (ja) * 2005-07-27 2007-02-08 Fujitsu Ltd 予測プログラムおよび予測装置
JP2009502151A (ja) * 2005-07-25 2009-01-29 ビーエーエスエフ ソシエタス・ヨーロピア 実質的に同一のメタボロームを有する動物集団の提供および分析方法
JP2009066088A (ja) * 2007-09-11 2009-04-02 Jeol Ltd 多変量解析装置及びコンピュータプログラム
JP2011247869A (ja) * 2010-04-27 2011-12-08 Kobe Univ メタボローム解析手法を用いた特定疾患の検査方法
US20150235139A1 (en) * 2014-02-20 2015-08-20 Nec Laboratories America, Inc. Extracting interpretable features for classification of multivariate time series from physical systems
WO2017090566A1 (ja) * 2015-11-26 2017-06-01 ヒューマン・メタボローム・テクノロジーズ株式会社 データ解析装置、方法及びプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07191706A (ja) * 1993-12-27 1995-07-28 Nkk Corp 因果モデルの同定方法及び制御用知識の学習方法
JP2009502151A (ja) * 2005-07-25 2009-01-29 ビーエーエスエフ ソシエタス・ヨーロピア 実質的に同一のメタボロームを有する動物集団の提供および分析方法
JP2007034700A (ja) * 2005-07-27 2007-02-08 Fujitsu Ltd 予測プログラムおよび予測装置
JP2009066088A (ja) * 2007-09-11 2009-04-02 Jeol Ltd 多変量解析装置及びコンピュータプログラム
JP2011247869A (ja) * 2010-04-27 2011-12-08 Kobe Univ メタボローム解析手法を用いた特定疾患の検査方法
US20150235139A1 (en) * 2014-02-20 2015-08-20 Nec Laboratories America, Inc. Extracting interpretable features for classification of multivariate time series from physical systems
WO2017090566A1 (ja) * 2015-11-26 2017-06-01 ヒューマン・メタボローム・テクノロジーズ株式会社 データ解析装置、方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7437003B2 (ja) 2019-07-01 2024-02-22 ヒューマン・メタボローム・テクノロジーズ株式会社 データ解析装置および方法
CN111508612A (zh) * 2020-04-08 2020-08-07 哈尔滨工业大学 一种基于疾病和文献关联的代谢物预测方法
CN111508612B (zh) * 2020-04-08 2023-09-22 哈尔滨工业大学 一种基于疾病和文献关联的代谢物预测方法

Also Published As

Publication number Publication date
JP7175521B2 (ja) 2022-11-21
JPWO2019203352A1 (ja) 2021-05-13
WO2019203352A1 (ja) 2019-10-24

Similar Documents

Publication Publication Date Title
Webb‐Robertson et al. A statistical selection strategy for normalization procedures in LC‐MS proteomics experiments through dataset‐dependent ranking of normalization scaling factors
Chikina et al. CellCODE: a robust latent variable approach to differential expression analysis for heterogeneous cell populations
Xia et al. Extended local similarity analysis (eLSA) of microbial community and other time series data with replicates
Karpievitch et al. Normalization and missing value imputation for label-free LC-MS analysis
Sheng et al. Identification of tumor-educated platelet biomarkers of non-small-cell lung cancer
Oberg et al. Statistical methods for quantitative mass spectrometry proteomic experiments with labeling
Donner et al. Comparing institutional-level bibliometric research performance indicator values based on different affiliation disambiguation systems
Lu et al. Identification of gene expression biomarkers for predicting radiation exposure
Colby et al. Suspect screening using LC–QqTOF is a useful tool for detecting drugs in biological samples
Gasparini et al. Mixed‐effects models for health care longitudinal data with an informative visiting process: A Monte Carlo simulation study
Reshef et al. Co-varying neighborhood analysis identifies cell populations associated with phenotypes of interest from single-cell transcriptomics
Kusonmano et al. Informatics for metabolomics
Cho Mass spectrometry-based proteomics in cancer research
Spirin et al. Assigning spectrum-specific p-values to protein identifications by mass spectrometry
Sun et al. Artificial intelligence defines protein-based classification of thyroid nodules
Zierk et al. Indirect determination of hematology reference intervals in adult patients on Beckman Coulter UniCell DxH 800 and Abbott CELL-DYN Sapphire devices
WO2019202728A1 (ja) データ解析装置及びデータ解析方法
Yamamoto et al. Human leukocyte antigen-DR expression on flow cytometry and tumor-associated macrophages in diffuse large B-cell lymphoma treated by rituximab, cyclophosphamide, doxorubicin, vincristine and prednisone therapy: retrospective cohort study
Jin et al. Cell-type-aware analysis of RNA-seq data
Xiao et al. Discriminating poststroke depression from stroke by nuclear magnetic resonance spectroscopy-based metabonomic analysis
Hunter-Schlichting et al. Validation of a hybrid approach to standardize immunophenotyping analysis in large population studies: The Health and Retirement Study
Stokes et al. c hip a rtifact CORRECT ion (caCORRECT): A Bioinformatics System for Quality Assurance of Genomics and Proteomics Array Data
CHEAR Metabolomics Analysis Team Deyssenroth Maya A. maya. deyssenroth@ mssm. edu 1 b Colicino Elena 1 Curtin Paul 1 Niedzwiecki Megan M. 1 et al. Quantitative methods for metabolomic analyses evaluated in the Children’s Health Exposure Analysis Resource (CHEAR)
Liu et al. Characteristic gene selection via weighting principal components by singular values
Hoffmann et al. BiPACE 2D—graph-based multiple alignment for comprehensive 2D gas chromatography-mass spectrometry

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

NENP Non-entry into the national phase

Ref country code: JP

122 Ep: pct application non-entry in european phase

Ref document number: 18915053

Country of ref document: EP

Kind code of ref document: A1