JP7087650B2 - データ検索装置、データ蓄積システムおよびデータ検索方法 - Google Patents

データ検索装置、データ蓄積システムおよびデータ検索方法 Download PDF

Info

Publication number
JP7087650B2
JP7087650B2 JP2018090730A JP2018090730A JP7087650B2 JP 7087650 B2 JP7087650 B2 JP 7087650B2 JP 2018090730 A JP2018090730 A JP 2018090730A JP 2018090730 A JP2018090730 A JP 2018090730A JP 7087650 B2 JP7087650 B2 JP 7087650B2
Authority
JP
Japan
Prior art keywords
data group
data
search
sample
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018090730A
Other languages
English (en)
Other versions
JP2019197371A (ja
Inventor
賢志 山田
浩一 児嶋
雄策 日置
克幸 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2018090730A priority Critical patent/JP7087650B2/ja
Publication of JP2019197371A publication Critical patent/JP2019197371A/ja
Application granted granted Critical
Publication of JP7087650B2 publication Critical patent/JP7087650B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、サンプルの質量分析により取得されたデータ群を検索するデータ検索装置、データ蓄積システムおよびデータ検索方法に関する。
複数の研究機関において、類似のサンプルを用いて質量分析に関する類似の研究が行われることがある。そのため、異なる研究機関の間で類似の研究に関するデータ群を共有することは有益である。そこで、近年、複数の研究機関の間で共通に利用可能なデータベースが提供されている(例えば、非特許文献1参照)。いずれかの研究機関に所属するデータベースの使用者は、取得したデータ群をデータベースに蓄積させることができる。また、使用者は、データベースに蓄積された所望のデータ群を閲覧することができる。
Hisayuki Horai、外34名、"MassBank: A public repository for sharing mass spectral data for life sciences"、J. Mass. Spectrom.、2010年、Vol. 45、pp. 703-714
データベースに蓄積される複数のデータ群の一部は、互いに関連していることがある。例えば、1つのデータ群に基づいて他の1つ以上のデータ群が生成されることがある。したがって、使用者は、所望のデータ群に加えて、当該データ群に関連する他のデータ群を閲覧したいことがある。しかしながら、データベースに蓄積されるデータ群の数は膨大であるため、該当するデータ群を効率よく見出すことはできない。
本発明の目的は、サンプルの質量分析により取得された複数のデータ群から所定のデータ群を効率よく見出すことが可能なデータ検索装置、データ蓄積システムおよびデータ検索方法を提供することである。
(1)第1の発明に係るデータ検索装置は、サンプルの質量分析により取得されかつ記憶装置に記憶された複数のデータ群から所定のデータ群を検索し、検索結果を表示部に表示させるデータ検索装置であって、各データ群は、予め定められた複数のカテゴリのいずれかに分類され、データ検索装置は、複数のカテゴリのうち、いずれかのカテゴリに属するデータ群の検索条件を受け付ける検索条件受付部と、記憶装置に記憶された複数のデータ群から検索条件受付部により受け付けられた検索条件に該当するデータ群を対象データ群として検索する対象データ検索部と、対象データ検索部により検索された対象データ群に関連しかつ他のカテゴリに属するデータ群を関連データ群として特定する関連データ特定部と、記憶装置に記憶されたデータ群から関連データ特定部により特定された関連データ群を検索する関連データ検索部と、関連データ検索部による関連データ群の検索結果を表示するように表示部を制御する表示制御部とを備える。
このデータ検索装置においては、複数のカテゴリのうち、いずれかのカテゴリに属するデータ群の検索条件が受け付けられる。サンプルの質量分析により取得されかつ記憶装置に記憶された複数のデータ群から受け付けられた検索条件に該当するデータ群が対象データ群として検索される。また、検索された対象データ群に関連しかつ他のカテゴリに属するデータ群が関連データ群として特定される。記憶装置に記憶されたデータ群から特定された関連データ群が検索される。関連データ群の検索結果が表示部に表示される。
この構成によれば、記憶装置にサンプルの質量分析により取得された膨大な数のデータ群が記憶されている場合でも、使用者は、いずれかのカテゴリに属する所望のデータ群に属するデータ群の検索条件を指定することにより、検索条件に該当する対象データ群および当該対象データ群の関連データ群を検索することができる。また、使用者は、表示部を視認することにより、関連データ群の検索結果を閲覧することができる。これにより、使用者は、複数のデータ群から所定のデータ群を効率よく見出すことができる。
(2)複数のカテゴリは、第1、第2および第3のカテゴリを含み、第1のカテゴリに属するデータ群は、第1のデータ群を含み、第2のカテゴリに属するデータ群は、第1のカテゴリに属する第1のデータ群に基づいて生成される1または複数の第2のデータ群を含み、第3のカテゴリに属するデータ群は、第2のカテゴリに属する第2のデータ群に基づいて生成される1または複数の第3のデータ群を含み、第1のカテゴリに属する第1のデータ群と、第2のカテゴリに属する第2のデータ群とは互いに関連し、第2のカテゴリに属する第2のデータ群と、第3のカテゴリに属する第3のデータ群とは互いに関連してもよい。
この構成によれば、いずれかの第1のデータ群の検索条件が受け付けられた場合、該当する1以上の第1のデータ群を対象データ群として検索することができる。また、各対象データ群に関連する1以上の第2のデータ群および1以上の第3のデータ群とを関連データ群として検索することができる。
いずれかの第2のデータ群の検索条件が受け付けられた場合、該当する1以上の第2のデータ群を対象データ群として検索することができる。また、各対象データ群に関連する1以上の第1のデータ群および1以上の第3のデータ群とを関連データ群として検索することができる。
いずれかの第3のデータ群の検索条件が受け付けられた場合、該当する1以上の第3のデータ群を対象データ群として検索することができる。また、各対象データ群に関連する1以上の第1のデータ群および1以上の第2のデータ群とを関連データ群として検索することができる。
(3)第1のカテゴリに属する各データ群は、質量分析に供されるサンプルに関するデータ群を含み、第2のカテゴリに属する各データ群は、サンプルの質量分析に関するデータ群を含み、第3のカテゴリに属する各データ群は、質量分析結果の解析に関するデータ群を含んでもよい。
この構成によれば、質量分析に供されるサンプルに関するいずれかのデータ群の検索条件が受け付けられた場合、該当する質量分析に供されるサンプルに関する1以上のデータ群を対象データ群として検索することができる。また、各対象データ群に関連するサンプルの質量分析に関する1以上のデータ群および質量分析結果の解析に関する1以上のデータ群とを関連データ群として検索することができる。
サンプルの質量分析に関するいずれかのデータ群の検索条件が受け付けられた場合、該当するサンプルの質量分析に関する1以上のデータ群を対象データ群として検索することができる。また、各対象データ群に関連する質量分析に供されるサンプルに関する1以上のデータ群および質量分析結果の解析に関する1以上のデータ群とを関連データ群として検索することができる。
質量分析結果の解析に関するいずれかのデータ群の検索条件が受け付けられた場合、該当する質量分析結果の解析に関する1以上のデータ群を対象データ群として検索することができる。また、各対象データ群に関連する質量分析に供されるサンプルに関する1以上のデータ群およびサンプルの質量分析に関する1以上のデータ群とを関連データ群として検索することができる。
(4)第1のカテゴリに属する各データ群は、当該データ群に固有の第1の識別情報をさらに含み、第2のカテゴリに属する各データ群は、当該データ群に固有の第2の識別情報と、第1のカテゴリに属するいずれかのデータ群に含まれる第1の識別情報とをさらに含み、第3のカテゴリに属する各データ群は、当該データ群に固有の第3の識別情報と、第2のカテゴリに属するいずれかのデータ群に含まれる第2の識別情報とをさらに含み、関連データ特定部は、第1、第2および第3の識別情報に基づいて対象データ群の関連データ群を特定してもよい。この場合、対象データ群の関連データ群を容易に特定することができる。
(5)表示制御部は、対象データ検索部による対象データ群の検索結果と、関連データ検索部による関連データ群の検索結果とを同時にまたは切り替え可能に表示するように表示部を制御してもよい。この場合、使用者は、表示部を視認することにより、対象データの検索結果および関連データ群の検索結果を容易に閲覧することができる。
(6)第2の発明に係るデータ蓄積システムは、サンプルの質量分析により取得されかつ予め定められた複数のカテゴリのいずれかに分類された複数のデータ群を記憶する記憶装置と、表示部と、記憶装置に記憶された複数のデータ群から所定のデータ群を検索し、検索結果を表示部に表示させる第1の発明に係るデータ検索装置とを備える。
このデータ蓄積システムによれば、記憶装置にサンプルの質量分析により取得された膨大な数のデータ群が記憶されている場合でも、使用者は、いずれかのカテゴリに属する所望のデータ群に属するデータ群の検索条件を指定することにより、検索条件に該当する対象データ群および当該対象データ群の関連データ群を検索することができる。また、使用者は、表示部を視認することにより、関連データ群の検索結果を閲覧することができる。これにより、使用者は、複数のデータ群から所定のデータ群を効率よく見出すことができる。
(7)第3の発明に係るデータ検索方法は、サンプルの質量分析により取得されかつ記憶装置に記憶された複数のデータ群から所定のデータ群を検索し、検索結果を表示部に表示させるデータ検索方法であって、各データ群は、予め定められた複数のカテゴリのいずれかに分類され、データ検索方法は、複数のカテゴリのうち、いずれかのカテゴリに属するデータ群の検索条件を受け付けるステップと、記憶装置に記憶された複数のデータ群から受け付けられた検索条件に該当するデータ群を対象データ群として検索するステップと、検索された対象データ群に関連しかつ他のカテゴリに属するデータ群を関連データ群として特定するステップと、記憶装置に記憶されたデータ群から特定された関連データ群を検索するステップと、関連データ群の検索結果を表示部に表示させるステップとを含み、各ステップはコンピュータにより実行される
このデータ検索方法によれば、記憶装置にサンプルの質量分析により取得された膨大な数のデータ群が記憶されている場合でも、使用者は、いずれかのカテゴリに属する所望のデータ群に属するデータ群の検索条件を指定することにより、検索条件に該当する対象データ群および当該対象データ群の関連データ群を検索することができる。また、使用者は、表示部を視認することにより、関連データ群の検索結果を閲覧することができる。これにより、使用者は、複数のデータ群から所定のデータ群を効率よく見出すことができる。
本発明によれば、サンプルの質量分析により取得された複数のデータ群から所定のデータ群を効率よく見出すことができる。
本発明の実施の形態に係るデータ検索装置を備えたデータ蓄積システムの構成を示すブロック図である。 データベースにおけるサンプルデータ群、実験データ群および解析データ群のデータ構造をそれぞれ示す図である。 表示部に表示されたサンプルデータ群、実験データ群および解析データ群の一覧の例をそれぞれ示す図である。 検索条件の指定および検索結果の表示例を示す図である。 データ検索プログラムにより行われるデータ検索処理のアルゴリズムを示すフローチャートである。 データ検索プログラムにより行われるデータ検索処理のアルゴリズムを示すフローチャートである。 データベースにおけるプロジェクトデータ群、検体データ群、前処理データ群、実験データ群および解析データ群のデータ構造をそれぞれ示す図である。
以下、本発明の実施の形態に係るデータ検索装置、それを備えたデータ蓄積システムおよびデータ検索方法について図面を参照しながら詳細に説明する。
(1)データ蓄積システムの構成
図1は、本発明の実施の形態に係るデータ検索装置を備えたデータ蓄積システムの構成を示すブロック図である。図1に示すように、データ蓄積システム100は、データ検索装置10、記憶装置20、操作部30および表示部40を備える。データ蓄積システム100は、複数組の操作部30と表示部40とを備えてもよい。図1には、1組の操作部30と表示部40とが図示されている。
本実施の形態においては、データ蓄積システム100は、サーバPC(パーソナルコンピュータ)と、1つ以上のクライアントPCとからなるクライアントサーバシステムである。データ検索装置10および記憶装置20は、データ蓄積システム100の複数の使用者に共通のサーバPCにより実現される。操作部30および表示部40は、各使用者のクライアントPCにより実現される。
記憶装置20には、データ検索プログラムの一部が記憶されている。なお、図示しないクライアントPCの記憶部には、データ検索プログラムの他の一部が記憶されている。また、記憶装置20には、サンプルの質量分析により取得された種々のデータ群が複数のカテゴリに分類された状態でデータベースとして記憶される。
各データ群は、複数のデータを含む。各データ群のデータについては後述する。複数のカテゴリは、例えば「サンプル」、「実験」および「解析」を含む。以下、「サンプル」、「実験」および「解析」のカテゴリに属するデータ群をそれぞれサンプルデータ群、実験データ群および解析データ群と呼ぶ。
実験データ群は、いずれかのサンプルデータ群に基づいて生成される。この場合、当該サンプルデータ群は親データ群であり、親データ群から生成された実験データ群は子データ群となる。解析データ群は、いずれかの実験データ群に基づいて生成される。この場合、当該実験データ群は親データ群であり、親データ群から生成された解析データ群は子データ群となる。親データ群であるサンプルデータ群と、親データ群から生成された1つ以上の子データ群である実験データ群と、当該1つ以上の子データ群から生成された1つ以上の孫データ群である解析データ群とは、互いに関連する。
データ検索装置10は、サーバPCのCPU(中央演算処理装置)およびクライアントPCのCPUがデータ検索プログラムを実行することにより実現される。データ検索装置10は、記憶装置20に記憶されたデータベースから使用者により指定された所望のデータ群および当該データ群に関連するデータ群を検索する。データ検索装置10の詳細については後述する。
操作部30は、例えばマウス等のポインティングデバイスおよびキーボードを含み、記憶装置20に記憶されたデータベースにおける所望のデータ群をデータ検索装置10に指定するためにクライアントPCの使用者により操作される。表示部40は、例えばLCD(液晶ディスプレイ)パネルまたは有機EL(エレクトロルミネッセンス)パネルを含み、対応する操作部30の操作に応答してデータ検索装置10により得られた検索結果を表示する。
(2)データベースのデータ構造
記憶装置20に記憶されるデータベースにおいては、カテゴリごとに1つ以上の行と複数の列とからなるテーブルが定義される。同一のカテゴリに属する1つ以上のデータ群が、対応するカテゴリにおけるテーブルの1つ以上の行にそれぞれ割り当てられる。各行における複数の列には、割り当てられたデータ群における複数のデータがそれぞれ格納される。
図2(a),(b),(c)は、データベースにおけるサンプルデータ群、実験データ群および解析データ群のデータ構造をそれぞれ示す図である。図2(a)に示すように、サンプルデータ群におけるデータは、質量分析に供されるサンプルに関するデータであり、「サンプル名」、「処理日」、「処理者」、「検体情報」および「前処理」等の属性に分類される。「処理日」は、サンプルの採取時期または採取場所等も含む。「検体情報」は、サンプルを採取した検体の情報であり、例えば、検体の疾患の罹患情報等を含む。「前処理」は、サンプルに対して行われた前処理方法に関する情報であり、例えば、タンパク質の抽出方法等を含む。また、サンプルデータ群におけるデータは、当該サンプルデータ群に固有の「サンプルID(識別子)」を主キー(PK:Primary Key)として含む。
図2(b)に示すように、実験データ群におけるデータは、サンプルの質量分析による分析または測定に関するデータであり、「実験名」、「実験日」、「実験者」、「実験条件」および「MSスペクトル(MSスペクトルを含む(波形処理前の未加工データであってもよい。))」等の属性に分類される。「実験条件」は、サンプルの質量分析による分析の条件であり、使用した装置名等を含む。また、実験データ群におけるデータは、当該実験データ群に固有の「実験ID」を主キーとして含むとともに、当該実験データ群の親データ群であるサンプルデータ群の「サンプルID」を外部キー(FK:Foreign Key)として含む。
図2(c)に示すように、解析データ群におけるデータは、サンプルの質量分析による分析または測定結果の解析に関するデータであり、「解析名」、「解析日」、「解析者」、「解析条件」、「波形処理後MSスペクトル」、「ピークリスト」および「解析結果」等の属性に分類される。「解析条件」は、取得されたMSスペクトルのデータベース照合によるアミノ酸配列等の同定、またはデノボシーケンシングによる同定等を含む。「波形処理後MSスペクトル」は、サンプルの質量分析で得られた未加工データに対してベースライン処理または平滑化処理等の波形処理を行った後のMSスペクトルである。「ピークリスト」は、波形処理後のMSスペクトルに基づいてある基準でピークとして検出されたピークの情報であり、m/z値と当該m/z値における信号強度とのリストである。「解析結果」は、サンプルのMSスペクトル(未加工データまたは波形処理後MSスペクトルのいずれでもよい。)の解析結果に関する情報であり、具体的には、アミノ酸配列同定結果またはペプチド・タンパク質同定結果である。また、解析データ群におけるデータは、当該解析データ群に固有の「解析ID」を主キーとして含むとともに、当該解析データ群の親データ群である実験データ群の「実験ID」を外部キーとして含む。
図2(a),(b),(c)のデータ構造に基づいて、サンプルデータ群、実験データ群および解析データ群の一覧を図1の表示部40に表示させることができる。図3(a),(b),(c)は、表示部40に表示されたサンプルデータ群、実験データ群および解析データ群の一覧の例をそれぞれ示す図である。
図3(a)の例においては、第1のサンプルデータ群の「サンプルID」は「Samp_ID_1」であり、「サンプル名」は「Sample 1」であり、「処理日」は「2017/1/1」である。第2のサンプルデータ群の「サンプルID」は「Samp_ID_2」であり、「サンプル名」は「Sample 2」であり、「処理日」は「2017/2/1」である。第3のサンプルデータ群の「サンプルID」は「Samp_ID_3」であり、「サンプル名」は「Sample 3」であり、「処理日」は「2017/3/4」である。
図3(b)の例においては、第1の実験データ群の「実験ID」は「Exp_ID_1」であり、「実験名」は「Experiment 1」であり、「実験日」は「2017/1/2」である。第2の実験データ群の「実験ID」は「Exp_ID_2」であり、「実験名」は「Experiment 2」であり、「実験日」は「2017/2/2」である。第3の実験データ群の「実験ID」は「Exp_ID_3」であり、「実験名」は「Experiment 3」であり、「実験日」は「2017/3/5」である。
図3(c)の例においては、第1の解析データ群の「解析ID」は「Ana_ID_1」であり、「解析名」は「Analysis 1」であり、「解析日」は「2017/1/3」である。第2の解析データ群の「解析ID」は「Ana_ID_2」であり、「解析名」は「Analysis 2」であり、「解析日」は「2017/2/3」である。第3の解析データ群の「解析ID」は「Ana_ID_3」であり、「解析名」は「Analysis 3」であり、「解析日」は「2017/3/6」である。
使用者は、図1の操作部30を操作していずれかの属性(サンプルIDまたはサンプル名等)を検索条件として入力することにより、検索すべき所望のサンプルデータ群、実験データ群または解析データ群を指定することができる。また、サンプルデータ群に含まれる「サンプルID」と、実験データ群に含まれる「実験ID」および「サンプルID」と、解析データ群に含まれる「解析ID」および「実験ID」とに基づいて、指定されたデータ群に関連する全てのデータ群が検索される。
(3)データ検索装置
図1に示すように、データ検索装置10は、サンプル検索条件受付部1a、実験検索条件受付部1b、解析検索条件受付部1cおよび関連データ特定部1dを含む。また、データ検索装置10は、サンプルデータ検索部2a、実験データ検索部2b、解析データ検索部2cおよび関連データ検索部2dを含む。さらに、データ検索装置10は、サンプル検索結果取得部3a、実験検索結果取得部3b、解析検索結果取得部3c、関連検索結果取得部3dおよび表示制御部4を含む。
サーバPCのCPUおよびクライアントPCのCPUがデータ検索プログラムを実行することにより、図1の構成要素(1a~1d,2a~2d,3a~3d,4)の機能が実現される。なお、図1の構成要素(1a~1d,2a~2d,3a~3d,4)の一部または全部が電子回路等のハードウエアにより構成されてもよい。
本実施の形態においては、サーバPCのCPUが記憶装置20に記憶されたデータ検索プログラムの一部を実行することにより図1の構成要素(1a~1d,2a~2d,3a~3d)の機能が実現される。また、クライアントPCのCPUが図示しない記憶部に記憶されたデータ検索プログラムの他の一部を実行することにより表示制御部4の機能が実現される。したがって、データ検索装置10は、クライアントPCに対応して1つ以上の表示制御部4を含む。
サンプル検索条件受付部1aは、サンプルデータ群に関する検索条件を操作部30から受け付ける。実験検索条件受付部1bは、実験データ群に関する検索条件を操作部30から受け付ける。解析検索条件受付部1cは、解析データ群に関する検索条件を操作部30から受け付ける。サンプル検索条件受付部1a、実験検索条件受付部1bまたは解析検索条件受付部1cが検索条件受付部の例である。
サンプルデータ検索部2aは、サンプル検索条件受付部1aにより受け付けられた検索条件に該当するサンプルデータ群を対象データ群として記憶装置20に記憶されたデータベースから検索する。実験データ検索部2bは、実験検索条件受付部1bにより受け付けられた検索条件に該当する実験データ群を対象データ群として記憶装置20に記憶されたデータベースから検索する。解析データ検索部2cは、解析検索条件受付部1cにより受け付けられた検索条件に該当する解析データ群を対象データ群として記憶装置20に記憶されたデータベースから検索する。サンプルデータ検索部2a、実験データ検索部2bまたは解析データ検索部2cが対象データ検索部の例である。
サンプル検索結果取得部3aは、サンプルデータ検索部2aにより検索されたサンプルデータ群を取得する。実験検索結果取得部3bは、実験データ検索部2bにより検索された実験データ群を取得する。解析検索結果取得部3cは、解析データ検索部2cにより検索された解析データ群を取得する。
関連データ特定部1dは、サンプル検索結果取得部3aにより取得されたサンプルデータ群に含まれる「サンプルID」を受け付ける。この場合、関連データ特定部1dは、当該「サンプルID」を含む実験データ群を関連データ群として特定する。また、関連データ特定部1dは、該当する実験データ群に含まれる「実験ID」を特定し、特定された「実験ID」を含む解析データ群を関連データ群として特定する。
あるいは、関連データ特定部1dは、実験検索結果取得部3bにより取得された実験データ群に含まれる「実験ID」および「サンプルID」を受け付ける。この場合、関連データ特定部1dは、当該「実験ID」を含む解析データ群を関連データ群として特定する。また、関連データ特定部1dは、当該「サンプルID」を含むサンプルデータ群を関連データ群として特定する。
あるいは、関連データ特定部1dは、解析検索結果取得部3cにより取得された解析データ群に含まれる「実験ID」を受け付ける。この場合、関連データ特定部1dは、当該「実験ID」を含む実験データ群を関連データ群として特定する。また、関連データ特定部1dは、該当する実験データ群に含まれる「サンプルID」を特定し、特定された「サンプルID」を含むサンプルデータ群を関連データ群として特定する。
関連データ検索部2dは、関連データ特定部1dにより特定された関連データ群を記憶装置20に記憶されたデータベースから検索する。関連検索結果取得部3dは、関連データ検索部2dにより検索された関連データ群を取得する。表示制御部4は、サンプル検索結果取得部3a、実験検索結果取得部3bまたは解析検索結果取得部3cにより取得された対象データ群の一覧と、関連検索結果取得部3dにより取得された関連データ群とを表示するように図1の表示部40を制御する。
(4)検索例
図4(a),(b)は、検索条件の指定および検索結果の表示例を示す図である。図4(a)に示すように、使用者は、図1の操作部30を用いて所定の操作を行うことにより、検索条件入力欄41を表示部40に表示させることができる。また、使用者は、操作部30を操作することにより、所望の検索条件を検索条件入力欄41に入力することができる。図4(a)の例では、サンプルの「処理者」である「Ieyasu Tokugawa」が検索条件として検索条件入力欄41に入力されている。
この場合、「処理者」として「Ieyasu Tokugawa」を含むサンプルデータ群が記憶装置20に記憶されたデータベースから検索される。また、検索されたサンプルデータ群に関連する実験データ群および解析データ群が記憶装置20に記憶されたデータベースから検索される。
これにより、図4(b)に示すように、サンプルデータ群の検索結果の一覧を示す検索結果表示欄42が表示部40に表示される。図4(b)の例では、第1、第3および第7のサンプルデータ群が検索結果として検索結果表示欄42に表示されている。なお、第7のサンプルデータ群の「サンプルID」は「Samp_ID_7」であり、「サンプル名」は「Sample 7」であり、「処理日」は「2017/8/10」である。第1および第3のサンプルデータ群は、図3(a)の第1および第3のサンプルデータ群とそれぞれ同じである。
また、検索結果表示欄42と対応するように関連データ選択欄43が表示部40に表示される。使用者は、操作部30を用いて関連データ選択欄43を操作することにより、検索されたサンプルデータ群に関連する実験データ群または解析データ群を選択することができる。なお、図4(b)の例では、関連する実験データ群選択が「関連実験」と表示され、関連する解析データ群選択が「関連解析」と表示されているが、表示例はこれに限定されない。実験データ群が選択された場合、表示部40の表示がサンプルデータ群に関連する実験データ群の検索結果の一覧の表示に遷移する。解析データ群が選択された場合、表示部40の表示がサンプルデータ群に関連する解析データ群の検索結果の一覧の表示に遷移する。
同様に、実験データ群に関する検索条件が検索条件入力欄41に入力された場合、実験データ群の検索結果の一覧を示す検索結果表示欄42および関連データ選択欄43が表示部40に表示される。使用者は、関連データ選択欄43を操作することにより、検索された実験データ群に関連するサンプルデータ群または解析データ群を選択することができる。サンプルデータ群が選択された場合、表示部40の表示が実験データ群に関連するサンプルデータ群の検索結果の一覧の表示に遷移する。解析データ群が選択された場合、表示部40の表示が実験データ群に関連する解析データ群の検索結果の一覧の表示に遷移する。
また、解析データ群に関する検索条件が検索条件入力欄41に入力された場合、解析データ群の検索結果の一覧を示す検索結果表示欄42および関連データ選択欄43が表示部40に表示される。使用者は、関連データ選択欄43を操作することにより、検索された解析データ群に関連するサンプルデータ群または実験データ群を選択することができる。サンプルデータ群が選択された場合、表示部40の表示が解析データ群に関連するサンプルデータ群の検索結果の一覧の表示に遷移する。実験データ群が選択された場合、表示部40の表示が解析データ群に関連する実験データ群の検索結果の一覧の表示に遷移する。
(5)データ検索処理
図5および図6は、データ検索プログラムにより行われるデータ検索処理のアルゴリズムを示すフローチャートである。サンプル検索条件受付部1aは、図1の操作部30からサンプルデータ群に関する検索条件が受け付けられたか否かを判定する(ステップS1)。サンプルデータ群に関する検索条件が受け付けられない場合、サンプル検索条件受付部1aはステップS11に進む。
サンプルデータ群に関する検索条件が受け付けられた場合、サンプルデータ検索部2aはステップS1で受け付けられた検索条件に該当するサンプルデータ群を図1の記憶装置20に記憶されたデータベースから検索する(ステップS2)。次に、サンプル検索結果取得部3aは、ステップS2におけるサンプルデータ群の検索結果を取得する(ステップS3)。
続いて、関連データ特定部1dは、ステップS2で検索結果が取得されたサンプルデータ群の関連データ群を特定する(ステップS4)。具体的には、関連データ特定部1dは、当該サンプルデータ群に含まれる「サンプルID」を含む実験データ群を関連データ群として特定するとともに、当該実験データ群に含まれる「実験ID」を含む解析データ群を関連データ群として特定する。
次に、関連データ検索部2dは、ステップS3で特定された関連データ群を記憶装置20に記憶されたデータベースから検索する(ステップS5)。続いて、関連検索結果取得部3dは、ステップS5における関連データ群の検索結果を取得する(ステップS6)。その後、表示制御部4は、ステップS3,S6でそれぞれ取得されたサンプルデータ群の検索結果および関連データ群の検索結果に基づいて、検索結果表示欄42および関連データ選択欄43を表示部40に表示させる(ステップS7)。これにより、データ検索処理が終了する。
ステップS11で、実験検索条件受付部1bは、操作部30から実験データ群に関する検索条件が受け付けられたか否かを判定する(ステップS11)。実験データ群に関する検索条件が受け付けられない場合、実験検索条件受付部1bはステップS21に進む。
実験データ群に関する検索条件が受け付けられた場合、実験データ検索部2bはステップS11で受け付けられた検索条件に該当する実験データ群を記憶装置20に記憶されたデータベースから検索する(ステップS12)。次に、実験検索結果取得部3bは、ステップS12における実験データ群の検索結果を取得する(ステップS13)。
続いて、関連データ特定部1dは、ステップS13で検索結果が取得された実験データ群の関連データ群を特定する(ステップS14)。具体的には、関連データ特定部1dは、当該実験データ群に含まれる「サンプルID」および「実験ID」をそれぞれ含むサンプルデータ群および解析データ群を関連データ群として特定する。
次に、関連データ検索部2dは、ステップS13で特定された関連データ群を記憶装置20に記憶されたデータベースから検索する(ステップS15)。続いて、関連検索結果取得部3dは、ステップS15における関連データ群の検索結果を取得する(ステップS16)。その後、表示制御部4は、ステップS13,S16でそれぞれ取得された実験データ群の検索結果および関連データ群の検索結果に基づいて、検索結果表示欄42および関連データ選択欄43を表示部40に表示させる(ステップS17)。これにより、データ検索処理が終了する。
ステップS21で、解析検索条件受付部1cは、操作部30から解析データ群に関する検索条件が受け付けられたか否かを判定する(ステップS21)。解析データ群に関する検索条件が受け付けられない場合、解析検索条件受付部1cはステップS1に戻る。ステップS1、ステップS11またはステップS21でいずれかのデータ群に関する検索条件が受け付けられるまでステップS1,S11,S21が繰り返される。
解析データ群に関する検索条件が受け付けられた場合、解析データ検索部2cはステップS21で受け付けられた検索条件に該当する解析データ群を記憶装置20に記憶されたデータベースから検索する(ステップS22)。次に、解析検索結果取得部3cは、ステップS22における解析データ群の検索結果を取得する(ステップS23)。
続いて、関連データ特定部1dは、ステップS23で検索結果が取得された解析データ群の関連データ群を特定する(ステップS24)。具体的には、関連データ特定部1dは、当該解析データ群に含まれる「実験ID」を含む実験データ群を関連データ群として特定するとともに、当該実験データ群に含まれる「サンプルID」を含むサンプルデータ群を関連データ群として特定する。
次に、関連データ検索部2dは、ステップS23で特定された関連データ群を記憶装置20に記憶されたデータベースから検索する(ステップS25)。続いて、関連検索結果取得部3dは、ステップS25における関連データ群の検索結果を取得する(ステップS26)。その後、表示制御部4は、ステップS23,S26でそれぞれ取得された解析データ群の検索結果および関連データ群の検索結果に基づいて、検索結果表示欄42および関連データ選択欄43を表示部40に表示させる(ステップS27)。これにより、データ検索処理が終了する。
(6)効果
本実施の形態に係るデータ蓄積システム100においては、記憶装置20に膨大な数のデータ群が記憶されている場合でも、使用者は、いずれかのカテゴリに属する所望のデータ群に属するデータ群の検索条件を指定することにより、検索条件に該当する対象データ群および当該対象データ群の関連データ群を検索することができる。
具体的には、サンプルデータ群に関する検索条件が受け付けられた場合、1以上のサンプルデータ群を対象データ群として検索することができる。また、各対象データ群に関連する1以上の実験データ群および1以上の解析データ群とを関連データ群として検索することができる。
実験データ群に関する検索条件が受け付けられた場合、該当する1以上の実験データ群を対象データ群として検索することができる。また、各対象データ群に関連する1以上のサンプルデータ群および1以上の解析データ群とを関連データ群として検索することができる。
解析データ群に関する検索条件が受け付けられた場合、該当する1以上の解析データ群を対象データ群として検索することができる。また、各対象データ群に関連する1以上のサンプルデータ群および1以上の実験データ群とを関連データ群として検索することができる。
使用者は、表示部40を視認することにより、対象データおよび関連データ群の検索結果を閲覧することができる。これにより、使用者は、複数のデータ群から所定のデータ群を効率よく見出すことができる。
また、上記の構成によれば、例えば特定のタンパクを含む解析データ群に関連するサンプルデータ群の全部を容易に検索することが可能である。そのため、仮に、この検索により取得されたサンプルデータ群が全て同じ疾患の患者に由来するものである場合、当該タンパクが疾患マーカであることの有力な手掛かりとなることを特定することができる。逆に、例えば特定の条件を含むサンプルデータ群に関連する解析データ群の全部を容易に検索することが可能である。これにより、特定の疾患を有する患者由来のサンプルデータ群から得られた全部の解析データ群の共通事項を検討することができる。
(7)他の実施の形態
(a)上記実施の形態において、カテゴリは、「サンプル」、「実験」および「解析」を含むが、本発明はこれに限定されない。カテゴリは、「サンプル」、「実験」および「解析」に加えて、または「サンプル」、「実験」および「解析」に代えて他のカテゴリを含んでもよい。また、カテゴリの数は3個以上であってもよい。本例におけるカテゴリは、「プロジェクト」をさらに含む。また、本例におけるカテゴリは、「サンプル」として「検体(specimen)」と「前処理」とを含む。
以下、「プロジェクト」、「検体」および「前処理」のカテゴリに属するデータ群をそれぞれプロジェクトデータ群、検体データ群および前処理データ群と呼ぶ。検体データ群は、いずれかのプロジェクトデータ群に基づいて生成される。この場合、当該プロジェクトデータ群は親データ群であり、親データ群から生成された検体データ群は子データ群となる。また、前処理データ群は、いずれかの検体データ群に基づいて生成される。この場合、当該検体データ群は親データ群であり、親データ群から生成された前処理データ群は子データ群となる。
なお、実験データ群は、いずれかの前処理データ群に基づいて生成される。この場合、当該前処理データ群は親データ群であり、親データ群から生成された実験データ群は子データ群となる。プロジェクトデータ群と、当該プロジェクトデータ群から生成された1つ以上の検体データ群と、当該1つ以上の検体データ群から生成された1つ以上の前処理データ群と、当該1つ以上の前処理データ群から生成された1つ以上の実験データ群と、当該1つ以上の実験データ群から生成された1つ以上の解析データ群とは、互いに関連する。
図7(a)~(e)は、データベースにおけるプロジェクトデータ群、検体データ群、前処理データ群、実験データ群および解析データ群のデータ構造をそれぞれ示す図である。図7(a)に示すように、プロジェクトデータ群におけるデータは、「プロジェクト名」、「機関」および「メンバー」等の属性に分類される。ここで、対象となるプロジェクトデータ群は、複数機関で実施される複数のプロジェクトに限らず、一の機関で実施される複数のプロジェクトを対象とすることができる。また、プロジェクトデータ群におけるデータは、当該プロジェクトデータ群に固有の「プロジェクトID」を主キーとして含む。
図7(b)に示すように、検体データ群におけるデータは、「生物種名」、「組織名」、「採取日」、「採取者」、「採取場所」および「病名」等の属性に分類される。また、検体データ群におけるデータは、当該検体データ群に固有の「検体ID」を主キーとして含むとともに、当該検体データ群の親データ群であるプロジェクトデータ群の「プロジェクトID」を外部キーとして含む。
図7(c)に示すように、前処理データ群におけるデータは、「薬品名」、「装置名」、「処理日」および「処理者」等の属性に分類される。また、前処理データ群におけるデータは、当該前処理データ群に固有の「前処理ID」を主キーとして含むとともに、当該前処理データ群の親データ群である検体データ群の「検体ID」を外部キーとして含む。
図7(d)に示すように、実験データ群のデータ構造は、実験データ群のデータが「サンプルID」に代えて「前処理ID」を外部キーとして含む点を除き、図2(b)の実験データ群のデータ構造と同様である。また、図7(e)の解析データ群のデータ構造は、図2(c)の解析データ群のデータ構造と同様である。
本例のように、各データ群がさらに多数のカテゴリのいずれかに分類され、記憶装置20にさらに膨大な数のデータ群が記憶されている場合でも、使用者は、いずれかのカテゴリに属する所望のデータ群に属するデータ群の検索条件を指定することにより、検索条件に該当する対象データ群および当該対象データ群の関連データ群を検索することができる。
(b)上記実施の形態において、対象データ群の検索結果と、関連データ群の検索結果とが切り替え可能に表示部40に表示されるが、本発明はこれに限定されない。対象データ群の検索結果と、関連データ群の検索結果とが同時に表示部40に表示されてもよい。
(d)上記実施の形態において、データ蓄積システム100は、サーバPCと、1つ以上のクライアントPCとからなるクライアントサーバシステムであるが、本発明はこれに限定されない。データ蓄積システム100は、1つのPC等の情報処理装置により構成されてもよい。
1a…サンプル検索条件受付部,1b…実験検索条件受付部,1c…解析検索条件受付部,1d…関連データ特定部,2a…サンプルデータ検索部,2b…実験データ検索部,2c…解析データ検索部,2d…関連データ検索部,3a…サンプル検索結果取得部,3b…実験検索結果取得部,3c…解析検索結果取得部,3d…関連検索結果取得部,4…表示制御部,10…データ検索装置,20…記憶装置,30…操作部,40…表示部,41…検索条件入力欄,42…検索結果表示欄,43…関連データ選択欄,100…データ蓄積システム

Claims (7)

  1. サンプルの質量分析により取得されかつ記憶装置に記憶された複数のデータ群から所定のデータ群を検索し、検索結果を表示部に表示させるデータ検索装置であって、
    各データ群は、予め定められた複数のカテゴリのいずれかに分類され、
    前記複数のカテゴリのうち、いずれかのカテゴリに属するデータ群の検索条件を受け付ける検索条件受付部と、
    前記記憶装置に記憶された前記複数のデータ群から前記検索条件受付部により受け付けられた検索条件に該当するデータ群を対象データ群として検索する対象データ検索部と、
    前記対象データ検索部により検索された対象データ群に関連しかつ他のカテゴリに属するデータ群を関連データ群として特定する関連データ特定部と、
    前記記憶装置に記憶されたデータ群から前記関連データ特定部により特定された関連データ群を検索する関連データ検索部と、
    前記関連データ検索部による関連データ群の検索結果を表示するように前記表示部を制御する表示制御部とを備える、データ検索装置。
  2. 前記複数のカテゴリは、第1、第2および第3のカテゴリを含み、
    前記第1のカテゴリに属するデータ群は、第1のデータ群を含み、
    前記第2のカテゴリに属するデータ群は、前記第1のカテゴリに属する第1のデータ群に基づいて生成される1または複数の第2のデータ群を含み、
    前記第3のカテゴリに属するデータ群は、前記第2のカテゴリに属する第2のデータ群に基づいて生成される1または複数の第3のデータ群を含み、
    前記第1のカテゴリに属する第1のデータ群と、前記第2のカテゴリに属する第2のデータ群とは互いに関連し、
    前記第2のカテゴリに属する第2のデータ群と、前記第3のカテゴリに属する第3のデータ群とは互いに関連する、請求項1記載のデータ検索装置。
  3. 前記第1のカテゴリに属する各データ群は、質量分析に供される前記サンプルに関するデータ群を含み、
    前記第2のカテゴリに属する各データ群は、前記サンプルの質量分析に関するデータ群を含み、
    前記第3のカテゴリに属する各データ群は、前記質量分析結果の解析に関するデータ群を含む、請求項2記載のデータ検索装置。
  4. 前記第1のカテゴリに属する各データ群は、当該データ群に固有の第1の識別情報をさらに含み、
    前記第2のカテゴリに属する各データ群は、当該データ群に固有の第2の識別情報と、前記第1のカテゴリに属するいずれかのデータ群に含まれる第1の識別情報とをさらに含み、
    前記第3のカテゴリに属する各データ群は、当該データ群に固有の第3の識別情報と、前記第2のカテゴリに属するいずれかのデータ群に含まれる第2の識別情報とをさらに含み、
    前記関連データ特定部は、第1、第2および第3の識別情報に基づいて対象データ群の関連データ群を特定する、請求項2または3記載のデータ検索装置。
  5. 前記表示制御部は、前記対象データ検索部による対象データ群の検索結果と、前記関連データ検索部による関連データ群の検索結果とを同時にまたは切り替え可能に表示するように前記表示部を制御する、請求項1~4のいずれか一項に記載のデータ検索装置。
  6. サンプルの質量分析により取得されかつ予め定められた複数のカテゴリのいずれかに分類された複数のデータ群を記憶する記憶装置と、
    表示部と、
    前記記憶装置に記憶された複数のデータ群から所定のデータ群を検索し、検索結果を前記表示部に表示させる請求項1~5のいずれか一項に記載のデータ検索装置とを備える、データ蓄積システム。
  7. サンプルの質量分析により取得されかつ記憶装置に記憶された複数のデータ群から所定のデータ群を検索し、検索結果を表示部に表示させるデータ検索方法であって、
    各データ群は、予め定められた複数のカテゴリのいずれかに分類され、
    前記複数のカテゴリのうち、いずれかのカテゴリに属するデータ群の検索条件を受け付けるステップと、
    前記記憶装置に記憶された前記複数のデータ群から受け付けられた検索条件に該当するデータ群を対象データ群として検索するステップと、
    検索された対象データ群に関連しかつ他のカテゴリに属するデータ群を関連データ群として特定するステップと、
    前記記憶装置に記憶されたデータ群から特定された関連データ群を検索するステップと、
    関連データ群の検索結果を前記表示部に表示させるステップとを含み、
    各ステップはコンピュータにより実行される、データ検索方法。
JP2018090730A 2018-05-09 2018-05-09 データ検索装置、データ蓄積システムおよびデータ検索方法 Active JP7087650B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018090730A JP7087650B2 (ja) 2018-05-09 2018-05-09 データ検索装置、データ蓄積システムおよびデータ検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018090730A JP7087650B2 (ja) 2018-05-09 2018-05-09 データ検索装置、データ蓄積システムおよびデータ検索方法

Publications (2)

Publication Number Publication Date
JP2019197371A JP2019197371A (ja) 2019-11-14
JP7087650B2 true JP7087650B2 (ja) 2022-06-21

Family

ID=68537591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018090730A Active JP7087650B2 (ja) 2018-05-09 2018-05-09 データ検索装置、データ蓄積システムおよびデータ検索方法

Country Status (1)

Country Link
JP (1) JP7087650B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7075385B2 (ja) 2019-10-30 2022-05-25 株式会社Soken 電力変換装置
JP7347378B2 (ja) * 2020-09-03 2023-09-20 株式会社島津製作所 質量分析データ表示処理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130060812A1 (en) 2011-09-04 2013-03-07 Ariel Inventions Llc Ssystems, devices, and methods for providing multidimensional search results
JP2017096668A (ja) 2015-11-19 2017-06-01 株式会社島津製作所 生体由来物質の同定支援方法及び同定支援装置
JP2017522657A (ja) 2014-06-17 2017-08-10 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited ユーザ関係データユーザ関係データの結合に基づく検索

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130060812A1 (en) 2011-09-04 2013-03-07 Ariel Inventions Llc Ssystems, devices, and methods for providing multidimensional search results
JP2017522657A (ja) 2014-06-17 2017-08-10 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited ユーザ関係データユーザ関係データの結合に基づく検索
JP2017096668A (ja) 2015-11-19 2017-06-01 株式会社島津製作所 生体由来物質の同定支援方法及び同定支援装置

Also Published As

Publication number Publication date
JP2019197371A (ja) 2019-11-14

Similar Documents

Publication Publication Date Title
Wang et al. NeuroPep: a comprehensive resource of neuropeptides
Barrett et al. Mining microarray data at NCBI’s Gene Expression Omnibus (GEO)
Gnad et al. PHOSIDA (phosphorylation site database): management, structural and evolutionary investigation, and prediction of phosphosites
US20140244625A1 (en) Sequence read archive interface
JP7087650B2 (ja) データ検索装置、データ蓄積システムおよびデータ検索方法
US8538983B2 (en) Systems, methods, and apparatus for facilitating chemical analyses
Esquivel-Rodriguez et al. Pairwise and multimeric protein–protein docking using the LZerD program suite
US10216910B2 (en) Simulated carbon and proton NMR chemical shifts based binary fingerprints for virtual screening
JP2009115724A (ja) 質量分析装置および質量分析方法
Kuhn et al. A pilot study for fragment identification using 2D NMR and deep learning
Moorthy et al. Updates to the inverted library search algorithm for mixture analysis
Shah et al. TraceSpecks: a software for automated idealization of noisy patch-clamp and imaging data
Perez de Souza et al. Computational methods for processing and interpreting mass spectrometry-based metabolomics
Yu et al. PeptideDepot: flexible relational database for visual analysis of quantitative proteomic data and integration of existing protein information
US8158003B2 (en) Precision peak matching in liquid chromatography-mass spectroscopy
Mendoza-Parra et al. NGS-QC generator: a quality control system for ChIP-Seq and related deep sequencing-generated datasets
JPWO2017158673A1 (ja) 質量分析データ解析装置及び質量分析データ解析用プログラム
WO2019241191A1 (en) Cut vertex method for identifying complex molecule substructures
JP7021754B2 (ja) 質量分析装置、質量分析方法および質量分析プログラム
US8160854B2 (en) Method of managing and displaying gene expression data
Arrais et al. GeneBrowser: an approach for integration and functional classification of genomic data
JP2016070789A (ja) 質量分析データ処理装置
CN109564227A (zh) 结果相依分析-swath数据的迭代分析
McJunkin et al. Automation and control of an imaging internal laser desorption Fourier transform mass spectrometer (I2LD-FTMS)
US6836733B1 (en) Biological sequence pattern probe

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220523

R151 Written notification of patent or utility model registration

Ref document number: 7087650

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151