JP6751064B2 - データ検索システム、データ検索方法、及びプログラム - Google Patents

データ検索システム、データ検索方法、及びプログラム Download PDF

Info

Publication number
JP6751064B2
JP6751064B2 JP2017180534A JP2017180534A JP6751064B2 JP 6751064 B2 JP6751064 B2 JP 6751064B2 JP 2017180534 A JP2017180534 A JP 2017180534A JP 2017180534 A JP2017180534 A JP 2017180534A JP 6751064 B2 JP6751064 B2 JP 6751064B2
Authority
JP
Japan
Prior art keywords
cluster
data
column
data set
search condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017180534A
Other languages
English (en)
Other versions
JP2019057082A (ja
Inventor
秀則 松崎
秀則 松崎
新肖 李
新肖 李
弾 梅田
弾 梅田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2017180534A priority Critical patent/JP6751064B2/ja
Priority to US15/903,736 priority patent/US10579616B2/en
Publication of JP2019057082A publication Critical patent/JP2019057082A/ja
Application granted granted Critical
Publication of JP6751064B2 publication Critical patent/JP6751064B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施形態は、データ検索システム、データ検索方法、及びプログラムに関する。
様々な分野においてデータベースから所望のデータを抽出するデータ検索システムが利用されている。データベースの形式として、複数のカラムの属性値が対応付けられたRDB(Relational Database)がある。
例えば、プログラムの実行結果を示すトレース情報から所望のデータを抽出するシステムであって、プログラムを構成する関数(スコープ)の種類、関数の処理が開始された開始時間、関数の処理が継続した処理時間、関数間の呼び出し関係等をカラムとし、開始時間を基準として時系列にソートされたRDBから、所定の時間範囲内のデータを抽出するシステムがある。
米国特許出願公開第2008/0178158号明細書
上記のようなRDBを利用した検索システムにおいて、ソートの基準となるカラム(基準カラム)に対応する検索条件が指定された場合には、検索条件に合致するデータを抽出する処理を容易に行うことができる。例えば、RDBを構成する複数のレコードが時系列にソートされており、検索条件としてある時間範囲が指定された場合には、当該時間範囲に含まれるレコードを容易に抽出することができる。
しかし、検索条件が基準カラムに対応していない場合(例えば、時系列にソートされたデータベースにおいて時間以外の検索条件が指定された場合)、データベース内を全スキャンすることが必要になる場合がある。ビッグデータを検索対象とする場合等には、検索効率を向上させることが非常に重要となる。
そこで、以下の実施形態では、データの検索効率を向上させることを目的とする。
実施形態のデータ検索システムは、データセット生成部と、記憶部と、インデックス情報生成部と、クラスタ読出部と、データ抽出部と、を備える。データセット生成部は、複数のレコードを含み、第1のカラムをソートの基準となる基準カラムとし、複数のレコードを構成するデータが第1のカラムの所定範囲毎にクラスタリングされた第1のデータセットと、複数のレコードを含み、第2のカラムを基準カラムとし、複数のレコードを構成するデータが第2のカラムの所定範囲毎にクラスタリングされた第2のデータセットを生成する。記憶部は、クラスタリングにより生成されたクラスタを記憶装置に記憶させる。インデックス情報生成部は、基準カラムを示す情報と、所定範囲を示す情報と、クラスタの記憶領域とが対応付けられたインデックス情報を生成する。クラスタ読出部は、インデックス情報に基づいて、基準カラムが検索条件に対応し且つ所定範囲が検索条件を含むクラスタを記憶装置から読み出す。データ抽出部は、読み出されたクラスタから検索条件に合致したデータを抽出する。
第1の実施形態の第1の例に係るデータ検索システムのハードウェア構成例を示す図。 第1の実施形態の第2の例に係るデータ検索システムのハードウェア構成例を示す図。 第1の実施形態に係る情報処理端末及びサーバのハードウェア構成例を示す図。 第1の実施形態に係るデータ検索システムの機能構成例を示すブロック図。 第1の実施形態に係るDBの生データのデータ構造例を示す図。 第1の実施形態に係る第1のデータセットのデータ構造例を示す図。 第1の実施形態に係る第1のデータセットから生成された第2のデータセットのデータ構造例を示す図。 第1の実施形態の第1の例に係るインデックス情報のデータ構造例を示す図。 第1の実施形態の第2の例に係るインデックス情報のデータ構造例を示す図。 第1の実施形態の第3の例に係るインデックス情報のデータ構造例を示す図。 第1の実施形態に係るデータ検索システムにおけるデータセットの生成処理例を示すフローチャート。 第1の実施形態に係るデータ検索システムにおけるクラスタの読み出しから抽出データの出力までの処理の例を示すフローチャート。 第1の実施形態の第1の例に係る検索条件のデータ構造例を示す図。 第1の実施形態に係るインデックス情報のうち第1の例に係る検索条件に対応する部分の例を示す図。 第1の実施形態の第1の例に係る検索条件に対応するクラスタのデータ構造例を示す図。 第1の実施形態の第1の例に係る抽出データのデータ構造例を示す図。 第1の実施形態の第2の例に係る検索条件のデータ構造例を示す図。 第1の実施形態に係るインデックス情報のうち第2の例に係る検索条件に対応する部分の例を示す図。 第1の実施形態の第2の例に係る検索条件に対応するクラスタのデータ構造例を示す図。 第1の実施形態の第2の例に係る抽出データのデータ構造例を示す図。 第1の実施形態の第1の例に係るクラスタの記憶領域の例を示す図。 第1の実施形態の第2の例に係るクラスタの記憶領域の例を示す図。 第2の実施形態に係る第3のデータセットのデータ構造例を示す図。 第2の実施形態に係るクラスタから抽出データを抽出する際の処理例を示すフローチャート。 第3の実施形態に係るデータセットの生成処理例を示すフローチャート。
(第1の実施形態)
図1は、第1の実施形態の第1の例に係るデータ検索システム1のハードウェア構成例を示す図である。本例に係るデータ検索システム1は、情報処理端末11、サーバ12、及びネットワーク13を含む。情報処理端末11は、ユーザが使用するPC(Personal Computer)(タブレット端末、スマートフォン等を含む)等であり得る。サーバ12は、データ検索システム1の管理者が管理するサーバコンピュータ等であり得る。情報処理端末11とサーバ12とは、インターネット、LAN(Local Area Network)等のネットワーク13を介して接続されている。なお、同図においては、情報処理端末11及びサーバ12がそれぞれ1つずつ記載されているが、それらの両方又は一方が複数存在してもよい。
サーバ12は、データベース(DB)15を有する。DB15は、記憶装置(不揮発性メモリ等)、制御演算装置(プロセッサ等)、制御演算装置を制御するプログラム等を利用して構築及び管理される。DB15は、使用目的に応じた各種のデータを蓄積して構築されるものである。DB15に蓄積されるデータの種類は特に限定されるべきものではないが、例えばプログラムの実行結果を示すトレース情報、所定のシステムの稼働状態を示すログ情報等であり得る。サーバ12は、情報処理端末11から送信された検索条件に合致するデータをDB15から抽出し、抽出されたデータ(抽出データ)を情報処理端末11に送信する。
図2は、第1の実施形態の第2の例に係るデータ検索システム1のハードウェア構成例を示す図である。本例に係るデータ検索システム1は、単体の情報処理端末21により構成される。情報処理端末21は、PC等であり得る。本例に係る情報処理端末21は、制御演算装置25、ユーザI/F(キーボード、タッチパネル、ディスプレイ等)26、及びDB15を含む。なお、同図においては、DB15が情報処理端末21内に存在している状態が示されているが、DB15は情報処理端末21外に存在してもよい。
制御演算装置25は、ユーザI/F26を介してユーザにより入力された検索条件に合致するデータをDB15から抽出し、抽出されたデータ(抽出データ)をユーザI/F26を介して出力する。
図3は、第1の実施形態に係る情報処理端末11,21及びサーバ12のハードウェア構成例を示す図である。情報処理端末11,21及びサーバ12は、CPU(Central Processing Unit)31、RAM(Random Access Memory)32、ROM(Read Only Memory)33、ストレージ34、入力デバイス35、出力デバイス36、通信I/F37、及びバス38を含む。CPU31は、ROM33等に記憶されたプログラムに従ってRAM32をワーキングエリアとして所定の制御演算処理を行う。ストレージ34は、不揮発性メモリであって、DB15を構成するデータ及びDB15を検索するために必要なデータを蓄積する。入力デバイス35は、外部から情報を入力するためのデバイスであり、例えばキーボード、マウス、タッチパネル等である。出力デバイス36は、内部で生成した情報を外部に出力するためのデバイスであり、例えばディスプレイ、プリンタ等である。通信I/F37は、適宜なコンピュータネットワーク(ネットワーク13等)を介して外部の装置との間で情報の送受信を可能にするデバイスである。なお、サーバ12においては、入力デバイス35及び/又は出力デバイス36が不要となる場合がある。
なお、図1〜図3に示すハードウェア構成は単なる例示であり、データ検索システム1は、使用状況に応じて適宜なハードウェア及びソフトウェアを利用して構築されるべきものである。
図4は、第1の実施形態に係るデータ検索システム1の機能構成例を示すブロック図である。本実施形態に係るデータ検索システム1は、記憶部101、入力部102、データセット生成部103、インデックス情報生成部104、クラスタ読出部105、データ抽出部106、及び出力部107を含む。
記憶部101は、DB15の検索(検索条件に合致したデータの抽出)に必要な各種のデータを記憶する。本実施形態に係る記憶部101は、複数のデータセット121,122を記憶する。
データセット121,122は、DB15の生データ(ソートされていない複数のレコード、対応付けられていない属性値等)を、基準カラムを基準としてソートしたテーブル状のデータである。基準カラムとは、ソートの基準となるカラムである。ここでは、記憶部101に第1のデータセット121と第2のデータセット122と記憶されている例が示されている。第1のデータセット121の基準カラムと第2のデータセット122の基準カラムとは異なる。更に多くのデータセットが記憶されてもよく、その場合には各データセットの基準カラムは互いに異なることとなる。記憶部101は、DB15の生データをそのまま記憶してもよい。
各データセット121,122はクラスタリングされている。すなわち、第1のデータセット121は第1のクラスタ群131により構成され、第2のデータセット122は第2のクラスタ群132により構成されている。更に多くのデータセットが存在する場合には、各データセットはそれぞれクラスタ群により構成される。
入力部102は、検索条件を入力する。検索条件とは、DB15を検索するためのキーとなる数値、文字、記号、それらの組み合わせ等からなる情報であり、例えば時間、名称、個数等を表す情報であり得る。検索条件は、DB15のデータ構造に含まれる複数のカラム(属性)に対応する情報である。例えば、時間のカラムに対応する検索条件は時刻、時間範囲等であり、名称のカラムに対応する検索条件はアルファベット、五十音等である。このように、検索条件は複数のカラムのいずれかに対応するように指定される。検索条件は、ユーザにより指定されてもよいし、所定のシステム(アプリケーション等)により自動的に指定されてもよい。
データセット生成部103は、1つ以上のデータセット121,122を生成する。本実施形態に係るデータセット生成部103は、DB15の生データから第1のデータセット121を生成し、第1のデータセット121から第2のデータセット122を生成する。DB15の生データから直接第2のデータセット122を生成してもよい。
図5は、第1の実施形態に係るDB15の生データ111のデータ構造例を示す図である。図6は、第1の実施形態に係る第1のデータセット121のデータ構造例を示す図である。図7は、第1の実施形態に係る第1のデータセット121から生成された第2のデータセット122のデータ構造例を示す図である。
図5に示すように、本実施形態に係る生データ111は、複数のレコード115が蓄積されて構成されている。各レコード115は、複数のデータが対応付けられて構成されている。本例に係るレコード115は、3つの属性値(例えば「1」、「A」、及び「500」)が対応付けられて構成されている。各属性値は、それぞれ異なる属性(カラム)に属する値である。
図6に示すように、本実施形態に係る第1のデータセット121は、第1のカラム141、第2のカラム142、及び第3のカラム143を含み、生データ111に含まれる複数のレコード115が第1のカラム141を基準としてソートされた構成を有している(本例では、生データ111のレコード115の配列と第1のデータセット121のレコード115の配列とが一致している。)。第1のデータセット121の基準カラムは第1のカラム141である。例えば、第1のカラム141は動作開始からの経過時間等であり得る。カラムの数及び各カラムの内容は、使用状況、生データ111の構成等に応じて変化することは無論である。
第1のデータセット121は、第1−1のレコードクラスタ151、第1−2のレコードクラスタ152、及び第1−3のレコードクラスタ153を含んでいる。これらのレコードクラスタ151〜153は、複数のレコード115を、第1のカラム141を基準としたクラスタ範囲(所定範囲)毎に分割したものである。第1−1のレコードクラスタ151は1〜10のクラスタ範囲(第1のカラム141の属性値の範囲)にあるレコード115からなり、第1−2のレコードクラスタ152は11〜20のクラスタ範囲にあるレコード115からなり、第1−3のレコードクラスタ153は21〜30のクラスタ範囲にあるレコード115からなる。当該クラスタ範囲は、使用状況に応じて適宜設定されるべきものである。本例に係るクラスタ範囲は均一な間隔で設定されているが、例えば各レコードクラスタ151〜153に所定数のレコード115が含まれるように不均等な間隔で設定されてもよい。
本例においては、第1−1のレコードクラスタ151は、第1のカラム141の最上位に位置するクラスタ151A、第2のカラム142の最上位に位置するクラスタ151B、及び第3のカラム143の最上位に位置するクラスタ151Cを含む。第1−2のレコードクラスタ152は、第1のカラム141の中間に位置するクラスタ152A、第2のカラム142の中間に位置するクラスタ152B、及び第3のカラム143の中間に位置するクラスタ152Cを含む。第1−3のレコードクラスタ153は、第1のカラム141の最下位に位置するクラスタ153A、第2のカラム142の最下位に位置するクラスタ153B、及び第3のカラム143の最下位に位置するクラスタ153Cを含む。
図7に示すように、本実施形態に係る第2のデータセット122は、第1のデータセット121と同一のカラム141〜143を含み、第1のデータセット121(生データ111)に含まれる複数のレコード115が第2のカラム142を基準としてソートされた構成を有している。第2のデータセット122の基準カラムは第2のカラム142である。
第2のデータセット122は、第2−1のレコードクラスタ161、第2−2のレコードクラスタ162、及び第2−3のレコードクラスタ163を含んでいる。これらのレコードクラスタ161〜163は、複数のレコード115を、第2のカラム142を基準としてクラスタ範囲毎に分割したものである。第2−1のレコードクラスタ161はA〜Eのクラスタ範囲(第2のカラム142の属性値の範囲)にあるレコード115からなり、第2−2のレコードクラスタ162はF〜Nのクラスタ範囲にあるレコード115からなり、第2−3のレコードクラスタ163はO〜Zのクラスタ範囲にあるレコード115からなる。当該クラスタ範囲は、使用状況に応じて適宜設定されるべきものである。本例では、クラスタ範囲が不均等な間隔で設定されているが、均一な間隔で設定されてもよい。
本例においては、第2−1のレコードクラスタ161は、第1のカラム141の最上位に位置するクラスタ161A、第2のカラム142の最上位に位置するクラスタ161B、及び第3のカラム143の最上位に位置するクラスタ161Cを含む。第2−2のレコードクラスタ162は、第1のカラム141の中間に位置するクラスタ162A、第2のカラム142の中間に位置するクラスタ162B、及び第3のカラム143の中間に位置するクラスタ162Cを含む。第2−3のレコードクラスタ163は、第1のカラム141の最下位に位置するクラスタ163A、第2のカラム142の最下位に位置するクラスタ163B、及び第3のカラム143の最下位に位置するクラスタ163Cを含む。
上記のように生成された第1のデータセット121を構成する第1のクラスタ群131(クラスタ151A〜151C,152A〜152C,153A〜153C)、及び第2のデータセット122を構成する第2のクラスタ群132(クラスタ161A〜161C,162A〜162C,163A〜163C)は、記憶部101により所定の記憶領域に記憶される。
インデックス情報生成部104は、基準カラムを示す情報と、クラスタ範囲を示す情報と、各クラスタ151A〜151C,152A〜152C,153A〜153C,161A〜161C,162A〜162C,163A〜163Cの記憶領域を示す情報とが対応付けられたインデックス情報を生成する。
図8は、第1の実施形態の第1の例に係るインデックス情報171のデータ構造例を示す図である。第1の例に係るインデックス情報171は、第1のデータセット121に対応する情報、すなわち基準カラムが第1のカラム141である場合における情報であり、基準カラム、レコードクラスタID、クラスタ範囲、及び記憶領域の関係を示している。
「基準カラム」は、上記基準カラムを示している。「レコードクラスタID」は、レコードクラスタ151〜153を特定する情報であり、本例では「1」が第1−1のレコードクラスタ151に対応し、「2」が第1−2のレコードクラスタ152に対応し、「3」が第1−3のレコードクラスタ153に対応している。「クラスタ範囲」は、各レコードクラスタ151〜153のクラスタ範囲を示している。「記憶領域」は、各クラスタ151A〜151C,152A〜152C,153A〜153Cの記憶領域を特定する情報(メモリアドレス等)である。本例では、クラスタ151Aが「SSD=0,ADDR=0」に記憶され、クラスタ151Bが「SSD=0,ADDR=3」に記憶され、クラスタ151Cが「SSD=0,ADDR=6」に記憶され、クラスタ152Aが「SSD=1,ADDR=0」に記憶され、クラスタ152Bが「SSD=1,ADDR=3」に記憶され、クラスタ152Cが「SSD=1,ADDR=6」に記憶され、クラスタ153Aが「SSD=2,ADDR=0」に記憶され、クラスタ153Bが「SSD=2,ADDR=3」に記憶され、クラスタ153Cが「SSD=2,ADDR=6」に記憶されていることが示されている。本例では、「SSD」が記憶素子(物理メディア)の種類及び位置を示し、「ADDR」が各記憶素子内に割り当てられた領域を示している。本例では、記憶素子として複数のソリッドステートドライブが利用されていることが示されている。
図9は、第1の実施形態の第2の例に係るインデックス情報172のデータ構造例を示す図である。第2の例に係るインデックス情報172は、第2のデータセット122に対応する情報、すなわち基準カラムが第2のカラム142である場合における情報であり、図8に示す第1の例に係るインデックス情報171と同様に、基準カラム、レコードクラスタID、クラスタ範囲、及び記憶領域の関係を示している。
本例において、「レコードクラスタID」の「4」は第2−1のレコードクラスタ161に対応し、「5」は第2−2のレコードクラスタ162に対応し、「6」は第2−3のレコードクラスタ163に対応している。「クラスタ範囲」は、各レコードクラスタ161〜163のクラスタ範囲を示している。「記憶領域」は、各クラスタ161A〜161C,162A〜162C,163A〜163Cの記憶領域を特定する情報(メモリアドレス等)である。本例では、クラスタ161Aが「SSD=0,ADDR=9」に記憶され、クラスタ161Bが「SSD=0,ADDR=12」に記憶され、クラスタ161Cが「SSD=0,ADDR=14」に記憶され、クラスタ162Aが「SSD=1,ADDR=9」に記憶され、クラスタ162Bが「SSD=1,ADDR=12」に記憶され、クラスタ162Cが「SSD=1,ADDR=14」に記憶され、クラスタ163Aが「SSD=2,ADDR=9」に記憶され、クラスタ163Bが「SSD=2,ADDR=12」に記憶され、クラスタ163Cが「SSD=2,ADDR=14」に記憶されていることが示されている。
図10は、第1の実施形態の第3の例に係るインデックス情報173のデータ構造例を示す図である。第3の例に係るインデックス情報173は、第1のデータセット121及び第2のデータセット122の両方に対応する情報、すなわち基準カラムが第1のカラム141又は第2のカラム142である場合における情報であり、図8及び図9に示すインデックス情報171,172と同様に、基準カラム、レコードクラスタID、クラスタ範囲、及び記憶領域の関係を示している。
上記のように、インデックス情報は、図8及び図9に示す第1及び第2の例に係るインデックス情報171,172のように、データセット121,122毎(基準カラム毎)に生成されてもよいし、図10に示す第3の例に係るインデックス情報173のように、全てのデータセット121,122(全ての基準カラム)について生成されてもよい。
クラスタ読出部105は、入力部102に入力された検索条件に対応するクラスタ151A〜151C,152A〜152C,153A〜153C,161A〜161C,162A〜162C,163A〜163Cを読み出す。クラスタ読出部105は、インデックス情報171〜173に基づいて、基準カラムが検索条件に対応し且つクラスタ範囲が検索条件を含むクラスタ151A〜151C,152A〜152C,153A〜153C,161A〜161C,162A〜162C,163A〜163Cを、記憶部101内の該当する記憶領域から読み出す。
データ抽出部106は、クラスタ読出部105により読み出されたクラスタ151A〜151C,152A〜152C,153A〜153C,161A〜161C,162A〜162C,163A〜163Cから、検索条件に合致するデータを抽出する。
出力部107は、データ抽出部106により抽出されたデータ(抽出データ)を所定の形式で出力する。抽出データは、ディスプレイ等のユーザI/F(出力デバイス36)に直接出力されてもよいし、GUI(Graphical User Interface)システム、解析システム等の外部システムに出力されてもよい。
上記各機能部101〜107は、例えば1又は複数の集積回路により実現される。上記各機能部101〜107は、CPU31等のプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現されてもよい。また、上記各機能部101〜107は、専用のIC(Integrated Circuit)等のプロセッサ、すなわちハードウェアにより実現されてもよい。また、上記各機能部101〜107は、ソフトウェア及びハードウェアを併用して実現されてもよい。複数のプロセッサを用いる場合、各プロセッサは、各機能部101〜107のうちの1つを実現してもよいし、各機能部101〜107のうちの2以上を実現してもよい。
図11は、第1の実施形態に係るデータ検索システム1におけるデータセット121,122の生成処理例を示すフローチャートである。先ず、データセット生成部103は基準カラムを設定する(S101)。図5及び図6に示す例においては、経過時間を示す第1のカラム141が最初の基準カラムに設定されている。その後、データセット生成部103は、生データ111に含まれる複数のレコード115を、設定された基準カラム(第1のカラム141)を基準としてソートし、第1のデータセット121を生成する(S102)。その後、データセット生成部103は、第1のデータセット121を基準カラム(第1のカラム141)の所定範囲(クラスタ範囲)毎にクラスタリングする(S103)。
その後、データセット生成部103は、他の基準カラムの候補が存在するか否かを判定する(S104)。他の基準カラムの候補の有無の判定基準は、生データ111の構造、使用状況等に応じて適宜設定されるべき事項であるが、例えば全てのカラム(図6に示す例では第1のカラム141、第2のカラム142、及び第3のカラム143)を基準カラムとして複数のデータセットを生成する場合には、未だ基準カラムに設定されていない全てのカラム(第2のカラム142及び第3のカラム143)が候補となる。
他の基準カラムの候補が存在しない場合(S104:No)、新たなデータセットの生成は行われない。一方、他の基準カラムの候補が存在する場合(S104:Yes)、データセット生成部103は当該候補の中から新たな基準カラム(図7に示す例では第2のカラム142)を設定し(S105)、既に生成されたデータセット(第1のデータセット121)又は生データ111を新たな基準カラム(第2のカラム142)を基準としてソートし、新たなデータセット(第2のデータセット122)を生成する(S106)。その後、データセット生成部103は、新たなデータセット(第2のデータセット122)を新たな基準カラム(第2のカラム142)の所定範囲(クラスタ範囲)毎にクラスタリングする(S107)。その後、再度ステップS104が実行される。
上記処理により、任意のカラムを基準カラムとするデータセットを生成することができる。図7に示す例では、第1のカラム141を基準カラムとする第1のデータセット121及び第2のカラム142を基準カラムとする第2のデータセット122のみが示されているが、上記処理により、第3のカラム143を基準カラムとするデータセットを生成してもよい。
インデックス情報生成部104は、上記のように生成された各データセット121,122に基づいてインデックス情報171〜173を生成する。インデックス情報171〜173の生成方法は特に限定されるべきものではないが、例えばデータセット121,122の生成処理と平行して生成されてもよいし、生成されたデータセット121,122に基づいて生成されてもよい。
図12は、第1の実施形態に係るデータ検索システム1におけるクラスタ151A〜151C,152A〜152C,153A〜153C,161A〜161C,162A〜162C,163A〜163Cの読み出しから抽出データの出力までの処理の例を示すフローチャートである。入力部102に検索条件が入力されると(S201)、クラスタ読出部105は、インデックス情報171〜173に基づいて、基準カラムが検索条件に対応し且つクラスタ範囲が検索条件を含むクラスタ151A〜151C,152A〜152C,153A〜153C,161A〜161C,162A〜162C,163A〜163Cを、インデックス情報171〜173に示される記憶領域から読み出す(S202)。データ抽出部106は、読み出されたクラスタ151A〜151C,152A〜152C,153A〜153C,161A〜161C,162A〜162C,163A〜163Cから、検索条件に合致するデータ(レコード115)を抽出する(S203)。出力部107は抽出されたデータを所定の形式で出力する(S204)。
図13は、第1の実施形態の第1の例に係る検索条件201のデータ構造例を示す図である。本例に係る検索条件201は、「第1のカラム141の属性値が2以上且つ10より小さい」レコード115を抽出することを示している。検索条件201のデータ構造はこれに限定されるものではなく、データセット121,122の構造、使用状況等に応じて適宜設定されるべきものである。例えば、レコード115に含まれる全ての属性値を抽出する代わりに、検索条件201に合致するカラムに対応する属性値のみ(例えば第1のカラム141の属性値及び第3のカラム143の属性値のみ)を抽出するようにしてもよい。
図14は、第1の実施形態に係るインデックス情報171〜173のうち第1の例に係る検索条件201に対応する部分の例を示す図である。図14には、レコードクラスタIDが「1」であるレコードクラスタ(第1−1のレコードクラスタ151)が、基準カラムが第1のカラム141であり、且つクラスタ範囲が2以上且つ10より小さい属性値を含むことを示している。図6及び図7に示すように、第1−1のレコードクラスタ151には3つのクラスタ151A〜151Cが含まれる。図14には、クラスタ151Aの記憶領域は「SSD=0,ADDR=0」であり、クラスタ151Bの記憶領域は「SSD=0,ADDR=3」であり、クラスタ151Cの記憶領域は「SSD=0,ADDR=6」であることが示されている。
図15は、第1の実施形態の第1の例に係る検索条件201に対応するクラスタ151A〜151Cのデータ構造例を示す図である。クラスタ読出部105は、図14に示すような、インデックス情報171〜173のうちの検索条件201に対応する部分の情報に基づいて、該当する記憶領域からこれらのクラスタ151A〜151Cを読み出す。
図16は、第1の実施形態の第1の例に係る抽出データ211のデータ構造例を示す図である。データ抽出部106は、図15に示すような読み出されたクラスタ151A〜151Cから、検索条件201に合致するデータである抽出データ211を抽出する。本例に係る検索条件201は、「第1のカラム141の属性値が2以上且つ10より小さい」レコード115を抽出することであるため、第1のカラム141の属性値が「3」であるレコード115のみが抽出データ211となる。
図17は、第1の実施形態の第2の例に係る検索条件221のデータ構造例を示す図である。本例に係る検索条件221は、「第2のカラム142の属性値がN以降である」レコード115を抽出することを示している。
図18は、第1の実施形態に係るインデックス情報171〜173のうち第2の例に係る検索条件221に対応する部分の例を示す図である。図18には、レコードクラスタIDが「5」及び「6」であるレコードクラスタ(第2−2のレコードクラスタ152及び第2−3のレコードクラスタ153)が、基準カラムが第2のカラム142であり、且つクラスタ範囲がN以降の属性値を含むことを示している。図7に示すように、第2−2のレコードクラスタ151及び第2−3のレコードクラスタ152には、合計6つのクラスタ162A〜162C,163A〜163Cが含まれる。図18には、クラスタ162Aの記憶領域は「SSD=1,ADDR=9」であり、クラスタ162Bの記憶領域は「SSD=1,ADDR=12」であり、クラスタ162Cの記憶領域は「SSD=1,ADDR=14」であり、クラスタ163Aの記憶領域は「SSD=2,ADDR=9」であり、クラスタ163Bの記憶領域は「SSD=2,ADDR=12」であり、クラスタ163Cの記憶領域は「SSD=2,ADDR=14」であることが示されている。
図19は、第1の実施形態の第2の例に係る検索条件221に対応するクラスタ162A〜162C,163A〜163Cのデータ構造例を示す図である。クラスタ読出部105は、図18に示すような、インデックス情報171〜173のうちの検索条件221に対応する部分の情報に基づいて、該当する記憶領域からこれらのクラスタ162A〜162C,163A〜163Cを読み出す。
図20は、第1の実施形態の第2の例に係る抽出データ231のデータ構造例を示す図である。データ抽出部106は、図19に示すような読み出されたクラスタ162A〜162C,163A〜163Cから、検索条件221に合致するデータである抽出データ231を抽出する。本例に係る検索条件221は、「第2のカラム142の属性値がN以降である」レコード115を抽出することであるため、第2のカラム142の属性値が「N」、「U」、「X」、「XX」、及び「Z」であるレコード115が抽出データ231となる。
図21は、第1の実施形態の第1の例に係るクラスタ151A〜151C,152A〜152C,153A〜153Cの記憶領域の例を示す図である。本例に係る記憶領域は、3つのSSD:第1のSSD241(SSD0)、第2のSSD242(SSD1)、及び第3のSSD243(SSD2)を含み、クラスタ151A〜151C,152A〜152C,153A〜153CがこれらのSSD241〜243に分散するように記憶されている。このように、複数のクラスタを複数の物理メディアに分散させて記憶させることにより、処理速度を向上させることが可能となる。
図22は、第1の実施形態の第2の例に係るクラスタ151A〜151C,152A〜152C,153A〜153Cの記憶領域の例を示す図である。本例に係る記憶領域は、4つのSSD:第1のSSD241(SSD0)、第2のSSD242(SSD1)、第3のSSD243(SSD2)、及び第4のSSD244(SSD3)を含み、クラスタ151A〜151C,152A〜152C,153A〜153CがこれらのSSD241〜244に分散するように記憶されている。本例においては、第1のカラム141の最上位に位置するクラスタ151Aが2つのクラスタ151A1,151A2(第1のクラスタ及び第2のクラスタ)に分割され、第2のカラム142の最上位に位置するクラスタ151Bが2つのクラスタ151B1,151B2(第1のクラスタ及び第2のクラスタ)に分割され、第3のカラム143の最上位に位置するクラスタ151Cが2つのクラスタ151C1,151C2(第1のクラスタ及び第2のクラスタ)に分割されており、これらの分割されたクラスタ151A1,151A2,151B1,151B2,151C1,151C2がそれぞれ異なるSSD(第1のSSD241及び第4のSSD244)に分散されて記憶されている。なお、1つのクラスタの分割数は上記のように2に限定されるものではなく、3以上であってもよい。このように、1つのクラスタを更に分割して複数の物理メディアに分散させて記憶させてもよい。この場合、インデックス情報171〜173は、分割されたクラスタ毎に記憶領域を特定できるように拡張される必要がある。このように1つのクラスタを分割させることで、物理メディアの残容量に依存せずにクラスタリングを行い、物理メディアの容量を有効に活用することが可能となる。また、頻繁にアクセスされるクラスタを分割することにより、更に処理速度の向上等を図ることが可能となる。
図21及び図22に示す例においては、第1のクラスタ群131に含まれるクラスタ(第1のデータセット121を構成するクラスタ)151A〜151C,152A〜152C,153A〜153Cのみについて説明されているが、第2のクラスタ群132に含まれるクラスタ(第2のデータセット122を構成するクラスタ)161A〜161C,162A〜162C,163A〜163C、及びその他のデータセットに対応するクラスタについても同様である。
上記データ検索システム1の機能を実現させるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD等のコンピュータで読み取り可能な記録媒体に記録されて提供することができる。また、プログラムは、ネットワークに接続された所定の記憶装置から所定のコンピュータにダウンロードすることにより提供されてもよいし、予めROM等に組み込まれて所定の情報処理装置に提供されてもよい。また、プログラムは、上記機能部101〜107の機能を実現する複数のモジュールから構成されてもよい。
図4には、データ検索システム1の基本的な機能部101〜107が示されているが、実施形態はこれに限らない。例えば、各機能部が協調しながら並列的に動作を行う構成、1つの機能部を複数の機能部に分割する構成、これらの構成を組み合わせた構成等であってもよい。
以上のように、本実施形態によれば、データの検索効率を向上させることが可能となる。クラスタを記憶する記憶素子はSSDに限られるものではなく、適宜な記憶素子を利用することができるが、本実施形態によれば、処理速度を向上させることができるので、他の記憶素子(例えばDRAM(Dynamic Random Access Memory)等)に比べて単位記憶容量当たりのコストが低いSSDを利用して、十分な処理速度を有するデータ検索システム1を提供することが可能となる。
以下に他の実施形態について図面を参照して説明するが、第1の実施形態と同一又は同様の作用効果を奏する箇所については同一の符号を付してその説明を省略する場合がある。
(第2の実施形態)
図23は、第2の実施形態に係る第3のデータセット301のデータ構造例を示す図である。第3のデータセット301は、図7に示す第2のデータセット122と同様に、第2のカラム142を基準カラムとするが、第3のデータセット301の最下部のレコードクラスタ311に含まれるクラスタ311A〜311Cは、第2のデータセット122の最下部のレコードクラスタ163とは異なり、第2のカラム142に基づくソートがなされていない。
このように、第2の実施形態に係るデータセット生成部103は、基準カラムに基づくソートがなされていないクラスタを含むようにデータセットを生成する。すなわち、第2の実施形態に係る各クラスタは、それぞれクラスタ範囲に応じた数のレコード115(例えばクラスタ161BにはA〜Eに対応する3つのレコード115、162BにはF〜Nに対応する2つのレコード115、311BにはO〜Zに対応する4つのレコード115)を格納しているものの、レコード115がソートされていないクラスタ(本例ではクラスタ311B)が存在する。このようなデータ構造を有するデータセット301であっても、基準カラムのクラスタ範囲毎にクラスタリングされているため、第1の実施形態と同様に、インデックス情報171〜173に基づいて適切なクラスタ161A〜161C,162A〜162C,311A〜311Cを読み出すことができる。読み出されたクラスタ161A〜161C,162A〜162C,311A〜311Cから検索条件に合致する適切なデータを抽出するため、従来技術のようにDB15内を全検索する場合と比べて、データの検索効率を向上させることができる。
図24は、第2の実施形態に係るクラスタ161A〜161C,162A〜162C,311A〜311Cから抽出データを抽出する際の処理例を示すフローチャートである。データ抽出部106は、クラスタ読出部105により読み出されたクラスタ161A〜161C,162A〜162C,311A〜311C内の検索を開始すると(S301)、先ず、読み出されたクラスタ内がソートされているか否かを判定する(S302)。クラスタ内がソートされているか否かの判定方法は特に限定されるべきものではなく、データセット121,122のデータ構造、検索条件等に応じて適宜選択されるべきものである。例えば、インデックス情報171〜173に予めソートの有無を示す情報を含ませる方法、ステップS202で読み出されたクラスタの基準カラムをスキャンしてソートの有無を確認する方法等が適用され得る。
読み出されたクラスタ内がソートされている場合(S302:Yes)、データ抽出部106は、クラスタ161A〜161C,162A〜162C内を二分探索により検索し(S303)、検索条件に合致するデータを抽出して出力部107に出力させる(S305)。一方、読み出されたクラスタ内がソートされていない場合(S302:No)、データ抽出部106は、クラスタ311A〜311C内を全検索し(S304)、その後ステップS305を実行する。その後、データ抽出部106は、読み出された複数のクラスタのうち未処理のクラスタが存在するか否かを判定する(S306)。データ抽出部106は、未処理のクラスタが存在する場合(S306:Yes)、再度ステップS302を実行し、未処理のクラスタが存在しない場合(S306:No)、当該ルーチンを終了する。
本実施形態によれば、ソート処理を削減することができるので、第1の実施形態と比較して、データセット121,122の生成にかかる処理負荷の軽減、処理速度の向上等を図ることができる。
(第3の実施形態)
本実施形態においては、予め複数のデータセットを生成しておくのではなく、既に存在しているデータセットの基準カラム(例えば、第1のデータセット121の第1のカラム)が検索条件に対応していない場合に、検索条件に対応するカラムを基準カラムとする新たなデータセットを生成する。
図25は、第3の実施形態に係るデータセットの生成処理例を示すフローチャートである。入力部102に検索条件が入力されると(S401)、データセット生成部103は、インデックス情報171〜173を参照して基準カラムが検索条件に対応するデータセットが存在するか否かを判定する(S402)。基準カラムが検索条件に対応するデータセットが存在する場合(S402:Yes)、クラスタ読出部105は、基準カラムが検索条件に対応し、且つクラスタ範囲が検索条件を含むクラスタを記憶領域から読み出す(S403)。その後、データ抽出部106は読み出されたクラスタから検索条件に合致するデータを抽出し(S406)、出力部107は抽出されたデータを出力する(S407)。
一方、基準カラムが検索条件に対応するデータセットが存在しない場合(S402:No)、クラスタ読出部105は、インデックス情報171〜173に基づいて、記憶領域から特定のデータセット(例えば第1のデータセット121を構成する第1のクラスタ群131)を読み出す(S404)。特定のデータセットとは、既に存在している1つ以上のデータセットから選択される1つのデータセットである。複数のデータセットから特定のデータセットを選択する方法は特に限定されるべきものではなく、データセットのデータ構造、検索条件等に応じて適宜選択されるべきものである。例えば、第1のカラム141を基準としてソートされたデータセット121を選択するようにしてもよい。その後、データセット生成部103は、読み出された特定のデータセットから検索条件に対応するカラム(例えば第2のカラム142)を基準カラムとする新たなデータセット(例えば第2のデータセット122)を生成する(S405)。その後、ステップS403が実行される。
なお、ステップS404の実行後に、ステップS405をスキップしてS403を実行し、その後又はステップS403,S406,S407と平行して、ステップS405を実行してもよい。すなわち、基準カラムが検索条件に対応するデータセットが存在しない場合(S402:No)、先ず、S404で読み出された既に存在している特定のデータセットを利用して、検索条件に合致するクラスタ(基準カラムが検索条件に対応し且つクラスタ範囲が検索条件を含むクラスタ(S403))を読み出すようにしてもよい。これにより、検索条件に合致するクラスタの読み出し及び抽出データの出力を、新たなデータセットの生成を待たずに、できるだけ早く行うことが可能となる。
本実施形態によれば、既に存在しているデータセットの基準カラムが検索条件に対応していない場合にのみ新たなデータセットが生成され、次回の検索から新たなデータセットを利用して高速に処理を行うことが可能となる。これにより、不要なデータセットの生成を避けることができ、処理負荷の軽減、処理速度の向上等を図ることが可能となる。
以上、本発明の実施形態を説明したが、この実施形態は例として提示したものであり、発明の範囲を限定することを意図するものではない。この新規な実施形態はその他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態及びその変形は発明の範囲及び要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 データ検索システム
11,21 情報処理端末
12 サーバ
13 ネットワーク
15 データベース
25 制御演算装置
26 ユーザI/F
31 CPU
32 ROM
33 RAM
34 ストレージ
35 入力デバイス
36 出力デバイス
37 通信I/F
38 バス
101 記憶部
102 入力部
103 データセット生成部
104 インデックス情報生成部
105 クラスタ読出部
106 データ抽出部
107 出力部
115 レコード
121 第1のデータセット
122 第2のデータセット
131 第1のクラスタ群
132 第2のクラスタ群
141〜143 カラム
151〜153,161〜163,311 レコードクラスタ
151A〜151C,152A〜152C,153A〜153C,161A〜161C,162A〜162C,163A〜163C,311A〜311C クラスタ
171〜173 インデックス情報
201,221 検索条件
211,231 抽出データ
241〜244 SSD
301 第3のデータセット

Claims (8)

  1. 複数のレコードを含み、第1のカラムをソートの基準となる基準カラムとし、前記複数のレコードを構成するデータが前記第1のカラムの所定範囲毎にクラスタリングされた第1のデータセットと、前記複数のレコードを含み、第2のカラムを前記基準カラムとし、前記複数のレコードを構成するデータが前記第2のカラムの所定範囲毎にクラスタリングされた第2のデータセットを生成するデータセット生成部と、
    前記クラスタリングにより生成されたクラスタを記憶装置に記憶させる記憶部と、
    前記基準カラムを示す情報と、前記所定範囲を示す情報と、前記クラスタの記憶領域とが対応付けられたインデックス情報を生成するインデックス情報生成部と、
    前記インデックス情報に基づいて、前記基準カラムが検索条件に対応し且つ前記所定範囲が前記検索条件を含む前記クラスタを前記記憶装置から読み出すクラスタ読出部と、
    読み出された前記クラスタから前記検索条件に合致したデータを抽出するデータ抽出部と、
    を備えるデータ検索システム。
  2. 前記第2のデータセットを構成する複数の前記クラスタのうちの少なくとも1つの前記クラスタは、当該クラスタ内で前記第2のカラムを基準としたソートがなされていない、
    請求項1に記載のデータ検索システム。
  3. 前記第2のデータセットは、前記第1のカラムが前記検索条件に対応していない場合に、前記検索条件に対応するカラムを前記基準カラムとして生成される、
    請求項1又は2に記載のデータ検索システム。
  4. 複数の前記クラスタは、複数の前記記憶装置に分散して記憶される、
    請求項1〜3のいずれか1項に記載のデータ検索システム。
  5. 同一のカラムのデータを有する第1のクラスタと第2のクラスタとが、それぞれ異なる前記記憶装置に記憶される、
    請求項4に記載のデータ検索システム。
  6. 前記記憶装置は、SSDである、
    請求項4又は5に記載のデータ検索システム。
  7. 複数のレコードを含み、第1のカラムをソートの基準となる基準カラムとし、前記複数のレコードを構成するデータが前記第1のカラムの所定範囲毎にクラスタリングされた第1のデータセットと、前記複数のレコードを含み、第2のカラムを前記基準カラムとし、前記複数のレコードを構成するデータが前記第2のカラムの所定範囲毎にクラスタリングされた第2のデータセットを生成するステップと、
    前記クラスタリングにより生成されたクラスタを記憶装置に記憶させるステップと、
    前記基準カラムを示す情報と、前記所定範囲を示す情報と、前記クラスタの記憶領域とが対応付けられたインデックス情報を生成するステップと、
    前記インデックス情報に基づいて、前記基準カラムが検索条件に対応し且つ前記所定範囲が前記検索条件を含む前記クラスタを前記記憶装置から読み出すステップと、
    読み出された前記クラスタから前記検索条件に合致したデータを抽出するステップと、
    を含むデータ検索方法。
  8. コンピュータに、
    複数のレコードを含み、第1のカラムをソートの基準となる基準カラムとし、前記複数のレコードを構成するデータが前記第1のカラムの所定範囲毎にクラスタリングされた第1のデータセットと、前記複数のレコードを含み、第2のカラムを前記基準カラムとし、前記複数のレコードを構成するデータが前記第2のカラムの所定範囲毎にクラスタリングされた第2のデータセットを生成する処理と、
    前記クラスタリングにより生成されたクラスタを記憶装置に記憶させる処理と、
    前記基準カラムを示す情報と、前記所定範囲を示す情報と、前記クラスタの記憶領域とが対応付けられたインデックス情報を生成する処理と、
    前記インデックス情報に基づいて、前記基準カラムが検索条件に対応し且つ前記所定範囲が前記検索条件を含む前記クラスタを前記記憶装置から読み出す処理と、
    読み出された前記クラスタから前記検索条件に合致したデータを抽出する処理と、
    を実行させるプログラム。
JP2017180534A 2017-09-20 2017-09-20 データ検索システム、データ検索方法、及びプログラム Active JP6751064B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017180534A JP6751064B2 (ja) 2017-09-20 2017-09-20 データ検索システム、データ検索方法、及びプログラム
US15/903,736 US10579616B2 (en) 2017-09-20 2018-02-23 Data search system, data search method, and program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017180534A JP6751064B2 (ja) 2017-09-20 2017-09-20 データ検索システム、データ検索方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2019057082A JP2019057082A (ja) 2019-04-11
JP6751064B2 true JP6751064B2 (ja) 2020-09-02

Family

ID=65720436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017180534A Active JP6751064B2 (ja) 2017-09-20 2017-09-20 データ検索システム、データ検索方法、及びプログラム

Country Status (2)

Country Link
US (1) US10579616B2 (ja)
JP (1) JP6751064B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6751064B2 (ja) * 2017-09-20 2020-09-02 株式会社東芝 データ検索システム、データ検索方法、及びプログラム
CN110737727B (zh) * 2018-07-19 2023-09-29 华为云计算技术有限公司 一种数据处理的方法及系统
KR102233944B1 (ko) * 2019-04-05 2021-03-30 주식회사 티맥스티베로 데이터베이스 관리를 위한 컴퓨터 프로그램
CN110188119A (zh) * 2019-06-10 2019-08-30 北京百度网讯科技有限公司 用于获取数据的方法和装置
CN113419795B (zh) * 2021-07-21 2022-05-03 网易(杭州)网络有限公司 调用关系的展示方法、装置、计算机设备及存储介质
WO2023152965A1 (ja) * 2022-02-14 2023-08-17 晋二 古庄 データ提供装置、データ提供方法及びプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6999957B1 (en) * 2000-01-11 2006-02-14 The Relegence Corporation System and method for real-time searching
JP2002132644A (ja) 2000-10-24 2002-05-10 Asahi Glass Co Ltd 時系列データベースシステム
US7383258B2 (en) * 2002-10-03 2008-06-03 Google, Inc. Method and apparatus for characterizing documents based on clusters of related words
US20050246324A1 (en) * 2004-04-30 2005-11-03 Nokia Inc. System and associated device, method, and computer program product for performing metadata-based searches
KR101358750B1 (ko) 2007-01-22 2014-02-06 삼성전자주식회사 관계형 데이터베이스를 이용한 프로그램 트레이스 방법
US8725739B2 (en) * 2010-11-01 2014-05-13 Evri, Inc. Category-based content recommendation
US9116995B2 (en) * 2011-03-30 2015-08-25 Vcvc Iii Llc Cluster-based identification of news stories
US9286366B2 (en) * 2013-12-02 2016-03-15 International Business Machines Corporation Time-delayed replication for data archives
WO2016006276A1 (ja) * 2014-07-10 2016-01-14 日本電気株式会社 インデックス生成装置及びインデックス生成方法
US9658801B2 (en) * 2015-09-15 2017-05-23 Salesforce.Com, Inc. System having in-memory buffer service, temporary events file storage system and backup events file uploader service
US10242258B2 (en) * 2015-09-30 2019-03-26 Microsoft Technology Licensing, Llc Organizational data enrichment
US11216491B2 (en) * 2016-03-31 2022-01-04 Splunk Inc. Field extraction rules from clustered data samples
US11249710B2 (en) * 2016-03-31 2022-02-15 Splunk Inc. Technology add-on control console
US20180081780A1 (en) 2016-09-21 2018-03-22 Kabushiki Kaisha Toshiba Trace-information management system, trace-information management method, and trace-information management program product
JP2018055667A (ja) 2016-09-21 2018-04-05 株式会社東芝 トレース情報管理システム、方法、及びプログラム
US10942960B2 (en) * 2016-09-26 2021-03-09 Splunk Inc. Automatic triage model execution in machine data driven monitoring automation apparatus with visualization
US10942946B2 (en) * 2016-09-26 2021-03-09 Splunk, Inc. Automatic triage model execution in machine data driven monitoring automation apparatus
JP6751064B2 (ja) * 2017-09-20 2020-09-02 株式会社東芝 データ検索システム、データ検索方法、及びプログラム

Also Published As

Publication number Publication date
JP2019057082A (ja) 2019-04-11
US20190087453A1 (en) 2019-03-21
US10579616B2 (en) 2020-03-03

Similar Documents

Publication Publication Date Title
JP6751064B2 (ja) データ検索システム、データ検索方法、及びプログラム
US20200356901A1 (en) Target variable distribution-based acceptance of machine learning test data sets
US10817258B2 (en) Clustering storage method and apparatus
JP5241370B2 (ja) テーブル分類装置、テーブル分類方法及びテーブル分類プログラム
Yagoubi et al. Massively distributed time series indexing and querying
JP4848317B2 (ja) データベースのインデックス作成システム、方法及びプログラム
US11080234B2 (en) Computer readable recording medium for index generation
CN111258966A (zh) 一种数据去重方法、装置、设备及存储介质
CN108205571B (zh) 键值数据表的连接方法及装置
CN111914020A (zh) 数据同步方法及装置、数据查询方法及装置
JP5686893B2 (ja) データベース管理システム、装置及び方法
US10303655B1 (en) Storage array compression based on the structure of the data being compressed
JP2009169689A (ja) データ分類方法およびデータ処理装置
KR101035037B1 (ko) 동적 임계값이 적용된 유사문서 분류화 장치 및 방법
US10268644B2 (en) Information processing apparatus, computer-readable recording medium having stored therein data conversion program, and data conversion method
CN115328950A (zh) 一种基于二级索引的hbase查询方法、终端设备及存储介质
KR102062139B1 (ko) 지능형 자료구조 기반의 데이터 처리 방법 및 그를 위한 장치
JP6666312B2 (ja) 多次元データ管理システム及び多次元データ管理方法
JPWO2014168199A1 (ja) 論理演算方法および情報処理装置
JP6455087B2 (ja) 帳票情報処理プログラム、帳票情報処理装置、および帳票情報処理方法
JP6361472B2 (ja) 対応情報生成プログラム、対応情報生成装置及び対応情報生成方法
JP2020030634A (ja) 検索装置、検索方法及び検索プログラム
JP2021067962A (ja) 情報処理システム及び情報処理方法
JP2018181121A (ja) 分析装置、分析プログラム及び分析方法
JP2019028788A (ja) 機密語特定装置、機密語特定方法及び機密語特定プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190813

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200813

R151 Written notification of patent or utility model registration

Ref document number: 6751064

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151