JP2004062475A - インデクス格納方法 - Google Patents

インデクス格納方法 Download PDF

Info

Publication number
JP2004062475A
JP2004062475A JP2002219053A JP2002219053A JP2004062475A JP 2004062475 A JP2004062475 A JP 2004062475A JP 2002219053 A JP2002219053 A JP 2002219053A JP 2002219053 A JP2002219053 A JP 2002219053A JP 2004062475 A JP2004062475 A JP 2004062475A
Authority
JP
Japan
Prior art keywords
page
index
key
stored
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002219053A
Other languages
English (en)
Inventor
Kanji Tanaka
田中 完治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd, Hitachi Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2002219053A priority Critical patent/JP2004062475A/ja
Publication of JP2004062475A publication Critical patent/JP2004062475A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】データ圧縮を施すことでインデクスファイル容量を削減しつつ、元のデータを復元することなくキー値の比較処理が行える方法を提供すること
【解決手段】インデクスページの新規作成処理では、ページに格納するキー値の最大値と最小値を比較して前方一致データを決定する。インデクスエントリをページに格納するときは、キー値からこの前方一致データを除く。この前方一致データは、圧縮データとしてページ制御情報に設定する。インデクスページへのエントリ追加処理では、追加するキー値がページ制御情報内の前方一致データを含まない場合、圧縮せずに格納し非圧縮エントリ数を増やす。インデクスページ内の圧縮したキーと検索対象のキーを比較する場合、検索対象のキーからページ制御情報内の前方一致データを除くことで、圧縮したキーを復元せずに比較できる。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、計算機上のデータベース管理システムにおけるインデクスの格納技術に関する。
【0002】
【従来の技術】
データベースのインデクスはデータを特徴付ける項目をデータとは別に管理し、この項目の値でキー値を構成し、キー値を用いてデータの格納位置を高速に求めるためにキー値を昇順または降順に並べて行の格納位置情報とともに管理する手法がとられる。
【0003】
インデクス全体の構造はBtreeと呼ばれる階層構造で実装されることが多く、この構造では、キー値順に並べ替えられたキー値データ全体を、リーフ(最下位)ページ(本特許ではインデクスをファイルに格納する上での最小単位を表す)に格納可能なデータ量に応じて分割し、これをページ間の双方向ポインタで連結する。さらに、下位のページ番号とそのページに格納されるキー値の最大値または最小値を上位ページで階層的に管理する構造である。データの検索,追加または削除の操作に際しては、対象データの項目からキー値を抽出し、ルート(最上位)ページから下位方向に当該キー値と下位ページの最大値または最小値と比較して格納されるべき下位ページを求め、最終的にリーフページ番号を求める。リーフページ内のキー値の並び順でキー値をサーチし目的のキー値を管理するインデクスエントリ(キー値と行格納情報で構成するデータ)を見つける(または追加位置をもとめる)方法である。インデクス上のキー値を圧縮して格納できれば、リーフページに格納できるインデクスエントリ数を増加させることができリーフページ数が削減でき、キー値の範囲を指定した条件検索などでは参照するリーフページ数が減少し、ランダム検索でもバッファヒット率が向上し総体的に検索性能の改善が期待できる。
【0004】
しかし、ファイル容量を削減する手法として現在広く使用されているデータ圧縮技術は、ランレングス法、ハフマン法に代表されるようにデータそのものを別のビット列に変換してしまうものである。データベースのインデクス部は与えられた検索キーで頻繁に参照されるため、インデクスファイル単位、ページ単位の圧縮はもちろん、キー値ごとに圧縮を適用した場合でも圧縮したままではキー値の大小関係が判定できないことから、圧縮による容量削減効果よりデータ復元処理にかかる処理負荷が大きく、高速なデータ取り出しの妨げとなるためこのような圧縮技術は適用されていなかった。
【0005】
【発明が解決しようとする課題】
上記の通り、従来のデータ圧縮技術では、圧縮したままキー値の大小関係を判定できないという問題があった。その結果、インデクス上のキー値は圧縮せずに格納され、さまざまな検索に対応するために多数のインデクスファイルを作成する場合には多大な記憶装置の容量が必要となってしまっていた。
【0006】
本発明は、データ圧縮を施しインデクスファイル容量を削減しつつ、元のデータを復元することなくキー値の比較処理が行える方法を提供することにある。
【0007】
【課題を解決するための手段】
上記目的を達成するために、本発明は、インデクスの格納単位であるページが同じであればインデクスのキー値は前方部分が一致しやすい特性に着目し、ページに格納されるキー値の最大値と最小値を比較して前方共通部分のビット列と長さを得、これをページ内の全キー値の前方共通部分のビットパターンとして抽出する手段と、各キー値を前方共通部分を排除したキー値に圧縮する手段と、抽出した共通部分をページごとに管理する手段とを備えることを特徴とする。
【0008】
また本発明は、全てのインデクスエントリに圧縮を施したインデクスページを作成後、新たにインデクスエントリが追加されることに対処するため、インデクスページ内のページ制御情報に非圧縮エントリ数を保持することを特徴とする。
【0009】
更に本発明は、共通部分が排除されたインデクスページ内から特定のキー値の検索、または特定のキー値の追加位置を求める場合において、圧縮された各キー値を元のデータに復元せずに共通部分を排除したまま比較することを特徴とする。
【0010】
【発明の実施の形態】
以下、本発明の実施例を図を用いて説明する。本実施例ではキー値は昇順方向に並べられ、上位ページは下位ページの最大値を管理するものとして説明する。
【0011】
図1は本発明の前提となるデータベースの構成例を示したもので、データを格納するデータファイル12とデータの格納位置を管理するためのインデクスファイル11からなる。インデクスファイル11はBtree構造をしており、キー値とキー値を有するデータの格納位置を示すポインタ情報からなるインデクスエントリ111を持つ。
【0012】
図2は本発明によるインデクスリーフページの構造である。インデクスリーフページにはエントリ部とページ内の格納状態を管理するページ制御情報部21で構成される。ページ制御情報部では格納エントリ数211、非圧縮エントリ数212、前方一致データ長213、前方一致データ214などを管理する。
インデクスページに対する圧縮操作は、以下3つの処理を行うときに実行する。
(1)データの初期登録時に、インデクスページを新規作成する。
(2)インデクスページにインデクスエントリを追加する。
(3)インデクスページにインデクスエントリを追加する余地がなくなることでインデクスページの分割が発生し、インデクスページを新規作成する。
【0013】
第一に、データ初期登録時のページ作成方法について、図3と図4を用いて説明する。初期登録時は登録データから抽出したキー値を昇順に並べ替え、順番に入力しながらページ内の空き領域がなくなるか一定の空き領域を残して格納する。まず、ページ内の格納可能な領域長をあらかじめ算出するとともに、圧縮データ長と格納エントリ数Nに初期値0を与える(ステップ301)。次に、抽出したキー値から(N+1)件目のインデクスエントリを作成する(ステップ302)。その次に、格納可能領域長と(N+1)件目のインデクスエントリ長を比較し格納可能かどうか判定する(ステップ303)。格納可能であれば格納可能領域長から(N+1)件目のインデクスエントリ長を減じ、(N+1)件目のエントリを作業領域に退避し、格納エントリ数Nを+1加算する(ステップ304)。インデクスページにエントリを追加できる間は、ステップ302とステップ304の処理を繰り返す。ステップ303で格納不可と判定された場合、退避済みエントリの最小キーと最大キー(N件目のキー)を比較し前方一致データαと前方一致データ長αを得る(ステップ305)。この前方一致データ長αと格納エントリ数Nを乗ずることで圧縮データ長αを算出する(ステップ306)。次に、退避済みエントリの最小キーと(N+1)件目のキーを比較し前方一致データβと前方一致データ長βを得る(ステップ307)。
【0014】
また、「前方一致データ長β」と「格納エントリ数(N)+1」を乗ずることで圧縮データ長βも算出する(ステップ308)。その後、「格納可能領域長に圧縮データ長βを加えた値」と「(N+1)件目のインデクスエントリ長」を比較し、圧縮後に格納可能かどうか判定する(ステップ309)。格納可能であれば格納可能領域長から(N+1)件目のインデクスエントリ長を減じ、(N+1)件目のエントリを作業領域に退避し、格納エントリ数Nを+1加算する(ステップ310)。
【0015】
また、エントリの追加が確定できたので、前方一致データαと前方一致データ長αを前方一致データβと前方一致データ長βの値に更新する(ステップ311)。更に、(N+1)件目のインデクスエントリを作成する(ステップ312)。インデクスページにエントリを追加できる間は、ステップ307〜ステップ312の処理を繰り返す。ステップ309で格納不可と判定された場合、確定済みの前方一致データαと前方一致データ長αと退避済みエントリをもとに、インデクスページ作成処理(図5)をステップ402から実行し(ステップ313)、次のインデクスページ作成処理に移る。
【0016】
インデクスページ作成処理について、図5を用いて説明する。まず、キー値で昇順に並び替えられたインデクスエントリの先頭データ(最小キー)と最終データ(最大キー)を比較し、ページ内格納キー値の前方一致データと前方一致データ長を決定する(ステップ401)。次に、前方共通部分がある場合は格納する各インデクスエントリから前方一致データを除いたキー値を作成する操作を全エントリに施してから格納し(ステップ403)、前方一致データと前方一致データ長をページ制御情報に設定する(ステップ404)。前方共通部分がない場合は、キー値は加工せず元のキー値のまま格納する(ステップ405)。最後に、格納エントリ数などのページ制御情報を設定し(ステップ406)、処理を終了する。
【0017】
データ初期登録時のページ作成処理では、ページ作成途中にページ内最大キーが決定できないため、非圧縮形式で作成したインデクスエントリを作業領域に退避していき、ページ長に格納できなくなった時点で仮のページ内最大キーを決定する。このページ内最大キーと最小キーを比較して前方一致データを抽出するが、各々のインデクスエントリを前方一致データの長さ分圧縮することで、仮のページ内最大キーより大きいキー値をもつインデクスエントリが格納可能になることがある。ページ内最大キーより大きいキーをもつインデクスエントリに対して1件ずつ格納可否を判定しながら作業領域に退避していき、最終的な格納エントリ数を求める。前方一致データが異なるキーをもつインデクスエントリの追加により前方一致データ長が短くなる場合、格納可能かどうか再計算する処理を繰り返すことで格納エントリ数が最終的に決定され、最終的に求まった前方一致データ長でエントリを圧縮し格納処理を行う。上記の圧縮操作は、リーフページと上位ページで共通である。ただし、右端インデクスページ(Btree上で階層ごとに右端に位置するページでルートページも含める)は圧縮操作を行わないが、この理由については次の項目で述べる。
【0018】
第二に、インデクスページにエントリを追加するときの圧縮操作について説明する。右端以外のインデクスページにエントリを追加する場合、キー値の範囲として「ページ内最小キーより小さいケース」と「ページ内最小キー以上かつページ内最大キー以下のケース」がある。後者は、追加するエントリがもつキー値の前方部分とページ制御情報の前方一致データが一致するため、追加するエントリから前方一致データを除きインデクスエントリを再作成する。この再作成したエントリをページに追加後、格納エントリ数などのページ制御情報を更新する。
【0019】
しかし前者は、追加するエントリがもつキー値の前方部分とページ制御情報の前方一致データが一致しないので、エントリを圧縮せずに格納する。その結果、ページ内に圧縮形式のエントリと非圧縮形式のエントリが混在することになるので、これらを区別するためにページ制御情報で非圧縮エントリ数を管理する。非圧縮形式のエントリは最小値側にしか現れないため、エントリごとに非圧縮と圧縮の区別をする必要はない。右端インデクスページにエントリを追加する場合、キー値の範囲として「ページ内最小キーより小さいケース」と「ページ内最小キー以上かつページ内最大キー以下のケース」だけでなく「ページ内最大キーより大きいケース」が存在するため、圧縮操作を行わない。
【0020】
第三に、インデクスページ分割時のページ作成方法について説明をする。ページ分割では、元のページに格納されたエントリ群を2分割し各ページに格納されるキー値の最大値と最小値が決定され、各々のページに対し図5で示した圧縮操作を施す。ページ分割時は元のページのどのエントリで分割するかが問題となる。一般にキー値の範囲が狭くなるほど前方一致データ長は長くなり圧縮効果が大きくなるが、分割後のページに非圧縮エントリと圧縮エントリを混在させて格納する場合、分割後のキー値には前方共通部分が存在しないか短くなることがある。この場合圧縮されていた各エントリが長くなることにより、分割後のページにも格納できなくなる。分割にあたってはこのようなことを考慮する必要がある。また、上位ページとリーフページを問わず同様の分割処理を行い、分割した両方のページに圧縮操作を施す。ただし、右端インデクスページの分割処理は、圧縮操作をしていないインデクスページを常に右端インデクスページだけにするため、キー値がより小さいインデクスエントリを格納するページには圧縮操作を施すが、もう一方のページには圧縮操作を施さない。
【0021】
分割する前のページの状態には、「非圧縮エントリと圧縮エントリが混在するページ」と「非圧縮エントリだけのページ」と「圧縮エントリだけのページ」の3通りある。まず、「非圧縮エントリと圧縮エントリが混在するページ」の分割処理について、図6を用いて説明する。このケースでは、分割位置として非圧縮エントリと圧縮エントリの境界を基準にする。非圧縮エントリ数が少ないと格納効率が低下するため、なるべく使用領域長が均等になるように補正処理を行う。
【0022】
ページ分割位置決定後のページ作成処理は、「非圧縮エントリと圧縮エントリが混在するページの作成」と「非圧縮エントリのみ存在するページの作成」と「圧縮エントリのみ存在するページの作成」の三つに分けられる。いずれの場合も、ページ内に格納されるキー値の最大値と最小値を比較し前方一致するデータ長とそのデータを抽出し直す。ここで抽出された共通部分はページ内のすべてのキー値に一致することとなる。従って、すべてのキー値からこの長さ分の前方データを削除して格納する。そしてページ制御情報内には、格納エントリ数、非圧縮エントリ数とともに前方一致データ長及びそのデータを設定する。ただし、「非圧縮エントリと圧縮エントリが混在するページの作成」の場合、圧縮し直すと格納可能領域長を超えてしまうことがある。このときは、圧縮操作をせずエントリを元のまま格納する。
【0023】
次に、「非圧縮エントリだけのページ」と「圧縮エントリだけのページ」の分割処理について説明する。このケースでは、格納エントリ数が均等になるように分割する。ページ分割位置決定後のページ作成処理は、「非圧縮エントリのみ存在するページの作成」または「圧縮エントリのみ存在するページの作成」のときと同じである。
ここでインデクスページ分割時の補正処理について、図7と図8を用いて詳述する。まず、追加エントリを含めたLα(非圧縮エントリ群の全体長)・Nα(非圧縮エントリ群を構成するエントリの数)・Lβ(圧縮エントリ群の全体長)・Nβ(圧縮エントリ群を構成するエントリの数)を求める(ステップ601〜609)。これらを求める際、追加するエントリのキー値(ページ分割の契機となったキー値)の前方部分がページ制御情報内の前方一致データと一致するかどうかで処理を二つに分ける(ステップ601)。一致する場合、非圧縮エントリ群にエントリを追加しないので、LαとNαにページ分割前の値を設定する(ステップ602、603)。逆に圧縮エントリ群にエントリを追加するので、Lβに「ページ分割前の圧縮エントリ群の長さ+追加エントリ長−前方一致データ長」を代入し(ステップ604)、Nβに「圧縮エントリ数(格納エントリ数−非圧縮エントリ数)+1」を代入する(ステップ605)。ステップ601で一致しないと判定された場合、非圧縮エントリ群にエントリを追加するので、Lαに「ページ分割前の非圧縮エントリ群の長さ+追加エントリ長」を代入し(ステップ606)、Nαに「非圧縮エントリ数+1」を代入する(ステップ607)。逆に圧縮エントリ群にエントリを追加しないので、LβとNβにページ分割前の値を設定する(ステップ608、609)。
【0024】
次に、ステップ601〜609で求めた値をもとに分割位置を決定する(ステップ610〜623)。ページ分割後に各々のページが使用する領域長はLαとLβで目安をつけることができるので、この二つを比較する(ステップ610)。LαとLβが等しい場合、ページはほぼ均等に分割できるのでNα番目のインデクスエントリを分割位置として決定する(ステップ611)。LαがLβより大きい場合、ページを均等に分割するため非圧縮エントリ群から圧縮エントリ群へエントリを移していく。このとき、LαがLβ以下になるまで以下四つの処理を繰り返す。ただし、この過程で非圧縮エントリ群にエントリがなることがあるので、四つの処理を実行する前に「Nαが2以上か」を判定する(ステップ612)。
(1)Lαから任意の非圧縮エントリ長を減算する(ステップ613)。
(2)Nαから1を減算する(ステップ614)。
(3)(Nα+1)件目の非圧縮エントリを含めて、前方一致データ長とLβを再算出。(ステップ615)。
(4)Nβに1を加算する(ステップ616)。
【0025】
その後、Nα番目のインデクスエントリを分割位置として決定する(ステップ611)。LαがLβより小さい場合、ページを均等に分割するため圧縮エントリ群から非圧縮エントリ群へエントリを移していく。このとき、LαがLβ以上になるまで以下四つの処理を繰り返す。ただし、この過程で圧縮エントリ群にエントリがなることがあるので、四つの処理を実行する前に「Nβが2以上か」を判定する(ステップ618)。
(1)Lαに任意の非圧縮エントリ長を加算する(ステップ619)。
(2)Nαに1を加算する(ステップ620)。
(3)Lβから任意の圧縮エントリ長を減算する(ステップ621)。
(4)Nβから1を減算する(ステップ622)。
【0026】
その後、Nα番目のインデクスエントリを分割位置として決定する(ステップ611)。分割位置決定(ステップ611)後、1からNαまでの非圧縮エントリ群を1ページに格納し、もう一つのページに1からNβまでの圧縮エントリ群を格納する。このとき、エントリ群の全体長(LαとLβ)が格納可能領域長を越えなければ図5の圧縮操作を行うが、超えてしまう場合はエントリ群をページ分割前のエントリの形式で格納する。
【0027】
最後に、特定のキー値を検索する場合の比較方式について、図9を用いて説明する。この比較方式は、全てのインデクスページに共通である。まず、ページ制御情報から前方一致データがあるかどうかを判定する(図9の(1))。前方一致データがなければ、ページ内の非圧縮エントリ群に対して検索するキー値でサーチを行い目的のデータを取り出す(図9の(4))。前方一致データがあれば、この長さに合わせて検索するキー値と前方一致データを比較する(図9の(2))。前方一致データと一致しなければ、ページ内の非圧縮エントリ群に対して検索するキー値でサーチを行い目的のデータを取り出す(図9の(4))。前方一致データと一致すれば、圧縮エントリ群に対して検索するキー値から前方共通部分を除いてサーチを行い目的のデータを取り出す(図9の(3))。いずれの場合も従来に比べ検索範囲を狭めることができる。非圧縮エントリ群に対して検索する場合、検索キーのすべてのデータを比較する。圧縮エントリ群に対して検索する場合には、検索キーの前方共通部分を除くデータで比較する。
【0028】
以上説明したように、インデクスページ内に存在するキー値の前方部分が一致しやすい特性を利用することで、インデクスページの格納効率を向上させることが可能になる。これに伴い、インデクスアクセス時のI/O回数を削減することも可能となる。更に、前方一致データとそれ以外のデータを分けて検索することで、圧縮したデータを復元することもなく高速な検索が可能になる。
【0029】
【発明の効果】
以上説明したように、本発明によれば、インデクスページ内に存在するキー値の前方部分が一致しやすい特性を利用することで、インデクスページの格納効率を向上させることが可能になる。
【図面の簡単な説明】
【図1】本発明適用の前提となるインデクスの格納構造を示す概略図、
【図2】本発明の圧縮方法を適用したインデクスページを示す図、
【図3】インデクス初期登録時のページ作成方法を示すフロ−チャ−ト図1、
【図4】インデクス初期登録時のページ作成方法を示すフロ−チャ−ト図2、
【図5】インデクスページ作成時の圧縮方法を示すフロ−チャ−ト図、
【図6】インデクスページ分割時のページ作成例を示す図、
【図7】インデクスページ分割時の補正処理を示すフロ−チャ−ト図1、
【図8】インデクスページ分割時の補正処理を示すフロ−チャ−ト図2、
【図9】インデクスページ内での比較方法を示す図である。
【符号の説明】
11:インデクスファイル
12:データファイル
21:ページ制御情報
211:ページ制御情報
212:非圧縮エントリ数
213:前方一致データ長
214:前方一致データ

Claims (3)

  1. 入力されたデータを構成する複数項目のうちの一つ以上の項目をインデクスとして記憶し、上記項目の値をキー値として昇順または降順にキー値とこれに対応するデータの格納位置情報を記憶し、上記インデクスを格納するページごとにページ内に格納するキー値の前方共通部分を各キー値から除外することを特徴とするインデクス格納方法。
  2. 入力されたデータを構成する複数項目のうちの一つ以上の項目をインデクスとして記憶し、上記項目の値をキー値として昇順または降順にキー値とこれに対応するデータの格納位置情報を記憶し、上記インデクスを格納するページごとにページ内に格納する上記キー値の前方共通部分を各キー値から除外してインデクスのデータ圧縮格納を行い、圧縮できないキー値をページ制御情報内の非圧縮エントリ数にて管理するインデクス格納方法。
  3. 入力されたデータを構成する複数項目のうちの一つ以上の項目をインデクスとして記憶し、上記項目の値をキー値として昇順または降順にキー値とこれに対応するデータの格納位置情報を記憶し、上記インデクスを格納するページごとにページ内に格納するキー値の前方共通部分を各キー値から除外して上記インデクスのデータ圧縮格納を行い、除外されたキー値を復元することなくキー値の大小関係を判定するインデクス格納方法。
JP2002219053A 2002-07-29 2002-07-29 インデクス格納方法 Pending JP2004062475A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002219053A JP2004062475A (ja) 2002-07-29 2002-07-29 インデクス格納方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002219053A JP2004062475A (ja) 2002-07-29 2002-07-29 インデクス格納方法

Publications (1)

Publication Number Publication Date
JP2004062475A true JP2004062475A (ja) 2004-02-26

Family

ID=31940048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002219053A Pending JP2004062475A (ja) 2002-07-29 2002-07-29 インデクス格納方法

Country Status (1)

Country Link
JP (1) JP2004062475A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100370459C (zh) * 2005-12-08 2008-02-20 华为技术有限公司 一种减少分页数据检索时间的方法及装置
JP2008130084A (ja) * 2006-11-23 2008-06-05 Samsung Electronics Co Ltd 最適化されたインデックス検索方法及び装置
JP2008217596A (ja) * 2007-03-06 2008-09-18 Toshiba Corp 文書検索システム及びプログラム
US7783855B2 (en) 2005-09-09 2010-08-24 International Business Machines Corporation Keymap order compression
JP2011070607A (ja) * 2009-09-28 2011-04-07 Brother Industries Ltd 情報生成装置、情報生成プログラム、情報生成方法、ノード装置、ノードプログラム及び検索方法
JP2015079508A (ja) * 2013-10-15 2015-04-23 ネイバー コーポレーションNAVER Corporation データベース管理方法、プログラム及び該管理システム、並びにデータベースのツリー構造

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7783855B2 (en) 2005-09-09 2010-08-24 International Business Machines Corporation Keymap order compression
US7840774B2 (en) 2005-09-09 2010-11-23 International Business Machines Corporation Compressibility checking avoidance
CN100370459C (zh) * 2005-12-08 2008-02-20 华为技术有限公司 一种减少分页数据检索时间的方法及装置
JP2008130084A (ja) * 2006-11-23 2008-06-05 Samsung Electronics Co Ltd 最適化されたインデックス検索方法及び装置
US7970769B2 (en) 2006-11-23 2011-06-28 Samsung Electronics Co., Ltd. Apparatus and method for optimized index search
JP2008217596A (ja) * 2007-03-06 2008-09-18 Toshiba Corp 文書検索システム及びプログラム
JP4510041B2 (ja) * 2007-03-06 2010-07-21 株式会社東芝 文書検索システム及びプログラム
JP2011070607A (ja) * 2009-09-28 2011-04-07 Brother Industries Ltd 情報生成装置、情報生成プログラム、情報生成方法、ノード装置、ノードプログラム及び検索方法
JP2015079508A (ja) * 2013-10-15 2015-04-23 ネイバー コーポレーションNAVER Corporation データベース管理方法、プログラム及び該管理システム、並びにデータベースのツリー構造
US10664459B2 (en) 2013-10-15 2020-05-26 Naver Corporation Database managing method, database managing system, and database tree structure

Similar Documents

Publication Publication Date Title
US11238098B2 (en) Heterogenous key-value sets in tree database
US20210311912A1 (en) Reduction of data stored on a block processing storage system
US7840774B2 (en) Compressibility checking avoidance
EP1866776B1 (en) Method for detecting the presence of subblocks in a reduced-redundancy storage system
KR101708261B1 (ko) 개별 액세스 가능한 데이터 유닛의 스토리지 관리
US8051252B2 (en) Method and apparatus for detecting the presence of subblocks in a reduced-redundancy storage system
US5850565A (en) Data compression method and apparatus
US11023439B2 (en) Variable cardinality index and data retrieval
US20100185690A1 (en) Dynamic manipulation of archive files
US20100114843A1 (en) Index Compression In Databases
CN110741637B (zh) 简化视频数据的方法、计算机可读存储介质和电子装置
JP2005302038A (ja) Bツリー中の連続キーの名前を変更する方法およびシステム
US6735600B1 (en) Editing protocol for flexible search engines
JPH1131096A (ja) データ格納検索方式
CN108475508B (zh) 音频数据和保存在块处理存储系统中的数据的简化
JP4237813B2 (ja) 構造化文書管理システム
US6721753B1 (en) File processing method, data processing apparatus, and storage medium
JP4960417B2 (ja) 可変長のデータ断片の開始・終了オフセットを決定する方法及び装置
JP2004062475A (ja) インデクス格納方法
JP5287071B2 (ja) データベース管理システムおよびプログラム
JP2013101470A (ja) データベース圧縮装置
KR20080026772A (ko) Lempel-Ziv 압축 방법의 복원 속도를 보완한압축 방법
WO2009001174A1 (en) System and method for data compression and storage allowing fast retrieval
JP4091586B2 (ja) 構造化文書管理システム、索引構築方法及びプログラム
JP2000181768A (ja) デ―タ格納検索方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040713

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060512

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070522