JPH06149635A

JPH06149635A - レコード追加処理方法

Info

Publication number: JPH06149635A
Application number: JP4316309A
Authority: JP
Inventors: Yuichiro Hiranuma; 雄一郎平沼
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1992-10-30
Filing date: 1992-10-30
Publication date: 1994-05-31

Abstract

(57)【要約】【目的】任意の属性値をキーとするデータベースに対
し比較的大量のレコードを追加する場合に、属性値の高
速検索用のインデックス生成等を伴う追加処理時間短縮
を図る。【構成】新たにデータベースに追加される一群のレコ
ードについて、予めその属性値をソートし（Ｓ８）、そ
の後、既存のレコード群の属性値とマージする（Ｓ
９）。こうして属性値の配列を一挙に新たに生成し、そ
の後、既存のインデックスの代わりに新たなインデック
スを再生成する。追加されるレコード数が多い場合、一
つずつレコードと属性値を追加してその都度インデック
スを部分修正するより、新たに再配列された属性値に基
づいてインデックスを再生成する方が高速化を図れる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、各種のデータベースに
対し比較的大量のレコードを追加処理する場合の処理速
度向上を図ったレコード追加処理方法に関する。

【０００２】

【従来の技術】大量のデータを検索処理するために、従
来よりコンピュータシステムが広く使用されている。図
２に一般の情報検索システムブロック図を示す。図のシ
ステムは、バスライン１に対し、プロセッサ２、記憶装
置３、キーボード４、ディスプレイ５及びフロッピーデ
ィスク装置６が接続されたものである。記憶装置３には
情報検索のためのデータベース７が格納されている。

【０００３】これらのシステムでは、オペレータがキー
ボード４を用いて適当な検索キーを入力し、これに従っ
てプロセッサ２がデータベース７を検索してその結果を
ディスプレイ５に表示する。このようなシステムにおい
て、データベース７に対し適時新たなデータが追加さ
れ、あるいは既存のデータの削除等の処理が行なわれ
る。新たなデータを追加する処理のために、プロセッサ
２にはレコード追加管理部１０が設けられる。レコード
追加管理部１０には、インデックス管理部１１とレコー
ド本体管理部１２が設けられている。インデックス管理
部１１は、レコードの検索をするために必要なインデッ
クスを生成処理する部分である。また、レコード本体管
理部１２は、データベース７の中にレコード本体を書き
加えたり削除したりする処理を行なう部分である。

【０００４】図３に上記のようなデータベースの例説明
図を示す。上記のようなデータベース７としては、例え
ばこの図に示すようなものが考えられる。このデータベ
ースは、例えば会社の従業員に対する各種の情報を収集
したもので、従業員毎に順番にレコード番号が１、２、
３というように付与されている。また、各従業員につい
て、従業員番号、氏名、年齢、所属等の属性値が付与さ
れている。例えば、この例では、Ａさんについてはレコ
ード番号１のレコードとしてデータベースに格納されて
おり、その所属コードは１００とされている。この所属
コードはそのＡさんの所属する部署を示すものである。
同様にしてＢさん、Ｃさん、Ｄさん…についてもそれぞ
れ各種の属性値が格納されている。

【０００５】ここで、所属コードをキーとしてデータベ
ースを検索する場合には、全レコードを読み出して、キ
ーと属性値と比較する。そして、一致したものについて
レコード番号が引き出される。しかしながら、属性値は
各レコード毎に付与されており、レコードの数が膨大な
場合、属性値一つ一つと比較して、その一致検索を行な
うと非常に時間がかかる。そこで、従来この種のデータ
ベースについては、各属性値について高速検索用のイン
デックスを付加するようにしている。

【０００６】図４に属性値とインデックスの構成説明図
を示す。このインデックスは、Ｂｔｒｅｅ式のインデッ
クスとしてよく知られた構成のものである。即ち、属性
値は図に示すように、例えば昇順に配列されている。そ
して、この属性値をそれぞれ例えば１９９以下、２９９
以下、３９９以下というように仕切り、更にこうして設
けた仕切りについて、またその上位の仕切りとして９９
９以下、 10000以下といった仕切りを設ける。このよう
にすれば、検索対象となる属性値が入力された場合、比
較的少ない回数の比較処理によって目的とする属性値と
の一致検索を行なうことができ、レコード検索処理を高
速化できる。

【０００７】

【発明が解決しようとする課題】ところで上記のような
従来のレコード追加処理方法には次のような解決すべき
課題があった。図５に従来のレコード追加方法フローチ
ャートを示す。図に示すように、従来は例えばレコード
の追加要求があった場合に、図２に示す装置に対し、ま
ずステップＳ１においてレコード追加管理部１０にレコ
ード追加要求を発行する。そしてステップＳ２におい
て、レコード本体管理部１２に対しレコード本体追加要
求の発行を行なう。これによって、まず、データベース
７にレコード本体の書き込みが行なわれる。

【０００８】次にステップＳ３において、レコード追加
管理部１０からインデックス管理部１１に対し、インデ
ックス付き属性値の追加要求を行なう。これは、新たに
追加されたレコードに付与された属性値を、既に存在す
る属性値の配列中に割り込ませる処理である。ステップ
Ｓ４において、インデックス管理部１１は入力されたイ
ンデックス付き属性値をインデックスに追加する。こう
してステップＳ５に移り、更に追加すべきレコードがあ
るかどうかを判断する。そして更に追加するレコードが
あれば、ステップＳ１からステップＳ４までの処理を繰
り返す。

【０００９】ここで、従来のレコード追加処理において
は、追加されるレコードの量に関わりなく、常にその都
度、図５に示すような処理手順が踏まれていた。しかし
ながら、既に存在する属性値の配列に新たな属性値を割
り込ませ、必要に応じてインデックスの修正等を行なう
処理は、一定以上の処理時間を必要とし、追加されるレ
コード数が多くなれば非常に多くの時間がかかる。

【００１０】本発明は以上の点に着目してなされたもの
で、データベースに対し比較的大量のレコードを追加す
る場合に、特にそのインデックス生成等を伴う追加処理
時間短縮を図ったレコード追加処理方法を提供すること
を目的とするものである。

【００１１】

【課題を解決するための手段】本発明のレコード追加処
理方法は、データベースを構成するレコード毎に、任意
の属性値を付与し、前記属性値を前記レコード検索用の
キーとして一定の順に配列したものに、高速検索用のイ
ンデクスを付加する場合において、前記データベースに
対し、新たに一群のレコードを追加するとき、予め新た
に追加する一群のレコードの前記属性値をソートした
後、既存のレコード群の属性値とマージして、その後新
たな属性値の配列に対し、前記インデクスを再生成して
付加することを特徴とするものである。

【００１２】

【作用】この方法では、新たにデータベースに追加され
る一群のレコードについて、予めその属性値をソートし
その後、既存のレコード群の属性値とマージする。こう
して、属性値の配列を一挙に新たに生成してしまう。そ
の後、既存のインデックスの代わりに新たなインデック
スを再生成して付加する。追加されるレコード数が多い
場合、一つずつ属性値を追加してインデックスを部分修
正するより、新たに再配列された属性値に基づいてイン
デックスを再生成する方が高速化を図れる。

【００１３】

【実施例】以下、本発明を図の実施例を用いて詳細に説
明する。図１は本発明のレコード追加処理方法実施例を
示すフローチャートである。このフローチャートの説明
をする前に、本発明の方法を実施するためのハードウェ
ア構成を説明する。

【００１４】図６に本発明の方法を実施するためのハー
ドウェアブロック図を示す。本発明の方法を実施する場
合、システム全体の構成は図２に示した一般の情報検索
システムと同様である。本発明の方法を実施するには、
そのプロセッサに図６に示したような機能ブロックを追
加する。即ち、図６の装置には、レコード高速追加管理
部２１、レコード本体管理部２２、インデックス再生成
管理部２３、属性値バッファ２４、ソート処理部２５及
びインデックス再生成部２６が設けられている。上記各
ブロックは、それぞれプロセッサのプログラムの１処理
単位から構成され、その処理機能や手順は図１のフロー
チャートの説明と共に具体的に説明する。

【００１５】再び図１に戻って、本発明の方法では、ま
ず一定のデータベースに対し一群のレコード追加要求が
あった場合、その量を考慮した上で、レコード高速追加
管理部２１に対しレコード追加要求の発行が行なわれる
（ステップＳ１）。なお、この追加されるレコード量
が、例えば数個単位の場合には、実質的に従来方法がよ
り高速に処理できる。従って、予め本発明の方法では一
定のレコード量を閾値として設定しておき、その閾値と
比較した上で、閾値を超えた場合に高速追加処理が進め
られる。

【００１６】ステップＳ２において、レコード本体管理
部２２に対しレコード高速追加管理部２１がレコード本
体追加要求を発行する。これによって、レコード本体管
理部２２はデータベース中に新たなレコード本体の追加
処理を実行する。このようなレコード追加処理自体は従
来と同様の手順である。

【００１７】次にステップＳ３において、レコード高速
追加管理部２１からインデックス再生成管理部２３に対
しインデックス付き属性値追加要求発行が行なわれる。
即ち、図４に示したような所定の属性値配列に対し、高
速検索用のインデックスを付加する要求が発行される。
インデックス再生成管理部２３はこの要求を受けて、属
性値を属性値バッファ２４に格納する（ステップＳ
４）。属性値バッファ２４は一定量の属性値を一時格納
するためのメモリから構成される。

【００１８】即ち、本発明の方法においては、レコード
追加要求に対しレコード本体をデータベースに追加する
と、属性値は一旦この属性値バッファ２４に格納し、全
てのレコードについてレコード本体の追加処理を先行さ
せる。ステップＳ５においてレコード追加に残りがある
かどうかを判断し、残りがあればステップＳ１からステ
ップＳ４までの処理が繰り返される。こうして全てのレ
コードについてレコード本体のデータベースへの追加と
属性値の属性値バッファ２４への格納が完了するとステ
ップＳ６に移る。

【００１９】ステップＳ６では、レコード高速追加管理
部２１に対しレコード追加終了要求が発行される。次に
ステップＳ７において、インデックス再生成管理部２３
は、レコード高速追加管理部２１から属性値追加終了要
求を受け、ステップＳ８の処理に移る。ステップＳ８に
おいては、このインデックス再生成管理部２３が属性値
バッファ２４をソート処理部２５に渡す。即ち、属性値
バッファ２４に格納された一群の属性値がソート処理部
２５において昇順あるいは降順にソートされる。そし
て、最後にステップＳ９に移り、インデックス再生成管
理部２３はソートされた属性値をインデックス再生成部
２６に渡す。インデックス再生成部２６は、こうしてソ
ートされた一群の属性値を既存のレコード群の属性値と
マージし、新たな属性値の配列を得る。その後、インデ
ックス再生成部２６はその新たな属性値の配列に対しイ
ンデックスを再生成し付加する。

【００２０】次に、上記のような方法によって処理を行
なった場合と従来の方法とを比較して、処理時間上の効
果を述べる。まず、従来方法によるｎ件のレコード追加
に要する時間Ｔを以下の式で表わす。Ｔ＝（Ｒ＋Ｈ）×ｎ …（式１）但し、Ｒは１レコード本体の追加時間で、Ｈはインデッ
クス付き１属性値の追加時間である。

【００２１】これに対し、本発明の方法によるｎ件のレ
コード追加に要する時間ＮｅｗＴは以下の式で表わされ
る。ＮｅｗＴ＝（Ｒ＋ｉ）×ｎ＋Ｓ（ｎ）＋Ｍ（ｍ，ｎ） …（式２）なお、ｍは既存のレコード数、ｉは属性値を属性値バッ
ファに格納するための時間、Ｓ（ｎ）は属性値ｎ個をソ
ートする時間、Ｍ（ｍ，ｎ）はｍ件のレコードに付いて
いる既存の属性値の配列と新たにソートされたｎ件の属
性値の配列をマージして、その後新たなインデックスを
生成するのに要する時間である。

【００２２】大量のレコードを追加する場合、既に存在
するインデックス付きの属性値に対し１個１個属性値を
割り込ませ、インデックスの部分修正等を行なっていく
場合に比べて、配列の終わった属性値に対し新たにイン
デックスを生成した方が早いことが多い。これを次の式
により表わすことができる。Ｈ×ｎ＞１×ｎ＋Ｓ（ｎ）＋Ｃ（ｎ） …（式３）なお、Ｃ（ｎ）はソートしたｎ個の属性値から新たなイ
ンデックスを生成するために必要な時間である。即ち、
この式３の意味は、ｎ個の属性値を属性値バッファに格
納し、これをソートした上で新たなインデックスを生成
する場合、インデックス付きの１属性値をｎ回追加する
場合に比べ、より早く処理が可能なことを意味してい
る。従って本発明の方法による処理時間と従来方法によ
る処理時間の差は次の式により表わすことができる。ＮｅｗＴ−Ｔ＝ｉ×ｎ＋Ｓ（ｎ）＋Ｍ（ｍ，ｎ） …（式４）

【００２３】上記式のレコード件数ｎが大きくなればな
る程その差は大きくなる。また、ｎ／ｍが大きくなれば
なる程Ｍ（ｍ，ｎ）はＣ（ｎ）に近づいていく。従って
ｍに比べｎがかなり大きい場合には、本発明の方法によ
る処理時間は従来方法に比べて非常に短縮される。従っ
て、本発明の方法を実施する場合、予めｍとｎを比較
し、例えばｎ／ｍの値が一定の閾値以上の場合に、本発
明の方法を採用するといった選択を行なうことが好まし
い。

【００２４】本発明は以上の実施例に限定されない。上
記実施例において属性値の検索のために例えばＢｔｒｅ
ｅ式のインデックスを使用した例を説明したが、このイ
ンデックスの構成はこのようなものに限らず、従来よく
知られたこの種の属性値の検索のためのインデックスと
して差し支えない。また、もちろんその検索のためのハ
ードウェア構成は同様の機能を持つ各種の構成に置き換
えて差し支えない。

【００２５】

【発明の効果】以上説明した本発明のレコード追加処理
方法は、属性値をレコード検索用のキーとして一定の順
に配列したものに高速検索用のインデックスを付加する
場合において、データベースに対し新たに一群のレコー
ドを追加する時、予め新たに追加する一群のレコードの
属性値をソートした後、既存のレコードの属性値とマー
ジし、その後新たな属性値の配列に対しインデックスを
再生成して付加するようにしたので、個別にレコードを
追加し属性値を既存の属性値の配列に割り込ませていく
処理を繰り返す場合に比べ、大量のレコードの追加処理
を短時間で行なうことができる。これによって、データ
ベースの追加変更等の処理を高速化し、この種のシステ
ム運用を効率化することができる。

【図面の簡単な説明】

【図１】本発明のレコード追加処理方法実施例を示すフ
ローチャートである。

【図２】一般の情報検索システムブロック図である。

【図３】データベース例説明図である。

【図４】属性値とインデックスの構成説明図である。

【図５】従来のレコード追加方法フローチャートであ
る。

【図６】本発明の方法を実施するためのハードウェアブ
ロック図である。

【符号の説明】

Ｓ１〜Ｓ９処理ステップ

Claims

【特許請求の範囲】

【請求項１】データベースを構成するレコード毎に、
任意の属性値を付与し、前記属性値を前記レコード検索用のキーとして一定の順
に配列したものに、高速検索用のインデクスを付加する
場合において、前記データベースに対し、新たに一群のレコードを追加
するとき、予め新たに追加する一群のレコードの前記属性値をソー
トした後、既存のレコード群の属性値とマージして、その後新たな属性値の配列に対し、前記インデクスを再
生成して付加することを特徴とするレコード追加処理方
法。