JPH0584935B2 - - Google Patents

Info

Publication number
JPH0584935B2
JPH0584935B2 JP61298023A JP29802386A JPH0584935B2 JP H0584935 B2 JPH0584935 B2 JP H0584935B2 JP 61298023 A JP61298023 A JP 61298023A JP 29802386 A JP29802386 A JP 29802386A JP H0584935 B2 JPH0584935 B2 JP H0584935B2
Authority
JP
Japan
Prior art keywords
index
records
record
generated
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61298023A
Other languages
English (en)
Other versions
JPS63149728A (ja
Inventor
Tadayoshi Ideshita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP61298023A priority Critical patent/JPS63149728A/ja
Publication of JPS63149728A publication Critical patent/JPS63149728A/ja
Publication of JPH0584935B2 publication Critical patent/JPH0584935B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、フアイルシステムまたはデータベー
スシステムにおける索引の生成方式に関し、特に
データレコードの複数のフイールドの個々に対す
る索引を一括して生成する索引生成方式に関する
ものである。
〔従来の技術〕
フアイルシステムまたはデータベースシステム
においては、キー項目に対するデータアクセスを
高速にするため、データレコードの索引を生成す
ることが一般に行なわれる。このような索引は、
データ部中のデータレコードをスキヤンしてキー
項目とアドレスを取り出し、キー項目を分類処理
することで生成される。
ここで、既存の分類処理では、入力データ中の
分類キーとなるフイールドのデータ属性(数値、
文字、日本語等の種別や長さ)は分類対象となる
全データで同一であることが必要であつたため、
データ属性の異なる複数の索引を生成する場合、
以下のような方式が採用されていた。
〇従来方式 例えば、第7図に示すような人事フアイル5a
に含まれるデータレコードより社員NO、氏名、
年齢のフイールドに対して索引を生成する場合、
人事フアイル5a中のデータレコードをスキヤン
しながら、索引を生成するフイールドの値とデー
タレコードのアドレスとを対として取り出し、こ
れらを索引を生成するフイールドの値で分類する
という処理を、生成すべき索引の数だけ繰り返し
て必要な数の索引を生成する方式である。
即ち、先ず、人事フアイル5aの各データレコ
ードから社員NOとアドレスとの対を取り出し、
これを社員NOで分類することにより第7図に示
すような社員NOの索引(1)5eを生成し、次い
で、人事フアイル5aの各データレコードから氏
名とアドレスとの対を取り出し、これを氏名で分
類することにより第7図に示すような氏名の索引
(2)5fを生成し、最後に、人事フアイル5aの各
データレコードから年齢とアドレスとの対を取り
出し、これを年齢で分類することにより第7図に
示すような年齢の索引(3)5gを生成するものであ
る。
〇従来方式 例えば、第8図に示した人事フアイル5a(第
7図のものと同じ)に含まれるデータレコードの
社員NO、年齢のフイールドのように、同一のデ
ータ属性に変換可能なフイールドが存在する場
合、同一のデータ属性に変換可能な社員NOと年
齢の索引生成と、同一のデータ属性に変換できな
い残りの氏名の索引生成とを別々に行ない、後者
の氏名の索引(2)5fは第7図で説明した方法と同
じ方法で生成し、前者の社員NOと年齢の索引生
成を以下のように行なう方式である。
各データレコードをスキヤンして、生成すべき
索引対応のデータ属性変換後のフイールド、レコ
ードアドレスおよび生成すべき索引毎のID(索引
ID)を含む索引レコードを、生成すべき索引の
数だけ生成する。つまり、社員NOのフイールド
の属性を4桁から3桁に変換し、年齢のフイール
ドの属性を2桁から3桁に変換して両者を同一に
し、社員NOの索引レコードには例えば1の索引
IDを、年齢の索引レコードには例えば3の索引
IDを付加して、第8図に示すような索引レコー
ド群7aを生成する。次いで、この生成した索引
レコード群7aを、索引IDを第1分類キー、索
引対応のフイールドを第2分類キーとして分類し
て、第8図に示すような分類済の索引レコード群
7bを生成する。そして、索引レコード群7b中
の同一索引ID毎に、索引IDを除去すると共に索
引対応フイールドのデータ属性を元のデータ属性
に戻す処理を行うことにより、索引(1)5e、索引
(3)5gを生成する。
〔発明が解決しようとする問題点〕
しかし、上述した従来の方式では、生成すべ
き索引の数と同じだけデータレコードのスキヤン
と分類処理とを繰り返す必要があり、索引生成時
間が長くなる。
また、上述した従来の方式では、同一のデー
タ属性に変換できる索引の数が増えれば増えるほ
ど従来方式よりデータスキヤンと分類処理の回
数は少なくなるが、データ属性を合わせるための
データ属性変換、元のデータ属性に戻すためのデ
ータ属性変換の処理が必要であり、更に、索引を
生成すべき複数のフイールド中に同一のデータ属
性に変換できないようなフイールドが存在する場
合には、最低でも2回の分類処理が必要になると
いう問題点がある。
本発明はこのような従来の欠点を解決したもの
で、その目的は、索引を生成すべき複数のフイー
ルドを含み且つ少なくとも1つのフイールドのデ
ータ属性が他のフイールドのデータ属性と異なつ
ている複数のデータレコードであつても、1回の
分類処理だけで所望とする数の索引を生成するこ
とができる索引生成方式を提供することにある。
〔問題点を解決するための手段〕
本発明は上記の目的を達成するために、 索引を生成すべき複数のフイールドを含み且つ
少なくとも1つのフイールドのデータ属性が他の
フイールドのデータ属性と異なつている複数のデ
ータレコードから、前記各フイールド対応の索引
を生成する方式において、 記憶手段に記憶された前記複数のデータレコー
ドを順次読取り、各データレコードに関し、生成
すべき索引対応のフイールド、レコードアドレス
および該生成すべき索引の識別番号である索引
IDを含む索引レコードを、生成すべき索引の数
だけ生成する索引レコード生成手段と、 2つの索引レコードの索引IDを比較して等し
くないときは勝者結果を返却する索引ID比較手
段と、2つの索引レコードの索引対応のフイール
ドを比較して勝敗結果を返却する、索引ID別に
設けられた索引ID別キー比較手段と、前記索引
ID比較手段で等しいと判定された索引IDに対応
する前記索引ID別キー比較手段に前記索引ID比
較手段で勝敗の着かなかつた2つの索引レコード
を入力する索引ID判定手段とを含むキー比較機
構、および、前記索引レコード生成手段で生成さ
れた複数の索引レコードを2つずつ前記キー比較
機構で比較することによりトーナメント方式で勝
者、敗者を決定していつて、前記索引IDを第1
分類キーとして且つ同一索引IDを持つ索引レコ
ード間においては索引対応のフイールドを第2分
類キーとして前記索引レコード生成手段で生成さ
れた複数の索引レコードを分類する分類機構を有
する索引レコード分類手段と、 該索引レコード分類手段で分類された分類済索
引レコード群の並びの索引IDを監視しつつ対応
する索引を生成する索引構築手段とを備えてい
る。
〔作 用〕
本発明の索引生成方式が備える索引レコード分
類手段は、第2分類キーとなる索引対応のフイー
ルドのデータ属性が索引ID毎に異なるものであ
つても、複数の索引レコードを第1分類キーであ
る索引IDで分類し、なお且つ第1分類キーが同
じ索引レコード間では、第2分類キーで分類する
という分類を、正確かつ一括して行なえる。
そこで、一つのデータレコードに対し、生成す
べき索引の数だけ索引レコードを生成し、且つ各
索引レコードに索引対応の索引IDを付加して各
索引レコードが生成すべきどの索引に対応するも
のであるかを識別可能とし、このような索引レコ
ードを上記索引レコード分類手段によつて索引
IDを第1分類キー、同一索引IDの索引レコード
間においては索引対応フイールドを第2分類キー
として分類処理することにより、索引を生成すべ
き複数のフイールドを含み且つ少なくとも1つの
フイールドのデータ属性が他のフイールドのデー
タ属性と異なつているような複数のデータレコー
ドであつても、一回の分類処理で各フイールド対
応の索引が生成できるようにしている。
〔実施例〕
以下、本発明の実施例について、図面を参照し
ながら説明する。
第1図は、本発明に係る索引生成方式の実施例
を示すブロツク図である。本実施例は、索引レコ
ード生成手段1a、索引レコード分類手段1b、
索引構築手段1cおよびデータフアイル1dより
構成されている。索引レコード分類手段1bは、
分類機構1e、キー比較機構1fを含む。
索引を生成すべき複数のデータレコードはデー
タフアイル1dに格納されており、索引レコード
生成手段1aはデータフアイル1dから順次にデ
ータレコードを入力するとともに、入力した各デ
ータレコードについて、そのレコードのアドレス
と生成すべき索引に対応するフイールドを抽出
し、更に索引対応に索引の識別番号(ID)を付
加して例えば第3図に示す形式の索引レコード
を、生成すべき索引の数だけ作成する。このよう
にして作成された索引レコードは、索引レコード
分類手段1bに引き渡される。そして、すべての
データレコードの入力が完了し、すべての索引レ
コードの生成が完了すると、その旨が索引レコー
ド分類手段1bに通知される。これに応答して索
引レコード分類手段1bは、索引レコードに対し
て索引IDを第1分類キーとして、索引フイール
ドを第2分類キーとして、分類処理を開始する。
索引レコード分類手段1b中の分類機構1e
は、例えば第2図に示すように初期設定部2a、
置換選択部2b、ストリング併合部2c、ストリ
ング出力部2d、ストリング記憶部2eから構成
される。なお、キー比較機構1fは、第1図のキ
ー比較機構1fである。分類機構1eは、予め索
引レコード生成手段1aより初期設定された後、
置換選択部2bに入力データとして前述した索引
レコードが入力される。置換選択部2bは、内部
記憶素子上に例えば第4図に示すようなトーナメ
ント木を構成し、そのトーナメント木の各ノード
n1〜n8においてキー比較機構1fを用いて分
類キーの比較を行ない、勝者、敗者を決定してゆ
く。
キー比較機構1f中の索引ID比較手段1gは、
ノードでの2つの索引レコードの索引IDを比較
し、索引IDが異なる場合は、索引IDの小さい方
を勝者として比較結果を分類機構1eに返す。索
引IDが等しい場合は、索引ID判定手段1hによ
り索引IDの判定が行われ、対応する索引IDの索
引ID別キー比較手段1iに分岐され、各索引対
応の第2の分類キーによる比較が行なわれる。そ
の比較結果が返却されることにより各ノードでの
勝者が決定される。
置換選択部2bは、トーナメント木の最上位の
ノードでの勝者から順に索引レコードを出力し、
内部記憶素子上で、ある程度並んだレコードの列
(ストリングと称する)を作成しストリング記憶
部2eに書き込んでゆく。すべての索引レコード
の入力が完了すると、次にストリング併合部2c
に制御が渡される。
ストリング併合部2cは、ストリング記憶部2
eから複数のストリングを読み出し、各ストリン
グの先頭のレコードから併合処理を行ない、併合
されたストリングをストリング記憶部に書き戻し
てゆく。ストリング併合部でのキー比較も、キー
比較機構1fを用いて行なわれる。併合処理を繰
り返し、ストリング数が減少され、最終併合が可
能となると、ストリング出力部2dに制御が渡さ
れ、最終併合の結果が出力データとなる。索引レ
コード分類手段1bからの出力データは、次に索
引構築手段1cに渡される。
索引構築手段1cは、分類された索引レコード
の索引IDを監視しながら、索引IDを取り除き、
索引を生成してゆく。索引IDが切り換わると、
一つの索引の生成が完了し、次の索引の生成が開
始される。最後の索引レコードの処理が終了した
時点で、すべての索引の生成が完了する。生成さ
れた索引はデータフアイル1dに書き込まれる。
第5図は、本実施例を具体的なデータをもとに
した例である。同図において、5aは索引を作成
するベースとなる人事フアイルで、このフアイル
に含まれるデータレコードより社員NO、氏名、
年齢のフイールドに対して索引生成を行なう。索
引レコード生成手段1aは、フアイル5aからデ
ータレコードを入力するとともに、索引を生成す
べき各フイールドの値と入力レコードのアドレス
を抽出し、索引IDとして、社員NOに01、氏名に
02、年齢に03を割り当てて索引レコードを作成
し、索引レコード分類手段1bに渡して行く。本
例では、入力データレコード1件に対して3件の
索引レコードが生成されている。第6図の6aに
このようにして生成された索引レコードの並びを
示す。
索引レコード分類手段1bは、前述のキー比較
機構1fを用いて、索引IDを第1分類キーとし
て、同一索引IDを持つ索引レコードに対しては
それぞれの索引フイールドを第2分類キーとして
分類することになる。
第4図はその場合の置換選択部2bにおける比
較過程でのトーナメント木の状態図を示してい
る。また、第6図の6bは、上述のようにして分
類された索引レコード分類手段1bから出力され
るレコードの並びを示している。索引構築手段1
cは、この出力レコードをもとに、索引IDを取
り除き、社員NO、氏名、年齢のフイールドの索
引、すなわち第5図の索引(1)5e、索引(2)5f、
索引(3)5gを順次作成して行く。
〔発明の効果〕
本発明は、以上説明したように、索引レコード
生成手段において、一つのデータレコードに対
し、索引対応のフイールドとレコードアドレスと
索引IDとを持つ索引レコードを、生成すべき索
引の数だけ生成するようにし、索引レコード分類
手段において、上記生成された複数の索引レコー
ドを索引IDを第1分類キーとし、索引対応のフ
イールドを第2分類キーとして分類するようにし
たため、分類済索引レコード群におけるレコード
の並びは、第6図の出力レコードの並び6bに示
したように、索引ID順で且つ同一索引ID内では
索引フイールドの内容順となり、索引構築手段は
索引IDの切り換わりを索引の区切りとして識別
し、索引IDを削除するだけで複数の索引の生成
が可能となり、索引を生成すべきデータレコード
の1回の読み込みと1回の分類処理だけで、複数
の索引をキーのデータ型変換を行なうことなく一
括して生成することが可能となるので、索引の生
成に必要な時間を短縮できると共に、キーのデー
タ型変換を行なう必要がないので適用範囲が広く
なるという効果がある。
【図面の簡単な説明】
第1図は本発明の実施例を示すブロツク図、第
2図は索引レコード分類手段の構成例を示すブロ
ツク図、第3図は索引レコードの形式例を示す
図、第4図は実施例の置換選択部2b中のトーナ
メント木での比較過程を示す説明図、第5図は人
事フアイルを用いた索引生成方式の動作説明図及
び、第6図は第5図の例での索引レコード分類手
段1bへの入力及び出力レコードの並びの例を示
す図、第7図および第8図は従来の索引生成方式
の説明図である。 図において、1a…索引レコード生成手段、1
b…索引レコード分類手段、1c…索引構築手
段、1d…データフアイル、1e…分類機構、1
f…キー比較機構、1g…索引ID比較手段、1
h…索引ID判定手段、1i…索引ID別キー比較
手段。

Claims (1)

  1. 【特許請求の範囲】 1 索引を生成すべき複数のフイールドを含み且
    つ少なくとも1つのフイールドのデータ属性が他
    のフイールドのデータ属性と異なつている複数の
    データレコードから、前記各フイールド対応の索
    引を生成する方式において、 記憶手段に記憶された前記複数のデータレコー
    ドを順次読取り、各データレコードに関し、生成
    すべき索引対応のフイールド、レコードアドレス
    および該生成すべき索引の識別番号である索引
    IDを含む索引レコードを、生成すべき索引の数
    だけ生成する索引レコード生成手段と、 2つの索引レコードの索引IDを比較して等し
    くないときは勝敗結果を返却する索引ID比較手
    段と、2つの索引レコードの索引対応のフイール
    ドを比較して勝敗結果を返却する、索引ID別に
    設けられた索引ID別キー比較手段と、前記索引
    ID比較手段で等しいと判定された索引IDに対応
    する前記索引ID別キー比較手段に前記索引ID比
    較手段で勝敗の着かなかつた2つの索引レコード
    を入力する索引ID判定手段とを含むキー比較機
    構、および、前記索引レコード生成手段で生成さ
    れた複数の索引レコードを2つずつ前記キー比較
    機構で比較することによりトーナメント方式で勝
    者、敗者を決定していつて、前記索引IDを第1
    分類キーとして且つ同一索引IDを持つ索引レコ
    ード間においては索引対応のフイールドを第2分
    類キーとして前記索引レコード生成手段で生成さ
    れた複数の索引レコードを分類する分類機構を有
    する索引レコード分類手段と、 該索引レコード分類手段で分類された分類済索
    引レコード群の並びの索引IDを監視しつつ対応
    する索引を生成する索引構築手段とを具備したこ
    とを特徴とする索引生成方式。
JP61298023A 1986-12-15 1986-12-15 索引生成方式 Granted JPS63149728A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61298023A JPS63149728A (ja) 1986-12-15 1986-12-15 索引生成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61298023A JPS63149728A (ja) 1986-12-15 1986-12-15 索引生成方式

Publications (2)

Publication Number Publication Date
JPS63149728A JPS63149728A (ja) 1988-06-22
JPH0584935B2 true JPH0584935B2 (ja) 1993-12-03

Family

ID=17854114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61298023A Granted JPS63149728A (ja) 1986-12-15 1986-12-15 索引生成方式

Country Status (1)

Country Link
JP (1) JPS63149728A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332670A (ja) * 1993-05-19 1994-12-02 Nec Corp 加算回路付きソート処理装置
JP2687887B2 (ja) * 1994-07-22 1997-12-08 日本電気株式会社 リレーショナルデータベースの管理方式

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59121436A (ja) * 1982-12-27 1984-07-13 Fujitsu Ltd デ−タ群のソ−ト方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59121436A (ja) * 1982-12-27 1984-07-13 Fujitsu Ltd デ−タ群のソ−ト方法

Also Published As

Publication number Publication date
JPS63149728A (ja) 1988-06-22

Similar Documents

Publication Publication Date Title
JP2003044267A (ja) データソート方法、データソート装置およびデータソートプログラム
US7058621B1 (en) Method for extracting information from a database
US20040215598A1 (en) Distributed data mining and compression method and system
JPS62194533A (ja) 木構造デ−タのパタ−ンマツチング方式
KR100417908B1 (ko) 처리 회로 및 검색 프로세서 회로
JPH05225238A (ja) データベース検索システム
JPH0584935B2 (ja)
US5047951A (en) Inference processor using meta knowledge
US4020473A (en) Automatic system for providing telephone number information service
CN109492383B (zh) 一种数据权限的解析方法
JPS59121436A (ja) デ−タ群のソ−ト方法
JP2827658B2 (ja) 図形解析装置及び図形検索装置
JP2578777B2 (ja) 多階層型デ−タベ−スのセットオカランス格納順序決定装置
Mcquitty et al. A Method for Hierarchical Clustering of a Matrix of a Thousand By a Thousand 1
JPS63311432A (ja) 連想語検索システム
CN115858572A (zh) 基于红黑树数据查询的方法、装置、存储介质及电子设备
JPH09330322A (ja) データ検索装置
JP2001325293A (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
JPH04209069A (ja) 前方一致文字列検索方式
JPS62239232A (ja) 複数レコ−ドクラス分類方式
Smith Synthesis heuristics for large asynchronous sequential circuits
EP0318983A2 (en) Interrogating device and method
JP2000123014A (ja) データ検索システムおよび方法
JPH07114566A (ja) データ構造変換システム及びその変換方法
JP2718107B2 (ja) 比較処理方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term