JPH06124306A - 同時出現性対応インデックス検索方式 - Google Patents

同時出現性対応インデックス検索方式

Info

Publication number
JPH06124306A
JPH06124306A JP4271544A JP27154492A JPH06124306A JP H06124306 A JPH06124306 A JP H06124306A JP 4271544 A JP4271544 A JP 4271544A JP 27154492 A JP27154492 A JP 27154492A JP H06124306 A JPH06124306 A JP H06124306A
Authority
JP
Japan
Prior art keywords
search
item
index
data
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4271544A
Other languages
English (en)
Inventor
Tomoko Kawabata
知子 川畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP4271544A priority Critical patent/JPH06124306A/ja
Publication of JPH06124306A publication Critical patent/JPH06124306A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】多数のメンバから成るグループのような繰り返
し集団を格納したデータベースから、複数項目の検索条
件を同時に満たすメンバが存在するグループを検索する
ことができる同時出現性対応インデックス検索方式を提
供する。 【構成】検索式1の解析を行い検索用語解析テーブル3
に展開する検索式解析部2と、インデックスファイル8
を参照し項目ごとに検索を行う索引検索部4と、項目ご
との検索結果が出力される検索結果集合ファイル5a,
5bと、検索結果集合ファイル5a,5bの結果を利用
して論理積演算を行い結果を最終結果集合ファイル7に
格納する論理演算部6とから成る。インデックスファイ
ル8には、検索用語となり得る各項目データをインデッ
クスとし、繰り返し位置ごとにそれが出現する繰り返し
集団データのデータ番号を格納したものであり、繰り返
し集団データベースから繰り返し位置の順番であらかじ
め作成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は同時出現性対応インデッ
クス検索方式に関し、特に繰り返し集団を検索単位とす
るデータベースにおいて、複数項目間のデータ同時出現
性を考慮した検索を行うことが可能な同時出現性対応イ
ンデックス検索方式に関する。
【0002】
【従来の技術】従来、繰り返し集団を格納したデータベ
ースから、検索条件を満たす繰り返し集団を検索する場
合に、複数項目に検索条件を設定して同時検索を行う
と、各項目の検索条件を満たすデータが同じ繰り返し集
団内に存在していれば、検索条件を満たしているとして
検索処理を行っている。すなわち、各項目の検索条件を
満たすデータが繰り返し集団内の同じ繰り返し内に存在
するか、異なる繰り返し内に存在するかにかかわらず、
それらのデータが同じ繰り返し集団内に存在していれ
ば、その繰り返し集団は検索条件を満たしているとして
検索されていた。
【0003】図2に繰り返し集団データのデータ構造例
を示す。N人の所属メンバにより構成されるグループの
データで、グループ名,グループ番号およびメンバ情報
から成り、メンバ情報は項目名が“名前”“血液型”
“星座”の同じ構造のデータの繰り返しで構成されてい
る。なお、“繰り返し位置”とは、繰り返し集団内で何
番目に出現しているかを表すもので、図2の場合は、項
目名“名前”が“菊池”のデータが1番目に出現してい
るので、繰り返し位置=1と示すことができる。“繰り
返し集団”とは、このように同じ構造のデータが、複数
(繰り返して)存在することで成り立つもであり、“繰
り返し集団”を構成している各所属メンバの情報を“繰
り返し”と呼ぶ。
【0004】図3は、図2のデータ構造を持つ多数の繰
り返し集団データから成る繰り返し集団データベースの
一例である。
【0005】
【発明が解決しようとする課題】上述した従来の方法で
は、複数項目間のデータ同時出現性を考慮した検索を行
うことができなかった。例えば、検索したい条件が「血
液型がO型で星座が射手座の人がいるグループ」とする
と、図3に示した例の場合、求めるデータは5件目のみ
である。しかし、従来の方法では、まず「血液型がO
型」の条件で検索して1,5,10件目のデータを求
め、次に、同様に「星座が射手座」の条件で検索して
1,5件目のデータを求め、両方に存在するデータを最
終の結果として出力するため、「O型で山羊座の人」と
「A型で射手座の人」が別々に存在する1件目のデータ
も、検索条件を満たしているグループとして検索される
という問題点がある。
【0006】本発明の目的は、複数項目の検索条件を同
時に満たすメンバが存在するグループを検索することが
できる同時出現性対応インデックス検索方式を提供する
ことにある。
【0007】
【課題を解決するための手段】本発明の同時出現性対応
インデックス検索方式は、入力された検索式を解析して
検索用語,項目等に分解する検索式解析部と、繰り返し
集団データを格納したデータベースから項目別に繰り返
し位置ごとに作成され項目データをインデックスとして
その項目データが格納されている前記繰り返し集団デー
タのデータ番号を登録したインデックスレコードが格納
されているインデックスファイルと、前記検索式解析部
で抽出した検索用語により各項目ごとに前記インデック
スレコードを検索し取得したデータ番号の情報を項目ご
とに検索結果集合ファイルに出力する索引検索部と、前
記検索結果集合ファイルから項目ごとの情報を入力し同
じ繰り返し位置について各項目に同じデータ番号が存在
するデータ番号を抽出する論理演算部とを備えて構成さ
れている。
【0008】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0009】図1は本発明の一実施例の構成を示すブロ
ック図である。
【0010】本実施例の同時出現性対応インデックス検
索方式は、図1に示すように、入力された検索式1の解
析を行い検索用語解析テーブル3に展開する検索式解析
部2と、インデックスファイル8を参照し項目ごとに各
検索用語の検索を行う索引検索部4と、項目ごとの検索
結果が別々に出力される検索結果集合ファイル5a,5
bと、検索結果集合ファイル5a,5bの結果を利用し
て論理積演算を行い最終結果を最終結果集合ファイル7
に格納する論理演算部6と、索引検索部4で使用するイ
ンデックスファイル8とで構成されている。
【0011】以下、図1の動作について、図3に示した
繰り返し集団データベースの例を用いて詳細に説明す
る。
【0012】まず、検索式1として「血液型=O型 R
EL 星座=射手座」が入力されるものとする。ここ
で、“血液型”及び“星座”は検索対象となる項目名で
あり、“REL”は複数項目の同時出現の検索を行う際
に指定する同時出現性対応検索パラメータである。“O
型”と“射手座”は各項目に対する検索用語である。
【0013】検索式解析部2は、検索式1が入力される
と、これを項目名,検索パラメータ及び検索用語の3種
別に分解し、同時出現性対応検索パラメータ“REL”
を検出すると、検索式1内で先に出現した項目から検索
用語解析テーブル3に以降の検索処理に必要な検索用語
情報(集合ファイル番号,項目名,検索用語)を順次設
定する。図4に設定後の検索用語解析テーブル3の例を
示す。
【0014】索引検索部4では、検索用語解析テーブル
3に設定された項目順に、インデックスファイル8を参
照し、繰り返し位置ごとにインデックスレコードから検
索用語を含む繰り返し集団のデータ番号を検索し、検索
結果を項目ごとに検索結果集合ファイル5a,5bに出
力する。図4に示すように、検索対象の項目名は“血液
型”と“星座”で、“血液型”に対する検索用語は“O
型”で集合ファイル番号は1であり、“星座”に対する
検索用語は“射手座”で集合ファイル番号は2である。
従って、まず検索用語“O型”で項目“血液型”のイン
デックスレコードを検索し、得られた結果を検索結果集
合ファイル(#1)5aに格納し、次に検索用語“射手
座”で項目“星座”のインデックスレコードを検索し、
得られた結果を検索結果集合ファイル(#2)5bに格
納する。
【0015】ここで、検索に使用するインデックスファ
イル8内のインデックスレコードについて説明する。図
5は、項目名“血液型”に対するインデックスレコード
の一例を、図6は項目名“星座”に対するインデックス
レコードの一例を示す説明図で、それぞれ図3に示した
繰り返し集団データベースに対応するものである。図5
の繰り返し位置が1のインデックスレコードを例に説明
すると、先頭行(網掛け部分)は、項目名“血液型”に
対し、繰り返し位置が1の部分に“A型”が出現してい
る繰り返し集団データのデータ番号は、1,7,11,
12……であることを示している。すなわち、検索用語
となり得る項目データをインデックスとし、繰り返し位
置ごとにそれが出現する繰り返し集団データのデータ番
号を格納したものである。
【0016】各インデックスレコードのインデックスフ
ァイル8への登録は、繰り返し集団データベースからあ
らかじめ行って置くのがよいが、必要時に作成すること
も可能である。又、登録は繰り返し位置の順番で行う。
なお、インデックスの配列順序は、図5のように各繰り
返し位置に対して同じになるようにしてもよいが、項目
データの出現順に配列すると、図6に示すように繰り返
し位置により異なる配列順序となる。
【0017】次に、索引検索部4の検索処理について詳
細に説明する。まず、検索用語解析テーブル3に最初に
設定されている項目“血液型”の検索用語“O型”を検
索する。繰り返し位置が1からN(Nは繰り返しの数)
までのインデックスレコード内に“O型”が存在してい
るかを照合する。図5の繰り返し位置が1のインデック
スレコードの場合、インデックス中に“O型”が存在し
ている(斜線部分)ので、“O型”が存在するデータ番
号として4,5,9,17,18……を取得する。そし
て、この検索結果を検索結果集合ファイル5aに格納す
る。
【0018】検索結果集合ファイル5a,5bには、図
7に示すように、繰り返し位置に対して各データ番号の
状態を記録するテーブルが設定されており、索引検索を
行う前にはテーブルのすべての欄が「0」に初期化され
ている。検索後は、条件に合致したデータが存在してい
ることを表すために、該当するデータ番号のビットを
「0」から「1」へ変更する。項目“血液型”の繰り返
し位置が1に対する変更結果は、図8(a)に示すよう
に、データ番号4,5,9,17,18……の欄が
「1」となる。
【0019】繰り返し位置が2の場合にもインデックス
中に“O型”が存在している(斜線部分)ので、データ
番号が3,8,15,16,21……のビットを「0」
から「1」へ変更する。変更した結果は図9(a)とな
る。同様に、繰り返し位置が3の場合の処理結果は、図
10(a)となる。
【0020】次に、検索用語解析テーブル3の2番目に
設定されている項目名“星座”の検索用語“射手座”を
検索する。項目名“血液型”の処理と同様に、繰り返し
位置1からNまでインデックスレコード内に“射手座”
が存在しているか照合する。図6に示す繰り返し位置が
1のインデックスレコードには、インデックスに“射手
座”が存在しており(斜線部分)、そのデータ番号は
5,11,20,24,32……である。これを表すた
めに、検索結果集合ファイル5bのテーブルの該当する
データ番号のビットを「0」から「1」へ変更する。変
更した結果は図8(b)となる。繰り返し位置が2の場
合もインデックスに“射手座”が存在している(斜線部
分)ので、そのデータ番号1,9,17,20,25…
…のビットを「0」から「1」に変更すると、その結果
は図9(b)となる。繰り返し位置が3の場合は、イン
デックスに“射手座”は存在していないので、検索結果
集合ファイル5bのテーブルの各データ番号のビットは
変更せず、図10(b)に示すように初期値のままとな
る。
【0021】索引検索部4により項目ごとに検索結果集
合ファイル5a,5bに出力された検索結果を利用し
て、論理演算部6で論理積演算を行う。繰り返し位置ご
とに、各項目に対する同一データ番号のビットの論理積
演算を行い、演算結果を最終結果集合ファイル7に出力
する。
【0022】まず、項目名“血液型”の繰り返し位置が
1の検索結果と、項目名“星座”の繰り返し位置が1の
検索結果との論理積演算を、検索結果集合ファイル5a
及び5bのテーブルを利用して行う。この論理積演算を
行うことにより、“血液型”のデータ番号と“星座”の
データ番号の両方のビットが共に「1」の部分から、
“O型”と“射手座”が同時に存在しているデータ番号
を得ることができる。
【0023】図8(a)は“血液型”の繰り返し位置が
1の検索結果である。図8(b)は“星座”の繰り返し
位置が1の検索結果である。各項目の検索結果を利用し
て論理積演算を行った結果が図8(c)である。図8
(c)を見ると、データ番号5の部分のビットが「1」
になっているので、“O型”と“射手座”が同時に存在
しているのはデータ番号5の繰り返し集団データである
という結果を得ることができる。図6を参照すると、5
件目の繰り返し集団データ中に「O型で射手座の人」=
「青木さん」が存在していることを確認できる。
【0024】同様にして、繰り返し位置が2の場合に
は、図9(a)及び図9(b)から図9(c)が、繰り
返し位置が3の場合には、図10(a)及び図10
(b)から図10(c)の結果が得られる。この論理積
演算をすべての繰り返し位置に対して行うことにより、
入力された検索条件を満たすデータ番号をすべて得るこ
とができる。以上の演算結果をまとめて示したのが図1
1である。図11を参照すると、入力された検索条件を
満たすのはデータ番号5,8,16……であることが分
かる。
【0025】以下、本実施例では検索されない例の説明
を行う。
【0026】図6の1件目の繰り返し集団データを参照
すると、繰り返し位置が3のデータに“O型”が、繰り
返し位置が2のデータには“射手座”がそれぞれ存在し
ている。従来の検索方法では、繰り返し位置を意識せず
処理を行っているため、このような繰り返し集団データ
は検索条件を満たすものとみなされていたが、繰り返し
位置が2の論理積演算の結果である図9(c)と、繰り
返し位置が3の論理積演算の結果である図10(c)と
を参照すると、データ番号1のビットはそれぞれ「0」
になっており、この場合は検索されないことが分かる。
【0027】図10は繰り返し位置が3の検索結果を示
したものであるが、図10(b)の“星座”の検索結果
を見ると、すべてのデータ番号のビットが「0」になっ
ている。従って、論理積演算を行った図10(c)の演
算結果もすべてのデータ番号のビットが「0」になり、
繰り返し位置が3のデータには条件を満たすものが存在
しないことが分かる。
【0028】上述の実施例では、検索結果集合ファイル
5a,5bには、図7に示すような繰り返し位置とデー
タ番号による2次元のテーブルを用意し、索引検索部4
は検索結果を該当するビットを“0”から“1”に変更
して記憶させ、論理演算部6は各項目のテーブルの対応
するビットの論理積を求めて最終結果を決定するものと
したが、検索結果の記憶および最終結果の判定の方法は
上記に限定されるものではない。すなわち、項目ごとに
繰り返し位置に対して取得したデータ番号を直接記憶さ
せ、繰返し位置ごとに同一データ番号があるか否かを比
較検出することもでき、同一の最終結果が得られる。
【0029】
【発明の効果】以上説明したように、本発明の同時出現
性対応インデックス検索方式は、繰り返し位置ごとに検
索処理を行うため、各項目の検索条件を満たすデータが
同じ繰り返しに存在するものの検索、すなわち複数項目
間の同時出現性を考慮した検索を行うことができるとい
う効果を有している。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】繰り返し集団データのデータ構造例の説明図で
ある。
【図3】繰り返し集団データベースの一例を示す説明図
である。
【図4】本実施例の検索用語解析テーブルの一例を示す
説明図である。
【図5】項目名“血液型”に対するインデックスレコー
ドの説明図である。
【図6】項目名“星座”に対するインデックスレコード
の説明図である。
【図7】本実施例の検索結果集合ファイルに格納される
テーブルの説明図である。
【図8】本実施例の論理演算部の動作を説明するための
説明図である。
【図9】本実施例の論理演算部の動作を説明するための
説明図である。
【図10】本実施例の論理演算部の動作を説明するため
の説明図である。
【図11】本実施例の最終結果集合ファイルに格納され
るデータの説明図である。
【符号の説明】
1 検索式 2 検索式解析部 3 検索用語解析テーブル 4 索引検索部 5 検索結果集合ファイル 6 論理演算部 7 最終結果集合ファイル 8 インデックスファイル

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力された検索式を解析して検索用語,
    項目等に分解する検索式解析部と、繰り返し集団データ
    を格納したデータベースから項目別に繰り返し位置ごと
    に作成され項目データをインデックスとしてその項目デ
    ータが格納されている前記繰り返し集団データのデータ
    番号を登録したインデックスレコードが格納されている
    インデックスファイルと、前記検索式解析部で抽出した
    検索用語により各項目ごとに前記インデックスレコード
    を検索し取得したデータ番号の情報を項目ごとに検索結
    果集合ファイルに出力する索引検索部と、前記検索結果
    集合ファイルから項目ごとの情報を入力し同じ繰り返し
    位置について各項目に同じデータ番号が存在するデータ
    番号を抽出する論理演算部とを備えたことを特徴とする
    同時出現性対応インデックス検索方式。
  2. 【請求項2】 前記検索結果集合ファイルは繰返し位置
    とデータ番号とによる2次元の格納テーブルを各項目に
    対して備え、前記索引検索部は前記格納テーブルの該当
    する箇所のビットを“0”から“1”とすることで検索
    結果を記憶させ、前記論理演算部は各項目の格納テーブ
    ルの対応箇所の論理積演算を行うことを特徴とする請求
    項1記載の同時出現性対応インデックス検索方式。
JP4271544A 1992-10-09 1992-10-09 同時出現性対応インデックス検索方式 Withdrawn JPH06124306A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4271544A JPH06124306A (ja) 1992-10-09 1992-10-09 同時出現性対応インデックス検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4271544A JPH06124306A (ja) 1992-10-09 1992-10-09 同時出現性対応インデックス検索方式

Publications (1)

Publication Number Publication Date
JPH06124306A true JPH06124306A (ja) 1994-05-06

Family

ID=17501549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4271544A Withdrawn JPH06124306A (ja) 1992-10-09 1992-10-09 同時出現性対応インデックス検索方式

Country Status (1)

Country Link
JP (1) JPH06124306A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016131050A (ja) * 2016-04-25 2016-07-21 富士通株式会社 検索プログラム、検索方法、及び情報処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016131050A (ja) * 2016-04-25 2016-07-21 富士通株式会社 検索プログラム、検索方法、及び情報処理装置

Similar Documents

Publication Publication Date Title
JPH0652225A (ja) ファイル検索方法及びシステム
US5893094A (en) Method and apparatus using run length encoding to evaluate a database
JP2002278761A (ja) 否定項を含む相関ルール抽出方法およびシステム
JP2003044267A (ja) データソート方法、データソート装置およびデータソートプログラム
JP3452531B2 (ja) データ・マイニングする方法およびシステム
JP2001331509A (ja) リレーショナルデータベース処理装置、リレーショナルデータベースの処理方法及びリレーショナルデータベースの処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH02130673A (ja) データ検索方式
JPH1078969A (ja) 情報検索装置
JPH06124306A (ja) 同時出現性対応インデックス検索方式
US6738771B2 (en) Data processing method, computer readable recording medium, and data processing device
JP2005242587A (ja) クロス表作成のためのプログラム及び方法及び装置
JPH0194429A (ja) リレーショナル型データベースにおける階層的検索方式
JPS59121436A (ja) デ−タ群のソ−ト方法
JP2706021B2 (ja) 構造型データベースにおける検索高速化方法
JPS6340938A (ja) 情報検索における同意語検索方式
JPH09311862A (ja) データのドリルダウン方式
JPH06215044A (ja) 情報検索処理装置
JPH11306183A (ja) データベース検索システム
JPH0644326A (ja) 情報検索装置
JPH0675254B2 (ja) 開係データベース演算システム
JPS61182132A (ja) 情報検索方式
JP2724235B2 (ja) 変数名称推論装置
JPH04337867A (ja) データベース検索システム
JPH03108063A (ja) 後方一致検索方法および装置
JPS63238622A (ja) 関連検索方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000104