JPH0675254B2 - 開係データベース演算システム - Google Patents

開係データベース演算システム

Info

Publication number
JPH0675254B2
JPH0675254B2 JP1139094A JP13909489A JPH0675254B2 JP H0675254 B2 JPH0675254 B2 JP H0675254B2 JP 1139094 A JP1139094 A JP 1139094A JP 13909489 A JP13909489 A JP 13909489A JP H0675254 B2 JPH0675254 B2 JP H0675254B2
Authority
JP
Japan
Prior art keywords
attribute
relational database
database
given
hash value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1139094A
Other languages
English (en)
Other versions
JPH035886A (ja
Inventor
明彦 仲瀬
Original Assignee
工業技術院長
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 工業技術院長 filed Critical 工業技術院長
Priority to JP1139094A priority Critical patent/JPH0675254B2/ja
Publication of JPH035886A publication Critical patent/JPH035886A/ja
Publication of JPH0675254B2 publication Critical patent/JPH0675254B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は関係データベース間での結合演算を高速に、効
率良く実行することのできる開係データベース演算シス
テムに関する。
(従来の技術) 近時、種々の情報のデータベース化が進められ、情報検
索等に効率的に利用されるようになってきた。ところが
この種のデータベースは、その利用目的に応じてシステ
ム毎にそれぞれ独立に構築されているのが実情である。
そこで最近では、これらの複数の関係データベースをそ
の属性に従って結合し、より内容の充実したデータベー
スを構築して種々の知識処理に利用することが試みられ
ている。
このような関係データベース間での結合演算を高速に行
う手法として、例えば Kitsuregawa,M et al “Architecture and Performance of the Relational A
lgebra Machine GRACE" Proceedings of the International Conference on Par
allel Processing,1984 なる文献に紹介されるように、結合演算の対象となる2
つの属性のハッシュ値をそれぞれ求め、ハッシュ値の等
しい属性間でのみ実際の結合演算を行うことが知られて
いる。
この結合演算は第4図に例示するように、2つの関係デ
ータベースA,B間で結合演算を実行して新たな関係デー
タベースCを求めるような場合、その結合演算の対象と
する関係データベースAの属性2のハッシュ値(属性
2′)と、関係データベースBの属性1のハッシュ値
(属性1′)とを第5図に示すようにそれぞれ求め、こ
れらのハッシュ値の照合により、ハッシュ値の等しい属
性間で結合演算を実行することで前記関係データベース
A,Bの属性項目を求めた新たな関係データベースCを作
成するものである。
尚、ここではハッシュ関数h(x)に基づく3ビットの
ハッシュ値として、 h(abcd)=[001] h(xyz)=[010] h(pqr)=[110] が定義されている。
しかして実際の結合演算は、この例では関係データベー
スAの属性2の値(文字列)と関係データベースBの属
性1に値(文字列)とを直接照合することなく、関係デ
ータベースAのハッシュ値(属性2′)と、関係データ
ベースBのハッシュ値(属性1′)とが等しいタプルを
求め、これらのタプル間で結合演算処理が行われる。こ
の結果、実際に行われる文字列照合の回数が大幅に低減
され、結合演算の高速化が図られる。
ところがこのような手法をリストを含む非正規形の関係
データベースに適用しようとすると問題が生じる。例え
ば第6図に示すように、関係データベースDのリスト形
式で与えられる属性の要素に、関係データベースEの属
性1の要素が含まれるときにそれらの間の結合を行うべ
く、上記リスト形式で与えられる属性のハッシュ値を求
めても上記関係データベースEの属性のハッシュ値と一
致することがない。つまりリスト形式で与えられた関係
データベースDの属性2のハッシュ値を求めても、この
ハッシュ値から関係データベースDの属性2が関係デー
タベースEの属性を要素として含むか否かを判定するこ
とができない。この為、リストを含む非正規形の関係デ
ータベースに対する結合演算を効率的に行うことができ
ないと云う問題があった。
(発明が解決しようとする課題) このように従来にあっては、知識処理に利用されるデー
タベースのようにリスト構造を含む関係データベースに
対し、ある関係データベースの属性が他の関係データベ
ースの属性にリスト内に含まれるか否かを条件として関
係データベース間での結合演算を行う場合、ハッシュ値
を用いた結合演算の高速化の手法を採用することができ
ないと云う問題があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、リスト形式の属性を持つ関係デ
ータベースに対する結合演算を高速に実行することので
きる関係データベース演算システムを提供することにあ
る。
[発明の構成] (課題を解決するための手段) 本発明は、結合条件に係る属性が複数の要素で与えられ
る第1の関係データベースを格納する第1のデータベー
ス格納手段と、結合条件に係る属性が上記第1の関係デ
ータベースの属性を構成する要素で与えられる第2の関
係データベースを格納する第2のデータベース格納手段
と、前記第1のデータベース格納手段と第2のデータベ
ース格納手段にそれぞれ格納された関係データベースの
結合条件として特定される属性が複数の要素からなるリ
スト形式で与えられているか否かを判断する判断手段
と、この判断手段でそれぞれの関係データベースの属性
がリスト形式で与えられていると判断されたときにはそ
の属性の要素のそれぞれについて所定のハッシュ関数に
従って求められるハッシュ値のビット並列な論理和を求
め、この論理和を当該属性のハッシュ値とすると共に、
リスト形式で与えられないときには、所定のハッシュ関
数に従って求められるハッシュ値をそのまま当該属性の
ハッシュ値とするインデックス作成手段と、このインデ
ックス作成手段でそれぞれについて求められる第1及び
第2の関係データベースの属性についてのハッシュ値を
相互に照合し、ハッシュ値の結合演算を行う結合演算手
段と、この結合演算手段で演算された新たな関係データ
ベースを格納する結果リレーション手段とを具備するこ
とを特徴とするものである。
(作用) 本発明よれば、結合演算の対象となる関係データベース
の属性がリスト形式で与えられる場合、その属性の各要
素についてのハッシュ値のビット並列な論理和が上記リ
スト形式で与えられる属性のハッシュ値として求めら
れ、このハッシュ値にそのリストに含まれる属性の要素
の全てが反映されるので、他方の関係データベースのハ
ッシュ値との照合により、その属性が上記リスト形式で
与えられる属性の要素に含まれているか否かを容易に判
断することが可能となる。この結果、属性がリスト形式
で与えられる関係データベースを演算対象とする場合で
あっても、複数の関係データベース間での結合演算を高
速に、効率良く実行することができる。
(実施例) 以下、図面を参照して本発明の一実施例に係る関係デー
タベース演算システムについて説明する。
第1図は実施例システムの基本構成を示す図で、1,2は
データベース格納部である。これらのデータベース格納
部1,2には結合演算対象とする関係データベースがそれ
ぞれ格納される。しかしてデータベース格納部1に格納
された第1の関係データベースは、ここではその結合条
件となっている第2の属性が[a,b,d]のように複数の
要素からなるリスト形式で与えられている。またデータ
ベース格納部2に格納された第2の関係データベース
は、その結合条件となっている第1の属性が上記第1の
関係データベースの第2の属性を構成する要素にて与え
られている。
インデックス作成部3,4は上記データベース格納部1,2に
それぞれ格納された関係データベースの結合条件として
特定された属性についてのハッシュ値を所定のハッシュ
関数に基づいて作成するもので、その際、その属性がリ
スト形式で与えられているか否かを判断している。そし
てインデックス作成部3,4は、関係データベースの属性
がリスト形式で与えられている場合には、その属性の要
素のそれぞれについて求められるハッシュ値のビット並
列な論理和を求め、この論理和を当該属性のハッシュ値
としている。
尚、結合条件として特定された属性がリスト形式で与え
られない場合には、その属性のハッシュ値がそのまま求
められる。
結合演算部5は、上述した如くインデックス作成部3,4
にてそれぞれ求められる第1および第2の関係データベ
ースの属性についてのハッシュ値を相互に照合し、ハッ
シュ値の等しい属性間で上記関係データベース間での結
合演算を実行するもので、この結合演算により求められ
る新たな関係データベースが結果リレーション部6に格
納される。
即ち、データベース格納部1に格納された第1の関係デ
ータベースの第2の属性として与えられるリストに含ま
れる要素に、前記データベース格納部2に格納された第
2の関係データベースの第1の属性が等しいとき、これ
らの属性間で結合を行うものとする。するとインデック
ス作成部3は、データベース格納部1に格納された第1
の関係データベースの第2の属性がリスト形式で与えら
れるから、先ずそのリスト形式で示される属性の要素の
ハッシュ値を所定のハッシュ関数に従ってそれぞれ求
め、これらのハッシュ値のビット並列な論理和を当該属
性のハッシュ値として求める。
具体的には、第1の関係データベースのリストを構成す
る第2の属性の各要素(アトム)a,b,〜h(第2の関係
データベースの第1の属性と等価)に対して、例えば第
2図に示すように予め定められた所定のハッシュ関数h
を適用し、 h(a)=[00000001],h(b)=[00000010] h(c)=[00000100],h(d)=[01000100] h(e)=[00100000],h(f)=[10000000] h(a)=[01100000],h(b)=[00010000] なるハッシュ値を得るものとすると、インデックス作成
部3は第3図(a)〜(d)にそれぞれ示すようにして各属性
に対するハッシュ値を論理和処理により求める。つま
り、[a,b,d]なるリストとして示される属性について
は、それらの各要素のハッシュ値を h(a)=[00000001] h(b)=[00000010] h(d)=[01000100] として求め、これらの各要素のハッシュ値の間でビット
並列にその論理和を求めて当該属性のハッシュ値を h([a,b,d])=[01000111] として求める。
同様にして[b,e,f][b,c,g][c,d,h]なるリストと
して示される各属性についても、 h([b,e,f])=[10100010] h([b,c,g])=[01100110] h([c,d,h])=[01010100] としてそれぞれそのハッシュ値を求める。
結合演算部5は、このようにして求められる第1の関係
データベースについてのハッシュ値と第2の関係データ
ベースのハッシュ値との間で論理積処理して、そのハッ
シュ値の照合を行い、第2の関係データベースの属性を
リストの要素として含む第1の関係データベースの組を
探し、そのタプル間についてのみ結合演算を実行する。
このハッシュ値の照合処理によってタプルが見出されな
かったものについては、結合演算の対象から除外され
る。
このような結合演算処理により、この第1図に示す例で
は第1の関係データベースと第2の関係データベースと
の間で7組の条件成立の属性タプルが見出され、結果リ
レーション部6に示されるような新たな関係データベー
スが構築される。
上述したハッシュ値による演算について更に説明する
と、或る属性Lが複数の要素L1,L2,〜,Lnのリストとし
て与えられる場合、これらの各要素L1,L2,〜Lnのハッシ
ュ値h(L1),h(L2),〜h(Ln)のビット並列な論理
和をh(L)とすると、上記各ハッシュ値h(L1),h
(L2),〜h(Ln)のそれぞれにおいて[1]が立って
いるビットについては、上記論理和h(L)の該当ビッ
トにも必ず[1]が立つことになる。
しかしてこのようにリストを構成する各要素のハッシュ
値をビット並列に論理和してなる当該リスト形式の属性
のハッシュ値h(L)と、他方の関係データベースの属
性の各ハッシュ値h(L1),h(L2),〜h(Ln)との論
理積をそれぞれ求めると、 [但し、∧は論理積を示す演算子] なる関係が必ず成立するので、リスト形式の属性の要素
として他方の関係データベースの属性が含まれているこ
とを簡易に、且つ効果的に判定することぎ可能となる。
かくして上述したようにして関係データベース間の結合
条件とする属性についてのハッシュ値を、その属性がリ
スト形式で与えられる場合には、そのリストの要素のハ
ッシュ値のビット並列な論理和として求め、これらのハ
ッシュ値の照合によって結合演算を実行するか否かを判
定する本システムによれば、リスト形式のデータを含む
関係データベースに対する結合演算であっても、これを
簡易に高速に処理することができる。つまりハッシュを
インデックスとして高速に関係データベース間での結合
演算を実行することができる。この結果、従来での問題
を解消して種々の関係データベース間での結合演算処理
により、知識処理に適したデータベースを効果的に構築
していくことが可能となる。
尚、本発明は上述した実施例に限定されるものではな
い。ここでは2つの関係データベース間での結合演算に
ついて説明したが、3つ以上の関係データベース間での
結合演算についても同様に適用可能なことは勿論のこと
であり、また結合条件する属性の種類やその数について
も特に制限されるものではない。またハッシュ関数とし
ても、その属性の数や内容に応じて定めれば良いもので
あり、要は本発明はその要旨を逸脱しない範囲で種々変
形して実施することができる。
[発明の効果] 以上説明したように本発明によれば、リスト形式のデー
タを含む関係データベースについてもその結合演算を簡
易に効率良く、高速に実行することができる等の実用上
多大なる効果が奏せられる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る関係データベース演算
システムの基本的な構成を示す図、第2図は実施例シス
テムで用いられるハッシュ関数の例を示す図、第3図
(a)〜(d)はリスト形式で与えられる属性のハッシュ値の
算出例を示す図、第4図は関係データベースの結合演算
例を示す図、第5図は従来一般的なハッシュを用いた関
係データベースの結合演算の形態を示す図、第6図はハ
ッシュを用いて結合演算できなかった関係データベース
の例を示す図である。 1,2……データベース格納部、3,4……インデックス作成
部(ハッシュ値の算出手段)、5……結合演算部、6…
…結果リレーション格納部。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−225824(JP,A) 特開 昭63−225825(JP,A) 特開 昭63−286931(JP,A) ICOT TechnicalRepo rt TR−347(1988−5) 情報処理学会第35回(昭和62年後期)全 国大会講演論文集P.1609−1610 情報処理学会第36回(昭和63年前期)全 国大会講演論文集P.447−448 情報処理学会第37回(昭和63年後期)全 国大会講演論文集P.391−392

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】結合条件に係る属性が複数の要素で与えら
    れる第1の関係データベースを格納する第1のデータベ
    ース格納手段と、 結合条件に係る属性が上記第1の関係データベースの属
    性を構成する要素で与えられる第2の関係データベース
    を格納する第2のデータベース格納手段と、 前記第1のデータベース格納手段と第2のデータベース
    格納手段にそれぞれ格納された関係データベースの結合
    条件として特定される属性が複数の要素からなるリスト
    形式で与えられているか否かを判断する判断手段と、 この判断手段でそれぞれの関係データベースの属性がリ
    スト形式で与えられていると判断されたときにはその属
    性の要素のそれぞれについて所定のハッシュ関数に従っ
    て求められるハッシュ値のビット並列な論理和を求め、
    この論理和を当該属性のハッシュ値とすると共に、リス
    ト形式で与えられないときには、所定のハッシュ関数に
    従って求められるハッシュ値をそのまま当該属性のハッ
    シュ値とするインデックス作成手段と、 このインデックス作成手段でそれぞれについて求められ
    る第1及び第2の関係データベースの属性についてのハ
    ッシュ値を相互に照合し、ハッシュ値の結合演算を行う
    結合演算手段と、 この結合演算手段で演算された新たな関係データベース
    を格納する結果リレーション手段と、 を具備することを特徴とする開係データベース演算シス
    テム。
JP1139094A 1989-06-02 1989-06-02 開係データベース演算システム Expired - Lifetime JPH0675254B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1139094A JPH0675254B2 (ja) 1989-06-02 1989-06-02 開係データベース演算システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1139094A JPH0675254B2 (ja) 1989-06-02 1989-06-02 開係データベース演算システム

Publications (2)

Publication Number Publication Date
JPH035886A JPH035886A (ja) 1991-01-11
JPH0675254B2 true JPH0675254B2 (ja) 1994-09-21

Family

ID=15237355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1139094A Expired - Lifetime JPH0675254B2 (ja) 1989-06-02 1989-06-02 開係データベース演算システム

Country Status (1)

Country Link
JP (1) JPH0675254B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4620022B2 (ja) * 2006-09-12 2011-01-26 日本電信電話株式会社 メッセージ転送システムおよびメッセージ転送プログラム
JP5340222B2 (ja) * 2010-05-14 2013-11-13 日本電信電話株式会社 和集合集約処理と等結合処理の組み合わせ方法及びデータベースシステム及びプログラム
GB2498513A (en) * 2011-12-14 2013-07-24 Actix Ltd Mobile phone network management and optimisation

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63225824A (ja) * 1987-03-16 1988-09-20 Agency Of Ind Science & Technol 集合演算方式

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ICOTTechnicalReportTR−347(1988−5)
情報処理学会第35回(昭和62年後期)全国大会講演論文集P.1609−1610
情報処理学会第36回(昭和63年前期)全国大会講演論文集P.447−448
情報処理学会第37回(昭和63年後期)全国大会講演論文集P.391−392

Also Published As

Publication number Publication date
JPH035886A (ja) 1991-01-11

Similar Documents

Publication Publication Date Title
JPH11212980A (ja) インデクス作成方法および検索方法
JP2002501256A (ja) データベース装置
JP4374902B2 (ja) 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
JPH0675254B2 (ja) 開係データベース演算システム
KR101030250B1 (ko) 데이터 처리방법 및 데이터 처리 프로그램
WO2005043409A1 (ja) 表形式データの結合方法、結合装置およびプログラム
JP2000090115A (ja) インデクス作成方法および検索方法
JPH06215044A (ja) 情報検索処理装置
Datta et al. Apriori algorithm using hashing for frequent itemsets mining
JP3046221B2 (ja) 情報検索装置
JP3070093B2 (ja) レコード処理装置
JP2002140218A (ja) データ処理方法、コンピュータ読み取り可能な記録媒体及びデータ処理装置
US20040220901A1 (en) System and method for association itemset mining
CN107102862A (zh) 一种数据录入方法及装置
JP2578777B2 (ja) 多階層型デ−タベ−スのセットオカランス格納順序決定装置
JP3412168B2 (ja) ジョイン処理装置
JP3824091B2 (ja) リレーショナルデータベースシステム
JPH04156624A (ja) 知識ベースシステムにおける高速アクセス方式
JPH10326283A (ja) 文書検索システム
JPH01258125A (ja) レコードのキー順検索方式
JPH04148373A (ja) データ検索システム
JPH06251067A (ja) 並列データ検索装置
JPH11306183A (ja) データベース検索システム
JPH07319888A (ja) 索引検索方式
JPH0452967A (ja) 集合ファイルに対する論理積演算処理方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term