JPH033249B2 - - Google Patents

Info

Publication number
JPH033249B2
JPH033249B2 JP56074565A JP7456581A JPH033249B2 JP H033249 B2 JPH033249 B2 JP H033249B2 JP 56074565 A JP56074565 A JP 56074565A JP 7456581 A JP7456581 A JP 7456581A JP H033249 B2 JPH033249 B2 JP H033249B2
Authority
JP
Japan
Prior art keywords
data
processing
sorting
attribute
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56074565A
Other languages
English (en)
Other versions
JPS57189248A (en
Inventor
Kazuhide Iwata
Yutaka Hitai
Shigeki Shibayama
Shigeru Koyanagi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56074565A priority Critical patent/JPS57189248A/ja
Priority to US06/364,872 priority patent/US4514826A/en
Priority to EP82102957A priority patent/EP0066061B1/en
Priority to DE8282102957T priority patent/DE3274774D1/de
Publication of JPS57189248A publication Critical patent/JPS57189248A/ja
Publication of JPH033249B2 publication Critical patent/JPH033249B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
本発明は関係モデルを扱うデータベースシステ
ムで必要な集合演算を高速に実行することのでき
る関係代数演算装置に関する。 データベースシステムを構築する場合、現実世
界を抽象化して計算機内部に表現するデータをモ
デル化することが必要である。従来よりいくつか
のデータモデルが提唱されているが、その代表的
なものに階層モデル、網モデル、関係モデル等が
ある。この中で、特に将来の発展が期待されてい
る関係モデルは、数学の集合論における関係の概
念を応用したもので、何らから意味(属性)を有
するデータの集まりを考えてデータベースを構成
したものである。上記階層モデルや網モデル等の
従来のモデルは、ポインタチエーンでつながれた
複雑なデータ構造を有し、応用プログラムに依存
する度合が大きかつたのに対し、関係モデルはそ
のデータが集合で表わされる為、データ構造が単
純で応用プログラムが変化しても影響を受けない
と云う大きな利点を有している。この為、将来の
大容量データベースシステムや知識データベース
システムの構築に備えて、関係モデルの実働化に
関する研究が活発に行われている。 然し乍ら、現在の汎用計算機は数値計算を高速
度に処理すことを目的として設計されている為、
上記関係モデルを汎用計算機で実働化せんとする
と、プログラムが非常に複雑化し、処理時間が長
くなつてしまう不具合があつた。つまり、関係モ
デルにあらわれる集合演算に対して従来の汎用計
算機のアーキテクチヤが本質的に不向きであり、
その対策が強く望まれていた。 本発明はこのような事情を考慮してなされたも
ので、その目的とするところは、関係モデルを扱
うデータベースシステムで必要となる集合演算を
効率良く、高速に実行することのきる簡易で実用
性の高い構成の関係代数演算装置を提供すること
にある。 即ち本発明は、2つのバツフアメモリとFIFO
機能を持つメモリとを用いてソート処理するプロ
セツサにより構成された処理エレメントを複数個
縦続に結合してソートエンジンを構成すると共
に、このソートエンジンの各プロセツサの処理プ
ロセスをそれぞれフラツグメモリに記憶してこれ
に利用したソート処理を可能ならしめて上記した
目的を効果的に達成したものである。 以下、図面を参照して本発明の実施例につき説
明する。 次表第1表は、関係モデルの一例を示すもの
で、「レコード番号」、「曲目」、「作曲家」、「レコ
ード会社」なる属性によつて関係モデル化された
「レコード目録」を示している。
【表】 しかして、このような関係モデルから、例えば
「レコード番号」と「作曲家」なる2つの属性を
選択し、これらの関係モデルを「レコード番号」
順に並べた集合を、第2表に示す如く得る場合、
ここに集合演算が必要となる。
【表】 このような集合演算を実行する場合、第1表に
示す関係モデルをメモリに格納する方式として、
次の2通りが考えられる。1つはタツプルをベー
スにして3,C,a,T,5,A,b,S……な
る組をそれぞれ形成し、これらの組を順次格納す
るやり方であり、他方は属性をベースにして3,
5,6,……,C,A,F……,a,b,c…
…,T,S,W……なる組を形成し、これらの組
を順次格納するやり方である。これらのデータ格
納の手段は、データベース設計の基本的問題であ
り、どちらが優れているかと一概に結論を下すこ
とはできないが、この例の場合には、後者の属性
をベースとする方が有利である。即ち、タツプル
をベースとした場合、上記した集合演算を行うと
き「曲目」と「レコード会社」に関するデータが
冗長となり、無駄なデータ転送時間が増加する不
具合がある。この点、後者の属性をベースにした
データ格納方式によれば、「曲目」と「レコード
会社」に関するデータを除去し、「レコード番号」
と「作曲家」に関するデータだけを転送して集合
演算を実行することが可能となるので、メモリと
集合演算装置との間のデータ転送時間の短縮化を
図ることが可能となる。但し、「レコード番号」
でソートされた新しい関係モデルを作成しようと
する場合、上記属性をベースにした処理では工夫
を必要とする。即ち、タツプルをベースとした場
合、「レコード番号」を対比して、そのタツプル
全体の属性を振分け乍らソート処理することが可
能となるに対し、属性をベースとした場合には新
たにソート処理が必要となる為である。 本発明では、上記属性をベースとした処理を実
行してデータ転送量を減らし、処理効率の向上を
図ると共に、その処理プロセスを記憶しておくこ
とによつて、他の属性のデータによる新しい関係
モデルを作成する場合でも上記不具合が生じるこ
とのないようにし、この結果、関係モデルを扱う
データベースシステムの基本的演算となる種々の
集合演算を効率良く、高速に実行できるようにし
たものである。 第1図は本発明に係る処理プロセスの概念を示
すものである。 ソートエンジンSEは、入力されたデータを所
定の規則に従つて並べ換え、つまりソート処理し
て出力するもので、フラツグメモリFは、その一
連した処理プロセスを記憶保持する如く構成され
ている。また、ソートエンジンSEは、或る属性
によつて示される組のデータをソート処理したの
ち、これに関連た他の属性のデータが入力された
とき、上記フラツグメモリにFに記憶された処理
プロセスに従つて入力データをソート処理するよ
うに構成される。 例えば第1表に示される関係モデルから、第2
表に示される関係モデルを作成する場合、先ず
「レコード番号」のデータが3,5,6,4,1,
2の順序でソートエンジンに供給される。このデ
ータに対してソートエンジンは、値の小さいデー
タから順に並び換えるソート処理を実行し、第1
図に示すように1,2,3,4,5,6なるデー
タ列を出力する。一方、このソート処理のプロセ
スは、フラツグメモリFに順次記憶され、次に入
力される他の属性のデータに対するソート処理に
供される。しかして、「作曲家」のデータがa,
b,c,d,e,fの順序でソートエンジンに供
給されると、ソートエンジンはフラグメモリに記
憶された先の処理プロセスに従つて上記データを
ソート処理する。これによつて、「作曲家」のデ
ータ、c,b,d,a,f,eの順序にソートさ
れて出力され、前記「レコード番号」のデータに
それぞれ対応した順序となる。従つて、このよう
にしてソート処理されたデータから第2表に示す
新たな関係モデルが作成されることになる。 さて、このような集合演算を実行する本発明に
係る実施例装置は、例えば第2図に示すように構
成される。また第3図は同装置の処理プロセスを
示すタイミング図である。 第2図において、ソートエンジンSEは複数
(n個)の第1の処理エレメントPE1,PE2,〜
PEoを縦続に結合して構成される。この処理エレ
メントPEk(k=0〜o)は、2つのバツフアメモリ
Mk1,Mk3とFIFO機能を持つメモリBk2を用いて
入力データを所定規則に従つてソート処理するプ
ロセツサPk、このプロセツサPkの処理態様を記
憶するフラツグメモリFMk、そしてこのフラツ
グメモリFMkを制御するアドレスカウンタACk
よつて構成される。FIFO機能を持つメモリBk2
は、データの書込みと読出しを同時アクセス可能
で、且つデータの書込み順序に従つてそのデータ
を読出すRAMにより構成されるもので、これに
よつてデータ入出力のフアーストインフアースト
アウト(First In First Out)機能が呈せられる
ようになつている。プロセツサPkは、このメモ
リBk2のFIFO機能を利用し、メモリMk1とBk2
るいはメモリMk3とBk2に格納されたデータを批
較し、所定の規則、例えば値の小さいものから先
にデータ読出しすることによつてソート処理を実
行するものである。そして、このソート処理のプ
ロセス形態が前記アドレスカウンタACkに制御さ
れるフラツメモリFMk順次格納される。またプ
ロセツサPkは、このフラツグメモリFMkに格納
された処理プロセスに従い、他の属性データを先
のデータ対応してソート処理を行う。ソートエン
ジンSEでは、このように機能する各処理エレメ
ントPE1,PE2〜PEoが縦続に、且つパイプライ
ン動作して、一連したデータのソート処理を実行
している。つまり、一段目の処理エレメントPE1
では、データが2つ入力される都度、そのデータ
を比較してソート出力している。2段目の処理プ
ロセツサPE2では、上記2つのデータによつて構
成される組データを2組入力する都度、組間のデ
ータを対比してソート処理する。この場合、自己
の組内の他のデータについてはそのソートが終了
していることから他の組のデータに対して比較を
行う。そして、例えば値の小さいデータを読出し
たのち、次のデータと対比し、これを順次繰返し
てソート処理を行う。従つてこの処理プロセツサ
PE2からはソート処理された4個のデータからな
る組データが出力されることになる。以下、各段
の処理エレメントPE2は、2組のデータを得る都
度、同様にしてソート処理を行う。尚、一方の組
のデータが全て読出された場合は、ソート処理の
所定規則に従つて、残されたデータと無限大
(∞)データと比較したり、あるいは零(0)デ
ータと比較してソート処理を実行する。そして、
このようなソート処理は、連続して入力するデー
タ対して、各段の処理エレメントPEkにおいてパ
イプライン的に順次動作して行われる。 一方、マージエンジンMEは、2つの第2の処
理エレメントRP1,RP2を並列接続して構成され
る。これらの処理エレメントRP1,RP2は、バツ
フアメモリM01,M02とFIFO機能を持つメモリ
B01,B02とを用て入力データをマージ処理する
プロセツサP01,P02およびアドレスカウンタ
AC01,AC02により制御されて上記プロセツサ
P01,P02の処理プロセスを記憶するフラツグメモ
リFM01,FM02、そして上記プロセツサP01,P02
の処理結果を格納する出力バツフアメモリOB1
OB2を備えて構成される。このマージエンジン
MEは、入力された複数の集合間の共通するデー
タを抽出する等のマージ処理を実行するもので、
プロセツサP01,P02によるマージ処理プロセスが
前記フラツグメモリFM01,FM02に格納記憶され
る。プロセツサP01,P02は、このフラツグメモリ
FM01,FM02に格納された処理プロセスに従つて
他の属性データについても同様なマージ処理する
機能を有する。尚、上記したソート処理結果のみ
を得る場合には、ソート処理結果をメモリB01
介して出力バツフアメモリOB1に格納し、そのア
クセス要求によつて読出し出力するようにすれば
よい。また出力バツフアメモリOB1,OB2にソー
ト処理結果を直接的に書込むようにしてもよいこ
とは勿論のことである。 かくしてこのように構成された装置によれば、
第3図に処理プロセスを示すように、最初に「レ
コード番号」のデータ3,5,6,4,1,2を
入力してこれをソート処理し、且つこのソートプ
ロセスをフラツグメモリFMkにそれぞれ記憶す
る。しかるのち続いて入力される「作曲家」のデ
ータa,b,c,d,e,fを上記ソート処理プ
ロセスの順序に従つてソート処理することになる
ので、ここに第2表に示す如き関係モデルを得る
ことができる。しかも、第3図から明らかなよう
に、データに対するソート処理がパイプライン的
に継続して行われるので短時間に効率良くその処
理の実行を完了する。また、或る属性についてソ
ートされた順序に従つて他の属性データも同様に
簡単にソートすることが可能となるので、その処
理が非常に簡単である。またその制御も極めて簡
単であり、実用性が高い。その上、装置構成も、
入力データ数に応じて処理エレメントを縦続に結
合すればよく、n段の処理エレメントにて2n個の
データを扱うことができるので、実用化が容易で
ある等の絶大なる効果を奏する。 尚、実施例では1つの関係から新しい関係モデ
ルを作成する例につき説明したが、複数の関係モ
デルから別の関係モデルを作成する場合も同様に
実施できる。またマージエンジンの機能を利用し
て更に別の関係モデルを作成することができるこ
とは勿論のことであり、データベースシステムに
おける各種集合演算を効果的に実行できる。 例えば検索キーワードとして与えられるデータ
の集合に従つて、大容量フアイルからこれによつ
て指定される項目(属性)を抽出し、この項目の
他の属性データをも含めて抽出して関係モデルを
作成する場合、上記検索キーワード・データをソ
ートしたのち、フアイルデータのキーワード・デ
ータを入力してマージ処理し、このマージ結果を
フラツグメモリFM01,FM02に格納してフアイル
データ中の他の属性データを抽出するようにすれ
ば、ソートエンジンSEおよびマージエンジンME
のフラツグ情報(処理プロセスデータ)を利用し
た非常に複雑な集合演算を簡易に実行することが
できる。要するに本発明はその要旨を逸脱しない
範囲で種々変形して実施することができる。
【図面の簡単な説明】
図は本発明の一実施例を示すもので、第1図は
本装置の処理プロセスの概念を示す図、第2図は
実施例装置の概略構成図、第3図は実施例装置の
処理プロセスを示すタイミング図である。 SE……ソートエンジン、ME……マージエンジ
ン、CP……制御プロセツサ、BUS……共通バ
ス、PE1,PE2,〜PEo……第1の処理エレメン
ト、M11,M21〜Mo1,M13,M23〜Mo3……バツ
フアメモリ、B12,B22〜Bo2……FIFO機能を持
つメモリ、P1,P2〜Po……プロセツサ(ソート
処理)、AC1,AC2〜ACo……アドレスカウンタ、
FM1,FM2〜FMo……フラツグメモリ、RP1
RP2……第2の処理エレメント、M01,M02……
バツフアメモリ、B01,B02……FIFO機能を持つ
メモリ、P01,P02……プロセツサ(マージ処理)、
AC01,AC02……アドレスカウンタ、FM01
FM02……フラツグメモリ、OB1,OB2……出力
バツフアメモリ。

Claims (1)

  1. 【特許請求の範囲】 1 2組の入力データを組間で相互に比較し、所
    定の規則に従つて上記入力データを順に出力して
    新たな1組のデータを生成する処理エレメントを
    複数個縦属に接続し、これらの処理エレメントを
    パイプライン動作させて入力データの列をソート
    処理するソートエンジンからなり、 前記ソートエンジンの各処理エレメントは、関
    係データベースの或る属性のデータに対して所定
    の規則に従つてソート処理したときの処理プロセ
    スを記憶するフラグメモリを備え、同じ関係デー
    タベースの他の属性データが入力されたとき、前
    記フラグメモリに記憶された処理プロセス従つて
    当該入力データに対するソート処理を実行するこ
    とを特徴とする関係代数演算装置。
JP56074565A 1981-05-18 1981-05-18 Relational algebra operating device Granted JPS57189248A (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP56074565A JPS57189248A (en) 1981-05-18 1981-05-18 Relational algebra operating device
US06/364,872 US4514826A (en) 1981-05-18 1982-04-02 Relational algebra engine
EP82102957A EP0066061B1 (en) 1981-05-18 1982-04-06 Relational algebra engine
DE8282102957T DE3274774D1 (en) 1981-05-18 1982-04-06 Relational algebra engine

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56074565A JPS57189248A (en) 1981-05-18 1981-05-18 Relational algebra operating device

Publications (2)

Publication Number Publication Date
JPS57189248A JPS57189248A (en) 1982-11-20
JPH033249B2 true JPH033249B2 (ja) 1991-01-18

Family

ID=13550861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56074565A Granted JPS57189248A (en) 1981-05-18 1981-05-18 Relational algebra operating device

Country Status (1)

Country Link
JP (1) JPS57189248A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6116326A (ja) * 1984-07-03 1986-01-24 Agency Of Ind Science & Technol ソ−ト処理装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5063855A (ja) * 1973-10-08 1975-05-30

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5063855A (ja) * 1973-10-08 1975-05-30

Also Published As

Publication number Publication date
JPS57189248A (en) 1982-11-20

Similar Documents

Publication Publication Date Title
US4514826A (en) Relational algebra engine
JPS62194533A (ja) 木構造デ−タのパタ−ンマツチング方式
CN112579586A (zh) 数据处理方法、装置、设备及存储介质
EP0398884A1 (en) A relational database representation with relational database operation capability
JPH0785244B2 (ja) 対角交換連想ル−プメモリを利用した知識検索人口知能システム
JPH033249B2 (ja)
Jaro UNIMATCH: a computer system for generalized record linkage under conditions of uncertainty
JPH08235033A (ja) オブジェクト指向データベース管理システムにおける結合演算方式
JPS6116326A (ja) ソ−ト処理装置
CN110111837A (zh) 基于两阶段结构比对的蛋白质相似性的搜索方法及系统
JPH033263B2 (ja)
JP2000250921A (ja) データベースの管理方法およびシステム
JPH04215185A (ja) 条件検索処理方式
Menon Sorting and join algorithms for multiprocessor database machines
JPS6143338A (ja) 連想技術を使用して稀薄なデータベースをサーチする方法
Fan et al. A generalized simultaneous access dictionary machine
JPH04156624A (ja) 知識ベースシステムにおける高速アクセス方式
JPS5875245A (ja) 関係代数演算装置
Xie et al. A data reusing strategy based on hive
JPS5995649A (ja) 関係代数処理装置
JPH02151971A (ja) 木構造データのノード探索方法
JPS61170840A (ja) 結合処理における中間データ生成方法
Demarchi et al. A VLSI processor array for graph isomorphism
Geng et al. A Similarity-Based Method for Entity Coreference Resolution in Big Data Environment
JPH02123472A (ja) 画像検索装置