JPH033249B2

JPH033249B2 -

Info

Publication number: JPH033249B2
Application number: JP56074565A
Authority: JP
Inventors: Kazuhide Iwata; Yutaka Hitai; Shigeki Shibayama; Shigeru Koyanagi
Original assignee: Tokyo Shibaura Electric Co Ltd
Current assignee: Toshiba Corp
Priority date: 1981-05-18
Filing date: 1981-05-18
Publication date: 1991-01-18
Also published as: JPS57189248A

Description

【発明の詳細な説明】

本発明は関係モデルを扱うデータベースシステ
ムで必要な集合演算を高速に実行することのでき
る関係代数演算装置に関する。データベースシステムを構築する場合、現実世
界を抽象化して計算機内部に表現するデータをモ
デル化することが必要である。従来よりいくつか
のデータモデルが提唱されているが、その代表的
なものに階層モデル、網モデル、関係モデル等が
ある。この中で、特に将来の発展が期待されてい
る関係モデルは、数学の集合論における関係の概
念を応用したもので、何らから意味（属性）を有
するデータの集まりを考えてデータベースを構成
したものである。上記階層モデルや網モデル等の
従来のモデルは、ポインタチエーンでつながれた
複雑なデータ構造を有し、応用プログラムに依存
する度合が大きかつたのに対し、関係モデルはそ
のデータが集合で表わされる為、データ構造が単
純で応用プログラムが変化しても影響を受けない
と云う大きな利点を有している。この為、将来の
大容量データベースシステムや知識データベース
システムの構築に備えて、関係モデルの実働化に
関する研究が活発に行われている。然し乍ら、現在の汎用計算機は数値計算を高速
度に処理すことを目的として設計されている為、
上記関係モデルを汎用計算機で実働化せんとする
と、プログラムが非常に複雑化し、処理時間が長
くなつてしまう不具合があつた。つまり、関係モ
デルにあらわれる集合演算に対して従来の汎用計
算機のアーキテクチヤが本質的に不向きであり、
その対策が強く望まれていた。本発明はこのような事情を考慮してなされたも
ので、その目的とするところは、関係モデルを扱
うデータベースシステムで必要となる集合演算を
効率良く、高速に実行することのきる簡易で実用
性の高い構成の関係代数演算装置を提供すること
にある。即ち本発明は、２つのバツフアメモリとFIFO
機能を持つメモリとを用いてソート処理するプロ
セツサにより構成された処理エレメントを複数個
縦続に結合してソートエンジンを構成すると共
に、このソートエンジンの各プロセツサの処理プ
ロセスをそれぞれフラツグメモリに記憶してこれ
に利用したソート処理を可能ならしめて上記した
目的を効果的に達成したものである。以下、図面を参照して本発明の実施例につき説
明する。次表第１表は、関係モデルの一例を示すもの
で、「レコード番号」、「曲目」、「作曲家」、「レコ
ード会社」なる属性によつて関係モデル化された
「レコード目録」を示している。

【表】しかして、このような関係モデルから、例えば
「レコード番号」と「作曲家」なる２つの属性を
選択し、これらの関係モデルを「レコード番号」
順に並べた集合を、第２表に示す如く得る場合、
ここに集合演算が必要となる。

【表】このような集合演算を実行する場合、第１表に
示す関係モデルをメモリに格納する方式として、
次の２通りが考えられる。１つはタツプルをベー
スにして３，Ｃ，ａ，Ｔ，５，Ａ，ｂ，Ｓ……な
る組をそれぞれ形成し、これらの組を順次格納す
るやり方であり、他方は属性をベースにして３，
５，６，……，Ｃ，Ａ，Ｆ……，ａ，ｂ，ｃ…
…，Ｔ，Ｓ，Ｗ……なる組を形成し、これらの組
を順次格納するやり方である。これらのデータ格
納の手段は、データベース設計の基本的問題であ
り、どちらが優れているかと一概に結論を下すこ
とはできないが、この例の場合には、後者の属性
をベースとする方が有利である。即ち、タツプル
をベースとした場合、上記した集合演算を行うと
き「曲目」と「レコード会社」に関するデータが
冗長となり、無駄なデータ転送時間が増加する不
具合がある。この点、後者の属性をベースにした
データ格納方式によれば、「曲目」と「レコード
会社」に関するデータを除去し、「レコード番号」
と「作曲家」に関するデータだけを転送して集合
演算を実行することが可能となるので、メモリと
集合演算装置との間のデータ転送時間の短縮化を
図ることが可能となる。但し、「レコード番号」
でソートされた新しい関係モデルを作成しようと
する場合、上記属性をベースにした処理では工夫
を必要とする。即ち、タツプルをベースとした場
合、「レコード番号」を対比して、そのタツプル
全体の属性を振分け乍らソート処理することが可
能となるに対し、属性をベースとした場合には新
たにソート処理が必要となる為である。本発明では、上記属性をベースとした処理を実
行してデータ転送量を減らし、処理効率の向上を
図ると共に、その処理プロセスを記憶しておくこ
とによつて、他の属性のデータによる新しい関係
モデルを作成する場合でも上記不具合が生じるこ
とのないようにし、この結果、関係モデルを扱う
データベースシステムの基本的演算となる種々の
集合演算を効率良く、高速に実行できるようにし
たものである。第１図は本発明に係る処理プロセスの概念を示
すものである。ソートエンジンSEは、入力されたデータを所
定の規則に従つて並べ換え、つまりソート処理し
て出力するもので、フラツグメモリＦは、その一
連した処理プロセスを記憶保持する如く構成され
ている。また、ソートエンジンSEは、或る属性
によつて示される組のデータをソート処理したの
ち、これに関連た他の属性のデータが入力された
とき、上記フラツグメモリにＦに記憶された処理
プロセスに従つて入力データをソート処理するよ
うに構成される。例えば第１表に示される関係モデルから、第２
表に示される関係モデルを作成する場合、先ず
「レコード番号」のデータが３，５，６，４，１，
２の順序でソートエンジンに供給される。このデ
ータに対してソートエンジンは、値の小さいデー
タから順に並び換えるソート処理を実行し、第１
図に示すように１，２，３，４，５，６なるデー
タ列を出力する。一方、このソート処理のプロセ
スは、フラツグメモリＦに順次記憶され、次に入
力される他の属性のデータに対するソート処理に
供される。しかして、「作曲家」のデータがａ，
ｂ，ｃ，ｄ，ｅ，ｆの順序でソートエンジンに供
給されると、ソートエンジンはフラグメモリに記
憶された先の処理プロセスに従つて上記データを
ソート処理する。これによつて、「作曲家」のデ
ータ、ｃ，ｂ，ｄ，ａ，ｆ，ｅの順序にソートさ
れて出力され、前記「レコード番号」のデータに
それぞれ対応した順序となる。従つて、このよう
にしてソート処理されたデータから第２表に示す
新たな関係モデルが作成されることになる。さて、このような集合演算を実行する本発明に
係る実施例装置は、例えば第２図に示すように構
成される。また第３図は同装置の処理プロセスを
示すタイミング図である。第２図において、ソートエンジンSEは複数
（ｎ個）の第１の処理エレメントPE₁，PE₂，〜
PE_oを縦続に結合して構成される。この処理エレ
メントPE_k（ｋ＝_0〜o）は、２つのバツフアメモリ
M_k1，M_k3とFIFO機能を持つメモリB_k2を用いて
入力データを所定規則に従つてソート処理するプ
ロセツサP_k、このプロセツサP_kの処理態様を記
憶するフラツグメモリFM_k、そしてこのフラツ
グメモリFM_kを制御するアドレスカウンタAC_kに
よつて構成される。FIFO機能を持つメモリB_k2
は、データの書込みと読出しを同時アクセス可能
で、且つデータの書込み順序に従つてそのデータ
を読出すRAMにより構成されるもので、これに
よつてデータ入出力のフアーストインフアースト
アウト（First In First Out）機能が呈せられる
ようになつている。プロセツサP_kは、このメモ
リB_k2のFIFO機能を利用し、メモリM_k1とB_k2あ
るいはメモリM_k3とB_k2に格納されたデータを批
較し、所定の規則、例えば値の小さいものから先
にデータ読出しすることによつてソート処理を実
行するものである。そして、このソート処理のプ
ロセス形態が前記アドレスカウンタAC_kに制御さ
れるフラツメモリFM_k順次格納される。またプ
ロセツサP_kは、このフラツグメモリFM_kに格納
された処理プロセスに従い、他の属性データを先
のデータ対応してソート処理を行う。ソートエン
ジンSEでは、このように機能する各処理エレメ
ントPE₁，PE₂〜PE_oが縦続に、且つパイプライ
ン動作して、一連したデータのソート処理を実行
している。つまり、一段目の処理エレメントPE₁
では、データが２つ入力される都度、そのデータ
を比較してソート出力している。２段目の処理プ
ロセツサPE₂では、上記２つのデータによつて構
成される組データを２組入力する都度、組間のデ
ータを対比してソート処理する。この場合、自己
の組内の他のデータについてはそのソートが終了
していることから他の組のデータに対して比較を
行う。そして、例えば値の小さいデータを読出し
たのち、次のデータと対比し、これを順次繰返し
てソート処理を行う。従つてこの処理プロセツサ
PE₂からはソート処理された４個のデータからな
る組データが出力されることになる。以下、各段
の処理エレメントPE₂は、２組のデータを得る都
度、同様にしてソート処理を行う。尚、一方の組
のデータが全て読出された場合は、ソート処理の
所定規則に従つて、残されたデータと無限大
（∞）データと比較したり、あるいは零（０）デ
ータと比較してソート処理を実行する。そして、
このようなソート処理は、連続して入力するデー
タ対して、各段の処理エレメントPE_kにおいてパ
イプライン的に順次動作して行われる。一方、マージエンジンMEは、２つの第２の処
理エレメントRP₁，RP₂を並列接続して構成され
る。これらの処理エレメントRP₁，RP₂は、バツ
フアメモリM₀₁，M₀₂とFIFO機能を持つメモリ
B₀₁，B₀₂とを用て入力データをマージ処理する
プロセツサP₀₁，P₀₂およびアドレスカウンタ
AC₀₁，AC₀₂により制御されて上記プロセツサ
P₀₁，P₀₂の処理プロセスを記憶するフラツグメモ
リFM₀₁，FM₀₂、そして上記プロセツサP₀₁，P₀₂
の処理結果を格納する出力バツフアメモリOB₁，
OB₂を備えて構成される。このマージエンジン
MEは、入力された複数の集合間の共通するデー
タを抽出する等のマージ処理を実行するもので、
プロセツサP₀₁，P₀₂によるマージ処理プロセスが
前記フラツグメモリFM₀₁，FM₀₂に格納記憶され
る。プロセツサP₀₁，P₀₂は、このフラツグメモリ
FM₀₁，FM₀₂に格納された処理プロセスに従つて
他の属性データについても同様なマージ処理する
機能を有する。尚、上記したソート処理結果のみ
を得る場合には、ソート処理結果をメモリB₀₁を
介して出力バツフアメモリOB₁に格納し、そのア
クセス要求によつて読出し出力するようにすれば
よい。また出力バツフアメモリOB₁，OB₂にソー
ト処理結果を直接的に書込むようにしてもよいこ
とは勿論のことである。かくしてこのように構成された装置によれば、
第３図に処理プロセスを示すように、最初に「レ
コード番号」のデータ３，５，６，４，１，２を
入力してこれをソート処理し、且つこのソートプ
ロセスをフラツグメモリFM_kにそれぞれ記憶す
る。しかるのち続いて入力される「作曲家」のデ
ータａ，ｂ，ｃ，ｄ，ｅ，ｆを上記ソート処理プ
ロセスの順序に従つてソート処理することになる
ので、ここに第２表に示す如き関係モデルを得る
ことができる。しかも、第３図から明らかなよう
に、データに対するソート処理がパイプライン的
に継続して行われるので短時間に効率良くその処
理の実行を完了する。また、或る属性についてソ
ートされた順序に従つて他の属性データも同様に
簡単にソートすることが可能となるので、その処
理が非常に簡単である。またその制御も極めて簡
単であり、実用性が高い。その上、装置構成も、
入力データ数に応じて処理エレメントを縦続に結
合すればよく、ｎ段の処理エレメントにて2ⁿ個の
データを扱うことができるので、実用化が容易で
ある等の絶大なる効果を奏する。尚、実施例では１つの関係から新しい関係モデ
ルを作成する例につき説明したが、複数の関係モ
デルから別の関係モデルを作成する場合も同様に
実施できる。またマージエンジンの機能を利用し
て更に別の関係モデルを作成することができるこ
とは勿論のことであり、データベースシステムに
おける各種集合演算を効果的に実行できる。例えば検索キーワードとして与えられるデータ
の集合に従つて、大容量フアイルからこれによつ
て指定される項目（属性）を抽出し、この項目の
他の属性データをも含めて抽出して関係モデルを
作成する場合、上記検索キーワード・データをソ
ートしたのち、フアイルデータのキーワード・デ
ータを入力してマージ処理し、このマージ結果を
フラツグメモリFM₀₁，FM₀₂に格納してフアイル
データ中の他の属性データを抽出するようにすれ
ば、ソートエンジンSEおよびマージエンジンME
のフラツグ情報（処理プロセスデータ）を利用し
た非常に複雑な集合演算を簡易に実行することが
できる。要するに本発明はその要旨を逸脱しない
範囲で種々変形して実施することができる。

【図面の簡単な説明】

図は本発明の一実施例を示すもので、第１図は
本装置の処理プロセスの概念を示す図、第２図は
実施例装置の概略構成図、第３図は実施例装置の
処理プロセスを示すタイミング図である。 SE……ソートエンジン、ME……マージエンジ
ン、CP……制御プロセツサ、BUS……共通バ
ス、PE₁，PE₂，〜PE_o……第１の処理エレメン
ト、M₁₁，M₂₁〜M_o1，M₁₃，M₂₃〜M_o3……バツ
フアメモリ、B₁₂，B₂₂〜B_o2……FIFO機能を持
つメモリ、P₁，P₂〜P_o……プロセツサ（ソート
処理）、AC₁，AC₂〜AC_o……アドレスカウンタ、
FM₁，FM₂〜FM_o……フラツグメモリ、RP₁，
RP₂……第２の処理エレメント、M₀₁，M₀₂……
バツフアメモリ、B₀₁，B₀₂……FIFO機能を持つ
メモリ、P₀₁，P₀₂……プロセツサ（マージ処理）、
AC₀₁，AC₀₂……アドレスカウンタ、FM₀₁，
FM₀₂……フラツグメモリ、OB₁，OB₂……出力
バツフアメモリ。

Claims

【特許請求の範囲】１２組の入力データを組間で相互に比較し、所
定の規則に従つて上記入力データを順に出力して
新たな１組のデータを生成する処理エレメントを
複数個縦属に接続し、これらの処理エレメントを
パイプライン動作させて入力データの列をソート
処理するソートエンジンからなり、前記ソートエンジンの各処理エレメントは、関
係データベースの或る属性のデータに対して所定
の規則に従つてソート処理したときの処理プロセ
スを記憶するフラグメモリを備え、同じ関係デー
タベースの他の属性データが入力されたとき、前
記フラグメモリに記憶された処理プロセス従つて
当該入力データに対するソート処理を実行するこ
とを特徴とする関係代数演算装置。