JPS6172333A - 複数ファイルのマージ方法 - Google Patents

複数ファイルのマージ方法

Info

Publication number
JPS6172333A
JPS6172333A JP19350384A JP19350384A JPS6172333A JP S6172333 A JPS6172333 A JP S6172333A JP 19350384 A JP19350384 A JP 19350384A JP 19350384 A JP19350384 A JP 19350384A JP S6172333 A JPS6172333 A JP S6172333A
Authority
JP
Japan
Prior art keywords
files
data
sorting
stored
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP19350384A
Other languages
English (en)
Other versions
JPH0782429B2 (ja
Inventor
Naohito Ide
井出 尚人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP59193503A priority Critical patent/JPH0782429B2/ja
Publication of JPS6172333A publication Critical patent/JPS6172333A/ja
Publication of JPH0782429B2 publication Critical patent/JPH0782429B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はデータ管理システムに係り、特にソート処理で
のマージ処理方式に関する。
〔従来技術〕
データ管理システムは多種多様のデータを目的の構成に
して表示する等、多分野において有効なシステムである
。たとえば、商社の営業所内の品目別の売上、営業所別
売上計算表示等その用途は多い。
このようなデータ管理システムを有効としている処理に
ソート処理、マージ処理がある。ソート処理は入力され
たデータ群、すなわち入力ファイルを指定キー順に並び
換え出力ファイルを作る処理である。たとえば、この処
理によって前述した商社においては営業所内の品目別売
上額、営業所別売上順等に入力データを並び換えること
ができる。前述した。指定キーとは並び換えを行なう時
の昇順を詣示するデータを意味し、数字アルファベット
順等がこれに対応する。前述した商社の場合には売上デ
ータが指定キーとなる。
一方、マージ処理は複数のファイルを1個のファイルに
併合する処理であり、たとえばこの処理によって営業研
削に設けられた複数の売上ファイルを1個のファイルに
まとめることができる。
〔発明が解決しようとした問題点〕
前述したソート処理は一般的にマージ処理をも含んで行
なう。従来、ソート処理でのマージでは1個のファイル
にまとめられるファイル数すなわちマージウェイ数が多
い程高効率的に処理できるとされている。しかしながら
、現在行なわれているマージ処理は単に複数のファイル
を2個のファイル単位で順次マージ処理して、最終的に
1個のファイルにする方法が多く用いられている。この
方法ではソート処理の為の指定キーの比較が1回のマー
ジ処理の為に行なわれ1次回の比較には何ら用いられる
ことはない。その為、3個以上のファイルの場合には複
数回同じ比較処理を行なうこ′      ととなり、
不必要な時間を多く費やしていた。
〔問題点を解決するための手段〕
本発明の特徴としたところは、多数のデータを管理する
データ管理装置おいて、複数のデータブロックをファイ
ル単位で記憶する第1の複数の記憶手段と、前記複数の
記憶手段よりそれぞれデータブロックを読出し前記読出
した複数のそれぞれのデータブロック内に存在する特定
データによって順序付を行なうソート手段と、前記ソー
ト手段によって順序付されたデータブロックの先頭デー
タブロックを記憶する第2の記憶手段を有することを特
徴としたマージ処理方式にある。
〔作   用〕
ソート処理された複数のファイルより指定キーに対応し
てそれぞれ1個のデータブロックを読出し、その読出し
たデータブロックに対して指定キーでソート処理を行な
い、先頭データブロックを他の目的のファイルに格納す
る。そして順次先頭データブロックが記憶されていたフ
ァイルより続くデータブロックを読出して再度ソート処
理を行ない、先頭ブロックを他の目的のファイルに格納
し、目的の単一ファイルに指定キーでソートした複数の
ファイルに格納されていたデータブロックを格納する。
〔発明の実施例〕
第1図は本発明の実施例のシステム構成図である。磁気
ディスク装置1内には複数のファイルを有し、それらの
ファイルはストリング生成部2゜入力ワークファイル管
理部3.ソートメモリ部4によって記憶しているデータ
ブロックが制御される。ストリング生成部2は単に複数
必要データブロックを特定データすなわち指定キーに含
まれる情報によってそれらの複数のデータブロックを並
べ換える回路である。入力ワークファイル管理部3は本
発明の実施例におけるソート処理においてマージ処理す
る入力ワークファイルを管理する回路であり、この回路
によってソート処理する複数のファイルのデータブロッ
クが読出されソートメモリ部4に格納される。この時の
複数のファイルからのデータブロックの読出しはあらか
じめストリング生成部2によって措定キーによる並べ換
えがなされたファイルから行なわれるので、それぞれの
ファイルから読出されたデータブロックは指定キー順に
読出される。ソートメモリ部4は前述の読出されたデー
タプロフタの指定キー順の並び換えを行なう回路である
。複数のファイルのそれぞれ内部においては、ストリン
グ生成部において指定キー順に並べられているが、それ
ぞれのファイルより読出されたデータブロックにおいて
はまだソート処理がされていない。これを行なうのがソ
ートメモリ部4である。そして並べ換えられた各データ
ブロックの先頭のデータブロックが出力ワークファイル
管理部5の制御によって磁気ディスク装置内の出力ワー
クファイルWK2に格納される。
前述した動作は単にlデータブロックを出力ワークファ
イルに格納するのではなく1全での入力ワークファイル
内のストリングデータをソートメモリ部4でソート処理
して出力ワークファイルに格納するので、前述の動作の
くりかえしによって。
最終的には複数のファイルすなわちストリング内のデー
タブロックが全てソート処理されて1間の出力ワークフ
ァイルに格納される。
第2図は前述した処理の構成をさらに詳細に表わす構成
図、第3図はその処理フローチャート図である。
処理実行が開始(START)すると先ず、マージウェ
イ数の設定処理並びに出力ワークファイル管理テーブル
5°に属する相対キーカウンタに“1”をレコード件数
カウンタに“0”を格納する処理S1を実行する。マー
ジウェイ数の設定処理とは図示しない、たとえばキーボ
ード等によってオペレータが入力し設定するものである
。200フアイル等を同時に行なうのはワークファイル
等を多く必要とした為、ファイル領域の確保ができない
場合があり、これを防止する為にオペレータによって1
回のマージ処理を行なうファイルの数を設定する。第2
図においてはそのファイル数は4(A−D)となってい
る。次に入力管理テーブル3′にもとすき入力ワークフ
ァイルWKIのフ(フィルA−Dの対称レコードをソー
トテーブル4′に格納する処理S2を行なう。入力ワー
クファイル管理テーブル3“は入力ワークファイル管理
部3が有するテーブルであり、入力ワークファイルWK
I内のファイルA−Dのそれぞれに対応したストリング
内レコード数並びに相対キー値を記憶する。第2図にお
いては4個のファイルA−Dの管理テーブルについて表
わしているが、これは後述するようにさらに複数のファ
イルのソート処理をする場合もあり第2図ファイルA゛
〜D°に対応した管理テーブルもたとえば連続して存在
する。
処理S2によってソートテーブル4′にファイルへの1
データブロツクが格納される。尚、ソートテーブル4′
はソートメモリ部4内に設けられたテーブルである。
次に実行すべきマージウェイ数分をソートテーブル4′
に格納したかの判別S3を行なう。第2図においては1
制のマージウェイ数は4であるので、NOとなり、残り
ストリング数が1であるかの判別S4を行なう。本発明
の実施例においては処理後に前述のような数の更新を行
なうので最終値は全て1″となり、この“1”を判別し
ている。前述の判別S4は現在の状態では“1”ではな
い(NO)ので次に入力すべき入力管理テーブルのポイ
ントを指定する(S5)。そして次に残ファイルすなわ
ち残ストリング数が2の時にマージウェイ数を変更する
処理S6を行なう。第1回目においては残ストリング数
は2ではないので変更されず、再度処理S2を実行し、
前述した動作をマージウェイ数回くりかえす。尚、スト
リング数がマージウェイ数の整数倍である時には処理S
6によるマージウェイ数の変更はなされない。なぜなら
ば、マージウェイ故単位で中1別処理S3で処理S7に
分岐し、全てが終了すなわちマージウェイ数の整数倍の
ストリングのソート処理が終了した時には判別処理S4
においては残ストリング数が1となり次の判別処理S8
に分岐するからである。
前述の動作のくりかえしで、ソートテーブル3“には各
ストリングすなわちファイルA−Dの先頭データブロッ
クが格納される。このイニシャル七ノドの後に順次ソー
ト処理がなされる。先ず、出力ワークファイルWK2に
格納すべきアドレス値を指定する為に、相対キーカウン
タ5″の値とレコード件数カウンタ6の値を加算して相
対キーカウンタ5″に格納し、そしてレコード件数カウ
ンタをクリアする処理S7を実行する。そして第2図に
示すソートテーブル4゛内に格納された4個のデータブ
ロックに対するソート処理S9を実行する。この処理S
9によってソートテーブル4′内に格納された各データ
ブロックは指定キー順に並ぶ。尚、テーブル内のXは先
頭データブロックであり、Yは次のデータブロックであ
る。
ソートテーブル4″の入力ワークファイル管理テーブル
5′のポインタはそれぞれファイルA〜Dの入力ワーク
ファイル管理テーブル3′のアドレス値を示し、入力ワ
ークファイル管理テーブル3°にはファイルA−Dの相
対キー値が格納されているので間接的にソートテーブル
41内でソートされたテーブルブロックの記憶位置が求
められる。第4図はファイルA−Dすなわち各ストリン
グとソートテーブル4″の関係を直接的に表わした構成
図である。各ストリングA−Dの#ルコード〜#100
レコードはそれぞれデータブロックであり、そのデータ
ブロックがソートテーブル4′に格納されている。第2
図並びに第4図においてはファイルA−Dと同順でソー
トテーブル3にデータブロックが格納されているが、こ
れは単にそのような順に結果がなった場合であり、この
ソートテーブル4′に格納されている順は指定キー類と
なる。尚、ファイルA−Dと対応した順にソートした結
果がならなくとも入力ワークファイル管理テーブルポイ
ンタ7がそれぞれ並びかえられたファイルを表わしてい
るので対応関係はこのポインタ7とテーブル31によっ
て求められる。
ソート処理S9によって指定キー類にならべられたデー
タブロックの先頭データブロックすなわち最小レコード
Xを出力ワークファイルWK2の相対キーカウンタ5″
で指定される位置に格納S10しレコード件数カウンタ
5″を+1(510)f“      すお。尚、出カ
ワー27.イア、管理ヶ−7”JL15・は、後述する
が、マージウェイ数がソートすべき全ストリング数より
小さい場合に分割してマージウェイ数で行ない、さらに
それらの結果を分割してマージした単位でソート処理す
る時に必要となる管理テーブルである。
次に出力対称すなわち出力されたデータブロックXに対
応した入力管理テーブル3“を更新S11し相対キー値
を+1する。管理テーブル3fの更新処理Sit後、後
方出力対称ったストリングすなわちファイルがソート終
了であるかと判別する為、入力管理テーブル3°内のス
トリング内レコード数が1であるかを判別S12する。
1でない時すなわちNoの時には出力されたデータブロ
ックに対応するファイルA−Dより新比較対称レコード
すなわちデータブロックをソートテーブル41に補充S
13しレコード数を−1する。そして新比較対称レコー
ドの指定キーとソートテーブル4′内の次のレコードす
なわちYの指定キーとを比較し1等しいあるいはそれよ
り先の場合にはソートテーブル4′内には指定キー類に
格納されていることになり、処理SIOより再度実行す
る。それ以外の時にはソートをしなおす必要があるので
、ソート処理S9より実行する。尚1図中A、Bは処理
が続くことを表わす接続子である。
一方1判別312において、ストリング内レコード数が
1の時には、出力対称となったファ゛イルA−Dのうち
の1個のデータブロックが全てソートされたものである
ので、他のファイルも全て出力終了したかを判別S15
する。全て出力していない場合には残りのファイルに対
してソート処理を行なわなくてはならないので、再度残
りのファイルに対してソートする為処理9より再度くり
かえず。全て終了した場合には出力管理テーブル5゜仝
ストリング数、ストリング内レコード数、相対キー値に
更新処理516j、、出力管理テーブル5“に再度行な
うファイルのソート処理出力の管理テーブルを作成する
。これは次のストリング内レコード数と相対キー値を格
納する為のエリアを確保する為の処理である。そして処
理S2より再度。
たとえば新しいファイルA1〜D′のソートを行なう為
の処理をくりかえす。
前述の動作により特定のマージウェイ数たとえば第2図
においては4個単位でソートされてファイルA−D、A
’〜D9がそれぞれ11固のファイルとして出力ワーク
ファイルWK2に格納される。
この状態すなわちマージウェイ数単位で入力ワークファ
イルWKI内のファイルA−D、A’〜D1が全てソー
トされたか否かを判別する。ここでは出力管理テーブル
5“の全ストリング数すなわち出力ワークファイルWK
2が1個となったか否かを判別する。1個でない時には
それらのソートされ出力された出力ワークファイルの内
容を再度ソートする為、出力管理テーブル4“の内容を
入力管理テーブル21に格納S l 7 L、 さらに
ワークファイルWK2の内容を入力ワークファイルWK
1に格納S18する。尚、前述のテーブルのデータの移
動は直接データを移動しているがこの移動のかわりにポ
インタによってテーブル等のアドレスを指定して処理す
るシステムの場合には車にテーブルやファイルのボイン
ク値たとえば先短アドレスを変更することに等制約なデ
ータ等の移動が可能となる。処理317,518の実行
後再度前述した処理S2以後をくりかえすことによって
最終的には1個のストリングになり、ソート処理におけ
るマージ処理を終了する。
〔発明の効果〕
以上述べたように本発明はソート済みストリングファイ
ルすなわち複数の入力ワークファイルを同時に1デ一タ
ブロフク単位で読出してソート処理し、それを複数回く
りかえしし、ソート処理におけるマージ処理を行なうの
で、ソートにおける比較に無駄がなく1本発明によれば
短い時間でソート処理におけるマージ処理方式を得るこ
とができる。
【図面の簡単な説明】
第1図は本発明の実施例のシステム構成図、第2図は処
理の構成図、第3図は処理のフローチャート図、第4図
は入力ワークファイルとツートチ、    −プルの関
係を表わす構成図である。 ■・・・磁気ディスク装置、   2・・・ストリング
生成部、   3・・・入力ワークファイル管理rq+
、    3’ ・・・入力ワークファイル管理テーブ
ル、   4・・・ソートメモリ部、   4°・・・
ソートテーブル、   5・・・出力ワークファイル管
理部、   51・・・出力ワークファイル管理テーブ
ル、   5′′・・・相対キーカウンタ、   6・
・・レコード件mカウンタ。 A−D、A’〜D′、ストリング(ファイル)。 WKI・・・入力ワークファイル、    WK2・・
・出力ワークファイル

Claims (2)

    【特許請求の範囲】
  1. (1)多数のデータを管理するデータ管理装置において
    、複数のデータブロックをファイル単位で記憶する第1
    の複数の記憶手段と、前記複数の記憶手段よりそれぞれ
    データブロックを読出し前記読出した複数のそれぞれの
    データブロック内に存在する特定データによって、順序
    付を行なうソート手段と、前記ソート手段によって順序
    付されたデータブロックの先頭データブロックを記憶す
    る第2の記憶手段を有することを特徴としたマージ処理
    方式。
  2. (2)前記ソート手段は前記第2の記憶手段に先頭デー
    タブロックが記憶された時に前記先頭ブロックが記憶さ
    れていたファイルより続くデータブロックを読出し再度
    順序付を行なうことを繰り返すことを特徴とした特許請
    求の範囲第1項記載のマージ処理方式。
JP59193503A 1984-09-15 1984-09-15 複数ファイルのマージ方法 Expired - Lifetime JPH0782429B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59193503A JPH0782429B2 (ja) 1984-09-15 1984-09-15 複数ファイルのマージ方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59193503A JPH0782429B2 (ja) 1984-09-15 1984-09-15 複数ファイルのマージ方法

Publications (2)

Publication Number Publication Date
JPS6172333A true JPS6172333A (ja) 1986-04-14
JPH0782429B2 JPH0782429B2 (ja) 1995-09-06

Family

ID=16309131

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59193503A Expired - Lifetime JPH0782429B2 (ja) 1984-09-15 1984-09-15 複数ファイルのマージ方法

Country Status (1)

Country Link
JP (1) JPH0782429B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6327926A (ja) * 1986-07-22 1988-02-05 Toshiba Corp 文書作成装置
JPS6433628A (en) * 1987-07-30 1989-02-03 Nippon Telegraph & Telephone Merging processor
JPH01177122A (ja) * 1988-01-07 1989-07-13 Hitachi Ltd ソート処理装置
JPH01248232A (ja) * 1988-03-15 1989-10-03 Internatl Business Mach Corp <Ibm> レコード列組合せ方法
JPH0324617A (ja) * 1989-06-21 1991-02-01 Nec Corp データ処理方式
JPH08129478A (ja) * 1994-10-31 1996-05-21 Nec Corp 同値キーが存在するデータのソート方式

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5958852U (ja) * 1982-10-12 1984-04-17 株式会社明電舎 デ−タ処理装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5958852U (ja) * 1982-10-12 1984-04-17 株式会社明電舎 デ−タ処理装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6327926A (ja) * 1986-07-22 1988-02-05 Toshiba Corp 文書作成装置
JPS6433628A (en) * 1987-07-30 1989-02-03 Nippon Telegraph & Telephone Merging processor
JPH01177122A (ja) * 1988-01-07 1989-07-13 Hitachi Ltd ソート処理装置
JPH01248232A (ja) * 1988-03-15 1989-10-03 Internatl Business Mach Corp <Ibm> レコード列組合せ方法
JPH0324617A (ja) * 1989-06-21 1991-02-01 Nec Corp データ処理方式
JPH08129478A (ja) * 1994-10-31 1996-05-21 Nec Corp 同値キーが存在するデータのソート方式

Also Published As

Publication number Publication date
JPH0782429B2 (ja) 1995-09-06

Similar Documents

Publication Publication Date Title
CA1214284A (en) Sparse array bit map used in data bases
EP0339901A2 (en) Improved version management tool
JPH02178730A (ja) 分割法を用いた内部ソート方式
JPS6172333A (ja) 複数ファイルのマージ方法
JP2005135221A (ja) 表形式データの結合方法、結合装置およびプログラム
JPS62287350A (ja) インデツクス一括更新方式
JPH06215044A (ja) 情報検索処理装置
JP2604787B2 (ja) 二次元データ格納方式
JPH01302466A (ja) 商品マスタ管理方式
JPS62118435A (ja) 複数インデツクス生成方式
JPS63149728A (ja) 索引生成方式
JPH0449436A (ja) インデックス生成方式
JPH04138575A (ja) 有限要素データ再作成装置
JPS61279927A (ja) 部品表管理方式
JPH05307571A (ja) 情報検索システム
JPS63228244A (ja) レコ−ドの格納制御方式
JPH06149635A (ja) レコード追加処理方法
JPS63172334A (ja) デ−タベ−スシステムのデ−タ処理方式
JPS62282372A (ja) ライブラリ管理方式
JPH02259942A (ja) データベース世代管理処理方式
JPS63126030A (ja) ソ−ト処理方式
JPH04320572A (ja) データ処理装置
JPH06223060A (ja) 属性管理方法およびその装置
JPH06274391A (ja) マスタファイル高速更新処理方式
JPS6379147A (ja) デ−タベ−ス格納設計装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term