JPH0397026A - データ分類装置 - Google Patents

データ分類装置

Info

Publication number
JPH0397026A
JPH0397026A JP23398789A JP23398789A JPH0397026A JP H0397026 A JPH0397026 A JP H0397026A JP 23398789 A JP23398789 A JP 23398789A JP 23398789 A JP23398789 A JP 23398789A JP H0397026 A JPH0397026 A JP H0397026A
Authority
JP
Japan
Prior art keywords
records
sorting
storage means
record
sort
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP23398789A
Other languages
English (en)
Inventor
Makoto Kimura
誠 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP23398789A priority Critical patent/JPH0397026A/ja
Publication of JPH0397026A publication Critical patent/JPH0397026A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野1 この発明は、レコードデータを迅速にソートするのに好
適なデータ分類装置に関する。
[従来の技術] 従来、磁気ディスク等の外部メモリに格納された大量の
レコードデータをレコード単位でソートする場合、ソー
ト対象のレコード群を内部メモリのメモリ容量に応じて
複数ブロックに分割し、内部メモリ上でブロック別にソ
ート処理を行い、そのブロック別のソート結果に基づい
てさらに各ブロック間で再ソート処理を行っていた。
[発明が解決しようとする課M] このように、大量のレコードについてソートするときは
、複数ブロックに分割してソート処理を行うので、各ブ
ロック間での再ソート処理が必要になり、ソート処理に
長時間を要していた。
これは、ソート処理の特性を考慮せず、元のレコード形
態のままでソート処理を行っているため、内部メモリに
多数のレコードを展開できないことに起因するものと考
えられる. してみれば、ソート処理に支障を来たさない範囲でレコ
ードを圧縮し、圧縮したレコードに基づいてソート処理
ができ・れば、迅速にソート処理を行えることは明らか
である. この発明の課題は、レコードを圧縮してソート処理を行
えるようにすることである。
[課題を解決するための手段] この発明の手段は次の通りである。
外部記憶手段a(第1図の機能ブロック図を参照、以下
同じ)は、複数のレコードを記憶する。
変換手段bは、外部記憶手段a内のレコードを順次読出
し、キーワード、及び外部記憶手段aにおける記憶位置
情報からなるソート用レコードに変換する. 内部記憶手段Cは、変換手段bにより変換されたソート
用レコードを記憶する. ソート手段dは、内部記憶手段C内のソート用レコード
をキーワードに基づいてソートする。
逆変換手段eは、ソート手段dにてソートされたソート
用レコードを記憶位置情報に基づいて元のレコード形態
に逆変換して外部記憶手段aに格納する。
[作用] この発明の手段の作用は次の通りである。
今、外部記憶手段aは、50本のレコードを記憶し、各
レコード上にはキーワードを含む6ワードが存在し、こ
れらレコードの総データ量は、内部記憶手段Cのメモリ
容量の3倍弱であるものとする。
変換手段bは、外部記憶手段a内の50本のレコードを
順次読出し、キーワード以外の他のワードを削除し、キ
ーワードと、外部憶手段aにおける当該レコードの記憶
位置情報からなるソート用レコードに変換する。そして
、内部記憶手段Cは、変換手段bにより変換されたソー
ト用レコードを記憶するが、記憶位置情報がlワードの
データ量に相当するとするとソート用レコードは2ワー
ド分のデータ量となり、元のレコードの1/3に圧縮さ
れているので、内部記憶手段Cには、外部記憶手段a内
の50本のレコードに対応する50本のソート用レコー
ドの全てが一度に記憶される.そして、ソート手段dは
、内部記憶手段C内の50本のソート用レコードをキー
ワードに基づいてソートする。すなわち、この場合、ソ
ート手段dは、外部記憶手段a内の50本のレコードに
ついて、ブロックに分割することなく、内部記憶手段C
上で一度にソート処理を行う。従って、ブロック間での
再ソートの必要はなくなる.次に、逆変換手段eは、ソ
ート手段dにてソートされた50本の各ソート用レコー
ド内の記憶位置情報に基づいて元のレコードを読出して
、外部記憶手段aの所定エリアに格納する等、ソート用
レコードを元のレコードに逆変換して外部記憶手段aに
格納する. 従って、レコードを圧縮してソート処理を行え、ソート
処理が短時間で完了する。
[実施例] 以下、一実施例を第2図ないし第4図を参照しながら説
明する. 第2図は、データ分類装置のブロック構成図であり、外
部磁気ディスク1、内部メモリ2、ソート処理部3、変
換部4、デリミタ検出部5、カウンタ6、逆変換部7を
有している。
外部磁気ディスク1には、内部メモリ2のメモリ容量を
越える大量の可変長レコードが格納されている。
内部メモリ2は、外部磁気ディスク1に格納された可変
長レコードをソート処理するためのワークメモリとして
活用される. ソート処理部3は、変換部4から内部メモリ2に転送さ
れたレコードを、キーワードに基づいてソートする. 変換部4は、外部磁気ディスク1内の可変長レコードを
順次読出し、キーワード以外のワードを削除し、所定の
再変換用の情報を付加したソート用レコードに圧縮変換
し、内部メモリ2に転送する.変換部4は、ソート用レ
コードに圧縮変換するに際し、デリミタ検出部5、およ
びカウンタ6を活用する. 逆変換部7は、ソート処理部3にて内部メモリ2上でソ
ートされたソート用レコードを、キーワードに付加され
た逆変換用の情報に基づいて元のレコード形態に逆変換
し、外部磁気ディスク1に格納する. 次に、ソート処理を第3図及び第4図を参照しながら説
明する. 最初に変換部4によるレコード圧縮処理を説明するが、
このレコード圧縮処理を第3図に概念的に示したので、
第3図を適時参照されたい。
変換部4は、先ず、カウンタ6をリセットして、クロッ
クパルスに同期して外部磁気ディスク1にリードアドレ
スを出力し可変長レコード上のデータを読出す.この際
、デリミタ検出部5は、読出されたデータを監視してデ
リミタの読出しを検出している。
そして、デリミタ検出部5により、レコードのスタート
を示すデリミタ“(゛が検出されたときは、変換部4は
、その時点のリードアドレスをラッチすると共に、次の
デリミタ、すなわち各ワード間の区切りを示すデリミタ
゛.゜゜が検出されるまで、読出しに係るデータ、すな
わち、キーワードをラッチする.そして、次のレコード
スタート用デリミタ“(”が読出されたときは、その時
点でのカウンタ6の内容を、前のレコードのデータ数(
レングス)としてラッチし、それまでのラッチ内容であ
るキーワード、レコードスタートアドレス、レングスか
らなるソート用レコードを作戒して、内部メモリ2にロ
ードする。そして、カウンタ6をリセットして、その時
点のリードアドレスをラッチする等の同様の処理を繰り
返していく。
このようにして、変換部4は、外部磁気ディスク1から
の可変長レコードを圧縮したソート用レコードを作成し
、内部メモリ2に転送する。
ソート処理部3は、内部メモリ2内の複数のソート用レ
コードに対し、各レコード上のキーワードに基づいてソ
ート処理を行う. 逆変換部7は、内部メモリ2上でソートされたソート用
レコードを先頭から順に読出し、そのレコード上のレコ
ードスタートアドレスから始まるレングス分の各アドレ
スをリードアドレスとして外部磁気ディスク1をアクセ
スして、ソート用レコードに対応する元のレコードを読
出し、その元のレコードを外部磁気ディスクの所定領域
に順次格納していく。
以上の一連のソート処理を第4図を参照しながら、補足
説明する. 外部磁気ディスク1には、第4図(a)に示したように
、数値で表現されたキーワードと、5個の可変長ワード
からなる複数のレコードが記憶されているものとする。
この場合、外部磁気ディスクlの各レコードは、先頭か
ら順に読出され、変換部4により、第4図(b)に示し
たように、キーワードと、レコードスタート用デリミタ
“(”の外部磁気ディスク1上での格納位置を示すアド
レス〈st1、st2、・・・)と、当該レコードのレ
ングス(61112、・・・)とからなるソート用レコ
ードに変換される. この場合、アドレス、レングスは共にl〜2バイトで表
現できるので、アドレスとレングスからなる記憶位置情
報のデータ量は、2〜4バイトとなる。一方、各ワード
は、例えば、JISコードによる3個の漢字で表現され
たワードでは、データ量は6バイトとなる。従って、通
常、記憶位置情報のデータ量は、lワード分のデータ量
を越えることはない。従って、ソート用レコードは、少
なくとも元のレコードの2/5以下に圧縮されているこ
とになる。
このように圧縮されたソート用レコードは、内部メモリ
2に展開され、ソート処理部3により、例えば、第4図
(C)に示したように、数値で表現されたキーワードの
昇順にソートされる。
そして、ソートされたソート用レコードは、逆変換部7
により、第4図(d)に示したように、元のレコード形
態に逆変換され、ソートされた状態で外部磁気ディスク
1の所定エリアに格納される. このように圧縮されたソート用レコードによりソート処
理が行われるので、上記のように、2/5以下に圧縮し
た場合には、内部メモリ2の約5/2倍の外部磁気ディ
スク1上のレコード群を、複数ブロックに分割すること
なく、一度にソートできる.従って、ブロック間での再
ソートの必要がなくなり、内部メモリ2のメモリ容量を
越える大量のレコードを迅速にソートできる.また、例
え、圧縮したソート用レコードの全てを内部メモリ2に
一度に展開出来ない場合であっても、分割ブロック数を
減らすことができ、ブロック間での再ソート処理の時間
を大幅に短縮できる.なお、この発明は、上述の実施例
に限定されることなく、例えば、ソート対象のレコード
は固定長レコードであっても良い.この場合はカウンタ
6によりレコードのレングスを監視する必要はない [発明の効果] この発明によれば、レコードを圧縮してソート処理を行
え、内部メモリのメモリ容量を越える大量のレコードを
高速にソートできる。
【図面の簡単な説明】
第1図はこの発明の機能ブロック図、第2図は実施例の
ブロック構成図、第3図はレコードの圧縮処理を概念的
に示す図、第4図は一連のソート処理の流れを示す系統
図である。 1・・・外部磁気ディスク、2・・・内部メモリ、3−
・・ソート処理部、4・・・変換部、7−・・逆変換部

Claims (1)

  1. 【特許請求の範囲】 複数のレコードを記憶する外部記憶手段と、この外部記
    憶手段内のレコードを順次読出し、キーワード、及び上
    記外部憶手段における記憶位置情報からなるソート用レ
    コードに変換する変換手段と、 この変換手段により変換されたソート用レコードを記憶
    する内部記憶手段と、 この内部記憶手段内のソート用レコードをキーワードに
    基づいてソートするソート手段と、このソート手段にて
    ソートされたソート用レコードを記憶位置情報に基づい
    て元のレコード形態に逆変換して上記外部記憶手段に格
    納する逆変換手段と、 を備えることを特徴とするデータ分類装置。
JP23398789A 1989-09-08 1989-09-08 データ分類装置 Pending JPH0397026A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23398789A JPH0397026A (ja) 1989-09-08 1989-09-08 データ分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23398789A JPH0397026A (ja) 1989-09-08 1989-09-08 データ分類装置

Publications (1)

Publication Number Publication Date
JPH0397026A true JPH0397026A (ja) 1991-04-23

Family

ID=16963769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23398789A Pending JPH0397026A (ja) 1989-09-08 1989-09-08 データ分類装置

Country Status (1)

Country Link
JP (1) JPH0397026A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226411B1 (en) 1997-01-31 2001-05-01 Fujitsu Limited Method for data compression and restoration

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226411B1 (en) 1997-01-31 2001-05-01 Fujitsu Limited Method for data compression and restoration

Similar Documents

Publication Publication Date Title
JP3217781B2 (ja) 多重レベルを利用するデータ圧縮
EP0380294A1 (en) String matching
US6424970B1 (en) Sorting system and method executed by plural computers for sorting and distributing data to selected output nodes
US6442553B1 (en) Hash system and hash method for transforming records to be hashed
US5710919A (en) Record compression
JPH01297723A (ja) ソート処理装置
JPH0397026A (ja) データ分類装置
US5873001A (en) Method for rapid expansion of multi-byte sorting weights table to include user supplied sorting weights
JPH0397027A (ja) データ分類装置
JPH048816B2 (ja)
JPS62121532A (ja) デ−タ検索方法
US5581751A (en) Key extraction apparatus and a key extraction method
JPH0267648A (ja) ツリー構造データベースのレコード追加方式
EP0111689A2 (en) Method of storing a B-tree type index file on rotating media devices
JPH048815B2 (ja)
JPH02127742A (ja) 空き領域検索方式
JPH0228846A (ja) データ格納方式
JPH01288920A (ja) データソート装置
JPH0199125A (ja) リンク分類方式
JPH09330322A (ja) データ検索装置
JPH04160441A (ja) 複数索引再生成方式
JPH01258125A (ja) レコードのキー順検索方式
JPS62166422A (ja) 可変長レコ−ドのソ−ト方法
JPH05298070A (ja) ソート処理装置
JPH03282646A (ja) レコード格納制御方式