JPS6266326A - 日本語デ−タ整列処理方式 - Google Patents

日本語デ−タ整列処理方式

Info

Publication number
JPS6266326A
JPS6266326A JP60207506A JP20750685A JPS6266326A JP S6266326 A JPS6266326 A JP S6266326A JP 60207506 A JP60207506 A JP 60207506A JP 20750685 A JP20750685 A JP 20750685A JP S6266326 A JPS6266326 A JP S6266326A
Authority
JP
Japan
Prior art keywords
records
processing
record
read
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60207506A
Other languages
English (en)
Other versions
JPH048816B2 (ja
Inventor
Nobuhiko Mori
信彦 毛利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60207506A priority Critical patent/JPS6266326A/ja
Publication of JPS6266326A publication Critical patent/JPS6266326A/ja
Publication of JPH048816B2 publication Critical patent/JPH048816B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 日本語データのレコードを、レコード先頭の漢字とその
読みをキーとして分類整列する場合の処理方式である。
同−読みのレコード群の全レコードが、所定の作業記憶
領域にすべて入る第1の場合、各レコード全体は入らな
いが、キー情報とアドレス情報のみ入る第2の場合、そ
れらの情報も入らない第3の場合に分けて、第3の場合
はファイル装置上で分類処理し、未処理レコードが減少
して、第1または第2の場合に対応する状況になれば、
処理を切り換えて、なるべく作業記憶領域を利用して処
理効率を上げるようにする。
〔産業上の利用分野〕
本発明は、情報処理システムにおける、日本語データの
レコードを、レコード先頭の漢字とその読みをキーとし
て分類整列する場合の処理方式に関する。
日本語データの処理として、例えば人名簿を作成する場
合等、日本語データレコードの例えば姓について、姓の
読みの第1字と、第1の漢字をキー情報として、該読み
の50音順、同−読みの群内では第1漢字の文字コード
の大小順等によって分類整列する処理が必要になる。
〔従来の技術と発明が解決しようとする問題点〕第2図
は、情報処理システムの一構成例を示すブロック図であ
る。
日本語データレコードを、キー情報の読みの50音順と
、同−読み内の第1漢字の文字コードの、例えば昇順に
、分類整列する場合には、磁気ディスク装置等のファイ
ル装置1に、予め例えば入力順に順不同の配列で保持さ
れている原データファイル2を、処理装置3において、
読みのカナ1字をキーとして通常の方法で分類すること
により、同−読みのレコードに群分けされて、ファイル
装置4上に作業ファイル5が作成される。
次に処理装置3は、作業ファイル5の、同−読みのレコ
ード群ごとに、そのキー情報の第1漢字の文字コードの
昇順にレコードを整列するように、ファイル装置6へ順
次出力して、出力データファイル7を構成する。
第3図は、この整列処理の一例を説明する図である。
作業ファイル5の各レコードは、フラグ部10、キ一部
11、データ部12からなり、キ一部11には、例えば
データ部12内の姓を示すデータの、読みを示す読み情
報13と、姓の第1漢字を示す漢字情報14が含まれる
処理装置3は、例えば主記憶に作業領域8を設けて、読
み情@113の第1文字のカナが同一のレコード(図は
、第1文字が「す」の例とする)群の全レコードを作業
領域8に読み出し、各レコードの漢字情報部14を順に
相互に照合して、値の最も小さい文字コードを持つレコ
ードの1つを決定すると、そのコードを記憶し、そのレ
コードを出力データファイル7に出力し、作業領域8上
の該レコードのフラグ部10を処理済の表示にする。
次に、記憶したコード値と同一か、同一のものが無けれ
ば、新たに最も小さい値の文字コードを持つレコードの
1つを、フラグ部10に処理済の表示の無いレコード(
未処理レコードという)の中から決定し、前記と同様に
処理する。
以上の処理を、作業領域8に未処理レコードが無くなる
まで操り返して、読み「す」の群の整列処理を終わり、
次の読み(図では「夕」)の群を作業領域8へ読み込ん
で、処理を開始する。
以上の整列処理は、主記憶上に取った作業領域8の上の
データについて実行され、その間に作業ファイル5への
アクセスを必要としないので、高速に整列処理を実行す
ることができる(以下において、これを第1方式という
)。
しかし、そのためには作業領域8に1群の全レコードを
保持することが必要であり、もし作業領域8が全レコー
ドを保持し切れない大きさであった場合には、少なくと
もそのレコード群については、別の方式で処理しなけれ
ばならない。
例えばそのような相対的に大きな群については、作業フ
ァイル5からルーコードづつ順番に読み出して、それが
未処理レコードであれば、前に読み出して保持するルー
コードと比較し、両レコードのうち漢字情報14の文字
コードの大きくないルーコードを選択して保持し、次の
レコードを読み出す、という処理を1群の全レコードに
ついて操り返して、全レコードの読出し/比較処理ごと
に出力すべきルコードが決定する(以下において、これ
を第3方式という)。
第3方式によれば、群の大きさに関わらず、2レコード
を保持する作業領域があれば常に整列処理を実行するこ
とができるが、作業ファイル5へのアクセスが多くなる
ので、処理に時間を要することは明らかである。
そのために、データ量に対して作業−領域が比較的小さ
く制限される場合の別の方式(第2方式とする)として
、第4図に示すように、作業領域8には作業ファイル5
の各レコードのデータ部12の代わりにレコードアドレ
ス15を保持することにする。
こ−でレコードアドレスとは、作業ファイル5上の該レ
コード位置を示すアドレスであって、°通常は4バイト
程度のデータ長を有し、一般にレコードのデータ部12
のデータ長よりは十分に短い。
従って、このようにすることによって、作業領域8には
比較的多数のレコードの情報の保持が可能になる。
この場合、出カルコードを決定すると、そのレコードア
ドレス15によって、作業ファイル5から改めて該当レ
コードを読み出し、それを出力データファイル7へ出力
する必要があるが、キ一部に関しては第1方式の場合と
同様に、作業領域8上ですべて処理することができるの
で、第3方式よりは大幅に高速の処理ができる。
しかし、この方式をとる場合にも、準備した作業領域の
大きさを越えるレコード群については、例えば前記第3
方式によって処理しなければならない。
第5図は、以上の従来の処理の流れを示す図である。整
列処理を開始すると、処理のステップ20において、最
初の群のレコード情報を作業ファイル5から作業領域8
に読み込むことを試みる。読み込むレコード情報は、シ
ステムによって定まる、第1方式又は第2方式の情報で
ある。
その結果、ステップ21で1群の全レコードの所定情報
を作業領域8に読み込み及び設定したと判定した場合に
は、ステップ22で、第1又は第2方式による整列出力
処理を実行する。
又ステップ21で、全レコードの情報を読み込めなかっ
たと判定したときは、ステップ23に進んで、第3方式
により作業ファイル上での整列出力処理を実行する。
何れかの方式による処理を終わると、ステップ24で全
群の処理を終わったか識別し、未処理の群があればステ
ップ20へ戻り、全群完了で処理を終了する。
従って、高速に処理するためには、データ量を推定して
、作業領域8を十分に大きく確保しておく必要があり、
又その大きさが処理対象のデータ量に対して少しでも小
さい場合には、極端に処理時間が遅くなるという問題が
あった。
〔問題点を解決するための手段〕
第1図は、本発明の構成を示す処理の流れ図である。
図において、処理のステップ30は第1方式によるレコ
ード情報の読み込み、ステップ32はその結果全レコー
ドを読み込んだ場合の第1方式整列出力処理、ステップ
34は第2方式によるレコード情報の読み込み、ステッ
プ36は第2方式整列出力処理、ステップ38は第3方
式による整列出力処理、ステップ42.43は第3方式
による1ブロツクのレコード出力ごとに未処理レコード
数を監視して処理方式を切り換える制御である。
〔作 用〕
処理を開始すると、先ず前記第1方式として、作業ファ
イル5から作業領域8へ、1群の全レコードの読み込み
を行う、全レコードの読み込みに成功すればステップ3
2で第1方式によってその群の整列出力処理を完了した
後、次の群の処理があればステップ30に戻る。
全レコード読み込みができなかった場合には、ステップ
34で、第2方式のレコード情報を作業領域8に読み込
み及び設定し、群の全レコードの情報が作業領域8に入
ったときは、ステップ36で第2方式の整列出力処理を
実行した後、次の群の処理があればステップ30に戻る
第2方式のレコード情報の全レコード読み込みもできな
かった場合には、ステップ38において、第3方式によ
り整列出力のレコードを1ブロツク出力した後、ステッ
プ42.43で処理中の群の未処理レコード数をチェッ
クする。
未処理レコード数が第1方式の可能な数に減少していれ
ばステップ30に戻り、第2方式の可能な数になってい
ればステップ34に戻り、以上の何れでもなければステ
ップ38の第3方式処理を継続する。
以上の構成により、適当な大きさの作業領域8を設けて
おけば、それを越えるデータ量の場合にも、作業領域が
有効に利用されて、処理効率の改善が得られる。
〔実施例〕
第1図の、ステップ32における第1方式の整列出力処
理、ステップ36における第2方式の整列出力処理、及
びステップ38における第3方式の整列出力処理は、そ
れぞれ従来の各方式処理と同様である。
しかし、本発明により、処理方式は固定されることなく
、第1、第2、第3方式の順に、データ量と作業領域の
大きさとの関係で、可能な最も効率のよい処理方式が選
択され、且つ第3方式で処理が開始された後も、処理が
進んで未処理レコード数が減少すると、第1又は第2の
方式へ処理が自動的に切り換えられる。
即ち、処理を開始すると、先ず前記第1方式として、作
業ファイル5から作業領域8へ、1群の全レコードの読
み込みを行う、ステップ31の判定で、全レコードの読
み込みに成功していれば、ステップ32で第1方式によ
ってその群の整列出力処理を完了した後、ステップ44
で未処理の群があるか識別し、次の群の処理があればス
テップ30に戻る。
ステップ31で、全レコード読み込みができなかったと
判定した場合には、ステップ33で、読み込み試行によ
り得られた、作業領域8に保持可能なレコード数(第ル
コード数とする)を適当な記憶領域に記憶した後、ステ
ップ34で、第2方式のレコード情報を作業領域8に読
み込み及び設定する。
ステップ35で、第2方式の所要情報を全レコードにつ
いて、作業領域8に読み込んだと識別すると、ステップ
36で第2方式の整列出力処理を実行する。その後、次
の群の処理があればステップ30に戻る。
ステップ35で、第2方式のレコード情報の全レコード
読み込みもできないと識別した場合は、ステップ37で
、第2方式のレコード情報の作業領域8に保持可能なレ
コード数(第2レコード数とする)を適当な記憶領域に
記憶する。
次のステップ38で第3方式の処理を実行する。
ステップ38では、前記のように作業ファイル5の上で
レコードを順次走査して出力レコードを決定する処理を
実行し、出力レコードが決定すると、そのレコードを要
すれば出カバソファに書込み、1ブロツクの所定数の出
力レコードが出力バラファに蓄積されると、それを出力
データファイル7へ出力する。
以上のステップ38の処理のレコード走査において、処
理中の群の未処理レコード数をカウントしておき、ステ
ップ41〜43で未処理レコード数による処理の分岐を
制御する。
即ち、ステップ41の判定で、未処理レコード数が0で
あれば、ステップ44に進み、次に処理する群があれば
ステップ30に戻る。
未処理レコードがある場合、ステップ42で先に記憶し
た第ルコード数と比較し、未処理数が第ルコード数より
大きくなければ、ステップ30に戻り、残りのレコード
の処理を第1方式の処理に切り換える。
未処理レコード数が第ルコード数より大きい場合には、
ステップ43で先に記憶した第2レコード数と比較し、
未処理数が第2レコード数より大きくなければ、ステッ
プ34に戻り、残りのレコードの処理を第2方式の処理
に切り換える。
未処理レコード数が第2レコード数より大きい場合には
ステップ38に戻って第3方式の処理を継続する。
以上の構成により、適当な大きさの作業領域8を設けて
おけば、それを越えるデータ量の場合にも、作業領域が
有効に利用されて、処理効率の改善が得られる。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、日本
語データの整列出力処理において、作業領域が常に有効
に利用されるようになるので、情報処理システムの処理
効率を改善するという著しい工業的効果がある。
【図面の簡単な説明】
第1図は本発明の処理の流れ図、 第2図は情報処理システムの一構成例ブロック図、第3
図は整列処理の第1の例の説明図、第4図は整列処理の
第2の例の説明図、第5図は従来の処理の流れ図 である。 図において、 1.4.6はファイル装置、 2は原データ、     3は処理装置、5は作業ファ
イル、   7は出力データファイル、8は作業領域、
   10はフラグ部、11はキ一部、     12
はデータ部、13は読み情報、    14は漢字情報
、15はレコードアドレス、 20〜24.30〜38.41〜44は処理のステップ
第3図 第4図

Claims (1)

  1. 【特許請求の範囲】 ファイル装置に保持され、複数のレコードからなる日本
    語データを、該各レコードのキー情報の、読みの先頭文
    字と先頭の漢字をキーとして整列する処理において、 処理装置に作業用の記憶領域を設け、 該キー情報の読みの先頭文字の同一なレコードの群につ
    いて、未処理の該全レコードを該記憶領域に配列できる
    場合には、該全レコードを該記憶領域に読み出して、該
    記憶領域上のデータによって第1の前記整列処理を実行
    し、 第1の整列処理を実行することができないが、該各レコ
    ードごとの所要キー情報と該レコードの前記ファイル装
    置上の記憶アドレス情報とからなる部分情報が、該全レ
    コードについて該記憶領域に配列できる場合には、該全
    レコードの該部分情報を該記憶領域に読み出して、該記
    憶領域上のデータによって第2の前記整列処理を実行し
    、第1及び第2の整列処理を何れも実行できない場合に
    は、該ファイル装置から順次レコードを読み出して、次
    に整列するレコードを探索することによって、第3の前
    記整列処理を実行し、 第3の整列処理の実行中に、当該群の未処理レコード数
    を監視して、該未処理レコード数が第1又は第2の整列
    処理の可能なレコード数に減少した場合には、第1又は
    第2の整列処理に切り換えるように構成されていること
    を特徴とする日本語データ整列処理方式。
JP60207506A 1985-09-19 1985-09-19 日本語デ−タ整列処理方式 Granted JPS6266326A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60207506A JPS6266326A (ja) 1985-09-19 1985-09-19 日本語デ−タ整列処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60207506A JPS6266326A (ja) 1985-09-19 1985-09-19 日本語デ−タ整列処理方式

Publications (2)

Publication Number Publication Date
JPS6266326A true JPS6266326A (ja) 1987-03-25
JPH048816B2 JPH048816B2 (ja) 1992-02-18

Family

ID=16540846

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60207506A Granted JPS6266326A (ja) 1985-09-19 1985-09-19 日本語デ−タ整列処理方式

Country Status (1)

Country Link
JP (1) JPS6266326A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01286019A (ja) * 1988-04-08 1989-11-17 Internatl Business Mach Corp <Ibm> 文字ストリング処理方法
JPH0543283U (ja) * 1991-11-07 1993-06-11 株式会社クボタ 自動販売機の防犯装置
US9989861B2 (en) 2004-04-14 2018-06-05 Asml Netherlands B.V. Lithographic apparatus and device manufacturing method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01286019A (ja) * 1988-04-08 1989-11-17 Internatl Business Mach Corp <Ibm> 文字ストリング処理方法
JPH0543283U (ja) * 1991-11-07 1993-06-11 株式会社クボタ 自動販売機の防犯装置
US9989861B2 (en) 2004-04-14 2018-06-05 Asml Netherlands B.V. Lithographic apparatus and device manufacturing method

Also Published As

Publication number Publication date
JPH048816B2 (ja) 1992-02-18

Similar Documents

Publication Publication Date Title
JPH02178730A (ja) 分割法を用いた内部ソート方式
US5842208A (en) High performance recover/build index system by unloading database files in parallel
JP3515810B2 (ja) ソート処理方法および装置
JPS6266326A (ja) 日本語デ−タ整列処理方式
JP3534471B2 (ja) マージソート方法及びマージソート装置
JPH0782429B2 (ja) 複数ファイルのマージ方法
JP2923952B2 (ja) マージ処理方法
JPH03202934A (ja) データ処理装置
JPS62121532A (ja) デ−タ検索方法
JP2926803B2 (ja) ソート処理方法
JP3293551B2 (ja) ソート処理方法
JPH0267639A (ja) 優先度付き待行列制御方式
JP3293544B2 (ja) 補助記憶装置を用いたソート方式
JPS62166422A (ja) 可変長レコ−ドのソ−ト方法
JPH04199430A (ja) 優先度付き待行列制御方式
JPH05241785A (ja) ソート処理方式
JPH03290730A (ja) データの種別分類方式
JPH08235044A (ja) ジャーナル検索方式
JPH04199431A (ja) 優先度付き待行列制御方式
JPS63253431A (ja) インバ−テツド構造のデ−タベ−ス検索方式
JPH01228022A (ja) 二次元データ格納方式
JPH03259329A (ja) 大容量データのキー相対アドレス分類方式
JPH05158599A (ja) 自動実行装置
JPS61278933A (ja) デ−タのソ−ト方式
JPH0397026A (ja) データ分類装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees