JPH048816B2 - - Google Patents

Info

Publication number
JPH048816B2
JPH048816B2 JP60207506A JP20750685A JPH048816B2 JP H048816 B2 JPH048816 B2 JP H048816B2 JP 60207506 A JP60207506 A JP 60207506A JP 20750685 A JP20750685 A JP 20750685A JP H048816 B2 JPH048816 B2 JP H048816B2
Authority
JP
Japan
Prior art keywords
records
record
processing
information
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60207506A
Other languages
English (en)
Other versions
JPS6266326A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP60207506A priority Critical patent/JPS6266326A/ja
Publication of JPS6266326A publication Critical patent/JPS6266326A/ja
Publication of JPH048816B2 publication Critical patent/JPH048816B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔概要〕 日本語データのレコードを、レコード先頭の漢
字とその読みをキーとして分類整列する場合の処
理方式である。同一読みのレコード群の全レコー
ドが、所定の作業記憶領域にすべて入る第1の場
合、各レコード全体は入らないが、キー情報とア
ドレス情報のみ入る第2の場合、それらの情報も
入らない第3の場合に分けて、第3の場合はフア
イル装置上で分類処理し、未処理レコードが減少
して、第1または第2の場合に対応する状況にな
れば、処理を切り換えて、なるべく作業記憶領域
を利用して処理効率を上げるようにする。
〔産業上の利用分野〕
本発明は、情報処理システムにおける、日本語
データのレコードを、レコード先頭の漢字とその
読みをキーとして分類整列する場合の処理方式に
関する。
日本語データの処理として、例えば人名簿を作
成する場合等、日本語データレコードの例えば姓
について、姓の読みの第1字と、第1の漢字をキ
ー情報として、該読みの50音順、同一読みの群内
では第1漢字の文字コードの大小順等によつて分
類整列する処理が必要になる。
〔従来の技術と発明が解決しようとする問題点〕
第2図は、情報処理システムの一構成例を示す
ブロツク図である。
日本語データレコードを、キー情報の読みの50
音順と、同一読み内の第1漢字の文字コードの、
例えば昇順に、分類整列する場合には、磁気デイ
スク装置等のフアイル装置1に、予め例えば入力
順に順不同の配列で保持されている原データフア
イル2を、処理装置3において、読みのカナ1字
をキーとして通常の方法で分類することにより、
同一読みのレコードに群分けされて、フアイル装
置4上に作業フアイル5が作成される。
次に処理装置3は、作業フアイル5の、同一読
みのレコード群ごとに、そのキー情報の第1漢字
の文字コードの昇順にレコードを整列するよう
に、フアイル装置6へ順次出力して、出力データ
フアイル7を構成する。
第3図は、この整列処理の一例を説明する図で
ある。
作業フアイル5の各レコードは、フラグ部1
0、キー部11、データ部12からなり、キー部
11には、例えばデータ部12内の姓を示すデー
タの、読みを示す読み情報13と、姓の第1漢字
を示す漢字情報14が含まれる。
処理装置3は、例えば主記憶に作業領域8を設
けて、読み情報13の第1文字のカナが同一のレ
コード(図は、第1文字が「サ」の例とする)群
の全レコードを作業領域8に読み出し、各レコー
ドの漢字情報部14を順に相互に照合して、値の
最も小さい文字コードを持つレコードの1つを決
定すると、そのコードを記憶し、そのレコードを
出力データフアイル7に出力し、作業領域8上の
該レコードのフラグ部10を処理済の表示にす
る。
次に、記憶したコード値と同一か、同一のもの
が無ければ、新たに最も小さい値の文字コードを
持つレコードの1つを、フラグ部10に処理済の
表示の無いレコード(未処理レコードという)の
中から決定し、前記と同様に処理する。
以上の処理を、作業領域8に未処理レコードが
無くなるまで繰り返して、読み「サ」の群の整列
処理を終わり、次の読み(図では「タ」)の群を
作業領域8へ読み込んで、処理を開始する。
以上の整列処理は、主記憶上に取つた作業領域
8の上のデータについて実行され、その間に作業
フアイル5へのアクセスを必要としないので、高
速に整列処理を実行することができる(以下にお
いて、これを第1方式という)。
しかし、そのためには作業領域8に1群の全レ
コードが保持することが必要であり、もし作業領
域8が全レコードを保持し切れない大きさであつ
た場合には、少なくともそのレコード群について
は、別の方式で処理しなければならない。
例えばそのような相対的な大きな群について
は、作業フアイル5から1レコードづつ順番に読
み出して、それが未処理レコードであれば、前に
読み出して保持する1レコードと比較し、両レコ
ードのうち漢字情報14の文字コードの大きくな
い1レコードを選択して保持し、次のレコードを
読み出す、という処理を1群の全レコードについ
て繰り返して、全レコードの読出し/比較処理ご
とに出力すべき1レコードが決定する(以下にお
いて、これを第3方式という)。
第3方式によれば、群の大きさに関わらず、2
レコードを保持する作業領域があれば常に整列処
理を実行することができるが、作業フアイル5へ
のアクセスが多くなるので、処理に時間を要する
ことは明らかである。
そのために、データ量に対して作業領域が比較
的小さく制限される場合の別の方式(第2方式と
する)として、第4図に示すように、作業領域8
には作業フアイル5の各レコードのデータ部12
の代わりにレコードアドレス15を保持すること
にする。
ここでレコードアドレスとは、作業フアイル5
上の該レコード位置を示すアドレスであつて、通
常は4バイト程度のデータ長を有し、一般にレコ
ードのデータ部12のデータ長よりは十分に短
い。従つて、このようにすることによつて、作業
領域8には比較的多数のレコードの情報の保持が
可能になる。
この場合、出力1レコードを決定すると、その
レコードアドレス15によつて、作業フアイル5
から改めて該当レコードを読み出し、それを出力
データフアイル7へ出力する必要があるが、キー
部に関しては第1方式の場合と同様に、作業領域
8上ですべて処理することができるので、第3方
式よりは大幅に高速の処理ができる。
しかし、この方式をとる場合にも、準備した作
業領域の大きさを越えるレコード群については、
例えば前記第3方式によつて処理しなければなら
ない。
第5図は、以上の従来の処理の流れを示す図で
ある。整列処理を開始すると、処理のステツプ2
0において、最初の群のレコード情報を作業フア
イル5から作業領域8に読み込むことを試みる。
読み込みレコード情報は、システムによつて定ま
る、第1方式又は第2方式の情報である。
その結果、ステツプ21で1群の全レコードの
所定情報を作業領域8に読み込み及び設定したと
判定した場合には、ステツプ22で、第1又は第
2方式による整列出力処理を実行する。
又ステツプ21で、全レコードの情報を読み込
めなかつたと判定したときは、ステツプ23に進
んで、第3方式により作業フアイル上での整列出
力処理を実行する。
何れかの方式による処理を終わると、ステツプ
24で全群の処理を終わつたか識別し、未処理の
群があればステツプ20へ戻り、全群完了で処理
を終了する。
従つて、高速に処理するためには、データ量を
推定して、作業領域8を十分に大きく確保してお
く必要があり、又その大きさが処理対象のデータ
量に対して少しでも小さい場合には、極端に処理
時間が遅くなるという問題があつた。
〔問題点を解決するための手段〕
第1図は、本発明の構成を示す処理の流れ図で
ある。
図において、処理のステツプ30は第1方式に
よるレコード情報の読み込み、ステツプ32はそ
の結果全レコードを読み込んだ場合の第1方式整
列出力処理、ステツプ34は第2方式によるレコ
ード情報の読み込み、ステツプ36は第2方式整
列出力処理、ステツプ38は第3方式による整列
出力処理、ステツプ42,43は第3方式による
1ブロツクのレコード出力ごとに未処理レコード
数を監視して処理方式を切り換える制御である。
〔作用〕
処理を開始すると、先ず前記第1方式として、
作業フアイル5から作業領域8へ、1群の全レコ
ードの読み込みを行う、全レコードの読み込みに
成功すればステツプ32で第1方式によつてその
群の整列出力処理を完了した後、次の群の処理が
あればステツプ30に戻る。
全レコード読み込みができなかつた場合には、
ステツプ34で、第2方式のレコード情報を作業
領域8に読み込み及び設定し、群の全レコードの
情報が作業領域8に入つたときは、ステツプ36
で第2方式の整列出力処理を実行した後、次の群
の処理があればステツプ30に戻る。
第2方式のレコード情報の全レコード読み込み
もできなかつた場合には、ステツプ38におい
て、第3方式により整列出力のレコードを1ブロ
ツク出力した後、ステツプ42,43で処理中の
群の未処理レコード数をチエツクする。
未処理レコード数が第1方式の可能な数に減少
していればステツプ30に戻り、第2方式の可能
な数になつていればステツプ34に戻り、以上の
何れでもなければステツプ38の第3方式処理を
継続する。
以上の構成により、適当な大きさの作業領域8
を設けておけば、それを越えるデータ量の場合に
も、作業領域が有効に利用されて、処理効率の改
善が得られる。
〔実施例〕
第1図の、ステツプ32における第1方式の整
列出力処理、ステツプ36における第2方式の整
列出力処理、及びステツプ38における第3方式
の整列出力処理は、それぞれ従来の各方式処理と
同様である。
しかし、本発明により、処理方式は固定される
ことなく、第1、第2、第3方式の順に、データ
量と作業領域の大きさとの関係で、可能な最も効
率のよい処理方式が選択され、且つ第3方式で処
理が開始された後も、処理が進んで未処理レコー
ド数が減少すると、第1又は第2の方式へ処理が
自動的に切り換えられる。
即ち、処理を開始すると、先ず前記第1方式と
して、作業フアイル5から作業領域8へ、1群の
全レコードの読み込みを行う、ステツプ31の判
定で、全レコードの読み込みに成功していれば、
ステツプ32で第1方式によつてその群の整列出
力処理を完了した後、ステツプ44で未処理の群
があるが識別し、次の群の処理があればステツプ
30に戻る。
ステツプ31で、全レコード読み込みができな
かつたと判定した場合には、ステツプ33で、読
み込み試行により得られた、作業領域8に保持可
能なレコード数(第1レコード数とする)を適当
な記憶領域に記憶した後、ステツプ34で、第2
方式のレコード情報を作業領域8に読み込み及び
設定する。
ステツプ35で、第2方式の所要情報を全レコ
ードについて、作業領域8に読み込んだと識別す
ると、ステツプ36で第2方式の整列出力処理を
実行する。その後、次の群の処理があればステツ
プ30に戻る。
ステツプ35で、第2方式のレコード情報の全
レコード読み込みもできないと識別した場合に
は、ステツプ37で、第2方式のレコード情報の
作業領域8に保持可能なレコード数(第2レコー
ド数とする)を適当な記憶領域に記憶する。
次のステツプ38で第3方式の処理を実行す
る。ステツプ38では、前記のように作業フアイ
ル5の上でレコードを順次走査して出力レコード
を決定する処理を実行し、出力レコードが決定す
ると、そのレコードを要すれば出力バツフアに書
込み、1ブロツクの所定数の出力レコードが出力
バツフアに蓄積されると、それを出力データフア
イル7へ出力する。
以上のステツプ38の処理のレコード走査にお
いて、処理中の群の未処理レコード数をカウント
しておき、ステツプ41〜43で未処理レコード
数による処理の分岐を制御する。
即ち、ステツプ41の判定で、未処理レコード
数が0であれば、ステツプ44に進み、次に処理
する群があればステツプ30に戻る。
未処理レコードがある場合、ステツプ42で先
に記憶した第1レコード数と比較し、未処理数が
第1レコード数より大きくなければ、ステツプ3
0に戻り、残りのレコードの処理を第1方式の処
理に切り換える。
未処理レコード数が第1レコード数より大きい
場合には、ステツプ43で先に記憶した第2レコ
ード数と比較し、未処理数が第2レコード数より
大きくなければ、ステツプ34に戻り、残りのレ
コードの処理を第2方式の処理に切り換える。
未処理レコード数が第2レコード数より大きい
場合にはステツプ38に戻つて第3方式の処理を
継続する。
以上の構成により、適当な大きさの作業領域8
を設けておけば、それを越えるデータ量の場合に
も、作業領域が有効に利用されて、処理効率の改
善が得られる。
〔発明の効果〕
以上の説明から明らかなように、本発明によれ
ば、日本語データの整列出力処理において、作業
領域が常に有効に利用されるようになるので、情
報処理システムの処理効率を改善するという著し
い工業的効果がある。
【図面の簡単な説明】
第1図は本発明の処理の流れ図、第2図は情報
処理システムの一構成例ブロツク図、第3図は整
列処理の第1の例の説明図、第4図は整列処理の
第2の例の説明図、第5図は従来の処理の流れ図
である。 図において、1,4,6はフアイル装置、2は
原データ、3は処理装置、5は作業フアイル、7
は出力データフアイル、8は作業領域、10はフ
ラグ部、11はキー部、12はデータ部、13は
読み情報、14は漢字情報、15はレコードアド
レス、20〜24、30〜38、41〜44は処
理のステツプを示す。

Claims (1)

  1. 【特許請求の範囲】 1 フアイル装置に保持され、複数のレコードか
    らなる日本語データを、該各レコードのキー情報
    の、読みの先頭文字と先頭の漢字をキーとして整
    列する処理において、 処理装置に作業用の記憶領域を設け、 該キー情報の読みの先頭文字の同一なレコード
    の群について、未処理の該全レコードを該記憶領
    域に配列できる場合には、該全レコードを該記憶
    領域に読み出して、該記憶領域上のデータによつ
    て第1の前記整列処理を実行し、 第1の整列処理を実行することができないが、
    該各レコードごとの所要キー情報と該レコードの
    前記フアイル装置上の記憶アドレス情報とからな
    る部分情報が、該全レコードについて該記憶領域
    に配列できる場合には、該全レコードの該部分情
    報を該記憶領域に読み出して、該記憶領域上のデ
    ータによつて第2の前記整列処理を実行し、 第1及び第2の整列処理を何れも実行できない
    場合には、該フアイル装置から順次レコードを読
    み出して、次に整列するレコードを探索すること
    によつて、第3の前記整列処理を実行し、 第3の整列処理の実行中に、当該群の未処理レ
    コード数を監視して、該未処理レコード数が第1
    又は第2の整列処理の可能なレコード数に減少し
    た場合には、第1又は第2の整列処理に切り換え
    るように構成されていることを特徴とする日本語
    データ整列処理方式。
JP60207506A 1985-09-19 1985-09-19 日本語デ−タ整列処理方式 Granted JPS6266326A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60207506A JPS6266326A (ja) 1985-09-19 1985-09-19 日本語デ−タ整列処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60207506A JPS6266326A (ja) 1985-09-19 1985-09-19 日本語デ−タ整列処理方式

Publications (2)

Publication Number Publication Date
JPS6266326A JPS6266326A (ja) 1987-03-25
JPH048816B2 true JPH048816B2 (ja) 1992-02-18

Family

ID=16540846

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60207506A Granted JPS6266326A (ja) 1985-09-19 1985-09-19 日本語デ−タ整列処理方式

Country Status (1)

Country Link
JP (1) JPS6266326A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5060146A (en) * 1988-04-08 1991-10-22 International Business Machines Corporation Multilingual indexing system for alphabetical lysorting by comparing character weights and ascii codes
JP2573726Y2 (ja) * 1991-11-07 1998-06-04 株式会社クボタ 自動販売機の防犯装置
US7898642B2 (en) 2004-04-14 2011-03-01 Asml Netherlands B.V. Lithographic apparatus and device manufacturing method

Also Published As

Publication number Publication date
JPS6266326A (ja) 1987-03-25

Similar Documents

Publication Publication Date Title
JPH02178730A (ja) 分割法を用いた内部ソート方式
JPH048816B2 (ja)
JPH03202934A (ja) データ処理装置
JP2573577B2 (ja) ファイルアクセス装置
JPS62121532A (ja) デ−タ検索方法
JP3293551B2 (ja) ソート処理方法
JP2604787B2 (ja) 二次元データ格納方式
JPS6326411B2 (ja)
JPH07101382B2 (ja) マ−ジ処理装置
JP2586172B2 (ja) 学習機能付テーブル検索装置
JPH0275018A (ja) マージ処理方法
JPS63253431A (ja) インバ−テツド構造のデ−タベ−ス検索方式
JPH0145648B2 (ja)
JPS62166422A (ja) 可変長レコ−ドのソ−ト方法
JPH0397026A (ja) データ分類装置
JPH08235044A (ja) ジャーナル検索方式
JPS59221773A (ja) Ocrの文字読取方式
JPH02216554A (ja) 索引順編成ファイルの再編成方式
JPS5829046A (ja) メモリソーティング回路
JPH04199430A (ja) 優先度付き待行列制御方式
JPH03259329A (ja) 大容量データのキー相対アドレス分類方式
JPH01270127A (ja) データ検索処理方式
JPH03164839A (ja) データ格納方式
JPH04199431A (ja) 優先度付き待行列制御方式
JPH0758979B2 (ja) 蓄積型論理宛先のデータ管理処理方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees