JPH0764833A - ファイル容量削減方法 - Google Patents

ファイル容量削減方法

Info

Publication number
JPH0764833A
JPH0764833A JP5214675A JP21467593A JPH0764833A JP H0764833 A JPH0764833 A JP H0764833A JP 5214675 A JP5214675 A JP 5214675A JP 21467593 A JP21467593 A JP 21467593A JP H0764833 A JPH0764833 A JP H0764833A
Authority
JP
Japan
Prior art keywords
pattern
file
record
registered
procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5214675A
Other languages
English (en)
Inventor
Takahiro Tsukahara
崇弘 塚原
Takashi Kamiyabu
貴志 上藪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Solution Innovators Ltd
Original Assignee
NEC Corp
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Solution Innovators Ltd filed Critical NEC Corp
Priority to JP5214675A priority Critical patent/JPH0764833A/ja
Publication of JPH0764833A publication Critical patent/JPH0764833A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】項目列のパターンとパターン番号をファイルに
登録し、項目列をパターン番号で置換え、レコードを短
縮するファイル容量削減方法の提供。 【構成】ファイル容量削減方法には、レコードを読み込
むステップ1と、読み込んだレコードを先頭から区切
り、データ列をパターン化するステップ2と、パターン
の登録しているパターンファイル10を走査し、同一の
パターンを検索するステップ3と、検索するパターンが
新しいパターンであるか否かを判定するステップ3と、
新しいパターンをパターンファイル10に登録するステ
ップ5と、レコードのデータ列のパターンを全て走査し
たか否かを判定するステップ6と、を含む。更にパター
ンをパターン番号で置換するステップ7と、短縮レコー
ドをファイル11に格納するステップ8と、を含む。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明はファイル容量削減方法
に関し、特に項目列を区切ってなるデータ列のパターン
に同一パターンが頻出するレコードを含むファイルの容
量削減方法に関する。
【0002】
【従来の技術】従来、データレコードをファイルに格納
する場合、ファイル容量はレコード長およびレコード件
数に依存する。レコード長および件数が増加すると、フ
ァイル容量は比例して増大する。また、データレコード
に同一パターンのデータ列を含むレコードがある。例え
ば、部品リストあるいは原価積算のデータには、同一の
部品あるいは材料または名称の項目が、繰り返し頻出す
る。このような場合、ファイル容量の増大を防ぐため、
上述の項目をコード化し、それをキーとして項目を登録
する別ファイルを備え、データ入力、あるいは処理にお
いて、コードによってデータ長の短縮による入力操作の
簡略化、またはファイルの削減、あるいはデータの捜索
を容易にすることが行われている。そして、処理結果を
出力し可視化するとき、別ファイルによって、コードを
元のデータに戻している。
【0003】
【発明が解決しようとする課題】上述した従来のファイ
ル削減方法では、予じめデータのコードリストを備える
必要がある。また、1項目づつのデータを短縮すること
はできるが、複数の項目からなるデータ列をパターンと
してとらえることはできない。
【0004】
【課題を解決するための手段】この発明の目的は、レコ
ードを入力するとき、指定する項目数でレコードの項目
列を先頭から区切り、そのデータ列をパターン化し、新
しいパターン毎にそのパターンとパターン番号をファイ
ルに登録し、項目列をパターン番号で置換え、レコード
を短縮し、格納するにファイルの容量削減方法の提供で
ある。
【0005】そのため、このファイル容量削減方法は、
項目列からなるレコードを手順と、前記項目列を先頭か
らN項目づつ区切ってなるデータ列のパターンと前記パ
ターンに付与されるパターン番号を登録するパターンフ
ァイルを生成する手順と、前記レコードの項目列のパタ
ーンを前記パターン番号で置換し、前記レコードの短縮
レコードを作成する手順と、前記短縮レコードをファイ
ルに格納する手順と、を含む。
【0006】
【実施例】次に、この発明の実施例について図面を参照
して説明する。
【0007】この発明の一実施例を示す流れ図1を参照
すると、このファイル容量削減方法には、レコードを読
み込むステップ1と、指定される項目数Nで、読み込ん
だレコードを先頭から区切ってなる項目列のデータ列を
パターン化するステップ2と、パターンを登録している
パターンファイル10を走査し、同一のパターンを検索
するステップ3と、検索するパターンが登録されてない
新しいパターンであるか否かを判定するステップ4と、
新しいパターンをパターンファイル10に登録するステ
ップ5と、レコードのパターンを全て取得したか否かを
判定するステップ6と、パターン取得完了で、パターン
をパターン番号で置換し、レコードを短縮するステップ
7と、短縮レコードをファイル11に格納するステップ
8と、取得したパターンが最終であるか否かを判定する
ステップ9と、を含む。
【0008】更に、入力レコードを例示する図2(a)
を参照すると、入力レコードファイル14は、入力する
各レコード16乃至19がそれぞれ項目1乃至12を有
し、予じめレコードの特性を考慮してデータ列のパター
ン化する項目数Nを3として、3項目づつ区切っている
ことを示している。また、短縮レコードを格納するファ
イル11を例示する図2(b)を参照すると、入力レコ
ード16乃至19の区切ってなるパターンをパターン番
号に置換された短縮レコード31乃至34を示す。更
に、入力レコードのパターンを登録するパターンファイ
ル10を例示する図2(c)を参照すると、データ列か
ら得られるパターン41乃至44と、それぞれに対応す
るパターン番号45乃至48を示している。
【0009】次に、図1の実施例の動作を図2(a),
(b)および(c)を援用し、説明すると、レコード1
6を読み込むと(図1のステップ1)、レコード16の
先頭から3項目づつ区切って、パターン化する(ステッ
プ2)。1番目のパターン0.0.0をパターンファイ
ル10を走査し、検索すると(ステップ3)、パターン
0.0.0は未登録であるから新パターンである(ステ
ップ4のY)。新パターン41とパターン番号45をパ
ターンファイル10に登録する(ステップ5)。更に、
パターンの取得が終了していないので(ステップ6の
N)、2番目のパターン15.25.0を取得し、パタ
ーンファイル10を走査し、同一のパターンを検索する
(ステップ3)。パターン15.25.0は新パターン
であるから(ステップ4のY)、パターンファイル10
にパターン42とパターン番号46を登録する(ステッ
プ5)。パターン取得が終了していないので(ステップ
6のN)、3番目のパターン12.34.0を取得し、
パターンファイル10を走査し、検索する(ステップ
3)。パターン12.34.0は新パターンであるから
パターンファイル10にパターン43とパターン番号4
7を登録する(ステップ5)。パターン取得が終了して
いないので(ステップ6のN)、次のパターン0.0.
0を取得し、パターンファイル10を走査し、検索する
(ステップ3)。4番目のパターン0.0.0はパター
ン41およびパターン番号45に既に登録されているの
で(パターン4のN)、パターン取得が終了か否かを判
定し、終了であるので(ステップ9のY)、入力レコー
ド16の1番目から4番目までの各パターンをパターン
ファイル10に登録されている対応するパターン番号で
置換し、短縮レコード31を作成し、ファイル11に格
納する(ステップ8)。そして、入力したレコード16
の短縮処理を終了する。
【0010】次に、入力レコード17を読み込み(ステ
ップ1)、レコード17の先頭から3項目づつパターン
化し、パターンファイル10を走査し、検索すると、レ
コード17のパターン12.34.0,パターン0.
0.0,パターン15.25.0およびパターン12.
34.0のそれぞれは、既にパターンファイル10のパ
ターン41,42,43に登録されているので、レコー
ド17の各パターンはパターン番号で置換され短縮レコ
ード32としてファイル11に格納される。
【0011】更に、レコード33は、レコード32と同
様に短縮されて、短縮レコード43としてファイルに格
納される。レコード19は、1番目から3番目までのパ
ターン0.0.0が既にパターンファイルに登録されて
いるが、4番目のパターン10.11.12は既に出現
したパターンであるので、パターンファイル10に新た
にパターン44およびパターン番号48として登録さ
れ、レコード19は短縮レコード34として、ファイル
11に格納される。
【0012】レコードの項目列を区切る項目数Nは、フ
ァイルの特性およびレコードの項目構成によって定まる
「1」以上の整数値を示すパラメータである。この実施
例においては、Nを3とした場合を例示している。
【0013】以上の説明から、このファイル容量削減方
法では、入力レコードのパターンとパターン番号とを格
納するパターンファイル10と、短縮レコードを格納す
るファイル11と、を作成する。そして、この二つのフ
ァイルの容量を加えた容量が、入力レコードを短縮しな
いで格納したファイルの容量より少ないとき、ファイル
容量の削減の効果が発揮される。
【0014】
【発明の効果】以上説明したように、この発明によれ
ば、ファイル容量を削減できる。
【0015】その効果の評価を以下の条件で、 レコード件数 100件 1レコードの項目数 30項目 1項目の桁数 10桁 パターン化する項目列 3項目づつ パターン番号 3桁 パターンの種類 M種類 ファイル容量削減率Rを算出すると、 ファイル容量削減率R =1− (100×30×3÷3+M(30×3÷3+3))÷(100×30×10) =0.9−0.0011×M … 第1式 となる。
【0016】第1式によって、Mをパラメータとして、
ファイル容量削減率は以下の値になる。
【0017】M=10 R=0.889 M=50 R=0.845 M=100 R=0.79 M=200 R=0.68 M=500 R=0.45 M=700 R=0.13 この結果から類推できるように、レコードの項目列のデ
ータ列をそのままファイルに格納するよりも、同一のパ
ターンを検出し、パターン番号に置換えて、ファイルに
格納すると、ファイル容量の削減を行うことができる。
【0018】上述の条件においては、第1式から類推で
きるように、パターンの種類が818を越ると、逆にフ
ァイル容量の削減の効果はないことは明きらかである。
【0019】また、この発明によれば、予じめ項目のコ
ードファイルを備える必要がなく、レコード入力と並行
して、レコードの短縮を行い、ファイルの容量削減でき
る。
【図面の簡単な説明】
【図1】この発明の一実施例の方法を示す流れ図であ
る。
【図2】子図(a),(b)および(c)は、それぞれ
入力するレコードを例示する図,短縮レコードを格納す
るファイルを例示する図,パターンとパターン番号を登
録するパターンファイルを例示する図である。
【符号の説明】
1 レーコード読み込み手順 2 レコードのパターン化手順 3 パターンファイルの検索手順 4 新パターンの判定手順 5 パターンの登録手順 6 パターン取得の終り判定手順 7 短縮レコード作成手順 8 短縮レコードのファイル格納手順 9 パターン取得の終り判定手順 10 パターンファイル 11 ファイル

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 項目列からなるレコードを読み込む手順
    と、前記項目列を先頭からN項目づつ区切ってなるデー
    タ列のパターンと前記パターンに付与されるパターン番
    号を登録するパターンファイルを生成する手順と、前記
    レコードの項目列のパターンを前記パターン番号で置換
    し、前記レコードの短縮レコードを作成する手順と、前
    記短縮レコードをファイルに格納する手順と、を含むこ
    とを特徴とするファイル容量削減方法。
  2. 【請求項2】 前記パターンファイルを生成する手順
    は、読み込んだ1レコードを先頭からN項目づつ区切っ
    てなるデータ列をパターンとする手順と、前記パターン
    ファイルを検索し、前記パターンが登録されているか否
    かを判別する手順と、前記パターンが前記パターンファ
    イルに登録されていないとき、前記パターンにパターン
    番号を付加して、前記パターンファイルに登録する手順
    と、前記レコードのパターンを先頭から終りまで順次に
    取得し、前記登録する手順を繰り返す手順と、を含む請
    求項1記載のファイル容量削減方法。
JP5214675A 1993-08-31 1993-08-31 ファイル容量削減方法 Pending JPH0764833A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5214675A JPH0764833A (ja) 1993-08-31 1993-08-31 ファイル容量削減方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5214675A JPH0764833A (ja) 1993-08-31 1993-08-31 ファイル容量削減方法

Publications (1)

Publication Number Publication Date
JPH0764833A true JPH0764833A (ja) 1995-03-10

Family

ID=16659721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5214675A Pending JPH0764833A (ja) 1993-08-31 1993-08-31 ファイル容量削減方法

Country Status (1)

Country Link
JP (1) JPH0764833A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007310842A (ja) * 2006-05-22 2007-11-29 Nomura Research Institute Ltd データ処理システム
WO2018096998A1 (ja) * 2016-11-28 2018-05-31 株式会社ターボデータラボラトリー データ圧縮装置、コンピュータプログラム及びデータ圧縮方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007310842A (ja) * 2006-05-22 2007-11-29 Nomura Research Institute Ltd データ処理システム
WO2018096998A1 (ja) * 2016-11-28 2018-05-31 株式会社ターボデータラボラトリー データ圧縮装置、コンピュータプログラム及びデータ圧縮方法
JPWO2018096998A1 (ja) * 2016-11-28 2019-10-17 株式会社ターボデータラボラトリー データ圧縮装置、コンピュータプログラム及びデータ圧縮方法

Similar Documents

Publication Publication Date Title
US5357431A (en) Character string retrieval system using index and unit for making the index
US6009432A (en) Value-instance-connectivity computer-implemented database
US6236988B1 (en) Data retrieval system
EP0250705B1 (en) Method and apparatus for retrieval of symbol strings from data
CA2430568A1 (en) Value-instance-connectivity-computer-implemented database
JP2693914B2 (ja) 検索システム
US7487165B2 (en) Computer implemented method for retrieving hit count data from a data base system and according computer program product
JPH0764833A (ja) ファイル容量削減方法
JP3632643B2 (ja) 構造化文書管理装置
US6738771B2 (en) Data processing method, computer readable recording medium, and data processing device
JP2706021B2 (ja) 構造型データベースにおける検索高速化方法
JP3709890B2 (ja) 文字列検索装置
JP3183252B2 (ja) データベース検索システム
JPH05314188A (ja) 範囲をもつデータの検索処理方式
JPH05250414A (ja) キーワード検索方式
JPH07302347A (ja) グラフ生成装置
JPH052512A (ja) 空き領域検索方式
JP2596332B2 (ja) データ組合せ抽出方法およびその装置
JPH06168270A (ja) インデックスを用いた文字列検索システム及びそのインデックスの作成装置
JPH09330322A (ja) データ検索装置
JP2000123014A (ja) データ検索システムおよび方法
JPH0546666A (ja) 情報検索装置
JP2002183142A (ja) データ格納装置、データ格納方法及びデータ格納方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000076106A (ja) 索引順編成ファイルの管理方法
JPH05165891A (ja) データベースのデータ登録・検索方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990223