JP3704483B2 - ファイル圧縮処理装置 - Google Patents
ファイル圧縮処理装置 Download PDFInfo
- Publication number
- JP3704483B2 JP3704483B2 JP2001167341A JP2001167341A JP3704483B2 JP 3704483 B2 JP3704483 B2 JP 3704483B2 JP 2001167341 A JP2001167341 A JP 2001167341A JP 2001167341 A JP2001167341 A JP 2001167341A JP 3704483 B2 JP3704483 B2 JP 3704483B2
- Authority
- JP
- Japan
- Prior art keywords
- file
- threshold value
- value
- compression
- compressed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
【0001】
【産業上の利用分野】
本発明は、ファイル圧縮処理装置に関し、特に、光磁気ディスク(MO)やハードディスク等のファイル記録媒体に対して画像データやテキストデータ等をデータ圧縮処理して記録するファイル圧縮処理装置に関するものである。
【0002】
【従来の技術】
近年、光磁気ディスク(MO)やハードディスク等の大容量記録媒体に、テキストデータやバイナリデータ(プログラムや画像データ)等を記録してデータベースを構築しておき、端末からユーザが必要に応じて通信回線等を経由して該当データベースに対してアクセスを行ない、ユーザが要求するデータを検索できるようにしたオンライン情報検索サービスが普及しつつある。
【0003】
この場合、データベースの情報としては、極めて多量の情報量を有したものとなっており、よって記録媒体へのデータ記録方式としては各種のデータ圧縮技術が用いられ、記録ファイルの見かけ上の容量を増大するようになっている。
【0004】
この様なシステムにおけるデータファイルの圧縮技術の例として、例えば特開昭63−266579号公報や特開昭64−2152号公報等に開示される技術が挙げられる。これらの技術においては、記録データファイルの全てについてある定められたデータ圧縮を用いてデータ圧縮を行ない、利用者がこのファイルを利用する際に自動的に当該ファイルのデータ伸長再生処理を行なっている。
【0005】
【発明が解決しようとする課題】
このような従来のデータファイル圧縮システムでは、全てのファイルに関してデータ圧縮処理を行なってディスク等のファイル装置へ格納する方式であるために、ファイル装置内に空きファイル容量が十分ある場合にもファイル圧縮が行われることになり、そのファイルを利用する際には必ずファイルの伸長再生処理を行なう必要があり、再生処理が低下するという欠点がある。
【0006】
また、データ圧縮の際の圧縮方式も一通りのみであり、圧縮対象のファイルの最終アクセス日時やアクセス回数により求められるアクセス頻度やファイルの種類によっては圧縮、伸長速度や圧縮率がそれ程要求されないものもあるにもかかわらず、圧縮方式の選定は不可能となっている。
【0007】
本発明はこのような従来技術の欠点を解決すべくなされたものであって、第1の目的は、ファイル装置の空き容量が多ければファイルの圧縮を行なわずにファイルの高速再生を可能とし、またファイルのアクセス頻度や種類に応じて圧縮方式を適宜選択して、効率良いファイルの利用を可能としたファイル圧縮処理装置を提供することにある。
【0008】
また、本発明の第2の目的は、空きファイル容量の基準であるしきい値(必ず確保しておくべき容量値)の増減を可能とすることにより、効率的なファイル圧縮処理が行なえるファイル圧縮処理装置を提供することにある。
【0009】
また、本発明の第3の目的は、空きファイル容量が増加した時に、圧縮ファイルのうちアクセス頻度の高いファイルを伸長再生することで、伸長生成をできるだけ行なわずにファイルの利用が可能なファイル圧縮処理装置を提供することにある。
【0010】
【課題を解決するための手段】
上記目的を達成するため、本発明のファイル圧縮処理装置では、ファイルを記録するファイル装置上の現在の空き容量値と、空き容量値の上限として予め設定されたしきい値を比較するファイル状態監視手段と、前記ファイル状態監視手段により前記現在の空き容量値がしきい値より小さいと判断された場合に、前記ファイル装置上のファイルの圧縮処理を行なうファイル圧縮手段と、前記現在の空き容量値が前記しきい値よりも小さい場合で圧縮するファイルが存在せず、かつ前記しきい値を所定調整値分だけ減少させた時にしきい値が前記圧縮前後のファイルサイズの差分の最大値より大の場合、前記しきい値を所定調整値だけ減少させ、前記現在の空き容量値が前記しきい値よりも大きく、かつ前記しきい値が前記しきい値の初期値よりも小さい場合、前記しきい値を増加させるしきい値変更手段とを備えることを特徴とする。
【0011】
請求項2の本発明のファイル圧縮処理装置では、前記ファイル装置に記録された各ファイルに関する最終アクセス日時及びアクセス回数、圧縮済みか否かの情報、データ種別情報、及び、前記ファイル装置内の圧縮されたファイルの圧縮前後のファイルサイズの差分の最大値と最小値とそれぞれのファイル名を含む管理情報を格納するファイル属性管理部と、前記ファイル属性管理部の管理情報に基づいて、前記アクセス回数により求めたアクセス頻度の低い順に未圧縮のファイルを検索し、前記圧縮手段によって圧縮処理を行なう圧縮対象ファイルとして選択するファイル検索手段と、前記ファイル属性管理部の管理情報に基づいて、前記圧縮手段で圧縮処理を行なうファイルのデータ種別及びアクセス頻度を求め、前記アクセス頻度の高い段階のファイルには、伸長再生時間の短い圧縮方式を、前記アクセス頻度の低い段階のファイルには圧縮率の高いファイル圧縮方式を選択し、前記圧縮手段に対し選択した圧縮方式による圧縮処理を指示する圧縮方式選定手段を備えることを特徴とする。
【0012】
請求項3の本発明のファイル圧縮処理装置では、前記しきい値変更手段は、前記圧縮対象ファイルが存在しない場合、前記しきい値を所定調整値分だけ減少させた時にしきい値が前記圧縮前後のファイルサイズの差分の最大値より大の場合に、前記しきい値を所定調整値だけ減少させることを特徴とする。
【0013】
請求項4の本発明のファイル圧縮処理装置では、前記ファイル装置に記録された圧縮ファイルのアクセス要求に応じて、該圧縮ファイルを伸長再生するファイル再生手段を備えることを特徴とする。
【0014】
請求項5の本発明のファイル圧縮処理装置では、前記しきい値が初期の値で、かつ前記空き容量が前記しきい値より大であると前記ファイル状態監視手段が判断した時に、圧縮されているファイルを検索し、圧縮済みのファイルを伸長再生するファイル再生手段を備えることを特徴とする。
【0015】
請求項6の本発明のファイル圧縮処理装置では、前記ファイル検索手段は、しきい値が初期の値で、空き容量が、しきい値の初期の値より大であると判断した場合に、前記ファイル属性管理部の管理情報に基づいて、アクセス頻度の高い圧縮済みファイルを検索し、前記再生手段によって伸長再生処理を行なう圧縮済みファイルとして選択することを特徴とする。
【0016】
請求項7の本発明のファイル圧縮処理装置では、前記しきい値変更手段は、前記しきい値が初期値でなく、前記空き容量が前記しきい値の初期値より大であると判断した場合に、前記しきい値を前記初期値に戻し、また前記しきい値が初期値でなく、前記空き容量が前記しきい値の初期値より小で、かつ空き容量としきい値との差分が前記所定調整値より大であると判断した場合に、前記空き容量としきい値との差分を前記所定調整値で除算して得られる整数値に前記所定調整値を掛けた分だけ前記しきい値を増加させることを特徴とする。
【0017】
【発明の実施の形態】
以下、本発明の実施例について図面を参照して詳細に説明する。
【0018】
図1は本発明の第1実施例によるファイル圧縮処理装置を用いたファイル処理システムのブロック図である。図1において、このファイル処理システムは、ファイル圧縮処理装置100、利用者プログラム120、ファイル装置130で構成される。
【0019】
ファイル圧縮処理装置100は、ファイル装置130の各ディスク131に対して、利用者プログラム120とは非同期にファイルの自動圧縮及び伸長再生処理を行なう。利用者プログラム120は、ファイル圧縮処理装置100を介してファイル装置130に記録されているファイルにアクセスしてファイルの利用を行なう。ファイル装置130は、光磁気ディスク(MO)やハードディスク等の記録媒体であるディスク131と、各ディスク131に記録されているファイルの管理情報を管理するファイル属性管理部132を備える。
【0020】
ファイル圧縮処理装置100は、図示のように、ファイル状態監視手段101と、ファイル検索手段102、ファイル圧縮方式選定手段104、ファイル圧縮手段105、ファイル再生手段106で構成される。
【0021】
ファイル状態監視手段101は、ファイル属性管理部132内において管理されているファイル装置130上の現在のファイル空き容量値が予め定められたしきい値(ファイル装置130に確保しておくべき空きファイル容量値)を上回るか下回るかどうかを判断する。
【0022】
ファイル検索手段102は、ファイル状態監視手段101において現在のファイル空き容量値がしきい値を下回っていると判断したときに、圧縮対象ファイル(圧縮対象ファイルとは、利用者が圧縮記録すべきではないとして指定したファイルを除く全てのファイルである)のうち圧縮されていないファイルをアクセス頻度の低いものから順に検索する。この圧縮対象ファイルの検索は、ファイル属性管理部132のファイル管理情報を参照しながら行われる。
【0023】
ファイル属性管理部132のファイル管理情報には、ファイル名やディレクトリ名のリスト及びファイル毎の最終アクセス日時やアクセス回数等が含まれる。ファイルのアクセス頻度は、ファイル毎のアクセス回数を元に決定され、高・中・低等の段階に分けられる。このアクセス頻度の段階を決める基準は、ファイル検索手段102内部に設定されている。なお、利用者が基準及び段階の設定を行なうことも可能である。
【0024】
ファイル圧縮手段105は、この検索された圧縮対象ファイルを実際にデータ圧縮してファイル装置130のディスク131へ記録するものであり、圧縮対象ファイルのアクセス頻度やファイルの種類等の属性に応じて、データ圧縮方式を適宜選択して圧縮処理を行なう。
【0025】
この場合、データ圧縮手段105の圧縮対象ファイルをデータ圧縮する方式の選定に際しては、ファイル圧縮方式選定手段104がその選定を行なう。ファイル圧縮方式選定手段104は、ファイル属性管理部132の各ファイルに関する管理情報のうち、テキストデータやバイナリデータ(プログラムや画像データ等)といったデータ属性と、アクセス頻度を考慮して、そのファイルに適するデータ圧縮方式を選定する。
【0026】
ファイルのデータ属性は、データ属性に合ったより圧縮率の高いデータ圧縮方式を選定する際に使用され、ファイルのアクセス頻度は、データ圧縮・伸長再生時間の短いデータ圧縮方式を選定する際に使用される。データ圧縮方式選定手段104は、データ属性に基づいてで選定されたいくつかのデータ圧縮方式のうち、アクセス頻度の高いファイルについてはよりデータ圧縮・伸長再生時間が短いデータ圧縮方式を選定し、アクセス頻度の低いファイルについてはより圧縮率の高いデータ圧縮方式を選定する。
【0027】
ファイル装置130のファイル属性管理部132は、前述した如く、ファイル装置130のファイル空き容量値情報、各ファイルのファイル名及びディレクトリ名、ファイルを圧縮する前と後でのファイルサイズの差分の最大値と最小値と、それら最大値及び最小値を持つファイル名、各ファイルのファイルサイズ、データ属性(テキストデータファイル、プログラムファイル、画像データファイル等)、圧縮対象ファイルではないファイルであるかどうかの識別子、ファイルの圧縮/非圧縮、圧縮方式、最終アクセス日時、アクセス回数、圧縮ファイルであれば圧縮後のファイルサイズ等に関するファイル管理情報を管理する。ここで、圧縮対象ファイルではないファイルであるかどうかの識別子は、利用者によって圧縮すべきでないとして指定されたファイルに付けられる。
【0028】
なお、図1では、ファイル属性管理部132をディスク131とは物理的に別に設ける構成となっているが、実際には各ファイルはデータ領域とは別に上記ファイル管理情報を記録するファイル制御情報領域を有しており、このファイル制御情報領域のファイル管理情報をファイル属性管理部132が管理する。
【0029】
ファイル再生手段106は、利用者プログラム120からのファイル利用要求に応答して当該ファイルの伸長再生処理を行なうものであり、そのファイルの管理情報の一つであるデータ圧縮方式を参照して、その逆の伸長再生を行なう。もっとも、そのファイルがファイル属性管理部132のファイルの圧縮/非圧縮情報をチェックした結果、非圧縮のファイルであれば伸長再生は何等行なわず、単にファイル装置130からそのファイルを読み出すだけの処理となる。
【0030】
図2は図1に示した装置の動作を示すフローチャートである。利用者プログラム120とは非同期にファイル状態監視手段101にてファイル装置130内の現在の空きファイル容量が監視される(ステップ210)。ファイル装置130上の空き容量や空きファイル領域情報等は、ファイル管理情報としてファイル装置130上のファイル属性管理部132に格納され、この情報はオペレーティングシステムのファイル管理により管理されている。これら空きファイル領域情報や空き容量情報等に変更が生じると、ファイル属性管理部132のファイル管理情報が更新され、またファイルの作成、削除、拡張、縮小が生じた場合、オペレーティングシステムの管理により変更される。
【0031】
そして、ファイル状態監視手段101で現在のファイル装置130のファイル空き容量値としきい値が比較され(ステップ211)、しきい値に対して空きファイル容量値が大であれば、空きファイル容量に余裕があるのでデータ圧縮処理は行われない。この場合、データ圧縮は行われないので、ファイルの利用時には、データ伸長再生処理は行われることなく直ちにファイルのアクセス処理ができ高速化が可能となる。
【0032】
空き容量値がしきい値を下回っていれば、そこで初めてファイル圧縮処理が行われる。そのために、ファイル属性管理部132のファイル管理情報に基づいて圧縮対象ファイルが検索される(ステップ220)。検索に際しては、利用者により圧縮が禁止されたファイル以外のファイルのうちまだ圧縮されていないファイルでかつアクセス頻度の低い段階のファイルから検索される。圧縮対象ファイルが存在しなければ、ステップ210へ戻る。ステップ221において、「圧縮対象ファイル」の有無が判断されるが、この「圧縮対象ファイル」とは、設定されたしきい値以上のファイル空き容量に達するまでに圧縮の対象となるファイルのことを指称している。
【0033】
圧縮対象ファイルが検索されると、そのファイルに対してデータ圧縮処理が行われる(ステップ250)。この時、そのファイルのアクセス頻度とデータ属性に応じて、適した圧縮率及び圧縮・伸長速度のデータ圧縮方式がファイル圧縮方式選定手段104によって選定される。
【0034】
データ圧縮方式を選定する際、ファイル圧縮方式選定手段104は、ファイル属性管理部132のデータ属性によりデータ属性にあったデータ圧縮方式を選定する。次に、ファイル属性管理部132のアクセス回数によりアクセス頻度を求め、アクセス頻度の高い段階のファイルには、伸長再生時間の短いファイル圧縮方式を、アクセス頻度の低い段階のファイルには圧縮率の高いファイル圧縮方式を選定する。データ圧縮方式としては、周知のデータ圧縮方式が利用される。例えば、本実施例では、以下に挙げるようなデータ圧縮方式が利用される。
【0035】
テキストファイルに対するデータ圧縮方式としては、ハフマン符号化方式、算術符号化方式、レンペル・ジブ符号化方式等がある。ハフマン符号化方式は、文字の現れる頻度によって、文字を表わすビット数を変える方式である。ハフマン符号化方式は、木構造の符号表を作成するが、符号表が固定のものと可変のものがあり、前者を静的ハフマン符号化、後者を動的ハフマン符号化という。
【0036】
算術符号化方式は、ある区間で文字が現れる確率を考えて各区間でハフマン符号化を適用する方式である。また、レンペル・ジブ符号化方式は、文字列の繰り返しに着目し、文字列の冗長部分を削除することにより圧縮を行なう。一般的に、レンペル・ジブ符号化方式は、ハフマン符号化方式は算術符号化方式に比べると圧縮率は劣るが、圧縮・伸長再生処理速度は速い。ファイル圧縮方式選定手段104は、アクセス頻度の高い段階のファイルについてはレンペル・ジブ符号化方式、アクセス頻度の低い段階のファイルについてはハフマン符号化方式や算術符号化方式を選定する。
【0037】
バイナリファイル(画像データ)に対するデータ圧縮方式としては、ランレングス符号化方式、差分写像方式等がある。前者は、連続した同じデータを個数で表現し、画像上のピクセルを個数で示すことにより画像要素の列に比し多くのビット数を節約できるが、処理速度の点では劣る。差分写像方式は、画像を明るさの値そのものでなく、隣接画素の明るさとの差分を配列として表現する方式である。ファイル圧縮方式選定手段104は、画像データを例にとれば、アクセス頻度の高い段階のファイルについては差分写像方式、アクセス頻度の低い段階のファイルについてはランレングス符号化方式を選定する。
【0038】
これらのデータ圧縮方式の詳細については、以下の文献に開示されている。すなわち、bit別冊「ACM Computing Survey ’87 コンピュータサイエンス」”データ圧縮”(P.165〜P.195)、C Magagine 1991,1月号”データ圧縮アルゴリズム入門”(P.44〜P.58)、インタフェース 1992,8月号”データ圧縮アルゴリズムとその実体”(P.88〜P.123)等の文献が挙げられる。
【0039】
こうして選定されたデータ圧縮方式に従ってファイルの圧縮処理が行われることになる(ステップ260)。ファイル圧縮処理が終了すると、再度ステップ210に戻り以上の動作が繰り返される。このファイル圧縮処理は、空きファイル容量値がしきい値を上回るまで、繰り返される。ステップ211で空きファイル容量値がしきい値を上回ると判断されると、次のファイルの圧縮処理は不要となり行われない。その後は、新しいファイルの追加等で空きファイル容量値がしきい値より小となると、再度圧縮処理が行われる。
【0040】
図3は利用者プログラム120によりファイル装置130上のファイルを使用する場合の処理を示すフローチャートである。
【0041】
まず、ファイル再生手段106により、ファイル属性管理部132のファイル圧縮/非圧縮情報に基づいてそのファイルが圧縮されているかどうか判断される(ステップ310)。圧縮されていなければ、そのファイルはそのまま読み出されるが、圧縮されていればファイル属性情報に基づいてそのデータ圧縮方式が判断され(ステップ320)、その方式に対応した伸長再生処理が行われる(ステップ311)。
【0042】
図4は、本発明の第2の実施例によるファイル圧縮処理装置を示すブロック図であり、図1の第1実施例と共通の構成には同一の符号を付している。
【0043】
第2実施例のファイル圧縮処理装置では、第1実施例の構成に加えて、しきい値変更手段103を備えている。このしきい値変更手段103は、ファイル状態監視手段101がファイル空き容量値と比較するしきい値を増減する制御を行なう。
【0044】
また、ファイル検索手段102に対しては、既に圧縮されたファイルのうちアクセス頻度の高い段階のファイルの検索を行なう機能を追加している。本装置では、ファイル状態監視手段101において、しきい値が初期値でかつファイルの空き容量値がそのしきい値を上回っていると判断したときに、ファイル検索手段102が圧縮されているファイルのうちアクセス頻度の高いファイルを検索し、ファイル再生手段106にてファイルを伸長再生する構成としている。他の構成については、第1実施例と同じであるので、説明を省略する。
【0045】
図5、図6、図7は第2実施例の動作を示すフローチャートである。図2に示したフローチャートのステップと同一のステップについては同一の符号を付している。
【0046】
ステップ221で当該「圧縮対象ファイル」が存在しなければ、ステップ222でしきい値変更手段103においてしきい値を所定調整値分だけ減少できるかどうかを判断する。しきい値変更手段103は、所定調整値だけ減少させた後のしきい値が、ファイル属性管理部132で管理している全ファイル中の圧縮前のファイルサイズと圧縮後のファイルサイズの差分の最大値よりも大きい場合に、調整可能と判断して、現在設定されているしきい値を所定調整値分だけ減少させる(ステップ240)。図8に、ステップ222及びステップ240におけるしきい値を減少させる場合の状態を示す。ここでは、所定調整値をX、圧縮前のファイルサイズと圧縮後のファイルサイズの差分の最大値をMとしている。
【0047】
このように、調整後のしきい値を圧縮前後のファイルサイズの差分の最大値より大の場合にしきい値を減少させることにより、全ファイル中の圧縮前のファイルサイズと圧縮後のファイルサイズの差分の最大値分以上の空きファイル容量が維持できるようにしている。これにより、仮に圧縮前後のファイルサイズの差分が最大値のファイルについて伸長再生が発生した場合でも、ファイル装置130上に伸長再生したファイルが作成できるようにしている。また、しきい値を所定調整値だけ下げることにより、ステップ211で「NO」と判断されて、次のステップ230に進む(図6参照)。なお、上記しきい値の所定調整値については、しきい値変更手段103に予め設定しておく。
【0048】
図6に示す動作(ステップ230〜234)は、オペレーティングシステムのファイル管理によりファイル装置130上のファイルの削除や縮小があった時、空きファイル容量が増大することなるので、しきい値を初期値(本来確保すべき空きファイル容量値)へリセットして戻しておく必要があり、その処理の流れを示している。
【0049】
しきい値変更手段103は、ファイル空き容量値が初期しきい値を上回るかどうかの判断(ステップ230)と、現在のしきい値が初期値であるかどうかの判断を行ない(ステップ231)、条件を満たせば現在のしきい値を初期値に戻す(ステップ232)。そして、再びステップ210へ戻り空き容量値の状態監視が行われる。このしきい値の初期値へのリセット状態を図9に示す。
【0050】
ステップ230で、ファイル空き容量値が初期しきい値より小であると判断されると、空き容量値と現在のしきい値との差分αが所定調整値Xより大きいかどうかが判定される(ステップ233)。大きいと判定されると、空き容量値と現在のしきい値との差分αを所定調整値Xで除算し、得られる整数値と所定調整値Xを掛けた分だけ現在のしきい値を増大する(ステップ234)。そして、再度ステップ210に戻り、ファイル空き容量値が監視される。このしきい値の増大処理の状態を図10に示す。
【0051】
上述のように、ファイル空き容量がファイルの削除や縮小によって増大したとき、ステップ240でしきい値を初期値に戻し、あるいはステップ234でしきい値を増大して初期値に近づけることにより、確保しておくべきファイル空き容量を常に一定に維持されるようになる。また、しきい値は初期値以上に大きくなることはない。
【0052】
図7は、オペレーティングシステムのファイル管理によるファイル削除やファイルの縮小により空き容量が増大してしきい値の初期値を上回り(ステップ230)、かつ図6のステップ231でしきい値が初期値であると判断された場合に、圧縮されているアクセス頻度の高いファイルを伸長再生する処理を示している。
【0053】
図7に示すように、ファイル検索手段102は、空きファイル容量がしきい値の初期値を上回る場合には(ステップ235)、「圧縮済みファイル」の検索を行なう(ステップ236)。ここで、「圧縮済みファイル」の検索がなされるが、この「圧縮済みファイル」とは圧縮されたファイルでかつアクセス頻度の高い段階のファイルが該当する。アクセス頻度については、前述したように、ファイル属性管理部132のファイル管理情報に基づいて判断される。ステップ235で空きファイル容量がしきい値の初期値を上回るのでない場合には、再びステップ210へ戻り空き容量値の状態監視が行われる。
【0054】
検索の結果、「圧縮済みファイル」が存在すれば(ステップ237)、ファイル再生手段106によってそのファイルを伸長再生処理がなされる(ステップ238)。「圧縮済みファイル」が存在しなければ、再びステップ210へ戻り空き容量値の状態監視が行われる。ステップ235からステップ238の「圧縮済みファイル」の伸長再生処理の状態を図11に示す。
【0055】
図7におけるステップ236で、「圧縮済みファイル」が存在しない場合、全てのファイルは伸長再生されているものとして、ファイル再生手段106によるファイルの伸長再生は行われない。また、圧縮されたアクセス頻度の高いファイル以外は、「圧縮済みファイル」として扱わない。これにより、「圧縮済みファイル」として伸長再生した場合、伸長生成されたファイルはアクセス頻度が高いので、ファイル追加により空き容量が減少した時に、ステップ220から260ですぐにそのファイルが「圧縮対象ファイル」として圧縮される可能性が低くなる。
【0056】
このように、ファイル空き容量がファイルの削除やファイルの縮小によって増大したとき、空きファイル容量がしきい値の初期値に近づくまで、上記「圧縮済みファイル」の伸長再生を行なうことにより、利用者プログラム120でファイル装置130上のファイルを使用する場合にできるだけファイル再生手段106による伸長再生処理を行なわずにファイルのアクセス処理ができるようになる。
【0057】
ファイル検索手段102は、現在の空きファイル容量がしきい値の初期値を上回るのでない場合は、「圧縮済みファイル」がある場合でも、ファイル再生手段106によるファイルの伸長再生処理は行なわない。これは、現在のファイル容量がしきい値の初期値を上回るのでない場合に、ファイルの伸長再生を行なうと、ファイル空き容量値がしきい値より小さくなってしまうからである。
【0058】
以上のように、ファイルの空き容量を監視し、空き容量としきい値との大小にファイルの圧縮処理の要否を決定し、また、圧縮処理時にはそのファイルのアクセス頻度及びデータ属性に応じて適する圧縮方式を選択するので、全てのファイルを一括して一定の圧縮方式で圧縮するのに比べ、ファイル利用時の再生処理が高速化され、かつファイルの有効利用が可能となる。
【0059】
以上好ましい実施例をあげて本発明を説明したが、本発明は必ずしも上記実施例に限定されるものではない。
【0060】
【発明の効果】
以上説明したように本発明のファイル圧縮処理装置によれば、ファイル装置の空き容量が多ければファイルの圧縮を行なわずにファイルの高速再生を可能とし、またファイルのアクセス頻度や種類に応じて圧縮方式を適宜選択して、効率良いファイルの利用を可能としたファイル圧縮処理装置を提供することができる。
【0061】
また、空きファイル容量の基準であるしきい値をファイル装置の状態に応じて増減することにより、効率的なファイル圧縮処理が行なえるようになる。
【0062】
さらに、空きファイル容量が増加した時に、圧縮ファイルのうちアクセス頻度の高いファイルを伸長再生することで、伸長生成をできるだけ行なわずにファイルの利用が可能となり、ファイル利用時の再生処理が高速化される。
【図面の簡単な説明】
【図1】 本発明の第1の実施例によるファイル圧縮処理装置のブロック図。
【図2】 第1実施例のファイル圧縮処理装置のファイル圧縮処理の動作を示すフローチャート。
【図3】 第1実施例の利用者プログラムによるアクセスの動作を示すフローチャート。
【図4】 本発明の第2の実施例によるファイル圧縮処理装置のブロック図。
【図5】 第2実施例のファイル圧縮処理装置の動作を示すフローチャート。
【図6】 第2実施例のファイル圧縮処理装置の動作を示すフローチャート。
【図7】 第2実施例のファイル圧縮処理装置の動作を示すフローチャート。
【図8】 図5におけるしきい値を減少させる場合の状態を説明する図。
【図9】 図6におけるしきい値の初期値へのリセット状態を説明する図。
【図10】 図6におけるしきい値の増大処理の状態を説明する図。
【図11】 図7における「圧縮済みファイル」の伸長再生処理の状態を説明する図。
【符号の説明】
100 ファイル圧縮処理装置
101 ファイル状態監視手段
102 ファイル検索手段
103 しきい値変更手段
104 ファイル圧縮方式選定手段
105 ファイル圧縮手段
106 ファイル再生手段
120 利用者プログラム
130 ファイル装置
131 ディスク
132 ファイル属性管理部
【産業上の利用分野】
本発明は、ファイル圧縮処理装置に関し、特に、光磁気ディスク(MO)やハードディスク等のファイル記録媒体に対して画像データやテキストデータ等をデータ圧縮処理して記録するファイル圧縮処理装置に関するものである。
【0002】
【従来の技術】
近年、光磁気ディスク(MO)やハードディスク等の大容量記録媒体に、テキストデータやバイナリデータ(プログラムや画像データ)等を記録してデータベースを構築しておき、端末からユーザが必要に応じて通信回線等を経由して該当データベースに対してアクセスを行ない、ユーザが要求するデータを検索できるようにしたオンライン情報検索サービスが普及しつつある。
【0003】
この場合、データベースの情報としては、極めて多量の情報量を有したものとなっており、よって記録媒体へのデータ記録方式としては各種のデータ圧縮技術が用いられ、記録ファイルの見かけ上の容量を増大するようになっている。
【0004】
この様なシステムにおけるデータファイルの圧縮技術の例として、例えば特開昭63−266579号公報や特開昭64−2152号公報等に開示される技術が挙げられる。これらの技術においては、記録データファイルの全てについてある定められたデータ圧縮を用いてデータ圧縮を行ない、利用者がこのファイルを利用する際に自動的に当該ファイルのデータ伸長再生処理を行なっている。
【0005】
【発明が解決しようとする課題】
このような従来のデータファイル圧縮システムでは、全てのファイルに関してデータ圧縮処理を行なってディスク等のファイル装置へ格納する方式であるために、ファイル装置内に空きファイル容量が十分ある場合にもファイル圧縮が行われることになり、そのファイルを利用する際には必ずファイルの伸長再生処理を行なう必要があり、再生処理が低下するという欠点がある。
【0006】
また、データ圧縮の際の圧縮方式も一通りのみであり、圧縮対象のファイルの最終アクセス日時やアクセス回数により求められるアクセス頻度やファイルの種類によっては圧縮、伸長速度や圧縮率がそれ程要求されないものもあるにもかかわらず、圧縮方式の選定は不可能となっている。
【0007】
本発明はこのような従来技術の欠点を解決すべくなされたものであって、第1の目的は、ファイル装置の空き容量が多ければファイルの圧縮を行なわずにファイルの高速再生を可能とし、またファイルのアクセス頻度や種類に応じて圧縮方式を適宜選択して、効率良いファイルの利用を可能としたファイル圧縮処理装置を提供することにある。
【0008】
また、本発明の第2の目的は、空きファイル容量の基準であるしきい値(必ず確保しておくべき容量値)の増減を可能とすることにより、効率的なファイル圧縮処理が行なえるファイル圧縮処理装置を提供することにある。
【0009】
また、本発明の第3の目的は、空きファイル容量が増加した時に、圧縮ファイルのうちアクセス頻度の高いファイルを伸長再生することで、伸長生成をできるだけ行なわずにファイルの利用が可能なファイル圧縮処理装置を提供することにある。
【0010】
【課題を解決するための手段】
上記目的を達成するため、本発明のファイル圧縮処理装置では、ファイルを記録するファイル装置上の現在の空き容量値と、空き容量値の上限として予め設定されたしきい値を比較するファイル状態監視手段と、前記ファイル状態監視手段により前記現在の空き容量値がしきい値より小さいと判断された場合に、前記ファイル装置上のファイルの圧縮処理を行なうファイル圧縮手段と、前記現在の空き容量値が前記しきい値よりも小さい場合で圧縮するファイルが存在せず、かつ前記しきい値を所定調整値分だけ減少させた時にしきい値が前記圧縮前後のファイルサイズの差分の最大値より大の場合、前記しきい値を所定調整値だけ減少させ、前記現在の空き容量値が前記しきい値よりも大きく、かつ前記しきい値が前記しきい値の初期値よりも小さい場合、前記しきい値を増加させるしきい値変更手段とを備えることを特徴とする。
【0011】
請求項2の本発明のファイル圧縮処理装置では、前記ファイル装置に記録された各ファイルに関する最終アクセス日時及びアクセス回数、圧縮済みか否かの情報、データ種別情報、及び、前記ファイル装置内の圧縮されたファイルの圧縮前後のファイルサイズの差分の最大値と最小値とそれぞれのファイル名を含む管理情報を格納するファイル属性管理部と、前記ファイル属性管理部の管理情報に基づいて、前記アクセス回数により求めたアクセス頻度の低い順に未圧縮のファイルを検索し、前記圧縮手段によって圧縮処理を行なう圧縮対象ファイルとして選択するファイル検索手段と、前記ファイル属性管理部の管理情報に基づいて、前記圧縮手段で圧縮処理を行なうファイルのデータ種別及びアクセス頻度を求め、前記アクセス頻度の高い段階のファイルには、伸長再生時間の短い圧縮方式を、前記アクセス頻度の低い段階のファイルには圧縮率の高いファイル圧縮方式を選択し、前記圧縮手段に対し選択した圧縮方式による圧縮処理を指示する圧縮方式選定手段を備えることを特徴とする。
【0012】
請求項3の本発明のファイル圧縮処理装置では、前記しきい値変更手段は、前記圧縮対象ファイルが存在しない場合、前記しきい値を所定調整値分だけ減少させた時にしきい値が前記圧縮前後のファイルサイズの差分の最大値より大の場合に、前記しきい値を所定調整値だけ減少させることを特徴とする。
【0013】
請求項4の本発明のファイル圧縮処理装置では、前記ファイル装置に記録された圧縮ファイルのアクセス要求に応じて、該圧縮ファイルを伸長再生するファイル再生手段を備えることを特徴とする。
【0014】
請求項5の本発明のファイル圧縮処理装置では、前記しきい値が初期の値で、かつ前記空き容量が前記しきい値より大であると前記ファイル状態監視手段が判断した時に、圧縮されているファイルを検索し、圧縮済みのファイルを伸長再生するファイル再生手段を備えることを特徴とする。
【0015】
請求項6の本発明のファイル圧縮処理装置では、前記ファイル検索手段は、しきい値が初期の値で、空き容量が、しきい値の初期の値より大であると判断した場合に、前記ファイル属性管理部の管理情報に基づいて、アクセス頻度の高い圧縮済みファイルを検索し、前記再生手段によって伸長再生処理を行なう圧縮済みファイルとして選択することを特徴とする。
【0016】
請求項7の本発明のファイル圧縮処理装置では、前記しきい値変更手段は、前記しきい値が初期値でなく、前記空き容量が前記しきい値の初期値より大であると判断した場合に、前記しきい値を前記初期値に戻し、また前記しきい値が初期値でなく、前記空き容量が前記しきい値の初期値より小で、かつ空き容量としきい値との差分が前記所定調整値より大であると判断した場合に、前記空き容量としきい値との差分を前記所定調整値で除算して得られる整数値に前記所定調整値を掛けた分だけ前記しきい値を増加させることを特徴とする。
【0017】
【発明の実施の形態】
以下、本発明の実施例について図面を参照して詳細に説明する。
【0018】
図1は本発明の第1実施例によるファイル圧縮処理装置を用いたファイル処理システムのブロック図である。図1において、このファイル処理システムは、ファイル圧縮処理装置100、利用者プログラム120、ファイル装置130で構成される。
【0019】
ファイル圧縮処理装置100は、ファイル装置130の各ディスク131に対して、利用者プログラム120とは非同期にファイルの自動圧縮及び伸長再生処理を行なう。利用者プログラム120は、ファイル圧縮処理装置100を介してファイル装置130に記録されているファイルにアクセスしてファイルの利用を行なう。ファイル装置130は、光磁気ディスク(MO)やハードディスク等の記録媒体であるディスク131と、各ディスク131に記録されているファイルの管理情報を管理するファイル属性管理部132を備える。
【0020】
ファイル圧縮処理装置100は、図示のように、ファイル状態監視手段101と、ファイル検索手段102、ファイル圧縮方式選定手段104、ファイル圧縮手段105、ファイル再生手段106で構成される。
【0021】
ファイル状態監視手段101は、ファイル属性管理部132内において管理されているファイル装置130上の現在のファイル空き容量値が予め定められたしきい値(ファイル装置130に確保しておくべき空きファイル容量値)を上回るか下回るかどうかを判断する。
【0022】
ファイル検索手段102は、ファイル状態監視手段101において現在のファイル空き容量値がしきい値を下回っていると判断したときに、圧縮対象ファイル(圧縮対象ファイルとは、利用者が圧縮記録すべきではないとして指定したファイルを除く全てのファイルである)のうち圧縮されていないファイルをアクセス頻度の低いものから順に検索する。この圧縮対象ファイルの検索は、ファイル属性管理部132のファイル管理情報を参照しながら行われる。
【0023】
ファイル属性管理部132のファイル管理情報には、ファイル名やディレクトリ名のリスト及びファイル毎の最終アクセス日時やアクセス回数等が含まれる。ファイルのアクセス頻度は、ファイル毎のアクセス回数を元に決定され、高・中・低等の段階に分けられる。このアクセス頻度の段階を決める基準は、ファイル検索手段102内部に設定されている。なお、利用者が基準及び段階の設定を行なうことも可能である。
【0024】
ファイル圧縮手段105は、この検索された圧縮対象ファイルを実際にデータ圧縮してファイル装置130のディスク131へ記録するものであり、圧縮対象ファイルのアクセス頻度やファイルの種類等の属性に応じて、データ圧縮方式を適宜選択して圧縮処理を行なう。
【0025】
この場合、データ圧縮手段105の圧縮対象ファイルをデータ圧縮する方式の選定に際しては、ファイル圧縮方式選定手段104がその選定を行なう。ファイル圧縮方式選定手段104は、ファイル属性管理部132の各ファイルに関する管理情報のうち、テキストデータやバイナリデータ(プログラムや画像データ等)といったデータ属性と、アクセス頻度を考慮して、そのファイルに適するデータ圧縮方式を選定する。
【0026】
ファイルのデータ属性は、データ属性に合ったより圧縮率の高いデータ圧縮方式を選定する際に使用され、ファイルのアクセス頻度は、データ圧縮・伸長再生時間の短いデータ圧縮方式を選定する際に使用される。データ圧縮方式選定手段104は、データ属性に基づいてで選定されたいくつかのデータ圧縮方式のうち、アクセス頻度の高いファイルについてはよりデータ圧縮・伸長再生時間が短いデータ圧縮方式を選定し、アクセス頻度の低いファイルについてはより圧縮率の高いデータ圧縮方式を選定する。
【0027】
ファイル装置130のファイル属性管理部132は、前述した如く、ファイル装置130のファイル空き容量値情報、各ファイルのファイル名及びディレクトリ名、ファイルを圧縮する前と後でのファイルサイズの差分の最大値と最小値と、それら最大値及び最小値を持つファイル名、各ファイルのファイルサイズ、データ属性(テキストデータファイル、プログラムファイル、画像データファイル等)、圧縮対象ファイルではないファイルであるかどうかの識別子、ファイルの圧縮/非圧縮、圧縮方式、最終アクセス日時、アクセス回数、圧縮ファイルであれば圧縮後のファイルサイズ等に関するファイル管理情報を管理する。ここで、圧縮対象ファイルではないファイルであるかどうかの識別子は、利用者によって圧縮すべきでないとして指定されたファイルに付けられる。
【0028】
なお、図1では、ファイル属性管理部132をディスク131とは物理的に別に設ける構成となっているが、実際には各ファイルはデータ領域とは別に上記ファイル管理情報を記録するファイル制御情報領域を有しており、このファイル制御情報領域のファイル管理情報をファイル属性管理部132が管理する。
【0029】
ファイル再生手段106は、利用者プログラム120からのファイル利用要求に応答して当該ファイルの伸長再生処理を行なうものであり、そのファイルの管理情報の一つであるデータ圧縮方式を参照して、その逆の伸長再生を行なう。もっとも、そのファイルがファイル属性管理部132のファイルの圧縮/非圧縮情報をチェックした結果、非圧縮のファイルであれば伸長再生は何等行なわず、単にファイル装置130からそのファイルを読み出すだけの処理となる。
【0030】
図2は図1に示した装置の動作を示すフローチャートである。利用者プログラム120とは非同期にファイル状態監視手段101にてファイル装置130内の現在の空きファイル容量が監視される(ステップ210)。ファイル装置130上の空き容量や空きファイル領域情報等は、ファイル管理情報としてファイル装置130上のファイル属性管理部132に格納され、この情報はオペレーティングシステムのファイル管理により管理されている。これら空きファイル領域情報や空き容量情報等に変更が生じると、ファイル属性管理部132のファイル管理情報が更新され、またファイルの作成、削除、拡張、縮小が生じた場合、オペレーティングシステムの管理により変更される。
【0031】
そして、ファイル状態監視手段101で現在のファイル装置130のファイル空き容量値としきい値が比較され(ステップ211)、しきい値に対して空きファイル容量値が大であれば、空きファイル容量に余裕があるのでデータ圧縮処理は行われない。この場合、データ圧縮は行われないので、ファイルの利用時には、データ伸長再生処理は行われることなく直ちにファイルのアクセス処理ができ高速化が可能となる。
【0032】
空き容量値がしきい値を下回っていれば、そこで初めてファイル圧縮処理が行われる。そのために、ファイル属性管理部132のファイル管理情報に基づいて圧縮対象ファイルが検索される(ステップ220)。検索に際しては、利用者により圧縮が禁止されたファイル以外のファイルのうちまだ圧縮されていないファイルでかつアクセス頻度の低い段階のファイルから検索される。圧縮対象ファイルが存在しなければ、ステップ210へ戻る。ステップ221において、「圧縮対象ファイル」の有無が判断されるが、この「圧縮対象ファイル」とは、設定されたしきい値以上のファイル空き容量に達するまでに圧縮の対象となるファイルのことを指称している。
【0033】
圧縮対象ファイルが検索されると、そのファイルに対してデータ圧縮処理が行われる(ステップ250)。この時、そのファイルのアクセス頻度とデータ属性に応じて、適した圧縮率及び圧縮・伸長速度のデータ圧縮方式がファイル圧縮方式選定手段104によって選定される。
【0034】
データ圧縮方式を選定する際、ファイル圧縮方式選定手段104は、ファイル属性管理部132のデータ属性によりデータ属性にあったデータ圧縮方式を選定する。次に、ファイル属性管理部132のアクセス回数によりアクセス頻度を求め、アクセス頻度の高い段階のファイルには、伸長再生時間の短いファイル圧縮方式を、アクセス頻度の低い段階のファイルには圧縮率の高いファイル圧縮方式を選定する。データ圧縮方式としては、周知のデータ圧縮方式が利用される。例えば、本実施例では、以下に挙げるようなデータ圧縮方式が利用される。
【0035】
テキストファイルに対するデータ圧縮方式としては、ハフマン符号化方式、算術符号化方式、レンペル・ジブ符号化方式等がある。ハフマン符号化方式は、文字の現れる頻度によって、文字を表わすビット数を変える方式である。ハフマン符号化方式は、木構造の符号表を作成するが、符号表が固定のものと可変のものがあり、前者を静的ハフマン符号化、後者を動的ハフマン符号化という。
【0036】
算術符号化方式は、ある区間で文字が現れる確率を考えて各区間でハフマン符号化を適用する方式である。また、レンペル・ジブ符号化方式は、文字列の繰り返しに着目し、文字列の冗長部分を削除することにより圧縮を行なう。一般的に、レンペル・ジブ符号化方式は、ハフマン符号化方式は算術符号化方式に比べると圧縮率は劣るが、圧縮・伸長再生処理速度は速い。ファイル圧縮方式選定手段104は、アクセス頻度の高い段階のファイルについてはレンペル・ジブ符号化方式、アクセス頻度の低い段階のファイルについてはハフマン符号化方式や算術符号化方式を選定する。
【0037】
バイナリファイル(画像データ)に対するデータ圧縮方式としては、ランレングス符号化方式、差分写像方式等がある。前者は、連続した同じデータを個数で表現し、画像上のピクセルを個数で示すことにより画像要素の列に比し多くのビット数を節約できるが、処理速度の点では劣る。差分写像方式は、画像を明るさの値そのものでなく、隣接画素の明るさとの差分を配列として表現する方式である。ファイル圧縮方式選定手段104は、画像データを例にとれば、アクセス頻度の高い段階のファイルについては差分写像方式、アクセス頻度の低い段階のファイルについてはランレングス符号化方式を選定する。
【0038】
これらのデータ圧縮方式の詳細については、以下の文献に開示されている。すなわち、bit別冊「ACM Computing Survey ’87 コンピュータサイエンス」”データ圧縮”(P.165〜P.195)、C Magagine 1991,1月号”データ圧縮アルゴリズム入門”(P.44〜P.58)、インタフェース 1992,8月号”データ圧縮アルゴリズムとその実体”(P.88〜P.123)等の文献が挙げられる。
【0039】
こうして選定されたデータ圧縮方式に従ってファイルの圧縮処理が行われることになる(ステップ260)。ファイル圧縮処理が終了すると、再度ステップ210に戻り以上の動作が繰り返される。このファイル圧縮処理は、空きファイル容量値がしきい値を上回るまで、繰り返される。ステップ211で空きファイル容量値がしきい値を上回ると判断されると、次のファイルの圧縮処理は不要となり行われない。その後は、新しいファイルの追加等で空きファイル容量値がしきい値より小となると、再度圧縮処理が行われる。
【0040】
図3は利用者プログラム120によりファイル装置130上のファイルを使用する場合の処理を示すフローチャートである。
【0041】
まず、ファイル再生手段106により、ファイル属性管理部132のファイル圧縮/非圧縮情報に基づいてそのファイルが圧縮されているかどうか判断される(ステップ310)。圧縮されていなければ、そのファイルはそのまま読み出されるが、圧縮されていればファイル属性情報に基づいてそのデータ圧縮方式が判断され(ステップ320)、その方式に対応した伸長再生処理が行われる(ステップ311)。
【0042】
図4は、本発明の第2の実施例によるファイル圧縮処理装置を示すブロック図であり、図1の第1実施例と共通の構成には同一の符号を付している。
【0043】
第2実施例のファイル圧縮処理装置では、第1実施例の構成に加えて、しきい値変更手段103を備えている。このしきい値変更手段103は、ファイル状態監視手段101がファイル空き容量値と比較するしきい値を増減する制御を行なう。
【0044】
また、ファイル検索手段102に対しては、既に圧縮されたファイルのうちアクセス頻度の高い段階のファイルの検索を行なう機能を追加している。本装置では、ファイル状態監視手段101において、しきい値が初期値でかつファイルの空き容量値がそのしきい値を上回っていると判断したときに、ファイル検索手段102が圧縮されているファイルのうちアクセス頻度の高いファイルを検索し、ファイル再生手段106にてファイルを伸長再生する構成としている。他の構成については、第1実施例と同じであるので、説明を省略する。
【0045】
図5、図6、図7は第2実施例の動作を示すフローチャートである。図2に示したフローチャートのステップと同一のステップについては同一の符号を付している。
【0046】
ステップ221で当該「圧縮対象ファイル」が存在しなければ、ステップ222でしきい値変更手段103においてしきい値を所定調整値分だけ減少できるかどうかを判断する。しきい値変更手段103は、所定調整値だけ減少させた後のしきい値が、ファイル属性管理部132で管理している全ファイル中の圧縮前のファイルサイズと圧縮後のファイルサイズの差分の最大値よりも大きい場合に、調整可能と判断して、現在設定されているしきい値を所定調整値分だけ減少させる(ステップ240)。図8に、ステップ222及びステップ240におけるしきい値を減少させる場合の状態を示す。ここでは、所定調整値をX、圧縮前のファイルサイズと圧縮後のファイルサイズの差分の最大値をMとしている。
【0047】
このように、調整後のしきい値を圧縮前後のファイルサイズの差分の最大値より大の場合にしきい値を減少させることにより、全ファイル中の圧縮前のファイルサイズと圧縮後のファイルサイズの差分の最大値分以上の空きファイル容量が維持できるようにしている。これにより、仮に圧縮前後のファイルサイズの差分が最大値のファイルについて伸長再生が発生した場合でも、ファイル装置130上に伸長再生したファイルが作成できるようにしている。また、しきい値を所定調整値だけ下げることにより、ステップ211で「NO」と判断されて、次のステップ230に進む(図6参照)。なお、上記しきい値の所定調整値については、しきい値変更手段103に予め設定しておく。
【0048】
図6に示す動作(ステップ230〜234)は、オペレーティングシステムのファイル管理によりファイル装置130上のファイルの削除や縮小があった時、空きファイル容量が増大することなるので、しきい値を初期値(本来確保すべき空きファイル容量値)へリセットして戻しておく必要があり、その処理の流れを示している。
【0049】
しきい値変更手段103は、ファイル空き容量値が初期しきい値を上回るかどうかの判断(ステップ230)と、現在のしきい値が初期値であるかどうかの判断を行ない(ステップ231)、条件を満たせば現在のしきい値を初期値に戻す(ステップ232)。そして、再びステップ210へ戻り空き容量値の状態監視が行われる。このしきい値の初期値へのリセット状態を図9に示す。
【0050】
ステップ230で、ファイル空き容量値が初期しきい値より小であると判断されると、空き容量値と現在のしきい値との差分αが所定調整値Xより大きいかどうかが判定される(ステップ233)。大きいと判定されると、空き容量値と現在のしきい値との差分αを所定調整値Xで除算し、得られる整数値と所定調整値Xを掛けた分だけ現在のしきい値を増大する(ステップ234)。そして、再度ステップ210に戻り、ファイル空き容量値が監視される。このしきい値の増大処理の状態を図10に示す。
【0051】
上述のように、ファイル空き容量がファイルの削除や縮小によって増大したとき、ステップ240でしきい値を初期値に戻し、あるいはステップ234でしきい値を増大して初期値に近づけることにより、確保しておくべきファイル空き容量を常に一定に維持されるようになる。また、しきい値は初期値以上に大きくなることはない。
【0052】
図7は、オペレーティングシステムのファイル管理によるファイル削除やファイルの縮小により空き容量が増大してしきい値の初期値を上回り(ステップ230)、かつ図6のステップ231でしきい値が初期値であると判断された場合に、圧縮されているアクセス頻度の高いファイルを伸長再生する処理を示している。
【0053】
図7に示すように、ファイル検索手段102は、空きファイル容量がしきい値の初期値を上回る場合には(ステップ235)、「圧縮済みファイル」の検索を行なう(ステップ236)。ここで、「圧縮済みファイル」の検索がなされるが、この「圧縮済みファイル」とは圧縮されたファイルでかつアクセス頻度の高い段階のファイルが該当する。アクセス頻度については、前述したように、ファイル属性管理部132のファイル管理情報に基づいて判断される。ステップ235で空きファイル容量がしきい値の初期値を上回るのでない場合には、再びステップ210へ戻り空き容量値の状態監視が行われる。
【0054】
検索の結果、「圧縮済みファイル」が存在すれば(ステップ237)、ファイル再生手段106によってそのファイルを伸長再生処理がなされる(ステップ238)。「圧縮済みファイル」が存在しなければ、再びステップ210へ戻り空き容量値の状態監視が行われる。ステップ235からステップ238の「圧縮済みファイル」の伸長再生処理の状態を図11に示す。
【0055】
図7におけるステップ236で、「圧縮済みファイル」が存在しない場合、全てのファイルは伸長再生されているものとして、ファイル再生手段106によるファイルの伸長再生は行われない。また、圧縮されたアクセス頻度の高いファイル以外は、「圧縮済みファイル」として扱わない。これにより、「圧縮済みファイル」として伸長再生した場合、伸長生成されたファイルはアクセス頻度が高いので、ファイル追加により空き容量が減少した時に、ステップ220から260ですぐにそのファイルが「圧縮対象ファイル」として圧縮される可能性が低くなる。
【0056】
このように、ファイル空き容量がファイルの削除やファイルの縮小によって増大したとき、空きファイル容量がしきい値の初期値に近づくまで、上記「圧縮済みファイル」の伸長再生を行なうことにより、利用者プログラム120でファイル装置130上のファイルを使用する場合にできるだけファイル再生手段106による伸長再生処理を行なわずにファイルのアクセス処理ができるようになる。
【0057】
ファイル検索手段102は、現在の空きファイル容量がしきい値の初期値を上回るのでない場合は、「圧縮済みファイル」がある場合でも、ファイル再生手段106によるファイルの伸長再生処理は行なわない。これは、現在のファイル容量がしきい値の初期値を上回るのでない場合に、ファイルの伸長再生を行なうと、ファイル空き容量値がしきい値より小さくなってしまうからである。
【0058】
以上のように、ファイルの空き容量を監視し、空き容量としきい値との大小にファイルの圧縮処理の要否を決定し、また、圧縮処理時にはそのファイルのアクセス頻度及びデータ属性に応じて適する圧縮方式を選択するので、全てのファイルを一括して一定の圧縮方式で圧縮するのに比べ、ファイル利用時の再生処理が高速化され、かつファイルの有効利用が可能となる。
【0059】
以上好ましい実施例をあげて本発明を説明したが、本発明は必ずしも上記実施例に限定されるものではない。
【0060】
【発明の効果】
以上説明したように本発明のファイル圧縮処理装置によれば、ファイル装置の空き容量が多ければファイルの圧縮を行なわずにファイルの高速再生を可能とし、またファイルのアクセス頻度や種類に応じて圧縮方式を適宜選択して、効率良いファイルの利用を可能としたファイル圧縮処理装置を提供することができる。
【0061】
また、空きファイル容量の基準であるしきい値をファイル装置の状態に応じて増減することにより、効率的なファイル圧縮処理が行なえるようになる。
【0062】
さらに、空きファイル容量が増加した時に、圧縮ファイルのうちアクセス頻度の高いファイルを伸長再生することで、伸長生成をできるだけ行なわずにファイルの利用が可能となり、ファイル利用時の再生処理が高速化される。
【図面の簡単な説明】
【図1】 本発明の第1の実施例によるファイル圧縮処理装置のブロック図。
【図2】 第1実施例のファイル圧縮処理装置のファイル圧縮処理の動作を示すフローチャート。
【図3】 第1実施例の利用者プログラムによるアクセスの動作を示すフローチャート。
【図4】 本発明の第2の実施例によるファイル圧縮処理装置のブロック図。
【図5】 第2実施例のファイル圧縮処理装置の動作を示すフローチャート。
【図6】 第2実施例のファイル圧縮処理装置の動作を示すフローチャート。
【図7】 第2実施例のファイル圧縮処理装置の動作を示すフローチャート。
【図8】 図5におけるしきい値を減少させる場合の状態を説明する図。
【図9】 図6におけるしきい値の初期値へのリセット状態を説明する図。
【図10】 図6におけるしきい値の増大処理の状態を説明する図。
【図11】 図7における「圧縮済みファイル」の伸長再生処理の状態を説明する図。
【符号の説明】
100 ファイル圧縮処理装置
101 ファイル状態監視手段
102 ファイル検索手段
103 しきい値変更手段
104 ファイル圧縮方式選定手段
105 ファイル圧縮手段
106 ファイル再生手段
120 利用者プログラム
130 ファイル装置
131 ディスク
132 ファイル属性管理部
Claims (7)
- ファイルを記録するファイル装置上の現在の空き容量値と、空き容量値の上限として予め設定されたしきい値を比較するファイル状態監視手段と、
前記ファイル状態監視手段により前記現在の空き容量値がしきい値より小さいと判断された場合に、前記ファイル装置上のファイルの圧縮処理を行なうファイル圧縮手段と、
前記現在の空き容量値が前記しきい値よりも小さい場合で圧縮するファイルが存在せず、かつ前記しきい値を所定調整値分だけ減少させた時にしきい値が前記圧縮前後のファイルサイズの差分の最大値より大の場合、前記しきい値を所定調整値だけ減少させ、前記現在の空き容量値が前記しきい値よりも大きく、かつ前記しきい値が前記しきい値の初期値よりも小さい場合、前記しきい値を増加させるしきい値変更手段とを備えることを特徴とするファイル圧縮処理装置。 - 前記ファイル装置に記録された各ファイルに関する最終アクセス日時及びアクセス回数、圧縮済みか否かの情報、データ種別情報、及び、前記ファイル装置内の圧縮されたファイルの圧縮前後のファイルサイズの差分の最大値と最小値とそれぞれのファイル名を含む管理情報を格納するファイル属性管理部と、
前記ファイル属性管理部の管理情報に基づいて、前記アクセス回数により求めたアクセス頻度の低い順に未圧縮のファイルを検索し、前記圧縮手段によって圧縮処理を行なう圧縮対象ファイルとして選択するファイル検索手段と、
前記ファイル属性管理部の管理情報に基づいて、前記圧縮手段で圧縮処理を行なうファイルのデータ種別及びアクセス頻度を求め、前記アクセス頻度の高い段階のファイルには、伸長再生時間の短い圧縮方式を、前記アクセス頻度の低い段階のファイルには圧縮率の高いファイル圧縮方式を選択し、前記圧縮手段に対し選択した圧縮方式による圧縮処理を指示する圧縮方式選定手段を備えることを特徴とする請求項1に記載のファイル圧縮処理装置。 - 前記しきい値変更手段は、前記圧縮対象ファイルが存在しない場合、前記しきい値を所定調整値分だけ減少させた時にしきい値が前記圧縮前後のファイルサイズの差分の最大値より大の場合に、前記しきい値を所定調整値だけ減少させることを特徴とする請求項2に記載のファイル圧縮処理装置。
- 前記ファイル装置に記録された圧縮ファイルのアクセス要求に応じて、該圧縮ファイルを伸長再生するファイル再生手段を備えることを特徴とする請求項1乃至3に記載のファイル圧縮処理装置。
- 前記しきい値が初期の値で、かつ前記空き容量が前記しきい値より大であると前記ファイル状態監視手段が判断した時に、圧縮されているファイルを検索し、圧縮済みのファイルを伸長再生するファイル再生手段を備えることを特徴とする請求項1乃至4に記載のファイル圧縮処理装置。
- 前記ファイル検索手段は、しきい値が初期の値で、空き容量が、しきい値の初期の値より大であると判断した場合に、前記ファイル属性管理部の管理情報に基づいて、アクセス頻度の高い圧縮済みファイルを検索し、前記再生手段によって伸長再生処理を行なう圧縮済みファイルとして選択することを特徴とする請求項5に記載のファイル圧縮処理装置。
- 前記しきい値変更手段は、前記しきい値が初期値でなく、前記空き容量が前記しきい値の初期値より大であると判断した場合に、前記しきい値を前記初期値に戻し、また前記しきい値が初期値でなく、前記空き容量が前記しきい値の初期値より小で、かつ空き容量としきい値との差分が前記所定調整値より大であると判断した場合に、前記空き容量としきい値との差分を前記所定調整値で除算して得られる整数値に前記所定調整値を掛けた分だけ前記しきい値を増加させることを特徴とする請求項2に記載のファイル圧縮処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001167341A JP3704483B2 (ja) | 1992-10-22 | 2001-06-01 | ファイル圧縮処理装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4-308173 | 1992-10-22 | ||
JP30817392 | 1992-10-22 | ||
JP2001167341A JP3704483B2 (ja) | 1992-10-22 | 2001-06-01 | ファイル圧縮処理装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27319393A Division JP3236152B2 (ja) | 1992-10-22 | 1993-10-04 | ファイル圧縮処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002049512A JP2002049512A (ja) | 2002-02-15 |
JP3704483B2 true JP3704483B2 (ja) | 2005-10-12 |
Family
ID=26565437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001167341A Expired - Fee Related JP3704483B2 (ja) | 1992-10-22 | 2001-06-01 | ファイル圧縮処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3704483B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4345830B2 (ja) | 2007-03-09 | 2009-10-14 | ソニー株式会社 | 情報記録装置、および情報記録方法 |
CN103999061B (zh) | 2011-12-22 | 2016-08-17 | 国际商业机器公司 | 存储器件存取系统 |
JP6011349B2 (ja) | 2013-01-11 | 2016-10-19 | 富士通株式会社 | ストレージ装置、およびデータ圧縮方法 |
JP6069031B2 (ja) * | 2013-03-04 | 2017-01-25 | 株式会社日立製作所 | 計算機及びメモリ管理方法 |
JP6620525B2 (ja) * | 2015-11-16 | 2019-12-18 | 富士ゼロックス株式会社 | 電子情報管理装置、電子情報管理プログラム |
CN113722284A (zh) * | 2021-07-30 | 2021-11-30 | 济南浪潮数据技术有限公司 | 一种集群日志存储方法、装置、设备及介质 |
CN117155406B (zh) * | 2023-10-30 | 2024-02-02 | 深圳市成为高科技有限公司 | 一种社会调查数据智能管理系统 |
-
2001
- 2001-06-01 JP JP2001167341A patent/JP3704483B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002049512A (ja) | 2002-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5675789A (en) | File compression processor monitoring current available capacity and threshold value | |
US7599906B2 (en) | File management device, file management method, file management method program, and recording medium the file management method program | |
US5819290A (en) | Data recording and management system and method for detecting data file division based on quantitative number of blocks | |
US6335746B1 (en) | Information processing method and apparatus for displaying a list of a plurality of image data files and a list of search results | |
US7136882B2 (en) | Storage device manager | |
US5590320A (en) | Computer file directory system | |
US5649151A (en) | Efficient method and apparatus for access and storage of compressed data | |
KR100714691B1 (ko) | 파일 시스템에 추가 정보를 저장하고 관리하는 장치 및방법 | |
CA2387653C (en) | File processing method, data processing device and storage medium | |
US7236992B2 (en) | Storage system | |
JP4315876B2 (ja) | ファイル管理プログラム、ファイル管理方法、及びファイル管理装置 | |
US5870756A (en) | Interchangeable storage medium containing program for processing data files thereupon to match a data file format to a computer system | |
JP2005215894A (ja) | データ処理装置、データ処理方法及びデータ処理プログラム | |
JPS6115243A (ja) | メモリ割当て方法 | |
EP1739678A1 (en) | Recording device, method thereof, program product and program recording medium | |
JP3236152B2 (ja) | ファイル圧縮処理装置 | |
JP3704483B2 (ja) | ファイル圧縮処理装置 | |
JP4233564B2 (ja) | データ処理装置、データ処理用のプログラムおよび記録媒体 | |
CA2377269C (en) | Disk medium managing method | |
EP3819754A1 (en) | Information processing apparatus and recording medium storing information processing program | |
US20050177547A1 (en) | Method for handling data | |
JP2000105717A (ja) | ファイル格納制御装置及びファイル格納制御方法 | |
JP2005353108A (ja) | データ記録装置及びデータ記録方法 | |
JPH0869400A (ja) | 圧縮データ記録方法 | |
JP4147484B2 (ja) | 記録装置および記録方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050224 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050708 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050725 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |