JP3770919B2 - ファイル処理方法、データ処理装置及び記憶媒体 - Google Patents
ファイル処理方法、データ処理装置及び記憶媒体 Download PDFInfo
- Publication number
- JP3770919B2 JP3770919B2 JP52369699A JP52369699A JP3770919B2 JP 3770919 B2 JP3770919 B2 JP 3770919B2 JP 52369699 A JP52369699 A JP 52369699A JP 52369699 A JP52369699 A JP 52369699A JP 3770919 B2 JP3770919 B2 JP 3770919B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- file
- section
- compressed
- storage medium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000003672 processing method Methods 0.000 title claims description 20
- 238000007906 compression Methods 0.000 claims description 89
- 230000006835 compression Effects 0.000 claims description 87
- 238000000034 method Methods 0.000 claims description 60
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 238000013144 data compression Methods 0.000 claims description 16
- 230000006837 decompression Effects 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/12—Formatting, e.g. arrangement of data block or words on the record carriers
- G11B20/1217—Formatting, e.g. arrangement of data block or words on the record carriers on discs
- G11B20/1252—Formatting, e.g. arrangement of data block or words on the record carriers on discs for discontinuous data, e.g. digital information signals, computer programme data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0608—Saving storage space on storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/0643—Management of files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0674—Disk device
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99942—Manipulating data structure, e.g. compression, compaction, compilation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
本発明はファイル処理方法、データ処理装置及び記憶媒体に係り、特に1又は複数の辞書や百科辞典等に関する辞書ファイル等のファイルを圧縮して記憶媒体に格納して読み出すファイル処理方法及びデータ処理装置並びに圧縮された辞書ファイル等のファイルを格納する記憶媒体に関する。
近年、辞書や百科辞典等の情報を予めCD−ROM等の記憶媒体に格納しておき、コンピュータでCD−ROMをアクセスすることにより、辞書や百科辞典等の情報を読み出して表示することが行われるようになった。これにより、辞書や百科辞典等の膨大な情報を非常にコンパクトな1枚のCD−ROMに格納できる。又、コンピュータを使用中に辞書や百科辞典等を開いて必要な情報を入手する代わりに、CD−ROMから必要な情報を読み取れるので、必要な情報を入手する手間が大幅に軽減される。
背景技術
辞書や百科辞典等の情報を格納した従来のCD−ROMでは、辞書ファイルが辞書データ及びインデックスのデータ(以下、インデックスデータと言う)からなる。例えば百科辞典の場合、辞書データには、語の意味を説明するテキストのデータ(以下、テキストデータと言う)、例えば語が動物であればその動物を示す画像のデータ(以下、画像データと言う)、例えば語が鳥であればその鳥の鳴き声を示す音声のデータ(以下、音声データと言う)等が含まれる。インデックスは、辞書ファイルから所望の辞書データを検索するために使用されるもので、辞書データに対して設けられており、キーワードと呼ばれることもある。インデックスデータには、見出しのポインタや項目のポインタ等が含まれる。見出しのデータには、見出し語が含まれる。又、項目のデータには、見出し語や解説文等が含まれる。
従来は、CD−ROMの記憶容量が比較的大きいため、テキストデータやインデックスデータは圧縮されずにCD−ROMに格納されている。他方、画像データ及び音声データは、特に画像データの情報量が多いこともあり、夫々適切な圧縮方式で圧縮されてCD−ROMに格納されている。
しかし、辞書毎や百科辞典毎に1枚のCD−ROMを必要とするのでは、辞書データの使い勝手が悪い。そこで、1枚のCD−ROMに複数の辞書や百科辞典等の情報を格納することが望ましいが、この場合、格納するべき情報量が、辞書データを圧縮しても1枚のCD−ROMの記憶容量を越えてしまう可能性があるという問題があった。又、CD−ROMに格納するべき辞書ファイルが単一の辞書や百科辞典等のものであっても、辞書ファイルの情報量が増大すれば、辞書データを圧縮しても1枚のCD−ROMの記憶容量を越えてしまう可能性もあった。
このため、辞書データだけでなく、インデックスデータを含む辞書ファイル全体を圧縮してCD−ROMに格納することが考えられるが、比較的簡単な方法で効率良く辞書ファイル全体を圧縮すると共に、圧縮辞書ファイルを短時間で伸長可能な方法は提案されていない。特に辞書や百科辞典等の場合には、インデックスデータの情報量が多いため、辞書ファイルの伸長時にインデックスデータを復元する処理に時間がかかると、所望のインデックスデータ又は辞書データへのアクセス時間が長くなり、辞書や百科辞典等の使い勝手が悪くなってしまう。
又、例えば辞書データをインデックスの項目単位又は固定長単位で圧縮する場合、特に辞書や百科辞典等ではインデックスデータの情報量が多いため、上記と同様に辞書ファイルの伸長時の処理に時間がかかってしまい、辞書や百科辞典等の使い勝手が悪くなってしまう。例えば、特開平9−26969号公報では、これに類似する方法を用いた電話帳検索システムが提案されているが、この提案方法では、インデックスデータは圧縮されない。これは、電話帳の場合、インデックスデータの情報量は、辞書データに対応する電話番号−姓、名、法人名、住所の情報量に比較すると小さく、圧縮しても全体としての情報圧縮効率があまり向上しないからである。このため、この提案方法を辞書や百科辞典等の情報を記憶媒体に格納する際に適用しても、辞書ファイル全体としての情報圧縮効率はあまり向上しない。
従って、従来は、辞書や百科辞典等のように、インデックスデータの情報量が辞書データの情報量と比較しても比較的大きい場合、辞書ファイルを効率良く圧縮して記憶媒体に格納すると共に、圧縮辞書ファイルを比較的簡単な処理により短時間でアクセスすることができないという問題があった。
発明の開示
そこで、本発明は、辞書や百科辞典等のように、インデックスデータの情報量が辞書データの情報量と比較しても比較的大きい場合でも、辞書ファイル等のファイルを効率良く圧縮して記憶媒体に格納すると共に、圧縮辞書ファイル等の圧縮ファイルを比較的簡単な処理により短時間でアクセス可能とするファイル処理方法、データ処理装置及び記憶媒体を提供することを目的とする。
本発明の目的は、データ及び該データに対するインデックスのデータを複数の区間に分割し、圧縮して圧縮ファイルを求めるステップと、該圧縮ファイルを前記区間の圧縮後のアドレス情報と共に記憶媒体に格納するステップとを含むファイル処理方法を提供することにある。本発明によれば、インデックスや各項目のテキスト等のデータにより構成される辞書ファイル等のファイルを効率良く圧縮して記憶媒体に格納することができ、又、圧縮ファイルの伸長を区間毎に行えば比較的簡単な処理でファイル検索を高速に行うことができる。
前記区間を固定長とすれば、圧縮前のアドレス情報を圧縮ファイルに含める必要がなく、データ圧縮効率を向上することができる。前記区間を可変長とし、前記格納するステップが、圧縮前のアドレス情報も前記記憶媒体に格納すれば、データの種別や区分に応じて適切な区間を設定することで、データ伸長を高速に行うことができる。
前記圧縮ファイルを前記区間毎に前記記憶媒体から読み出して伸長し、復元されたデータ及びインデックスのデータを補助記憶装置に格納するステップを更に含むようにすれば、高速データアクセスが可能な補助記憶装置を用いることにより、ファイル検索速度を向上することができる。
前記圧縮するステップが、各区間毎のデータ及びインデックスのデータに共通な圧縮アルゴリズム及び圧縮パラメータを使用するようにすれば、共通な圧縮アルゴリズム及び圧縮パラメータを使用することにより、データ圧縮処理及びデータ伸長時のデータ伸長処理を簡略化することができ、具体的な圧縮アルゴリズムとしてはハフマン符号やユニバーサル符号等を使用できる。
本発明の更に他の目的は、データ及び該データに対するインデックスのデータを複数の区間に分割し、圧縮して求められた圧縮ファイルを前記区間の圧縮後のアドレス情報と共に前記区間毎に記憶媒体から読み出すステップと、該圧縮ファイルを伸長して、データ及びインデックスのデータを復元するステップとを含むファイル処理方法を提供することにある。本発明によれば、圧縮辞書ファイル等の圧縮ファイルの伸長を区間毎に行うことにより比較的簡単な処理でファイル検索を高速に行うことができる。
本発明の他の目的は、データ及び該データに対するインデックスデータを複数の区間に分割し、圧縮して圧縮ファイルを求める手段と、該圧縮ファイルを前記区間の圧縮後のアドレス情報と共に記憶媒体に格納する手段とを備えたファイル処理装置を提供することにある。本発明によれば、インデックスや各項目のテキスト等のデータにより構成されるファイルを効率良く圧縮して記憶媒体に格納することができ、又、圧縮ファイルの伸長を区間毎に行えば比較的簡単な処理でファイル検索を高速に行うことができる。
本発明の更に他の目的は、データ及び該データに対するインデックスデータを複数の区間に分割し、圧縮して求められた圧縮ファイルを前記区間の圧縮後のアドレス情報と共に前記区間毎に記憶媒体から読み出す手段と、該圧縮ファイルを伸長して、データ及びインデックスデータを復元する手段とを備えたファイル処理装置を提供することにある。本発明によれば、圧縮ファイルの伸長を区間毎に行うことにより比較的簡単な処理でファイル検索を高速に行うことができる。
本発明の他の目的は、コンピュータで読み取り可能な情報を記憶した記憶媒体であって、コンピュータに、データ及び該データに対するインデックスのデータを複数の区間に分割し、圧縮して求められた圧縮ファイルを前記区間の圧縮後のアドレス情報と共に前記区間毎に前記記憶媒体から読み出させる手段と、コンピュータに、該圧縮ファイルを伸長して、データ及びインデックスのデータを復元させる手段とを備えたプログラムを格納する記憶媒体を提供することにある。本発明によれば、圧縮ファイルの伸長を区間毎に行うことにより比較的簡単な処理でファイル検索を高速に行うことができる。
本発明の更に他の目的は、コンピュータで読み取り可能な情報を記憶した記憶媒体であって、データ及び該データに対するインデックスのデータを複数の区間に分割し、圧縮して求められた圧縮ファイルを前記区間の圧縮後のアドレス情報と共に格納しており、該圧縮ファイルは、各区間毎のデータ及びインデックスのデータに共通な圧縮アルゴリズム及び圧縮パラメータを使用して圧縮されている記憶媒体を提供することにある。本発明によれば、効率良くファイルを圧縮して記憶媒体に格納することができ、又、圧縮ファイルの伸長を区間毎に行えば比較的簡単な処理でファイル検索を高速に行うことができる。
本発明の目的は、コンピュータで読取可能な情報を記録した記憶媒体であって、コンピュータに、辞書データ及び該辞書データに対するインデックスのデータを複数の区間に分割し、圧縮して圧縮辞書ファイルを求めさせる手順と、該圧縮辞書ファイルを前記区間の圧縮後のアドレス情報と共に記憶媒体に格納させる手順を実行させるためのプログラムを記録した記憶媒体を提供するにある。本発明によれば、比較的簡易な処理でファイル検索を高速に行うことができる。
本発明の更に他の目的は、圧縮ファイルを記録したコンピュータ読み取り可能な記録媒体であって、前記圧縮ファイルは、データ及び該データに対するインデックスのデータを複数の区間に分割して圧縮された圧縮データを記録した圧縮データ領域と、前記区間の圧縮後のアドレス情報を記録した格納アドレス情報領域と、前記圧縮の処理で用いた圧縮パラメータを記録した圧縮パラメータ領域を有する圧縮ファイルを記録したコンピュータ読み取り可能な記録媒体を提供するにある。本発明によれば、比較的簡易な処理でファイル検索を行うことができる。
従って、本発明によれば、辞書や百科辞典等のように、インデックスデータの情報量が辞書データの情報量と比較してもかなり大きい場合でも、辞書ファイル等のファイルを効率良く圧縮して記憶媒体に格納すると共に、圧縮辞書ファイル等のファイルを比較的簡単な処理により短時間でアクセス可能となる。
本発明の更に他の目的及び特長は、以下図面と共に述べる説明より明らかとなろう。
【図面の簡単な説明】
図1はファイル処理方法の実施例を採用したコンピュータシステムの概略構成を示すブロック図、
図2はCPUが行う圧縮パラメータ演算処理を説明するフローチャート、
図3は圧縮パラメータのデータ構造を示す図、
図4はCPUが行うデータ圧縮処理及びアドレス情報演算処理を説明するフローチャート、
図5はCPUが行う圧縮ファイル合成処理及び圧縮ファイル格納処理を説明するフローチャート、
図6は圧縮ファイルの合成を説明する図、
図7はCPUが行うインデックスリード処理を説明するフローチャート、
図8はCPUが行うデータ伸長処理を説明するフローチャート、
図9はCPUが行うテキストリード処理を説明するフローチャートである。
発明を実施するための最良の形態
本発明になるファイル処理方法及びデータ処理装置の一実施例を説明する。ファイル処理方法及びデータ処理装置の実施例は、本発明になる記憶媒体の一実施例を用いる。尚、記憶媒体の実施例では、本発明がCD−ROMに適用されているが、記憶媒体自体はCD−ROMに限定されず、本発明はCD−ROM以外の光学的情報記憶媒体、光磁気ディスク等の光磁気記憶媒体、フロッピーディスク等の磁気記憶媒体、各種半導体メモリデバイス等にも同様に適用可能であることは言うまでもない。
図1は、ファイル処理方法の実施例を採用したコンピュータシステムの概略構成を示すブロック図であり、データ処理装置の実施例に対応する。同図中、コンピュータシステムは、大略バス9により接続された中央処理装置(CPU)1、ランダムアクセスメモリ(RAM)等からなる主記憶装置2、ハードディスクドライブ等からなる補助記憶装置3、キーボードやマウス等からなる入力装置4、表示装置5及びCD−ROMドライブ等からなるCD−ROM入出力装置6からなる。コンピュータシステムを構成する各要素自体は、周知の構成のもので構成することができる。
入力装置4は、CPU1に指示やデータを入力するのに用いられ、CPU1はこれらの指示やデータに基づいて補助記憶装置3に格納されたプログラムを実行することで、ユーザの要求する処理を行う。補助記憶装置3に格納されたプログラムは、予めインストールされていても、CD−ROM入出力装置6にロードされたCD−ROM6aからロードされても良い。主記憶装置2は、CPU1が行う演算処理等の中間結果や演算に使用されるデータ等を一時的に格納するのに用いられる。表示装置5は、CPU1が行った処理の結果やユーザに指示やデータの入力を促すメッセージを表示する。尚、表示装置5に代えて、又は、表示装置5に加えて、CPU1が行った処理の結果等を印字するプリンタ(図示せず)をバス9に接続しても良い。
先ず、CD−ROM入出力装置6にロードされたCD−ROM6aに、辞書や百科辞典等の辞書ファイルを格納するファイル格納処理について説明する。ファイル格納処理は、大略圧縮パラメータ演算処理と、インデックスやテキスト等のデータ圧縮処理と、アドレス情報演算処理と、圧縮ファイル合成処理と、圧縮ファイル格納処理とからなる。本実施例では、説明の便宜上、CD−ROM6aはCPU1にファイル格納処理を行わせるプログラムが格納されており、CPU1は周知の方法でこのプログラムをCD−ROM6aから読み取って補助記憶装置3にロードするものとする。又、辞書や百科辞典等の辞書ファイルは、ホスト装置(図示せず)から転送されてバス9を介して補助記憶装置3に格納されているか、或いは、CD−ROM入出力装置6によりCD−ROM6aとは異なるCD−ROMから読み取られてバス9を介して補助記憶装置3に格納されているものとする。
1a)圧縮パラメータ演算処理:
図2は、CPU1が行う圧縮パラメータ演算処理を説明するフローチャートである。同図中、ステップS1は、補助記憶装置3をアクセスして辞書ファイルをオープンする。ステップS2は、辞書ファイルから1文字、即ち、例えば16ビットコードを読み出す。ステップS3は、読み出した16ビットコードの出現頻度をCPU1内の出現頻度カウンタでカウントする。ステップS4は、辞書ファイルの最終文字を処理したか否かを判定し、判定結果がNOであれば、処理はステップS2へ戻る。
他方、ステップS4の判定結果がYESの場合、ステップS5は、辞書ファイルをクローズする。ステップS6は、出現頻度順に16ビットコードをソートし、ステップS7は、出現頻度順に例えば1024個の16ビットコードを選択する。ステップS8は、選択されなかった残りの16ビットコードを8ビットコードに分解し、8ビットコードの出現頻度を算出する。ステップS9は、8ビットコードの出現頻度を約1/2にし、16ビットコードの出現頻度との補正を行う。
ステップS10は、補助記憶装置3内に圧縮パラメータの退避ファイルをオープンする。ステップS11は、1024個の16ビットコードとこれらの出現頻度を圧縮パラメータの退避ファイルに書き込む。又、ステップS12は、256個の8ビットコードとこれらの出現頻度を圧縮パラメータの退避ファイルに書き込む。ステップS13は、圧縮パラメータの退避ファイルをクローズし、処理は終了する。
図3は、圧縮パラメータのデータ構造を示す図である。ハフマン符号による圧縮の場合、同図に示すように、圧縮パラメータは、例えば1024種の16ビットコード毎の256種の出現頻度及び8ビットコード毎の256種の出現頻度からなる。これらの出現頻度は、ハフマン木の生成のためのデータとなる。尚、ユニバーサル符号による圧縮の場合の圧縮パラメータはトライの木もしくはそれを生成するための登録記号例とその参照番号等のデータで構成される。
1b)データ圧縮処理及びアドレス情報演算処理:
図4は、CPU1が行うデータ圧縮処理及びアドレス情報演算処理を説明するフローチャートである。同図中、ステップS21は、8ビットコードの出現頻度及び16ビットコードの出現頻度から変換テーブル、即ち、本実施例ではハフマン圧縮を行うのでハフマン木を作成する。ステップS22は、補助記憶装置3内の辞書ファイルをオープンする。ステップS23は、補助記憶装置3内に圧縮データの退避ファイル及びアドレス情報の退避ファイルをオープンする。
ステップS24は、辞書ファイルから1区間を読み出す。この区間は、固定長であっても、可変長であっても良いが、本実施例では説明の便宜上固定長であるものとする。尚、上記区間は、ブロックと呼ばれることもある。ステップS25は、ハフマン木を用いて1区間の圧縮データを演算する。ステップS26は、1区間の終わりに終了符号を付加する。又、ステップS27は、圧縮データを圧縮データの退避ファイルに書き込む。
ステップS28は、該当区間が格納されるアドレス情報を演算する。例えば区間が固定長の場合、アドレス情報は各区間に付けられた区間番号に基づいて演算される。ステップS29は、アドレス情報をアドレス情報の退避ファイルに書き込む。ステップS30は、最終区間を処理したか否かを判定し、判定結果がNOであれば、処理はステップS24へ戻る。最終区間を処理したか否かは、例えば区間番号や最終区間に付加された最終区間符号に基づいて判定することができる。
他方、ステップS30の判定結果がYESの場合、ステップS31は、圧縮データの退避ファイル及びアドレス情報の退避ファイルを夫々クローズする。又、ステップS32は、辞書ファイルをクローズし、処理は終了する。
1c)圧縮ファイル合成処理及び圧縮ファイル格納処理:
図5は、CPU1が行う圧縮ファイル合成処理及び圧縮ファイル格納処理を説明するフローチャートである。同図中、ステップS41は、補助記憶装置3内に圧縮ファイルをオープンする。ステップS42は、補助記憶装置3内の圧縮パラメータの退避ファイルをオープンし、ステップS43は、圧縮パラメータの退避ファイルの圧縮パラメータを圧縮ファイルに複写する。ステップS44は、圧縮パラメータの退避ファイルをクローズする。
ステップS45は、補助記憶装置3内のアドレス情報の退避ファイルをオープンし、ステップS46は、アドレス情報の退避ファイルのアドレス情報を圧縮ファイルに複写する。ステップS47は、アドレス情報の退避ファイルをクローズする。更に、ステップS48は、補助記憶装置3内の圧縮データの退避ファイルをオープンし、ステップS49は、圧縮データの退避ファイルの圧縮データを圧縮ファイルに複写する。ステップS50は、圧縮データの退避ファイルをクローズする。ステップS51は、圧縮ファイルをCD−ROM入出力装置6によりCD−ROM6aに格納する。又、ステップS52は、圧縮ファイルをクローズし、処理は終了する。
図6は、上記の如き1a)圧縮パラメータ演算処理、1b)データ圧縮処理及びアドレス情報演算処理及び1c)圧縮ファイル合成処理及び圧縮ファイル格納処理による圧縮ファイルの合成を説明する図である。同図中、(a)は圧縮パラメータを示し、本実施例ではハフマン符号による圧縮を行うための圧縮パラメータである。同図中、(b)は辞書ファイルの区間を示し、本実施例では各区間が例えば2kbyteであり、各区間は辞書データ及びインデックスデータからなる。例えば百科辞典の場合、辞書データには、語の意味を説明するテキストのテキストデータ、例えば語が動物であればその動物の示す画像データ、例えば語が鳥であればその鳥の鳴き声を示す音声データ等が含まれる。インデックスは、辞書ファイルから所望の辞書データを検索するために使用されるもので、辞書データに対して設けられており、キーワードと呼ばれることもある。インデックスデータには、見出しのポインタや項目のポインタ等が含まれる。見出しのデータには、見出し語が含まれる。又、項目のデータには、見出し語や解説文等が含まれる。
図6中、(c)は圧縮データを示し、各区間が固定長又は可変長で圧縮されている状態を示す。又、同図中、(d)は各区間に対して演算されたアドレス情報を示し、(e)は圧縮パラメータと、アドレス情報と、圧縮データを合成して管理情報を先頭に付加することで得られる圧縮ファイルを示す。管理情報は、辞書ファイル名、辞書ファイルの種別、辞書ファイルの圧縮種別等の、圧縮ファイルを検索する際に使用される情報が含まれる。
次に、CD−ROM入出力装置6にロードされたCD−ROM6aに格納された圧縮ファイルを読み取って所望のデータを検索するファイル検索処理について説明する。ファイル検索処理は、大略インデックスリード処理と、テキストリード処理とからなり、データ伸長処理を呼び出して実行される。本実施例では、説明の便宜上、CD−ROM6aはCPU1にファイル検索処理を行わせるプログラムが格納されており、CPU1は周知の方法でこのプログラム及び圧縮ファイルをCD−ROM6aから読み取って補助記憶装置3にロードするものとする。
2a)インデックスリード処理:
図7は、CPU1が行うインデックスリード処理を説明するフローチャートである。同図中、ステップS61は、ユーザが入力装置4より入力したインデックスデータに基づいて、最上位インデックスのアドレス情報を設定する。ステップS62は、伸長処理をコールし、補助記憶装置3内のファイル検索処理を行わせるプログラムから伸長処理を行わせるルーチンを読み出すことで、圧縮ファイル内の最上位インデックスのアドレスを伸長する。ステップS63は、上記インデックスデータに基づき、最上位インデックスの頭文字である上位インデックスのアドレスを獲得する。ステップS64は、伸長処理をコールし、圧縮ファイル内の上位インデックスのアドレスを伸長する。ステップS65は、上記インデックスデータに基づき、次階層の下位インデックスのアドレスを獲得する。ステップS66は、伸長処理をコールし、圧縮ファイル内の上記次階層の下位インデックスのアドレスを伸長する。ステップS67は、最下位インデックスのアドレスの伸長が終了したか否かを判定し、判定結果がNOであれば、処理はステップS65へ戻る。他方、ステップS67の判定結果がYESの場合、処理は終了する。
2b)データ伸長処理:
図8は、CPU1が行うデータ伸長処理を説明するフローチャートである。データ伸長処理は、インデックスリード処理及びテキストリード処理により呼び出される。同図中、ステップS71は、ユーザが入力装置4より入力したインデックスデータに基づいて、要求された伸長アドレス、データサイズや記憶領域を補助記憶装置3に記憶して、伸長されたデータサイズに対して充分な大きさの記憶領域を補助記憶装置3内に用意する。ステップS72は、CD−ROM6aから読み取って補助記憶装置3にロードされた圧縮ファイルがオープンされているか否かを判定し、判定結果がNOであると、ステップS73は補助記憶装置3内の圧縮ファイルをオープンする。ステップS74は、圧縮ファイルから圧縮パラメータを読み取り、圧縮パラメータ内の8ビットコードの出現頻度及び16ビットコードとその出現頻度を読み込む。ステップS75は、8ビットコードの出現頻度及び16ビットコードの出現頻度に基づき、ハフマン木を作成し、処理は後述するステップS76へ進む。尚、ハフマン木の葉のデータには、8ビットコードか16ビットコードかの判定用フラグが付加されている。
ステップS72の判定結果がYES又はステップS75の後、ステップS76は要求された伸長アドレスに対応するアドレス情報を圧縮ファイルから読み込む。ステップS77は、アドレス情報に基づいて、圧縮ファイルから対応する圧縮データの区間を読み込む。ステップS78は、ハフマン木により圧縮データの区間を伸長し、ステップS79は、8ビットコードか16ビットコードかの判定用フラグに基づいて、伸長されたデータを上記記憶領域に複写する。又、ステップS80は、圧縮ファイルに対して要求されたデータサイズの伸長が完了したか否かを判定する。
ステップS80の判定結果がNOの場合、ステップS81は、次の区間の伸長アドレスに対応したアドレス情報を圧縮ファイルから読み込む。ステップS81は、この次の区間の伸長アドレスに対応したアドレス情報に基づいて、圧縮ファイルから対応する圧縮データの区間を読み込み、処理はステップS78へ戻る。他方、ステップS80の判定結果がYESであると、処理は終了する。
2c)テキストリード処理:
図9は、CPU1が行うテキストリード処理を説明するフローチャートである。同図中、ステップS91は、ユーザが入力装置4より入力したインデックスデータに基づいて、伸長されたデータ中、インデックスと一致する項目をカウントする。ステップS92は、入力されたインデックスデータに基づいて、インデックスの項目ポインタの値をアドレスに設定する。ステップS93は、伸長処理をコールし、補助記憶装置3内のファイル検索処理を行わせるプログラムから伸長処理を行わせるルーチンを読み出すことで、圧縮ファイル内の項目ポインタで示されるテキスト、即ち、辞書データを1区間分伸長する。
ステップS94は、項目ポインタで示される辞書データが終了したか否かを判定し、判定結果がNOであると、ステップS95は次の1区間のアドレスを設定する。又、ステップS96は、伸長処理をコールして、圧縮ファイル内の項目ポインタで示される辞書データをこの次の1区間分伸長し、処理はステップS94へ戻る。他方、ステップS94の判定結果がYESの場合、ステップS97は入力されたインデックスデータに基づいて、全ての項目についての処理が終了したか否かを判定し、判定結果がNOであると、処理はステップS92へ戻る。ステップS97の判定結果がYESであると、ステップS98は全ての項目について伸長された辞書データを表示装置5に表示し、処理は終了する。
尚、ステップS98は、ステップS97の前に行うようにしても良い。この場合、ステップS98は、各項目について伸長された辞書データをその都度表示装置5に表示する。
上記実施例では、説明の便宜上、区間が固定長であるものとした。この場合、データ圧縮効率が良く、又、区間の圧縮前のアドレス情報を圧縮ファイルに格納しておかなくてもアドレス情報を圧縮ファイルから復元可能である。これは、区間が固定長であり、各区間には区間番号が付加されているため、各区間の他の区間に対する相対位置が算出可能であることによる。
他方、上記区間を可変長とすると、データ伸長速度を向上することができる。これは、データの種別や区分に対応して適切な長さの区間を設定することができ、余分なデータを伸長する必要がないことによる。尚、区間を可変長とした場合には、区間の圧縮前のアドレス情報を圧縮ファイルに格納しておく必要がある。従って、区間を固定長とするか、可変長とするかは、データ圧縮率を優先するか、データ伸長速度を優先するかにより決定すれば良い。
又、CD−ROM6aに格納される辞書ファイルは1以上であれば良い。複数の辞書や百科辞典等に関する複数の辞書ファイルをCD−ROM6aに格納した場合でも、図6中、(e)に示す管理情報内の辞書ファイル名や辞書ファイルの種別から検索したい辞書ファイルを特定することができる。
更に、上記実施例では、データ圧縮にハフマン符号を用いたが、ユニバーサル符号等も使用でき、辞書データを各区間毎に共通な圧縮パラメータで効率良く圧縮できるデータ圧縮方式であれば、ハフマン符号に限定されるものではない。又、データ圧縮及び伸張の対象となるデータは、辞書データに限定されず、インデックスとデータとからなるデータベースのデータをも包含する。
又、上記実施例では、ファイル検索処理プログラムおよび圧縮ファイルを補助記憶装置3にコピーして検索処理を行う説明しているが、これらを補助記憶装置3にコピーせず、プログラムと圧縮ファイルを主記憶装置2に展開し、前述と同様の処理を行うようにしても良い。
尚、上記実施例で用いる圧縮アルゴリズムによって、通常の8ビットでのハフマン符号によるデータ圧縮処理により圧縮率が向上し、CD−ROMや補助記憶装置として説明したハードディスクなどの記憶媒体に記録される圧縮ファイルの領域は少なくなる。圧縮アルゴリズムによって圧縮率は向上するが、圧縮ファイルを伸長するための処理時間は通常のハフマン符号圧縮のときとほとんど変わらない。
検索処理にかかる時間は、読み取り装置(ドライブ)のシーク時間と圧縮ファイルのリード時間と伸長処理時間からなる。
上述のように、圧縮アルゴリズムにより圧縮率が向上したことにより、記憶媒体に記録される圧縮ファイルの記録領域が少なくなることから、検索プログラムの検索処理にかかる時間のシーク時間が減少し、その結果、検索速度が向上する。この効果はハードウェアの性能向上に伴い、さらに顕著になる。
以上、本発明を実施例により説明したが、本発明は本発明の範囲内で種々の変形及び改良が可能であることは言うまでもない。
Claims (42)
- データ及び該データに対するインデックスのデータの両方を複数の区間に分割し、該データ中の所定数の16ビットコードを出現頻度順に選択し、選択されなかった残りの16ビットコードを8ビットコードに分解し、該8ビットコードを出現頻度順に選択した結果に基づいて変換テーブルを作成し、該変換テーブルに基づいてデータ圧縮を行って圧縮ファイルを求めるステップと、
該圧縮ファイルを前記各区間の圧縮後のデータが格納されるアドレス情報と共に記憶媒体に格納するステップとを含む、ファイル処理方法。 - 前記区間は固定長である、特許請求の範囲第1項記載のファイル処理方法。
- 前記区間は可変長であり、前記格納するステップは、圧縮前のアドレス情報も前記記憶媒体に格納する、特許請求の範囲第1項記載のファイル処理方法。
- 前記圧縮ファイルを前記区間毎に前記記憶媒体から読み出して伸長して、データ及びインデックスのデータを復元するステップを更に含む、特許請求の範囲第1項〜第3項のいずれか1項記載のファイル処理方法。
- 復元されたデータ及びインデックスのデータを補助記憶装置に格納するステップを更に含む、特許請求の範囲第4項記載のファイル処理方法。
- 前記圧縮するステップは、各区間毎のデータ及びインデックスのデータに共通な圧縮アルゴリズム及び圧縮パラメータを使用する、特許請求の範囲第1項〜第5項のいずれか1項記載のファイル処理方法。
- 前記データは、辞書データである、特許請求の範囲第1項〜第6項のいずれか1項記載のファイル処理方法。
- データ及び該データに対するインデックスのデータの両方を複数の区間に分割し、該データ中の所定数の16ビットコードを出現頻度順に選択し、選択されなかった残りの16ビットコードを8ビットコードに分解し、該8ビットコードを出現頻度順に選択した結果に基づいて変換テーブルを作成し、該変換テーブルに基づいてデータ圧縮を行って求められた圧縮ファイルを前記各区間の圧縮後のデータが格納されるアドレス情報と共に前記区間毎に記憶媒体から読み出すステップと、
該変換テーブルに基づいてデータ伸長を行って該圧縮ファイルを伸長して、データ及びインデックスのデータを復元するステップとを含む、ファイル処理方法。 - 復元されたデータ及びインデックスのデータを補助記憶装置に格納するステップを更に含む、特許請求の範囲第8項記載のファイル処理方法。
- 前記区間は固定長である、特許請求の範囲第8項又は第9項記載のファイル処理方法。
- 前記区間は可変長であり、圧縮前のアドレス情報も前記記憶媒体に格納されている、特許請求の範囲第8項〜第10項のいずれか1項記載のファイル処理方法。
- 前記データは、辞書データである、特許請求の範囲第8項〜第11項のいずれか1項記載のファイル処理方法。
- データ及び該データに対するインデックスのデータの両方を複数の区間に分割し、該データ中の所定数の16ビットコードを出現頻度順に選択し、選択されなかった残りの16ビットコードを8ビットコードに分解し、該8ビットコードを出現頻度順に選択した結果に基づいて変換テーブルを作成し、該変換テーブルに基づいてデータ圧縮を行って各区間を圧縮して圧縮ファイルを求める手段と、
該圧縮ファイルを前記各区間の圧縮後のデータが格納されるアドレス情報と共に記憶媒体に格納する手段とを備えた、ファイル処理装置。 - 前記区間は固定長である、特許請求の範囲第13項記載のファイル処理装置。
- 前記区間は可変長であり、前記格納する手段は、圧縮前のアドレス情報も前記記憶媒体に格納する、特許請求の範囲第13項記載のファイル処理装置。
- 前記圧縮ファイルを前記区間毎に前記記憶媒体から読み出して伸長して、データ及びインデックスのデータを復元する手段を更に備えた、特許請求の範囲第13項〜第15項のいずれか1項記載のファイル処理装置。
- 復元されたデータ及びインデックスのデータを補助記憶装置に格納する手段を更に備えた、特許請求の範囲第16項記載のファイル処理装置。
- 前記圧縮する手段は、各区間毎のデータ及びインデックスのデータに共通な圧縮アルゴリズム及び圧縮パラメータを使用する、特許請求の範囲第13項〜第17項のいずれか1項記載のファイル処理装置。
- 前記データは、辞書データである、特許請求の範囲第13項〜第18項のいずれか1項記載のファイル処理装置。
- データ及び該データに対するインデックスのデータの両方を複数の区間に分割し、該データ中の所定数の16ビットコードを出現頻度順に選択し、選択されなかった残りの16ビットコードを8ビットコードに分解し、該8ビットコードを出現頻度順に選択した結果に基づいて変換テーブルを作成し、該変換テーブルに基づいてデータ圧縮を行って求められた圧縮ファイルを前記各区間の圧縮後のデータが格納されるアドレス情報と共に前記区間毎に記憶媒体から読み出す手段と、
該変換テーブルに基づいて該圧縮ファイルを伸長して、データ及びインデックスのデータを復元する手段とを備えた、ファイル処理装置。 - 復元されたデータ及びインデックスのデータを補助記憶装置に格納する手段を更に備えた、特許請求の範囲第20項記載のファイル処理装置。
- 前記区間は固定長である、特許請求の範囲第20項又は第21項記載のファイル処理装置。
- 前記区間は可変長であり、圧縮前のアドレス情報も前記記憶媒体に格納されている、特許請求の範囲第20項又は第21項記載のファイル処理装置。
- 前記データは、辞書データである、特許請求の範囲第20項〜第23項のいずれか1項記載のファイル処理装置。
- コンピュータで読み取り可能な情報を記憶した記憶媒体であって、
コンピュータに、データ及び該データに対するインデックスのデータの両方を複数の区間に分割し、該データ中の所定数の16ビットコードを出現頻度順に選択し、選択されなかった残りの16ビットコードを8ビットコードに分解し、該8ビットコードを出現頻度順に選択した結果に基づいて変換テーブルを作成し、該変換テーブルに基づいてデータ圧縮を行って求められた圧縮ファイルを前記各区間の圧縮後のデータが格納されるアドレス情報と共に前記区間毎に前記記憶媒体から読み出させる手段と、
コンピュータに、該変換テーブルに基づいて該圧縮ファイルを伸長して、データ及びインデックスのデータを復元させる手段とを備えたプログラムを格納する、記憶媒体。 - コンピュータに、復元されたデータ及びインデックスのデータを補助記憶装置に格納させる手段を更に含む、特許請求の範囲第25項記載の記憶媒体。
- 前記区間は固定長である、特許請求の範囲第25項又は第26項記載の記憶媒体。
- 前記区間は可変長であり、前記読み出させる手段は、圧縮前のアドレス情報も前記記憶媒体から読み出させる、特許請求の範囲第25項又は第26項記載の記憶媒体。
- 前記圧縮ファイルは、各区間毎のデータ及びインデックスのデータに共通な圧縮アルゴリズム及び圧縮パラメータを使用して圧縮されている、特許請求の範囲第25項〜第28項のいずれか1項記載の記憶媒体。
- 前記データは、辞書データである、特許請求の範囲第25項〜第29項のいずれか1項記載の記憶媒体。
- コンピュータで読み取り可能な情報を記憶した記憶媒体であって、
データ及び該データに対するインデックスのデータの両方を複数の区間に分割し、該データ中の所定数の16ビットコードを出現頻度順に選択し、選択されなかった残りの16ビットコードを8ビットコードに分解し、該8ビットコードを出現頻度順に選択した結果に基づいて変換テーブルを作成し、該変換テーブルに基づいてデータ圧縮を行って求められた圧縮ファイルを前記各区間の圧縮後のデータが格納されるアドレス情報と共に格納しており、
該圧縮ファイルは、各区間毎のデータ及びインデックスのデータに共通な圧縮アルゴリズム及び圧縮パラメータを使用して圧縮されている、記憶媒体。 - 前記区間は固定長である、特許請求の範囲第31項記載の記憶媒体。
- 前記区間は可変長であり、圧縮前のアドレス情報も格納している、特許請求の範囲第31項記載の記憶媒体。
- 前記データは、辞書データである、特許請求の範囲第31項〜第33項のいずれか1項記載の記憶媒体。
- コンピュータで読取可能な情報を記録した記憶媒体であって、
コンピュータに、
辞書データ及び該辞書データに対するインデックスのデータの両方を複数の区間に分割し、該辞書データ中の所定数の16ビットコードを出現頻度順に選択し、選択されなかった残りの16ビットコードを8ビットコードに分解し、該8ビットコードを出現頻度順に選択した結果に基づいて変換テーブルを作成し、該変換テーブルに基づいてデータ圧縮を行って圧縮辞書ファイルを求めさせる手順と、
該圧縮辞書ファイルを前記各区間の圧縮後のデータが格納されるアドレス情報と共に記憶媒体に格納させる手順とを実行させるためのプログラムを記録した記憶媒体。 - 前記区間は固定長である、特許請求の範囲第35項記載の記憶媒体。
- 前記区間は可変長であり、前記読み出させる手段は、圧縮前のアドレス情報も前記記憶媒体から読み出させる、特許請求の範囲第35項記載の記憶媒体。
- 前記圧縮辞書ファイルは、各区間毎の辞書データ及びインデックスのデータに共通な圧縮アルゴリズム及び圧縮パラメータを使用して圧縮されている、特許請求の範囲第35項〜第37項のいずれか1項記載の記憶媒体。
- コンピュータに、前記圧縮辞書ファイルを前記区間毎に前記記憶媒体から読み出して伸長して、辞書データ及びインデックスのデータを復元させる手順を実行させるプログラムを更に記録した、特許請求の範囲第35項〜第38項のいずれか1項記載の記憶媒体。
- コンピュータに、復元された辞書データ及びインデックスのデータを補助記憶装置に格納させる手順を実行させるプログラムを更に記録した、特許請求の範囲第39項記載の記憶媒体。
- 圧縮ファイルを記録したコンピュータ読み取り可能な記録媒体であって、
前記圧縮ファイルは、辞書データ及び該辞書データに対するインデックスのデータの両方を複数の区間に分割して該辞書データ中の所定数の16ビットコードを出現頻度順に選択し、選択されなかった残りの16ビットコードを8ビットコードに分解し、該8ビットコードを出現頻度順に選択した結果に基づいて変換テーブルを作成し、該変換テーブルに基づいてデータ圧縮を行って各区間が圧縮された圧縮データを記録した圧縮データ領域と、
前記各区間の圧縮後の辞書データが格納されるアドレス情報を記録した格納アドレス情報領域と、前記圧縮の処理で用いた圧縮パラメータを記録した圧縮パラメータ領域を有する、圧縮ファイルを記録したコンピュータ読み取り可能な記録媒体。 - 前記圧縮パラメータは、前記辞書データ中の出現頻度順に選択した16ビットコードおよびその出現頻度と、該選択されなかった残りの16ビットコードを分割した8ビットコードから出現頻度順に選択した8ビットコードおよびその出現頻度である、特許請求の範囲第41項に記載の記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28855997 | 1997-10-21 | ||
PCT/JP1998/004736 WO1999021092A1 (fr) | 1997-10-21 | 1998-10-20 | Procede de traitement de fichiers, dispositif de traitement de donnees et support de memorisation |
Publications (1)
Publication Number | Publication Date |
---|---|
JP3770919B2 true JP3770919B2 (ja) | 2006-04-26 |
Family
ID=17731828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP52369699A Expired - Lifetime JP3770919B2 (ja) | 1997-10-21 | 1998-10-20 | ファイル処理方法、データ処理装置及び記憶媒体 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6721753B1 (ja) |
EP (1) | EP0962865A4 (ja) |
JP (1) | JP3770919B2 (ja) |
KR (1) | KR100495593B1 (ja) |
CN (2) | CN100535889C (ja) |
AU (1) | AU740957B2 (ja) |
CA (1) | CA2275391C (ja) |
WO (1) | WO1999021092A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10684831B2 (en) | 2015-06-10 | 2020-06-16 | Fujitsu Limited | Information processing apparatus, information processing method, and recording medium |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100535889C (zh) | 1997-10-21 | 2009-09-02 | 富士通株式会社 | 文件处理方法和数据处理装置 |
CA2387653C (en) | 1999-08-13 | 2006-11-14 | Fujitsu Limited | File processing method, data processing device and storage medium |
JP2003006216A (ja) * | 2001-06-26 | 2003-01-10 | Sony Corp | 情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム |
KR20020008101A (ko) * | 2001-12-12 | 2002-01-29 | 주식회사 애니콤소프트웨어 | 데이터의 비트 인덱스 압축방법 |
WO2006123429A1 (ja) | 2005-05-20 | 2006-11-23 | Fujitsu Limited | 情報検索方法、装置、プログラム、該プログラムを記録した記録媒体 |
KR20080046345A (ko) | 2006-11-22 | 2008-05-27 | 삼성전자주식회사 | 휴대용 단말기의 메모리 절약 장치 및 방법 |
US8843449B2 (en) | 2009-06-16 | 2014-09-23 | Bmc Software, Inc. | Unobtrusive copies of actively used compressed indices |
US8706727B2 (en) * | 2009-06-19 | 2014-04-22 | Sybase, Inc. | Data compression for reducing storage requirements in a database system |
US8694474B2 (en) * | 2011-07-06 | 2014-04-08 | Microsoft Corporation | Block entropy encoding for word compression |
JP2016170750A (ja) * | 2015-03-16 | 2016-09-23 | 富士通株式会社 | データ管理プログラム、情報処理装置およびデータ管理方法 |
US9946462B1 (en) * | 2016-02-15 | 2018-04-17 | Seagate Technology Llc | Address mapping table compression |
JP6794782B2 (ja) * | 2016-11-02 | 2020-12-02 | 富士通株式会社 | 情報処理装置、情報処理プログラム、及び情報処理方法 |
CN107357854A (zh) * | 2017-06-28 | 2017-11-17 | 光大环境科技(中国)有限公司 | 数据存储的方法、装置及计算机存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0527943A (ja) * | 1991-07-19 | 1993-02-05 | Fujitsu Ltd | データ圧縮方式 |
JPH08167852A (ja) * | 1994-12-13 | 1996-06-25 | Fujitsu Ltd | データ圧縮方法及び装置 |
JPH08320648A (ja) * | 1995-05-24 | 1996-12-03 | Matsushita Electric Ind Co Ltd | ナビゲーション装置 |
JPH0926902A (ja) * | 1995-07-12 | 1997-01-28 | Fujikura Ltd | ファイル圧縮並びに復元方法 |
JPH0969785A (ja) * | 1995-08-30 | 1997-03-11 | Toshiba Corp | データ圧縮方法及びデータ圧縮装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8828796D0 (en) * | 1988-12-09 | 1989-01-18 | British Telecomm | Data compression |
US5146221A (en) * | 1989-01-13 | 1992-09-08 | Stac, Inc. | Data compression apparatus and method |
US5333313A (en) * | 1990-10-22 | 1994-07-26 | Franklin Electronic Publishers, Incorporated | Method and apparatus for compressing a dictionary database by partitioning a master dictionary database into a plurality of functional parts and applying an optimum compression technique to each part |
JP3332954B2 (ja) | 1992-07-07 | 2002-10-07 | オリンパス光学工業株式会社 | 急速変形圧電アクチュエータおよび急速変形圧電アクチュエータを用いた内視鏡 |
JPH0628150A (ja) * | 1992-07-08 | 1994-02-04 | Funai Techno Syst Kk | プログラム容量圧縮方法 |
US5442350A (en) * | 1992-10-29 | 1995-08-15 | International Business Machines Corporation | Method and means providing static dictionary structures for compressing character data and expanding compressed data |
US5649183A (en) * | 1992-12-08 | 1997-07-15 | Microsoft Corporation | Method for compressing full text indexes with document identifiers and location offsets |
US5953723A (en) * | 1993-04-02 | 1999-09-14 | T.M. Patents, L.P. | System and method for compressing inverted index files in document search/retrieval system |
JP3051014B2 (ja) * | 1993-12-27 | 2000-06-12 | ローム株式会社 | データ記憶装置及びデータシステム |
JPH08241325A (ja) * | 1995-03-03 | 1996-09-17 | Matsushita Electric Ind Co Ltd | 電子辞書及びその製造方法並びにインデックス圧縮・伸長装置 |
JPH0926969A (ja) * | 1995-07-10 | 1997-01-28 | Hitachi Maxell Ltd | 電話帳検索システム |
US6278992B1 (en) * | 1997-03-19 | 2001-08-21 | John Andrew Curtis | Search engine using indexing method for storing and retrieving data |
CN100535889C (zh) | 1997-10-21 | 2009-09-02 | 富士通株式会社 | 文件处理方法和数据处理装置 |
-
1998
- 1998-10-20 CN CN03106774.3A patent/CN100535889C/zh not_active Expired - Fee Related
- 1998-10-20 WO PCT/JP1998/004736 patent/WO1999021092A1/ja active IP Right Grant
- 1998-10-20 KR KR10-1999-7005642A patent/KR100495593B1/ko not_active IP Right Cessation
- 1998-10-20 US US09/319,742 patent/US6721753B1/en not_active Expired - Lifetime
- 1998-10-20 JP JP52369699A patent/JP3770919B2/ja not_active Expired - Lifetime
- 1998-10-20 CA CA002275391A patent/CA2275391C/en not_active Expired - Fee Related
- 1998-10-20 CN CNB98801551XA patent/CN1148657C/zh not_active Expired - Fee Related
- 1998-10-20 AU AU94639/98A patent/AU740957B2/en not_active Ceased
- 1998-10-20 EP EP98947952A patent/EP0962865A4/en not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0527943A (ja) * | 1991-07-19 | 1993-02-05 | Fujitsu Ltd | データ圧縮方式 |
JPH08167852A (ja) * | 1994-12-13 | 1996-06-25 | Fujitsu Ltd | データ圧縮方法及び装置 |
JPH08320648A (ja) * | 1995-05-24 | 1996-12-03 | Matsushita Electric Ind Co Ltd | ナビゲーション装置 |
JPH0926902A (ja) * | 1995-07-12 | 1997-01-28 | Fujikura Ltd | ファイル圧縮並びに復元方法 |
JPH0969785A (ja) * | 1995-08-30 | 1997-03-11 | Toshiba Corp | データ圧縮方法及びデータ圧縮装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10684831B2 (en) | 2015-06-10 | 2020-06-16 | Fujitsu Limited | Information processing apparatus, information processing method, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
KR20000069633A (ko) | 2000-11-25 |
CN100535889C (zh) | 2009-09-02 |
US6721753B1 (en) | 2004-04-13 |
CN1148657C (zh) | 2004-05-05 |
KR100495593B1 (ko) | 2005-06-16 |
CN1242846A (zh) | 2000-01-26 |
CA2275391C (en) | 2005-12-06 |
CA2275391A1 (en) | 1999-04-29 |
WO1999021092A1 (fr) | 1999-04-29 |
EP0962865A1 (en) | 1999-12-08 |
AU740957B2 (en) | 2001-11-15 |
AU9463998A (en) | 1999-05-10 |
EP0962865A4 (en) | 2004-11-24 |
CN1487448A (zh) | 2004-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100597513B1 (ko) | 파일 처리 방법, 데이터 처리 장치 및 기억 매체 | |
JP3770919B2 (ja) | ファイル処理方法、データ処理装置及び記憶媒体 | |
JP4342753B2 (ja) | 文書検索装置、文書検索方法、プログラム及びコンピュータに読み取り可能な記憶媒体 | |
US8866647B2 (en) | Computer product, information processing apparatus, and information search apparatus | |
JP2002123410A (ja) | データ記憶装置 | |
JPH1196145A (ja) | 文書画像データの記憶制御方式 | |
US20070174261A1 (en) | Database retrieval apparatus, retrieval method, storage medium, and progam | |
US20040225497A1 (en) | Compressed yet quickly searchable digital textual data format | |
JP2000305822A (ja) | データベース管理装置,データベースレコード抽出装置,データベース管理方法及びデータベースレコード抽出方法 | |
JP4754849B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JPH04360246A (ja) | ファイル圧縮装置 | |
JPH06202921A (ja) | ファイル圧縮処理装置 | |
JPH10261969A (ja) | データ圧縮方法および装置 | |
JP2002092017A (ja) | 概念辞書拡張方法、装置、および概念辞書拡張プログラムを記録した記録媒体 | |
JP3898717B2 (ja) | データ圧縮/復元装置およびデータ圧縮/復元方法 | |
JPH10161996A (ja) | 文書作成方法及び装置 | |
JPH11259487A (ja) | 類似文書検索装置、類似文書検索方法、および類似文書検索のためのプログラムが記録された記録媒体 | |
JPH1166076A (ja) | データ派生装置及び方法、並びに、データ派生プログラムを格納した記憶媒体 | |
JP2002007411A (ja) | 情報検索方法及びその実施装置並びにその処理プログラムを記録した記録媒体 | |
JP2003323449A (ja) | データベース検索装置および検索方法ならびに記憶媒体、プログラム | |
JPH08272814A (ja) | 文字列検索装置 | |
JPH1097542A (ja) | 全文検索装置及び全文検索方法 | |
JPH01230126A (ja) | 索引順編成ファイルのインデックスアクセス方式 | |
JPH0969058A (ja) | 計算機システムおよびそのシステムで使用されるファイル管理方法 | |
JP2000276490A (ja) | 文書検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040405 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050405 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050511 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050602 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060208 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090217 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100217 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110217 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110217 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120217 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130217 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130217 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140217 Year of fee payment: 8 |
|
EXPY | Cancellation because of completion of term |