JP5808360B2 - 文字列圧縮及び復元システム並びに方法 - Google Patents
文字列圧縮及び復元システム並びに方法 Download PDFInfo
- Publication number
- JP5808360B2 JP5808360B2 JP2013080292A JP2013080292A JP5808360B2 JP 5808360 B2 JP5808360 B2 JP 5808360B2 JP 2013080292 A JP2013080292 A JP 2013080292A JP 2013080292 A JP2013080292 A JP 2013080292A JP 5808360 B2 JP5808360 B2 JP 5808360B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- sample
- replacement
- partial
- replacement pointer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
入力文字列Nから部分文字列を抽出し、該入力文字列Nにおける該部分文字列の出現回数をカウントし、該部分文字列とカウントを頻出パターン記憶手段に格納する頻出パターン分析手段と、
前記頻出パターン記憶手段を参照し、所定の回数K以上の出現回数の部分文字列を連結してサンプル文字列記憶手段に格納するサンプル文字列生成手段と、
前記入力文字列Nの開始位置iから始まる部分文字列と、前記サンプル文字列記憶手段から読み出した前記サンプル文字列Mの最大一致長LMと該部分文字列の出現位置PMを求め、前記入力文字列Nの開始位置i番目から始まる部分文字列と、該入力文字列Nの0番目からi−1番目までに出現した部分文字列との最大一致長LNと、該出現した部分文字列の出現位置P N を求め、該最大一致長LNが該最大一致長LMより大きい場合は、置換ポインタを該入力文字列Nの過去の位置を示すものとし、該最大一致長LMが該最大一致長LN以上である場合は、該置換ポインタをサンプル文字列M上の位置を示すものとし、該入力文字列Nの[i…i+L+1]の部分文字列を出現済みの部分文字列として動的辞書記憶手段に格納し、置換ポインタ列と該サンプル文字列を出力する置換ポインタ生成手段と、
を有する符号化手段と、
前記置換ポインタ生成手段から前記置換ポインタ列と前記サンプル文字列を取得し、置換ポインタがサンプル文字列M上の位置を示している場合には、該置換ポインタが参照するサンプル文字列M上の部分文字列を出力し、該置換ポインタが前記入力文字列Nの過去の位置を示す場合には、該置換ポインタが参照する既に復元済みの部分文字列を出力する置換ポインタ分析手段を有する復号手段と、を有する。
ステップ307) 最大一致長LをLNとし、ポインタをP N とし、ステップ310に移行する。
110 サンプル文字列生成部
120 サンプル文字列取得部
130 置換ポインタ生成部
140 サンプル文字列探索部
150 サンプル文字列M記憶部
160 動的辞書探索・更新部
170 動的辞書記憶部
180 置換ポインタ記憶部
200 復号部
210 置換ポインタ分析部
220 入力サンプル文字列記憶部
230 出力文字列記憶部
310 頻出パターン分析部
320 頻出パターン記憶部
Claims (4)
- 置換方式による文字列圧縮及び復元システムであって、
入力文字列Nから部分文字列を抽出し、該入力文字列Nにおける該部分文字列の出現回数をカウントし、該部分文字列とカウントを頻出パターン記憶手段に格納する頻出パターン分析手段と、
前記頻出パターン記憶手段を参照し、所定の回数K以上の出現回数の部分文字列を連結してサンプル文字列記憶手段に格納するサンプル文字列生成手段と、
前記入力文字列Nの開始位置iから始まる部分文字列と、前記サンプル文字列記憶手段から読み出したサンプル文字列Mの最大一致長LMと該部分文字列の出現位置PMを求め、前記入力文字列Nの開始位置i番目から始まる部分文字列と、該入力文字列Nの0番目からi−1番目までに出現した部分文字列との最大一致長LNと、該出現した部分文字列の出現位置P N を求め、該最大一致長LNが該最大一致長LMより大きい場合は、置換ポインタを該入力文字列Nの過去の位置を示すものとし、該最大一致長LMが該最大一致長LN以上である場合は、該置換ポインタをサンプル文字列M上の位置を示すものとし、該入力文字列Nの[i…i+L+1]の部分文字列を出現済みの部分文字列として動的辞書記憶手段に格納し、置換ポインタ列と該サンプル文字列を出力する置換ポインタ生成手段と、
を有する符号化手段と、
前記置換ポインタ生成手段から前記置換ポインタ列と前記サンプル文字列を取得し、置換ポインタがサンプル文字列M上の位置を示している場合には、該置換ポインタが参照するサンプル文字列M上の部分文字列を出力し、該置換ポインタが前記入力文字列Nの過去の位置を示す場合には、該置換ポインタが参照する既に復元済みの部分文字列を出力する置換ポインタ分析手段を有する復号手段と、
を有することを特徴とするサンプル文字列(辞書)を用いた二段階置き換えによる圧縮及び復元システム。 - 前記サンプル文字列記憶手段は、前記入力文字列Nに対して1%以下程度の領域とする
請求項1記載のサンプル文字列(辞書)を用いた二段階置き換えによる圧縮及び復元システム。 - 置換方式による文字列圧縮及び復元方法であって、
頻出パターン分析手段と、頻出パターン記憶手段と、サンプル文字列生成手段と、サンプル文字列記憶手段と、動的辞書記憶手段と、置換ポインタ生成手段とを有する符号化手段、及び、置換ポインタ分析手段を有する復号手段とを有する装置において、
前記符号化手段の前記頻出パターン分析手段が、入力文字列Nから部分文字列を抽出し、該入力文字列Nにおける該部分文字列の出現回数をカウントし、該部分文字列とカウントを前記頻出パターン記憶手段に格納する頻出パターン分析ステップと、
前記符号化手段の前記サンプル文字列生成手段が、前記頻出パターン記憶手段を参照し、所定の回数K以上の出現回数の部分文字列を連結してサンプル文字列記憶手段に格納するサンプル文字列生成ステップと、
前記符号化手段の前記置換ポインタ生成手段が、前記入力文字列Nの開始位置iから始まる部分文字列と、前記サンプル文字列記憶手段から読み出したサンプル文字列Mの最大一致長LMと該部分文字列の出現位置PMを求め、前記入力文字列Nの開始位置i番目から始まる部分文字列と、該入力文字列Nの0番目からi−1番目までに出現した部分文字列との最大一致長LNと、該出現した部分文字列の出現位置P N を求め、該最大一致長LNが該最大一致長LMより大きい場合は、置換ポインタを該入力文字列Nの過去の位置を示すものとし、該最大一致長LMが該最大一致長LN以上である場合は該置換ポインタをサンプル文字列M上の位置を示すものとし、該入力文字列Nの[i…i+L+1]の部分文字列を出現済みの部分文字列として動的辞書記憶手段に格納し、置換ポインタ列と該サンプル文字列を出力する置換ポインタ生成ステップと、
前記復号手段の前記置換ポインタ分析手段が、前記符号化手段より前記置換ポインタ列と前記サンプル文字列を取得し、置換ポインタがサンプル文字列M上の位置を示している場合には、該置換ポインタが参照するサンプル文字列M上の部分文字列を出力し、該置換ポインタが前記入力文字列Nの過去の位置を示す場合には、該置換ポインタが参照する既に復元済みの部分文字列を出力する置換ポインタ分析ステップと、
を行うことを特徴とするサンプル文字列(辞書)を用いた二段階置き換えによる圧縮及び復元方法。 - 前記サンプル文字列記憶手段を、前記入力文字列Nに対して1%以下程度の領域とする
請求項3記載のサンプル文字列(辞書)を用いた二段階置き換えによる圧縮及び復元方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013080292A JP5808360B2 (ja) | 2013-04-08 | 2013-04-08 | 文字列圧縮及び復元システム並びに方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013080292A JP5808360B2 (ja) | 2013-04-08 | 2013-04-08 | 文字列圧縮及び復元システム並びに方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014204357A JP2014204357A (ja) | 2014-10-27 |
JP5808360B2 true JP5808360B2 (ja) | 2015-11-10 |
Family
ID=52354418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013080292A Active JP5808360B2 (ja) | 2013-04-08 | 2013-04-08 | 文字列圧縮及び復元システム並びに方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5808360B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7159557B2 (ja) | 2017-12-28 | 2022-10-25 | 富士通株式会社 | 動的辞書の生成プログラム、動的辞書の生成方法および復号化装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2954749B2 (ja) * | 1991-07-19 | 1999-09-27 | 富士通株式会社 | データ圧縮方式 |
JP3241788B2 (ja) * | 1992-02-28 | 2001-12-25 | 富士通株式会社 | データ圧縮方式 |
JP3231105B2 (ja) * | 1992-11-30 | 2001-11-19 | 富士通株式会社 | データ符号化方式及びデータ復元方式 |
JPH06202844A (ja) * | 1993-01-05 | 1994-07-22 | Fujitsu Ltd | データ圧縮復元処理装置 |
JP3277792B2 (ja) * | 1996-01-31 | 2002-04-22 | 株式会社日立製作所 | データ圧縮方法および装置 |
JP2000269822A (ja) * | 1999-03-12 | 2000-09-29 | Fujitsu Ltd | データ圧縮装置、及びデータ復元装置 |
JP4479530B2 (ja) * | 2004-12-28 | 2010-06-09 | カシオ電子工業株式会社 | データ圧縮装置、及びデータ復元装置 |
-
2013
- 2013-04-08 JP JP2013080292A patent/JP5808360B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014204357A (ja) | 2014-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6319740B2 (ja) | データ圧縮を高速化する方法、並びに、データ圧縮を高速化するためのコンピュータ、及びそのコンピュータ・プログラム | |
KR101841103B1 (ko) | Vlsi 효율적인 허프만 인코딩 장치 및 방법 | |
US9203887B2 (en) | Bitstream processing using coalesced buffers and delayed matching and enhanced memory writes | |
US8692696B2 (en) | Generating a code alphabet of symbols to generate codewords for words used with a program | |
US20120288088A1 (en) | Method and system for compressing and encrypting data | |
KR101866151B1 (ko) | 적응형 레이트 압축 해시 프로세싱 디바이스 | |
JP4077409B2 (ja) | 高速最長一致探索方法及び装置 | |
US20200294629A1 (en) | Gene sequencing data compression method and decompression method, system and computer-readable medium | |
JP2007043595A (ja) | 可変長符号復号化方法および装置ならびにデータ伸長装置 | |
JP2019522940A (ja) | Simdエンジンを用いる汎用データ圧縮 | |
Nandi et al. | Modified compression techniques based on optimality of LZW code (MOLZW) | |
JP5808360B2 (ja) | 文字列圧縮及び復元システム並びに方法 | |
JP5808359B2 (ja) | 文字列圧縮及び復元システム並びに方法 | |
US9197243B2 (en) | Compression ratio for a compression engine | |
JP5808361B2 (ja) | 文字列圧縮及び復元システム並びに方法 | |
Chakraborty et al. | A Dictionary based Efficient Text Compression Technique using Replacement Strategy | |
Rincy et al. | Preprocessed text compression method for Malayalam text files | |
Philip et al. | LiBek II: A novel compression architecture using adaptive dictionary | |
US10826962B2 (en) | Techniques for dynamic shared compression | |
Qasem et al. | ITFComp: a compression algorithm for ARM architecture instruction trace files | |
Jrai | Efficiency lossless data techniques for Arabic text compression | |
CN115033381A (zh) | 压缩文件的处理方法、装置、计算机设备及存储介质 | |
JP2013148974A (ja) | データ格納方法及び装置及びプログラム | |
KR20130061254A (ko) | 사전 자료구조 구현체에서의 압축/복원 방법 및 그 장치 | |
JP2013211643A (ja) | 圧縮方法、復元方法、情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150310 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150422 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150519 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150813 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20150821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150904 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150908 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Ref document number: 5808360 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |