JPH0723238A - Picture data compression and decoding device - Google Patents

Picture data compression and decoding device

Info

Publication number
JPH0723238A
JPH0723238A JP5153094A JP15309493A JPH0723238A JP H0723238 A JPH0723238 A JP H0723238A JP 5153094 A JP5153094 A JP 5153094A JP 15309493 A JP15309493 A JP 15309493A JP H0723238 A JPH0723238 A JP H0723238A
Authority
JP
Japan
Prior art keywords
dictionary
data
universal
image data
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5153094A
Other languages
Japanese (ja)
Inventor
Yoshiyuki Okada
佳之 岡田
Yasuhiko Nakano
泰彦 中野
Shigeru Yoshida
茂 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5153094A priority Critical patent/JPH0723238A/en
Publication of JPH0723238A publication Critical patent/JPH0723238A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To enhance the compression ratio of universal coding by selecting an exclusive dictionary corresponding to the difference from statistic property depending on a line pitch and a dot period of a dot picture with respect to the picture data compression and decoding device applying universal coding to 2-dimension picture data such as a character and dots after they are converted into a pattern run length code. CONSTITUTION:A space dictionary 16-1 and a non-space dictionary 16-2 are provided as dictionaries used for universal coding and whether or not plural lines of conversion objects to intermediate data are space is discriminated by a dictionary selection means 14 by line pitch information of a character picture and one of the dictionaries 16-1, 16-2 is selected and a pattern run length code by an intermediate coding means 10 is coded by a universal coding means 12. A dictionary is selected similarly by a decoder. Moreover, a specific dictionary is selected from the dot picture according to its dot period.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字、網点などの1次
元ビットストリームの画像データをユニバーサル符号に
符号化して圧縮すると共に符号データを復号する画像デ
ータ圧縮及び復元装置に関し、特に、1次元ビットスト
リームをパターンとランレングスの中間データに変換し
た後にユニバーサル符号化する画像データ圧縮及び復元
装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image data compression and decompression device for encoding and compressing image data of a one-dimensional bit stream such as characters and halftone dots into a universal code and decoding the code data, and more particularly to 1. BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image data compression / decompression device that universally encodes a three-dimensional bitstream after converting it into intermediate data of a pattern and run length.

【0002】近年、オフィスオートメーションが発展
し、文書が白黒2値の画像情報としてファクシミリや光
ディスクファイル・システムなどで扱われるようになっ
ている。文書情報をディジタルデータとして利用すると
き、画像情報のデータ量は、文字画像に比べ非常に大き
く10数〜数10倍になる。また、最近は、画像の品位
を向上させるため、ファクシミリにおいては、従来のG
3機の約200dpiから、次のG4機では300dp
i,400dpiへと解像度が上がり、データ量は増加
する方向にある。したがって、蓄積や伝送等で画像情報
を効率良く扱うには、効率的なデータ圧縮を加えること
でデータ量を減らすことが必須となる。
In recent years, office automation has been developed, and a document has been handled as a binary image information in a facsimile or an optical disk file system. When the document information is used as digital data, the data amount of the image information is much larger than that of the character image and is ten to several tens of times. Further, recently, in order to improve the image quality, in the facsimile, the conventional G
About 200 dpi for three aircraft, 300 dpi for the next G4 aircraft
The resolution increases to i, 400 dpi, and the amount of data tends to increase. Therefore, in order to handle image information efficiently for storage and transmission, it is essential to reduce the data amount by adding efficient data compression.

【0003】[0003]

【従来の技術】従来、白黒2値画像の圧縮方式として、
画像の二次元的性質を捉えた中間データへの変換処理を
行った後にユニバーサル符号化する方式が既に提案され
ており、この方法によれば従来の代表的な2つの方式で
あるMMR方式と予測符号化方式に匹敵する圧縮率が得
られる。
2. Description of the Related Art Conventionally, as a compression method for a monochrome binary image,
A universal encoding method has been already proposed after performing conversion processing to intermediate data that captures the two-dimensional characteristics of an image. According to this method, two typical conventional methods, the MMR method and the prediction method, have been proposed. A compression ratio comparable to the encoding scheme is obtained.

【0004】図24は従来のデータ圧縮装置を示し、パ
ターン・ランレングス変換部10と、LZW符号化部1
2で構成される。また図25は従来の画像データ復元装
置を示したもので、LZW復号化部18とパターン・ラ
ンレングス逆変換部20で構成される。図26は画像デ
ータとパターン・ランレングス符号の変換を、白黒画像
データを例にとって示す。画像データは通常、1次元の
ビットストリームとして入力される。この画像データは
実際の画像に対応した所定ビット長のラインデータに図
26(a)に示すように分割する。この2次元の原画デ
ータについて、4ラインを対象に、図26(b)のよう
に白黒パターンの種類と同一パターンが連続する数、即
ちランレングス情報との組で表現される中間データに変
換する。このように変換されたパターン・ランレングス
符号を対象に、例えばLZW符号に変換するユニバーサ
ル符号化を適用する。
FIG. 24 shows a conventional data compression apparatus, which includes a pattern run length conversion unit 10 and an LZW encoding unit 1.
It consists of 2. FIG. 25 shows a conventional image data restoration device, which is composed of an LZW decoding unit 18 and a pattern run length inverse conversion unit 20. FIG. 26 shows conversion of image data and pattern run-length code by taking monochrome image data as an example. Image data is usually input as a one-dimensional bit stream. This image data is divided into line data having a predetermined bit length corresponding to the actual image as shown in FIG. This two-dimensional original image data is converted into intermediate data represented by a combination of the number of consecutive black-and-white patterns and the same pattern, that is, run length information, as shown in FIG. . For the pattern run-length code converted in this way, universal coding for converting to, for example, an LZW code is applied.

【0005】符号データの復元は、LZA符号からパタ
ーン・ランレングス符号を復号した後に、図26に示す
逆変換を行って元の原画データを復元し、最終的に1次
元のビットストリームとして出力する。この方法は、2
値画像の2次元的情報を前処理によって取り入れ、その
結果をユニバーサル符号化するため、データの種類に依
存せず、かつ簡単な回路で効率よくデータを圧縮するこ
とができる。
To restore the code data, after decoding the pattern run length code from the LZA code, the inverse original transform shown in FIG. 26 is performed to restore the original original image data and finally output as a one-dimensional bit stream. . This method is 2
Since the two-dimensional information of the value image is taken in by preprocessing and the result is universally encoded, the data can be efficiently compressed by a simple circuit without depending on the type of the data.

【0006】即ち、入力した画像を複数ラインのパター
ンとランレングスの中間データに変換し、中間データか
らパターンとランレングスの連続性等の統計的性質をユ
ニバーサル符号化の手法により学習しながら符号の最良
化を図り、種々の性質の画像において効率の良い圧縮を
行うようにするものである。また、元来ユニバーサル符
号は、情報保存型のデータ圧縮方法であり、データ圧縮
時に情報源の統計的な性質を予め仮定しないため、文字
コード、オブジェクトコードなどの種々のデータに適用
することができる。文書画像では、文字の輪郭等や文字
間隔には類似性がある。また、網点画像は網点周期性、
網点形状の同一性等が類似している。この類似性のもつ
冗長性をユニバーサル符号化により削減し、有効な圧縮
を行うことができる。
That is, an input image is converted into intermediate data of a pattern and a run length of a plurality of lines, and the statistical properties such as continuity of the pattern and the run length are learned from the intermediate data by a universal coding method. The optimization is performed so that the images having various properties are efficiently compressed. Further, the universal code is originally an information storage type data compression method, and since the statistical property of the information source is not assumed in advance at the time of data compression, it can be applied to various data such as character codes and object codes. . In a document image, there are similarities in character outlines and character spacing. Also, the halftone dot image has halftone dot periodicity,
The dot shapes are similar in identity. The redundancy with this similarity can be reduced by universal coding, and effective compression can be performed.

【0007】ここでは、ユニバーサル符号化の一つであ
るLZW符号を取り上げる(T.A.Welch,"A Technique f
or High-Performance Data Compression",Computer,Jun
e1984 参照)。LZW符号では、次のシンボルを次の部
分列に組み込むようにしてインデックスのみで符号化で
きるようにしている。図27にLZW符号における辞書
の木構成を示し、図28にLZW符号における文字列の
符号化を示す。また、LZW符号の符号化と復号化の詳
細なアルゴリズムを図29と図30に示す。LZW符号
化は、書き替え可能な辞書をもち、入力文字コード、デ
ータ中を相異なる文字列に分け、この文字列を出現した
順に番号(インデックスi)を付けて辞書に登録すると
ともに、現在入力している文字列を辞書に登録してある
最長一致文字列の番号で表して、符号化するものであ
る。
Here, the LZW code which is one of the universal coding is taken up (TAWelch, "A Technique f
or High-Performance Data Compression ", Computer, Jun
e1984). In the LZW code, the next symbol is incorporated in the next subsequence so that the next symbol can be encoded only by the index. FIG. 27 shows the tree structure of the dictionary in the LZW code, and FIG. 28 shows the encoding of the character string in the LZW code. Further, detailed algorithms of encoding and decoding of LZW code are shown in FIGS. 29 and 30. The LZW encoding has a rewritable dictionary, divides the input character code and data into different character strings, adds the number (index i) to the character string in the order of appearance, and registers it in the dictionary. The encoded character string is represented by the number of the longest matching character string registered in the dictionary and is encoded.

【0008】図29のLZW符号化処理では、まずステ
ップS1で予め全文字につき一文字からなる文字列を初
期値として登録してから符号化を始める。ステップS2
では入力した最初の文字Kを辞書検索する参照番号ωと
し、これを語頭文字列(prefix string )とする。次に
ステップS3で入力データの次の文字Kを読み込み、ス
テップS4ではステップS2で求めた語頭文字列ωにス
テップS3で読み込んだ文字Kを加えた文字列(ωK)
が現在の辞書にあるか否か検索する。
In the LZW encoding process of FIG. 29, first, in step S1, a character string consisting of one character for all characters is registered in advance as an initial value, and then encoding is started. Step S2
Then, the input first character K is used as a reference number ω for dictionary search, and this is used as a prefix string. Next, in step S3, the next character K of the input data is read, and in step S4, the character string (ωK) obtained by adding the character K read in step S3 to the initial character string ω obtained in step S2.
Is searched for in the current dictionary.

【0009】ステップS4で文字列(ωK)が辞書にあ
れば、ステップS5で文字列(ωK)を参照番号ωに置
き換え、ステップS5で入力データが終了かどうかを判
断した後、再びステップS3に戻って文字列(ωK)が
辞書から探せなくなるまで最大一致長の検索を続ける。
次にステップS4で文字列(ωK)が辞書になければ、
ステップS7に進んでステップS2で求めた文字Kの参
照番号ωを符号語code(ω)として出力する。
If the character string (ωK) is found in the dictionary in step S4, the character string (ωK) is replaced with the reference number ω in step S5, and it is determined in step S5 whether or not the input data has ended. Returning to this, the search for the maximum matching length is continued until the character string (ωK) cannot be searched from the dictionary.
Next, in step S4, if the character string (ωK) is not in the dictionary,
Proceeding to step S7, the reference number ω of the character K obtained in step S2 is output as the code word code (ω).

【0010】また文字列(ωK)に新たな参照番号を付
加して辞書に登録し、さらにステップS2の入力文字K
を参照番号ωに置き換えるとともに、辞書アドレスNを
インクリメントして、ステップS5のチェックを受けた
後、ステップS2に戻って次の文字Kを読み込む。図3
1、図32を参照して符号化を具体的に説明すると次の
ようになる。尚、説明を簡単にするためabcの3文字
の組合せからなるデータを圧縮する場合を取上げてい
る。まず図31の入力データは左から右へ読み込む。最
初の文字aを入力したとき、辞書にはaの他に一致する
文字列がないので、出力符号(参照番号ω)を符号語と
して出力する。
A new reference number is added to the character string (ωK) and registered in the dictionary, and the input character K in step S2 is added.
Is replaced with a reference number ω, the dictionary address N is incremented, and after the check in step S5, the process returns to step S2 to read the next character K. Figure 3
1, the encoding will be described in detail with reference to FIG. Note that, for simplification of description, the case where data consisting of a combination of three letters abc is compressed is taken up. First, the input data of FIG. 31 is read from left to right. When the first character a is input, the output code (reference number ω) is output as a code word because there is no matching character string in the dictionary other than a.

【0011】そして、拡張した文字列abに参照番号4
を付けて辞書に登録する。実際の登録は文字列(1b)
の形となる。続いて2番目のbが文字列の先頭になる。
辞書にはbの他に一致する文字列がないので、参照番号
2を符号語として出力し、拡張した文字列baを実際に
は2aの形で参照番号5をつけて辞書に登録する。3番
目のaが次の文字列の先頭になる。以下、同様にこの処
理を続ける。
The reference character 4 is added to the expanded character string ab.
And add it to the dictionary. The actual registration is a character string (1b)
Will be in the form of. Then, the second b becomes the beginning of the character string.
Since there is no matching character string other than b in the dictionary, reference number 2 is output as a code word, and the expanded character string ba is actually added to reference number 5 in the form of 2a and registered in the dictionary. The third a is the beginning of the next character string. Hereinafter, this processing is similarly continued.

【0012】図30の復号化処理は図29の符号化の逆
の操作を行う。まずステップS1において符号化と同様
に予め辞書に全文字につき一文字からなる文字列を初期
値として登録してから復号を始める。まずステップS2
で最初の符号(参照番号)を読み込み、現在のCODE
をOLDcodeとし、最初の符号は既に辞書に登録さ
れた一文字の参照番号いずれかに該当することから、入
力符号CODEに一致する文字code(K)を探し出
し、文字Kを出力する。なお、出力した文字(K)は後
の例外処理のためcharにセットしておく。
The decoding process of FIG. 30 performs the reverse operation of the encoding of FIG. First, in step S1, similarly to the encoding, a character string consisting of one character for every character is registered in the dictionary in advance as an initial value, and then decoding is started. First, step S2
The first code (reference number) is read with and the current CODE
Is the OLD code, and the first code corresponds to any one-character reference number already registered in the dictionary, so the character code (K) that matches the input code CODE is searched for and the character K is output. The output character (K) is set in char for exception processing later.

【0013】次にステップS3に進んで次の符号を読み
込んでCODEにNEWcodeとしてセットする。次
にステップS4に進み、ステップS3で入力された符号
CODEが辞書に定義(登録)されているか否かチェッ
クする。通常、入力した符号語は前回までの処理で辞書
に登録されているため、ステップS5に進んで符号CO
DEに対応する文字列code(ωK)を辞書から読み
出し、ステップS6で文字列Kを一時的にスタックし、
参照番号code(ω)を新たなCODEとして再度ス
テップS5に戻し、このステップS5,ステップS6の
手順を再帰的に参照番号ωが一文字にいたるまで繰り返
す。
Next, in step S3, the next code is read and set in CODE as NEWcode. Next, in step S4, it is checked whether the code CODE input in step S3 is defined (registered) in the dictionary. Normally, since the input codeword is registered in the dictionary by the processing up to the previous time, the process proceeds to step S5 and the code CO
The character string code (ωK) corresponding to DE is read from the dictionary, and the character string K is temporarily stacked in step S6.
The reference number code (ω) is returned to step S5 as a new CODE, and the procedure of steps S5 and S6 is recursively repeated until the reference number ω reaches one character.

【0014】最後にステップS7に進んでステップS6
でスタックした文字をLILO(Last In Fast Out)形
式でポップアップして出力する。同時にステップS7に
おいて、前回使った符号ωと今回復元した文字列の最初
の一文字Kを組(ω,K)と表した文字列に、新たな参
照番号を付加して辞書に登録する。なお、ステップS4
において登録されていない符号(符号化において直前の
参照番号を参照する場合に起きる)場合、ステップS9
にて、OLDcodeをCODEに、code(OLD
code,char)をNEWcodeに戻した後にス
テップS5へ進むようにする。
Finally, the process proceeds to step S7 and step S6.
The characters stacked at are popped up and output in the LILO (Last In Fast Out) format. At the same time, in step S7, a new reference number is added to the character string representing the previously used code ω and the first character K of the character string restored this time as a set (ω, K) and registered in the dictionary. Note that step S4
If the code is not registered in (which occurs when the immediately preceding reference number is referred to in encoding), step S9
, OLDcode to CODE, code (OLD
After returning (code, char) to NEWcode, the process proceeds to step S5.

【0015】図33を参照して復号化処理を具体的に説
明すると次のようになる。尚、説明を簡単にするためa
bcの3文字の組合せからなるデータを復元する場合を
取上げている。まず最初の入力文字は1であり、一文字
a,b,cについては既に参照番号1,2,3として図
32に示すように辞書に登録されているため、辞書の参
照により符号1に一致する参照番号の文字列aに置き換
えて出力する。
The decoding process will be specifically described with reference to FIG. 33 as follows. In addition, in order to simplify the explanation a
The case of restoring data consisting of a combination of three characters bc is described. First, the first input character is 1, and since the characters a, b, and c are already registered in the dictionary as reference numbers 1, 2, and 3 as shown in FIG. 32, the reference to the dictionary matches the code 1. The character string a of the reference number is replaced and output.

【0016】次の符号2についても同様にして文字bに
置き換えて出力する。このとき前回処理した符号と今回
復号した最初の一文字bとを組み合わせた(1b)に新
たな参照番号4を付加した辞書に登録する。3番目の符
号4は辞書の探索により1bからabと置き換えて文字
列abを出力する。同様に前回処理した符号2と今回復
号した文字列の1番目の文字aとの組合せた文字列2a
(=ba)を新たな参照番号5を付加して辞書に登録す
る。以下同様に、この処理を繰り返す。
Similarly, the following code 2 is replaced with the character b and output. At this time, the code processed previously is combined with the first character b decoded this time (1b) and is added to the dictionary with a new reference number 4. The third code 4 replaces 1b with ab by searching the dictionary and outputs the character string ab. Similarly, a character string 2a obtained by combining the previously processed code 2 and the first character a of the character string decoded this time
A new reference number 5 is added to (= ba) and registered in the dictionary. Similarly, this process is repeated thereafter.

【0017】ただし、図33の復号化では次の例外処理
がある。この例外処理は、第6番目の入力符号8の復号
で生ずる。符号8は復号時に辞書に定義されておらず、
復号できない。この場合には、前回処理した符号5に前
回復号した文字列baの最初の一文字bを加えた文字列
5bを求め、さらに2ab,babと置き換えられて出
力される。そして、文字列の出力語に前回の符号語5に
今回復号した文字列の文字bを加えた文字列5bに参照
番号8を付加して辞書に登録する。
However, there is the following exception processing in the decoding of FIG. This exception processing occurs in the decoding of the sixth input code 8. Code 8 is not defined in the dictionary at the time of decoding,
I can't decrypt. In this case, the character string 5b obtained by adding the first character b of the previously decoded character string ba to the code 5 processed last time is obtained and further replaced with 2ab and bab and output. Then, the reference number 8 is added to the character string 5b obtained by adding the character b of the character string decoded this time to the previous code word 5 to the output word of the character string and registered in the dictionary.

【0018】この例外処理は図30の復号化処理フロー
のステップS4,ステップS9の処理を通じて行われ、
最終的にステップS7で文字列の出力と新たな文字列に
参照番号を付加した辞書への登録が行われる。尚、図2
9、図30の符号化処理と復号化処理は、同じ辞書を作
り出しながら行う。
This exception processing is performed through the processing of steps S4 and S9 in the decoding processing flow of FIG.
Finally, in step S7, the character string is output and the new character string is registered in the dictionary with the reference number added. Incidentally, FIG.
9. The encoding process and the decoding process in FIG. 30 are performed while creating the same dictionary.

【0019】[0019]

【発明が解決しようとする課題】しかしながら、画像デ
ータをパターン・ランレングス符号に変換した後にユニ
バーサル符号に変換し、またユニバーサル符号から復号
したパターン・ランレングス符号を元の画像データに逆
変換する従来装置にあっては、次の問題があった。
However, the conventional method of converting the image data into the pattern run-length code and then the universal code, and the pattern-run length code decoded from the universal code into the original image data is reversely converted. The device had the following problems.

【0020】通常、ワープロ等で作成された文字画像の
場合、文字行間の行ピッチが一定であるために周期的に
空白部分が存在する。この場合、文字の部分と空白の部
分は分離可能であるが、画像の統計的性質が異なる。同
様に網点画像の場合も、網点周期毎に類似したパターン
が現れるが、網点周期の位相が異なるライン群では画像
の統計的性質が異なる。
Usually, in the case of a character image created by a word processor or the like, blank spaces are periodically present because the line pitch between character lines is constant. In this case, the character portion and the blank portion can be separated, but the statistical properties of the image are different. Similarly, in the case of a halftone dot image, a similar pattern appears for each halftone dot period, but the statistical properties of the image are different in the line groups having different phases of the halftone dot period.

【0021】しかしながら、従来の方法はLZW符号に
変換するユニバーサル符号化の部分において単一の辞書
を用いていたため、性質の異なるデータに対して混在さ
せた辞書を作成するか、データの種類毎に辞書をクリア
して再学習をするか2つの方法しかなかったため、圧縮
率を十分に高められない問題があった。本発明は、この
ような従来の問題点に鑑みてなされたもので、文字画像
の行ピッチや網点画像の網点周期に依存した統計的性質
の違いでデータを分類して専用の辞書を対応づけ、ユニ
バーサル符号化の圧縮率を高めるようにした画像データ
圧縮及び復元装置を提供することを目的とする。
However, since the conventional method uses a single dictionary in the universal encoding part for converting to the LZW code, it is necessary to prepare a mixed dictionary for data having different properties, or to prepare for each data type. Since there are only two methods of clearing the dictionary and re-learning, there is a problem that the compression rate cannot be increased sufficiently. The present invention has been made in view of such a conventional problem, and classifies the data according to the difference in statistical properties depending on the line pitch of the character image and the halftone dot period of the halftone dot image to create a dedicated dictionary. It is an object of the present invention to provide an image data compression / decompression device that is associated with the compression rate of universal encoding.

【0022】[0022]

【課題を解決するための手段】図1は本願第1発明の原
理説明図であり、文字画像を対象とする。まず本発明
は、図1(a)に示す中間符号化手段(パターン・ラン
レングス符号化手段)10とユニバーサル符号化手段1
2を備えた画像データ圧縮装置を対象とする。ここで中
間符号化手段10は、1次元のビットストリームで構成
される画像データを、所定長のラインデータに分割して
並べて2次元化し、この2次元データを所定ライン数毎
に分割方向でのパターンとライン方向での同一パターン
の連続数を示すランレングスの組でなる中間データに変
換する。またユニバーサル符号化手段12は、中間符号
化手段10で変換した中間データを辞書を用いてユニバ
ーサル符号に符号化する。
FIG. 1 is a diagram for explaining the principle of the first invention of the present application, which targets character images. First, the present invention is based on the intermediate coding means (pattern run length coding means) 10 and the universal coding means 1 shown in FIG.
An image data compression device provided with 2. Here, the intermediate encoding means 10 divides the image data composed of the one-dimensional bit stream into line data of a predetermined length and arranges them into two-dimensional data, and the two-dimensional data is divided by a predetermined number of lines in the division direction. It is converted into intermediate data that is a set of run lengths indicating the number of consecutive patterns and the same pattern in the line direction. The universal encoding means 12 encodes the intermediate data converted by the intermediate encoding means 10 into a universal code using a dictionary.

【0023】このような画像データ圧縮装置につき第1
発明は、ユニバーサル符号化に用いる辞書として空白用
辞書16−1と非空白用辞書16−2を設ける。そし
て、予め与えられた文字画像の行ピッチ情報により辞書
選択手段14で、中間データへの変換対象となった複数
ラインが空白か否か判断し、2つの辞書16−1,16
−2から1つを選択することを特徴とする。
First of all for such an image data compression apparatus
The invention provides a blank dictionary 16-1 and a non-blank dictionary 16-2 as dictionaries used for universal encoding. Then, based on the line pitch information of the character image given in advance, the dictionary selecting means 14 judges whether or not the plurality of lines which are the conversion targets to the intermediate data are blank, and the two dictionaries 16-1 and 16 are provided.
It is characterized in that one is selected from -2.

【0024】また本発明は、図1(b)に示すユニバー
サル復号化手段18と中間復号化手段(パターン・ラン
レングス逆変換手段)20とを備えた画像データ復元装
置を対象とする。ここでユニバーサル復号化手段18
は、辞書を用いて符号データから、所定ライン数毎に分
割方向でのパターンとライン方向での同一パターンの連
続数を示すランレングスとの組でなる2次元の中間デー
タを復号する。また中間復号化手段20は、ユニバーサ
ル復号化手段18で復号した2次元の中間データを、1
次元のビットストリームで構成する画像データに逆変換
する。
The present invention is also directed to an image data restoration device provided with a universal decoding means 18 and an intermediate decoding means (pattern / run length inverse conversion means) 20 shown in FIG. 1 (b). Here, the universal decoding means 18
Uses a dictionary to decode two-dimensional intermediate data, which is a set of a pattern in the dividing direction and a run length indicating the number of consecutive identical patterns in the line direction, for each predetermined number of lines from the code data. Further, the intermediate decoding means 20 converts the two-dimensional intermediate data decoded by the universal decoding means 18 into 1
Inverse conversion into image data composed of a three-dimensional bit stream.

【0025】このような画像データ復元装置につき第1
発明にあっては、ユニバーサル復号化に用いる辞書とし
て、空白用辞書16−1と非空白用辞書16−2を設け
る。そして、予め与えられた文字画像の行ピッチ情報に
より辞書選択手段14で、中間データへの変換対象とな
る複数ラインが空白か否か判断し、2つの辞書16−
1,16−2から対応する1つを選択する。
First of all, regarding such an image data restoration device
In the present invention, the blank dictionary 16-1 and the non-blank dictionary 16-2 are provided as the dictionaries used for universal decoding. Then, based on the line pitch information of the character image given in advance, the dictionary selection means 14 determines whether or not a plurality of lines to be converted into intermediate data are blank, and the two dictionaries 16-
The corresponding one is selected from 1, 16-2.

【0026】図2は本願の第2発明の原理説明図であ
り、同じく文字画像を対象としている。図2(a)の画
像データ圧縮装置では、ユニバーサル符号化に用いる辞
書として空白用辞書16−1と非空白用辞書16−2を
設け、辞書選択手段22が中間データへの変換対象とな
った複数ライン毎にパターンの出現頻度を求めて空白か
否か判断し、2つの辞書の1つを選択とすると共に選択
した辞書番号を符号化させることを特徴とする。
FIG. 2 is an explanatory view of the principle of the second invention of the present application, which is also intended for a character image. In the image data compression apparatus of FIG. 2A, a blank dictionary 16-1 and a non-blank dictionary 16-2 are provided as dictionaries used for universal encoding, and the dictionary selecting means 22 is a conversion target to intermediate data. It is characterized in that the frequency of appearance of the pattern is obtained for each of a plurality of lines to determine whether or not there is a blank, one of the two dictionaries is selected, and the selected dictionary number is encoded.

【0027】また図2(b)の画像データ復元装置で
は、同様に、ユニバーサル復号化に用いる辞書として空
白用辞書16−1と非空白用辞書16−2を設け、辞書
選択手段24が符号データから復元した辞書番号によ
り、2つの辞書の1つを選択することを特徴とする。す
なわち第2発明は、中間データのパターンの出現頻度を
学習して自動的に辞書を選択する。
In the image data restoration device of FIG. 2B, similarly, a blank dictionary 16-1 and a non-blank dictionary 16-2 are provided as dictionaries used for universal decoding, and the dictionary selection means 24 uses the code data. It is characterized in that one of the two dictionaries is selected according to the dictionary number restored from. That is, in the second invention, the appearance frequency of the pattern of the intermediate data is learned and the dictionary is automatically selected.

【0028】図3は本願の第3発明であり、網点画像を
対象とする。図3(a)の画像データ圧縮装置では、ユ
ニバーサル符号化に用いる辞書として、網点周期に対応
した複数の辞書32−1〜32−nを設ける。そして、
辞書選択手段26が、予め与えられた網点周期情報によ
り中間データへの変換対象となった複数ラインに対応し
た1つの辞書を複数の辞書32−1〜32−nから選択
することを特徴とする。
FIG. 3 shows a third invention of the present application, which is intended for a halftone dot image. In the image data compression apparatus of FIG. 3A, a plurality of dictionaries 32-1 to 32-n corresponding to halftone dot periods are provided as dictionaries used for universal encoding. And
It is characterized in that the dictionary selecting means 26 selects one dictionary corresponding to a plurality of lines to be converted into intermediate data from a plurality of dictionaries 32-1 to 32-n according to halftone dot period information given in advance. To do.

【0029】図3(b)の画像データ復元装置では、同
様に、ユニバーサル復号化に用いる辞書として網点周期
に対応した複数の辞書32−1〜32−nを設け、辞書
選択手段26が、予め与えられた網点周期情報により中
間データへの変換対象となる複数ラインに対応した1つ
の辞書を複数の辞書32−1〜32−nから選択するこ
とを特徴とする。
In the image data restoration device of FIG. 3B, similarly, a plurality of dictionaries 32-1 to 32-n corresponding to halftone dot periods are provided as dictionaries used for universal decoding, and the dictionary selection means 26 It is characterized in that one dictionary corresponding to a plurality of lines to be converted into intermediate data is selected from a plurality of dictionaries 32-1 to 32-n according to halftone dot period information given in advance.

【0030】図4は本願の第4発明の原理説明図であ
り、同じく網点画像を対象とする。図4(a)の画像デ
ータ圧縮装置では、ユニバーサル符号化に用いる辞書と
して、網点周期に対応した複数の辞書32−1〜32−
nを設け、そして、辞書選択手段32が、中間データへ
の変換対象となった複数ライン毎にパターンの出現頻度
の分布を求め、過去に求めた出現頻度との差から複数の
辞書32−1〜32−nの1つを選択するか又は新たな
作成辞書を選択し、選択辞書の辞書番号と共に符号化さ
せることを特徴とする。
FIG. 4 is an explanatory view of the principle of the fourth invention of the present application, which similarly targets a halftone dot image. In the image data compression apparatus of FIG. 4A, a plurality of dictionaries 32-1 to 32-corresponding to halftone dot periods are used as dictionaries used for universal encoding.
n is provided, and the dictionary selection means 32 obtains the distribution of the appearance frequency of the pattern for each of the plurality of lines that are the conversion target to the intermediate data, and the plurality of dictionaries 32-1 are obtained from the difference with the appearance frequency obtained in the past. 32 to 32-n or a new created dictionary is selected and encoded together with the dictionary number of the selected dictionary.

【0031】図4(b)の画像データ復元装置では、ユ
ニバーサル復号化に用いる辞書として、網点周期に対応
した複数の辞書32−1〜32−nを設け、辞書選択手
段34が、符号データから復元した辞書番号により複数
の辞書32−1〜32−nの1つを選択するか、又は新
たな作成辞書を選択して復号化を行わせることを特徴と
する。
In the image data restoration device of FIG. 4B, a plurality of dictionaries 32-1 to 32-n corresponding to halftone dot periods are provided as dictionaries used for universal decoding, and the dictionary selection means 34 causes the code data to be encoded. It is characterized in that one of the plurality of dictionaries 32-1 to 32-n is selected according to the dictionary number restored from, or a new created dictionary is selected for decoding.

【0032】ここで図3及び図4の網点画像を対象とし
た画像データ圧縮又復元装置ついて、辞書32−1〜3
2−nの分割数nは、網点周期と変換対象とするライン
数の最小公倍数を求め、最小公倍数を変換対象とする複
数ラインで割った値を辞書の分割数とする。即ち 分割数N=最小公倍数(網点周期,ライン数)/ライン
数 として求める。
Here, the image data compression or decompression device for the halftone image of FIGS.
For the division number n of 2-n, the least common multiple of the halftone dot period and the number of lines to be converted is obtained, and the value obtained by dividing the least common multiple by a plurality of lines to be converted is the number of divisions of the dictionary. That is, the number of divisions N = least common multiple (halftone dot period, number of lines) / number of lines.

【0033】[0033]

【作用】このように本発明は、文字画像の場合は、文字
と空白に対応する2つの辞書2を用意し、前処理として
中間データ、例えばパターン・ランレングス符号に変換
し、続いて与えられた文字の行ピッチ等の情報により辞
書を選択してユニバーサル符号に符号化する。また中間
データとしてのパターン・ランレングス符号に変換する
複数ラインごとの2次元データにつき、パターンの出現
頻度分布を求め、全く空白であれば空白に対応する辞書
を選択し、そうでなければ文字に対応する辞書を選択し
て符号化する。
As described above, according to the present invention, in the case of a character image, two dictionaries 2 corresponding to a character and a blank are prepared, intermediate data such as pattern run length code is converted as a pre-process, and is subsequently given. A dictionary is selected according to the information such as the line pitch of the characters and encoded into a universal code. In addition, the pattern appearance frequency distribution is calculated for the two-dimensional data for each line that is converted to the pattern run length code as the intermediate data, and if it is completely blank, the dictionary corresponding to the blank is selected. Select and encode the corresponding dictionary.

【0034】一方、網点画像の場合は、網点周期の位相
の異なりに対応した辞書を複数用意し、前処理として中
間データ、例えばパターン・ランレングス符号に変換
し、続いて、与えられた網点周期の位相の違いにより辞
書を選択してユニバーサル符号に符号化する。また中間
データとしてのパターン・ランレングス符号に変換する
複数ラインごとの2次元データにつき、出現頻度の分布
を求め、この出現頻度分布を以前の出現頻度分布と比較
して、差異の最も小さい複数ラインに対応する辞書を選
択して符号化する。このとき以前の出現頻度の分布との
差異が所定の閾値以上で対応が得られなければ、新たな
辞書を作って符号化する。
On the other hand, in the case of a halftone dot image, a plurality of dictionaries corresponding to different phases of the halftone dot period are prepared, intermediate data such as pattern run length code is converted as preprocessing, and then given. A dictionary is selected according to the phase of the halftone dot period and encoded into a universal code. In addition, the distribution of the appearance frequency is obtained for the two-dimensional data for each of the plurality of lines to be converted into the pattern run length code as the intermediate data, and the appearance frequency distribution is compared with the previous appearance frequency distribution, and the plurality of lines with the smallest difference are obtained. The dictionary corresponding to is selected and encoded. At this time, if the difference from the distribution of the previous appearance frequency is equal to or more than a predetermined threshold value and no correspondence is obtained, a new dictionary is created and encoded.

【0035】[0035]

【実施例】図5は文書画像を処理する第1発明の画像デ
ータ圧縮装置の実施例を示す。この実施例において、画
像データ圧縮装置は中間符号化手段としてのパターン・
ランレングス変換器10とLZW符号化を行うユニバー
サル符号器12を備える。ユニバーサル符号器12での
LZW符号化に使用する辞書として空白用辞書16−1
と文字用辞書16−2を設けている。
FIG. 5 shows an embodiment of the image data compression apparatus of the first invention for processing a document image. In this embodiment, the image data compression device uses a pattern
A run length converter 10 and a universal encoder 12 that performs LZW encoding are provided. Blank dictionary 16-1 as a dictionary used for LZW encoding in the universal encoder 12
And a character dictionary 16-2.

【0036】辞書選択部14は入力する文字画像につい
て予め定められている文書形式情報から文字の行ピッチ
を入力し、現在、ユニバーサル符号器12で符号化する
パターン・ランレングス符号が文書画像の空白か文字か
を判断する。空白であれば空白用辞書16−1を選択
し、文字であれば文字用辞書16−2を選択する。ここ
で、パターン・ランレングス変換器10は例えば図26
に示したように、1次元のビットストリームとして入力
される文字データを所定長のラインデータに分割して2
次元的に配列し、例えば4ラインを対象にパターンの種
類と同一パターンの繰り返しでなるランレングスの組合
せでなるパターン・ランレングス符号に変換する。
The dictionary selection unit 14 inputs the line pitch of characters from the document format information predetermined for the input character image, and the pattern run length code currently encoded by the universal encoder 12 is blank in the document image. Or character. If it is blank, the blank dictionary 16-1 is selected, and if it is a character, the character dictionary 16-2 is selected. Here, the pattern / run-length converter 10 is, for example, as shown in FIG.
, The character data input as a one-dimensional bit stream is divided into line data of a predetermined length and 2
For example, four lines are arranged in a dimension and converted into a pattern / run length code which is a combination of run lengths in which the type of pattern and the same pattern are repeated.

【0037】また、ユニバーサル符号器12は例えば、
図29に示したLZW符号化アルゴリズムに従ってパタ
ーン・ランレングス変換器10より得られた中間データ
としてのパターン・ランレングス符号を、そのとき選択
されている空白用辞書16−1または文字用辞書16−
2を使用してLZW符号化を行う。図6は図5の符号化
処理を示したフローチャートである。まずステップS1
でユニバーサル符号化に使用する辞書を空白用辞書16
−1と文字用辞書16−2の2つに分割する。続いてス
テップS2でパターン・ランレングス変換器10に文字
画像の現画像データを入力する。この現画像データは1
次元のビットストリームとして入力される。続いてステ
ップS3で、処理対象とする文字画像の文書形式に従っ
て1行分の文字数に対応したビット長毎のラインデータ
に分割し、これを行方向に並べて図26(a)に示した
2次元データに変換する。そして、この2次元データに
ついて例えば4ラインを1ブロックとして、行方向での
パターンとライン方向での同一パターンの繰返しを示す
ランレングスとの組合せでなるパターン・ランレングス
符号への変換を行う。
The universal encoder 12 is, for example,
The pattern run length code as intermediate data obtained by the pattern run length converter 10 according to the LZW encoding algorithm shown in FIG. 29 is converted into the blank dictionary 16-1 or the character dictionary 16-
2 is used to perform LZW encoding. FIG. 6 is a flowchart showing the encoding process of FIG. First, step S1
The dictionary used for universal encoding is the blank dictionary 16
-1 and the character dictionary 16-2. Then, in step S2, the current image data of the character image is input to the pattern / run length converter 10. This current image data is 1
Input as a dimensional bitstream. Subsequently, in step S3, the line image is divided into line data for each bit length corresponding to the number of characters of one line according to the document format of the character image to be processed, and the line data is arranged in the line direction to form the two-dimensional image shown in FIG. Convert to data. Then, with respect to the two-dimensional data, for example, four lines are set as one block, and conversion into a pattern run length code is performed which is a combination of a pattern in the row direction and a run length indicating repetition of the same pattern in the line direction.

【0038】続いてステップS4に進み、このときの文
字の行ピッチ情報に基づき、ユニバーサル符号器12に
よる符号化に使用する辞書を選択する。いま図7に示す
ような2次元データに変換された文字画像から得られた
パターン・ランレングスを対象に、辞書を用いてユニバ
ーサル符号化を行うものとする。2次元データに変換さ
れた文字画像は文字部分及び空白部分が共に4ラインで
あることが文字の行ピッチ情報から認識される。
Then, in step S4, a dictionary used for encoding by the universal encoder 12 is selected based on the line pitch information of the character at this time. Now, it is assumed that universal encoding is performed using a dictionary for a pattern run length obtained from a character image converted into two-dimensional data as shown in FIG. It is recognized from the character line pitch information that the character image converted into the two-dimensional data has a character portion and a blank portion each having four lines.

【0039】即ち、先頭の4ラインで構成された第1ブ
ロックは文字の行ピッチ情報から文字部分と認識され、
従って文字用辞書16−2が選択される。次の4ライン
の第2ブロックについては、文字の行ピッチ情報から空
白部分であることが認識され、空白用辞書16−1が選
択される。以下、奇数ブロックについては文字用辞書1
6−2が選択され、偶数ブロックについては空白用辞書
16−1が選択される。
That is, the first block composed of the first four lines is recognized as a character portion from the character line pitch information,
Therefore, the character dictionary 16-2 is selected. Regarding the second block of the next four lines, it is recognized from the character line pitch information that it is a blank portion, and the blank dictionary 16-1 is selected. Below, for odd-numbered blocks, character dictionary 1
6-2 is selected, and the blank dictionary 16-1 is selected for even blocks.

【0040】再び図6を参照するに、ステップS4で文
字の行ピッチ情報から辞書選択を行うと、ステップS5
で選択された空白用辞書16−1または文字用辞書16
−2を参照しながら符号化及び新たな辞書登録を行う。
この対象辞書を用いた符号化は、例えば図29に示した
AZW符号化アルゴリズムに従った処理となる。ステッ
プS5で1ブロック分の符号化が済むと、ステップS6
で符号化データを出力し、再びステップS4に戻って次
のブロックについて同様な処理を繰り返し、全ブロック
を終了するまで同様な処理を繰り返すことになる。
Referring again to FIG. 6, when the dictionary is selected from the character line pitch information in step S4, step S5
The blank dictionary 16-1 or the character dictionary 16 selected in
-2, encoding and new dictionary registration are performed.
The encoding using this target dictionary is, for example, a process according to the AZW encoding algorithm shown in FIG. When the encoding for one block is completed in step S5, step S6
Then, the encoded data is output, the process returns to step S4, the same process is repeated for the next block, and the same process is repeated until all blocks are completed.

【0041】図8は第1発明の画像データ復元装置の実
施例を示し、図5の符号データ圧縮装置で得られた符号
データを元の文書画像の画像データに戻す。この画像デ
ータ復元装置はユニバーサル復号器18,中間復号手段
としてのパターン・ランレングス逆変換器20,空白用
辞書16−1,文字用辞書16−2及び辞書選択部14
で構成される。
FIG. 8 shows an embodiment of the image data decompression device of the first invention, in which the code data obtained by the code data compression device of FIG. 5 is restored to the image data of the original document image. This image data restoration device includes a universal decoder 18, a pattern run length inverse converter 20 as an intermediate decoding means, a blank dictionary 16-1, a character dictionary 16-2, and a dictionary selection unit 14.
Composed of.

【0042】ユニバーサル復号器18は辞書を用いて、
例えば図30に示した符号化アルゴリズムに従って符号
データからパターン・ランレングス符号を復元する。こ
のとき辞書選択部14は予め与えられた復元しようとす
る文書画像の文字の行ピッチ情報に基づき、復元するパ
ターン・ランレングス符号のブロック単位に空白用辞書
16−1または文字用辞書16−2を選択する。パター
ン・ランレングス逆変換器20はユニバーサル復号器1
8で復元されたパターン・ランレングス符号を4ライン
の画素の並びでなる2次元データに逆変換した後、1次
元のビットストリームとして出力する。
The universal decoder 18 uses a dictionary to
For example, the pattern run length code is restored from the code data according to the coding algorithm shown in FIG. At this time, the dictionary selection unit 14 uses the blank line dictionary 16-1 or the character dictionary 16-2 for each block of the pattern run length code to be restored based on the line pitch information of the characters of the document image to be restored which is given in advance. Select. The pattern run length inverse converter 20 is a universal decoder 1
The pattern run length code restored in 8 is inversely converted into two-dimensional data consisting of a pixel array of four lines, and then output as a one-dimensional bit stream.

【0043】図9は図8の復元処理を示したフローチャ
ートである。まずステップS1で、ユニバーサル復号化
に使用する辞書を空白用辞書16−1と文字用辞書16
−2の2つに分割する。次にステップS2で符号データ
を入力する。続いてステップS3で1ブロック分の符号
データを対象に予め与えられている文字の行ピッチ情報
に基づき、空白用辞書16−1または文字用辞書16−
2のいずれか1つを選択する。
FIG. 9 is a flow chart showing the restoration processing of FIG. First, in step S1, the dictionaries used for universal decoding are the blank dictionary 16-1 and the character dictionary 16.
-2. Next, in step S2, code data is input. Subsequently, in step S3, the blank dictionary 16-1 or the character dictionary 16- is created on the basis of the line pitch information of the character given in advance for the code data for one block.
Select one of the two.

【0044】具体的には、図7に示したように先頭ブロ
ックの符号データについては文字部分となることから文
字用辞書16−2を選択し、次の第2ブロックについて
は空白部分となることから空白用辞書16−1を選択
し、以下同様に、奇数ブロックは文字用辞書16−2、
偶数ブロックは空白用辞書16−1を選択する。ステッ
プS3で辞書選択が済むとステップS4に進み、選択し
た対象辞書を参照して符号データからパターン・ランレ
ングス符号に変換する復号化を行い、新たな辞書登録を
繰り返す。1ブロック分のユニバーサル復号化が済むと
ステップS5に進み、パターン・ランレングス符号をパ
ターンの種類とランレングスに従って2次元データに逆
変換して、元の文書画像の画像データを復元する。
Specifically, as shown in FIG. 7, since the code data of the first block is a character portion, the character dictionary 16-2 is selected, and the next second block is a blank portion. Select the blank dictionary 16-1 from the following, and similarly, for the odd blocks, the character dictionary 16-2,
For even-numbered blocks, the blank dictionary 16-1 is selected. When the dictionary is selected in step S3, the process proceeds to step S4, the selected target dictionary is referred to, decoding is performed to convert the code data into the pattern run length code, and new dictionary registration is repeated. When the universal decoding for one block is completed, the process proceeds to step S5, the pattern run length code is inversely converted into two-dimensional data according to the type of pattern and the run length, and the image data of the original document image is restored.

【0045】このようなステップS3〜S5の処理を全
ブロックあるいは予め定めた数のブロック単位に繰り返
す。全ブロックあるいは所定のブロック単位の復元処理
が終了するとステップS6に進み、2次元画像に復元さ
れた復元データを1次元のビットストリームとして出力
する。図10は第2発明による画像データ圧縮装置の実
施例を示し、この実施例にあってはパターン・ランレン
グス符号に変換する所定ライン数、例えば4ラインで構
成されたブロック毎にパターンの出現頻度を求めて空白
か否か検出するようにしたことを特徴とする。即ち、パ
ターン・ランレングス変換器10,ユニバーサル符号器
12,空白用辞書16−1及び文字用辞書16−2は図
5の第1発明の実施例と同じであるが、新たに空白の有
無を検出する辞書選択部22を設けている。
The processes of steps S3 to S5 are repeated for all blocks or a predetermined number of blocks. When the restoration processing for all blocks or a predetermined block unit is completed, the process proceeds to step S6, and the restored data restored to the two-dimensional image is output as a one-dimensional bit stream. FIG. 10 shows an embodiment of the image data compression apparatus according to the second invention. In this embodiment, the frequency of appearance of a pattern for each block composed of a predetermined number of lines to be converted into a pattern run length code, for example, 4 lines. Is characterized by detecting whether or not there is a blank. That is, the pattern / run length converter 10, the universal encoder 12, the blank dictionary 16-1 and the character dictionary 16-2 are the same as those in the embodiment of the first invention shown in FIG. A dictionary selection unit 22 for detecting is provided.

【0046】辞書選択部はパターン・ランレングス変換
器10で変換された2次元データの1ブロックについて
空白パターンの出現頻度を検出する。即ち、空白を示す
ビット0000の空白パターンの出現頻度が他のパター
ンに対し極めて高い値として得られている場合には空白
と判断し、空白用辞書16−1を選択してユニバーサル
符号器12で符号化させる。これに対し文字部分につい
ては、オールビット0の空白パターン以外に他のビット
パターンの出現頻度もあることから、文字部分と判断し
て文字用辞書16−2を選択してユニバーサル符号器1
2での符号化に使用させる。
The dictionary selection unit detects the appearance frequency of the blank pattern for one block of the two-dimensional data converted by the pattern / run length converter 10. That is, when the appearance frequency of the blank pattern of the bit 0000 indicating a blank is obtained as an extremely high value with respect to other patterns, it is determined to be blank, the blank dictionary 16-1 is selected, and the universal encoder 12 is selected. Encode. On the other hand, with respect to the character portion, since there is the frequency of appearance of other bit patterns in addition to the blank pattern of all bits 0, it is judged that the character portion and the character dictionary 16-2 is selected and the universal encoder 1 is selected.
2 to be used for encoding.

【0047】図11は図10の空白検出を行う辞書選択
部22を用いた画像データ圧縮装置の処理動作を示した
フローチャートである。この場合にはステップS3でブ
ロック単位にパターンの出現頻度を求め、空白のみの場
合は空白用辞書16−1を、そうでない場合は文字用辞
書16−2を選択する。更に、復元側での辞書選択を可
能とするため、ユニバーサル符号器12ではパターン・
ランレングス符号のユニバーサル符号化に先立って最初
に辞書番号を符号化する。それ以外の処理は図6の符号
化と同じになる。
FIG. 11 is a flow chart showing the processing operation of the image data compression apparatus using the dictionary selection unit 22 for performing the blank detection of FIG. In this case, the appearance frequency of the pattern is obtained in block units in step S3, and if there is only a blank, the blank dictionary 16-1 is selected, and if not, the character dictionary 16-2 is selected. Furthermore, in order to enable dictionary selection on the restoration side, the universal encoder 12
The dictionary number is first encoded prior to universal encoding of the run length code. The other processing is the same as the encoding in FIG.

【0048】図12は図10の画像データ圧縮装置で得
られた符号データから元の文字画像の画像データを復元
する画像データ復元装置の実施例を示す。この実施例は
ユニバーサル復号器18に対し空白用辞書16−1と文
字用辞書16−2の2つを設けており、辞書選択部24
でいずれか1つを選択する。辞書選択部24は符号デー
タのブロック部分の先頭に符号化されている辞書番号を
復号し、復号した辞書番号に基づき空白用辞書16−1
または文字用辞書16−2を選択する。ユニバーサル復
号器18で空白用辞書16−1または文字用辞書16−
2を用いて復号されたパターン・ランレングス符号は、
パターン・ランレングス逆変換器20で2次元の画像デ
ータに復元され、最終的に1次元のビットストリームと
して出力される。
FIG. 12 shows an embodiment of an image data decompression device for decompressing the image data of the original character image from the coded data obtained by the image data compression device of FIG. In this embodiment, the universal decoder 18 is provided with two blank dictionaries 16-1 and character dictionaries 16-2.
Select any one. The dictionary selection unit 24 decodes the dictionary number encoded at the beginning of the block portion of the coded data, and based on the decoded dictionary number, the blank dictionary 16-1
Alternatively, the character dictionary 16-2 is selected. In the universal decoder 18, the blank dictionary 16-1 or the character dictionary 16-
The pattern run length code decoded using 2 is
The pattern / run length inverse converter 20 restores the two-dimensional image data and finally outputs it as a one-dimensional bit stream.

【0049】図13は図12の画像データ復元装置の復
元処理を示したフローチャートであり、ステップS2で
符号データのブロック部分の先頭の符号化された辞書番
号を復元し、復元した辞書番号に基づいて空白用辞書1
6−1または文字用辞書16−2を選択する点が特徴と
なる。それ以外は図9の復元処理と同じになる。図14
は網点画像を対象とした符号化を行う第3発明の画像デ
ータ圧縮装置の実施例を示す。この画像データ圧縮装置
はパターン・ランレングス変換器10,ユニバーサル符
号器12,辞書選択部26,辞書部28で構成される。
辞書部28は予め与えられた網点周期と変換対象となっ
ている1ブロックを構成するライン数との関係で辞書を
辞書30−1〜30−nに分割する。
FIG. 13 is a flow chart showing the restoration processing of the image data restoration device of FIG. 12, wherein the head encoded dictionary number of the block portion of the code data is restored in step S2, and based on the restored dictionary number. And blank dictionary 1
A feature is that 6-1 or the character dictionary 16-2 is selected. The rest is the same as the restoration process of FIG. 14
Shows an embodiment of an image data compression apparatus of the third invention for performing encoding on a halftone image. This image data compression apparatus is composed of a pattern / run length converter 10, a universal encoder 12, a dictionary selection unit 26, and a dictionary unit 28.
The dictionary unit 28 divides the dictionary into the dictionaries 30-1 to 30-n based on the relationship between the halftone dot period given in advance and the number of lines forming one block to be converted.

【0050】図15は網点画像を対象とした辞書分割を
具体的に示す。この網点画像は網点周期が12で4ライ
ン毎にパターン・ランレングス符号に変換する場合、網
点周期の位相が異なる3つのブロックが存在する。従っ
て、3つのブロック毎に出易いパターンが異なり、従っ
て辞書を3つの辞書30−1〜30−3に分割して、対
応する4ラインのブロック毎にユニバーサル符号化を行
う必要がある。
FIG. 15 specifically shows the dictionary division for the halftone image. In this halftone dot image, the halftone dot period is 12, and when converted into a pattern run length code every four lines, there are three blocks having different phases of the halftone dot period. Therefore, the patterns that are likely to appear in each of the three blocks are different, and therefore it is necessary to divide the dictionary into three dictionaries 30-1 to 30-3 and perform universal coding for each corresponding block of 4 lines.

【0051】即ち、網点周期と変換対象とする1ブロッ
クのライン数の最小公倍数を1ブロックのライン数で割
った値が辞書の分割数nとなる。図15の場合、網点周
期12と1ブロックのライン数4の最小公倍数は12で
あり、これを1ブロックのライン数4で割ると分割数n
=3となる。再び図14を参照するに、辞書選択部26
はパターン・ランレングス変換器10で網点画像データ
をブロック単位にパターン・ランレングス符号に変換し
た後、予め与えられている網点周期と現在変換対象とな
っているブロックの複数ラインとの関係から、辞書部2
8の辞書30−1〜30−nの中から対象となる辞書を
選択して、ユニバーサル符号器12による符号化を行わ
せる。
That is, a value obtained by dividing the least common multiple of the halftone dot period and the number of lines in one block to be converted by the number of lines in one block is the number of divisions n in the dictionary. In the case of FIG. 15, the least common multiple of the halftone dot period 12 and the number of lines in one block is 12, and when this is divided by the number of lines in one block, the division number n.
= 3. Referring again to FIG. 14, the dictionary selection unit 26
Is a pattern run length converter 10 that converts halftone dot image data into a pattern run length code in block units, and then a relationship between a halftone dot period given in advance and a plurality of lines of the block currently being converted. From the dictionary section 2
The target dictionary is selected from the eight dictionaries 30-1 to 30-n, and the universal encoder 12 performs the encoding.

【0052】図16は図14の網点画像を対象とした画
像データ圧縮装置の処理動作を示したフローチャートで
ある。まずステップS1で網点の周期情報と位相の違
い、即ち1ブロックを構成するライン数により決めた分
割数nにより1つの辞書を複数の辞書30−1〜30−
nに分割する。続いて、網点画像の現画像データをステ
ップS2で入力し、パターン・ランレングス変換器10
で2次元のパターン・ランレングス符号に変換する。
FIG. 16 is a flow chart showing the processing operation of the image data compression apparatus for the halftone image of FIG. First, in step S1, one dictionary is divided into a plurality of dictionaries 30-1 to 30-in accordance with the difference between the halftone dot period information and the phase, that is, the division number n determined by the number of lines forming one block.
Divide into n. Then, the current image data of the halftone image is input in step S2, and the pattern / run length converter 10 is input.
Is converted into a two-dimensional pattern run length code.

【0053】続いてステップS4に進み、ブロック単位
に与えられた網点周期と現在変換の対象となっているブ
ロックの複数ラインとの関係から、対応する辞書30−
iを選択する。続いてステップS5で、選択した辞書を
使用してユニバーサル符号化と辞書登録を行い、1ブロ
ック分の符号化が済むと、ステップS6で符号データを
出力する。以上のステップS4〜S6を所定ブロックま
たは全ブロックを終了するまで繰り返す。
Then, in step S4, the corresponding dictionary 30-is determined from the relationship between the halftone dot period given in block units and the plurality of lines of the block currently being converted.
Select i. Subsequently, in step S5, universal coding and dictionary registration are performed using the selected dictionary, and when coding of one block is completed, code data is output in step S6. The above steps S4 to S6 are repeated until a predetermined block or all blocks are completed.

【0054】図17は図14の画像データ圧縮装置で得
られた符号データから元の網点画像を復元する画像デー
タ復元装置の実施例を示す。この実施例においても、図
14の場合と同様、網点周期と変換対象となっている1
ブロックのライン数との関係から定まる分割数nで辞書
部28を辞書30−1〜30−nに分割する。また、辞
書選択部26で、現在ユニバーサル復号器18で復号し
ようとするブロックに対応する複数ラインと予め与えら
れた網点周期の関係から、対象となる辞書を選択する。
FIG. 17 shows an embodiment of an image data decompression device for decompressing the original halftone dot image from the coded data obtained by the image data compression device of FIG. Also in this embodiment, as in the case of FIG. 14, the halftone dot period and the conversion target 1
The dictionary unit 28 is divided into the dictionaries 30-1 to 30-n with the division number n determined from the relationship with the number of lines of the block. Further, the dictionary selection unit 26 selects a target dictionary from the relationship between a plurality of lines corresponding to the block currently to be decoded by the universal decoder 18 and a halftone dot period given in advance.

【0055】図18は図17の復元処理を示したフロー
チャートである。この復元処理にあっては、ステップS
1で図16の場合と同様、網点周期と位相の違いにより
決められた1ブロックのライン数で決まる分割数nで辞
書を分割する。またステップS3において、現在復元対
象となっているブロックに対応する複数ラインと予め与
えられた網点周期の関係から、対応する辞書を選択す
る。
FIG. 18 is a flow chart showing the restoration processing of FIG. In this restoration process, step S
16, the dictionary is divided by the number of divisions n determined by the number of lines in one block determined by the difference in halftone dot period and phase, as in the case of FIG. Further, in step S3, the corresponding dictionary is selected from the relationship between the plurality of lines corresponding to the block currently being restored and the halftone dot period given in advance.

【0056】図19は網点画像を対象とした第4発明の
画像データ復元装置の実施例を示す。この画像データ復
元装置にあっては、辞書選択部32で変換対象となるブ
ロックを構成する複数ラインの網点画像データを対象に
パターンの出現頻度の分布を求め、この出現頻度の分布
を以前のブロックの出現頻度の分布と比較し、差異の最
も小さいブロックに対応する辞書を選択して符号化する
ようにしたことを特徴とする。また、以前のブロックの
出現頻度との差異が所定の閾値より大きい場合には、新
たな辞書を作って符号化する。
FIG. 19 shows an embodiment of the image data restoration device of the fourth invention for a halftone image. In this image data restoration device, the dictionary selection unit 32 obtains the distribution of the appearance frequency of the pattern for the halftone dot image data of a plurality of lines forming the block to be converted, and the distribution of the appearance frequency is calculated as before. It is characterized in that the dictionary corresponding to the block having the smallest difference is selected and encoded by comparing with the distribution of the appearance frequency of the block. If the difference from the appearance frequency of the previous block is larger than a predetermined threshold value, a new dictionary is created and encoded.

【0057】図22は辞書選択部32における過去のブ
ロックの出現頻度の分布と、現在処理対象としているブ
ロックの出現頻度分布を示す。図22(a)のA,B,
Cは以前のブロックの出現頻度の分布である。このよう
な状態で図22(b)に示す現在処理対象としているブ
ロックの出現頻度の分布Dが得られたとする。これを出
現頻度分布A,B,Cに重ねると破線で示すようにな
る。この場合、出現頻度分布Bは以前のブロックの出現
頻度分布Bとの差異が最も小さいことから、出現頻度分
布Bをもつブロックの符号化で使用した辞書を選択す
る。また、辞書選択部32は辞書部28の中の辞書30
−1〜30−nのいずれかを選択したとき、あるいは新
たな辞書30−(n+1)を選択した場合には、ユニバ
ーサル符号器12におけるパターン・ランレングス符号
の符号化に先立ってブロックの先頭に選択した辞書番号
を符号化する。
FIG. 22 shows the distribution of the appearance frequencies of past blocks in the dictionary selection unit 32 and the appearance frequency distribution of the blocks currently being processed. 22A, A, B,
C is the distribution of the appearance frequency of the previous block. In such a state, it is assumed that the distribution D of the appearance frequency of the block currently being processed shown in FIG. 22B is obtained. When this is overlaid on the appearance frequency distributions A, B, and C, it becomes as shown by the broken line. In this case, since the appearance frequency distribution B has the smallest difference from the appearance frequency distribution B of the previous block, the dictionary used for encoding the block having the appearance frequency distribution B is selected. In addition, the dictionary selection unit 32 uses the dictionary 30 in the dictionary unit 28.
When any one of -1 to 30-n is selected, or when a new dictionary 30- (n + 1) is selected, the block is added to the head of the block before the universal run encoder 12 encodes the pattern run length code. Encode the selected dictionary number.

【0058】図21は図19のパターンの出現頻度の分
布から辞書を選択する画像選択処理を示したフローチャ
ートであり、ステップS3でブロック単位に2次元デー
タとした1ブロックの複数ラインのパターンの出現頻度
を求め、以前の出現頻度の分布との差から辞書を選択す
る。また、以前の出現頻度との差が所定の閾値を越えて
いる場合には新たな辞書を作成する。そして、選択した
辞書番号または新たに作成した辞書番号を最初に符号化
するようになる。これをブロック単位に繰り返す。
FIG. 21 is a flow chart showing an image selection process for selecting a dictionary from the distribution of the appearance frequencies of the patterns shown in FIG. The frequency is calculated, and the dictionary is selected based on the difference from the distribution of the previous appearance frequency. If the difference from the previous appearance frequency exceeds a predetermined threshold, a new dictionary is created. Then, the selected dictionary number or the newly created dictionary number is encoded first. This is repeated for each block.

【0059】図22は図19の画像データ圧縮装置で得
られた符号データから元の網点画像を復元する第4発明
の画像データ復元装置の実施例を示す。ユニバーサル復
号器18,パターン・ランレングス逆変換器20及び辞
書30−1〜30−nに分割された辞書部28は、図1
7の第3発明と同じであるが、新たに辞書選択部34が
設けられる。
FIG. 22 shows an embodiment of the image data decompression device of the fourth invention for decompressing the original halftone dot image from the coded data obtained by the image data compression device of FIG. The universal decoder 18, the pattern run length inverse converter 20, and the dictionary unit 28 divided into the dictionaries 30-1 to 30-n are shown in FIG.
7 is the same as the third invention, but a dictionary selecting unit 34 is newly provided.

【0060】辞書選択部34は符号データのブロック先
頭に符号化されている辞書番号を復号し、復号した辞書
番号に基づいて辞書部28の中の辞書30−1〜30−
nのいずれかを選択するか新たな辞書を作成する。図2
3は図22の復元処理を示したフローチャートであり、
ステップS2で送られてきた辞書番号を復元して複数の
辞書30−1〜30−nの中から対応する辞書を選択す
るか、あるいは新たな辞書を作成してユニバーサル復号
器18による復号化を行う。
The dictionary selection unit 34 decodes the dictionary number encoded at the head of the block of the coded data, and the dictionaries 30-1 to 30-in the dictionary unit 28 based on the decoded dictionary number.
Either select n or create a new dictionary. Figure 2
3 is a flowchart showing the restoration processing of FIG.
The dictionary number sent in step S2 is restored and the corresponding dictionary is selected from the plurality of dictionaries 30-1 to 30-n, or a new dictionary is created and decoded by the universal decoder 18. To do.

【0061】[0061]

【発明の効果】以上説明してきたように本発明によれ
ば、複数の辞書を用いて、文字画像の場合は空白部分と
文字部分に分けてそれぞれ対応する専用の辞書を選択
し、また網点画像の場合は網点周期と処理単位となる複
数ラインから位相の異なった数分の辞書に分けてそれぞ
れ対応する専用の辞書を選択することで、統計的性質の
異なる部分を考慮せずに、混在した単一の辞書を用いて
符号化した場合に比べ、より高い圧縮率を得ることがで
きる。
As described above, according to the present invention, a plurality of dictionaries are used, and in the case of a character image, a blank part and a character part are separately selected and corresponding dedicated dictionaries are selected. In the case of an image, by dividing a plurality of dictionaries having different phases from a plurality of lines as a halftone dot period and a processing unit and selecting a dedicated dictionary corresponding to each, without considering a portion having different statistical properties, A higher compression rate can be obtained as compared with the case of encoding using a single mixed dictionary.

【図面の簡単な説明】[Brief description of drawings]

【図1】文字画像を対象とした第1発明の原理説明図FIG. 1 is an explanatory view of the principle of the first invention for character images.

【図2】文字画像を対象とした第2発明の原理説明図FIG. 2 is an explanatory view of the principle of the second invention for character images.

【図3】網点画像を対象とした第3発明の原理説明図FIG. 3 is an explanatory diagram of the principle of the third invention for a halftone image.

【図4】網点画像を対象とした第4発明の原理説明図FIG. 4 is an explanatory view of the principle of the fourth invention for a halftone image.

【図5】第1発明の画像データ圧縮装置の実施例構成図FIG. 5 is a block diagram of an embodiment of an image data compression apparatus of the first invention.

【図6】図5の実施例の符号化処理を示したフローチャ
ート
FIG. 6 is a flowchart showing an encoding process of the embodiment of FIG.

【図7】文字画像と辞書選択の説明図FIG. 7 is an explanatory diagram of character images and dictionary selection.

【図8】第1発明の画像データ復元装置の実施例構成図FIG. 8 is a configuration diagram of an embodiment of an image data restoration device of the first invention.

【図9】図8の実施例の復号化処理を示したフローチャ
ート
FIG. 9 is a flowchart showing a decoding process of the embodiment of FIG.

【図10】第2発明の画像データ圧縮装置の実施例構成
FIG. 10 is a block diagram of an embodiment of an image data compression apparatus of the second invention.

【図11】図10の実施例の符号化処理を示したフロー
チャート
11 is a flowchart showing the encoding process of the embodiment of FIG.

【図12】第2発明の画像データ復元装置の実施例構成
FIG. 12 is a block diagram of an embodiment of an image data restoration device of the second invention.

【図13】図12の実施例の復号化処理を示したフロー
チャート
FIG. 13 is a flowchart showing a decoding process of the embodiment of FIG.

【図14】第3発明の画像データ圧縮装置の実施例構成
FIG. 14 is a block diagram of an embodiment of an image data compression apparatus of the third invention.

【図15】網点画像と辞書選択の説明図FIG. 15 is an explanatory diagram of halftone image and dictionary selection.

【図16】図14の実施例の符号化処理を示したフロー
チャート
16 is a flowchart showing the encoding process of the embodiment of FIG.

【図17】第3発明の画像データ復元装置の実施例構成
FIG. 17 is a block diagram of an embodiment of an image data restoration device of the third invention.

【図18】図17の実施例の復号化処理を示したフロー
チャート
FIG. 18 is a flowchart showing a decoding process of the embodiment of FIG.

【図19】第4発明の画像データ圧縮装置の実施例構成
FIG. 19 is a block diagram of an embodiment of an image data compression apparatus of the fourth invention.

【図20】辞書選択に用いる複数ラインごとのパターン
出現頻度分布の相違を示した説明図
FIG. 20 is an explanatory diagram showing a difference in pattern appearance frequency distribution for each of a plurality of lines used for dictionary selection.

【図21】図19の実施例の符号化処理を示したフロー
チャート
FIG. 21 is a flowchart showing the encoding process of the embodiment of FIG.

【図22】第4発明の画像データ復元装置の実施例構成
FIG. 22 is a configuration diagram of an embodiment of an image data restoration device of the fourth invention.

【図23】図22の実施例の復号化処理を示したフロー
チャート
FIG. 23 is a flowchart showing a decoding process of the embodiment of FIG.

【図24】従来の画像データ圧縮装置の説明図FIG. 24 is an explanatory diagram of a conventional image data compression device.

【図25】従来の画像データ復元装置の説明図FIG. 25 is an explanatory diagram of a conventional image data restoration device.

【図26】2次元画像データとパターン・ランレングス
符号との間の変換および逆変換を示した説明図
FIG. 26 is an explanatory diagram showing conversion and inverse conversion between two-dimensional image data and a pattern run length code.

【図27】ユニバーサル符号化で用いる辞書の木構造を
示した説明図
FIG. 27 is an explanatory diagram showing a tree structure of a dictionary used in universal encoding.

【図28】ユニバーサル符号の説明図FIG. 28 is an explanatory diagram of a universal code.

【図29】従来のLZA符号化アルゴリズムを示したフ
ローチャート
FIG. 29 is a flowchart showing a conventional LZA encoding algorithm.

【図30】従来のLZW復号化アルゴリズムを示したフ
ローチャート
FIG. 30 is a flowchart showing a conventional LZW decoding algorithm.

【図31】abc3文字を例にとってLZW符号化を具
体的に示した説明図
FIG. 31 is an explanatory diagram concretely showing LZW encoding by taking abc3 characters as an example.

【図32】図31の符号化で使用される辞書の説明図32 is an explanatory diagram of a dictionary used in the encoding of FIG. 31.

【図33】abc3文字を例にとってLZW復号化を具
体的に示した説明図
FIG. 33 is an explanatory diagram concretely showing LZW decoding by taking abc3 characters as an example.

【符号の説明】[Explanation of symbols]

10:中間符号化手段(パターン・ランレングス符号
器) 12:ユニバーサル符号化手段(ユニバーサル符号器) 14,22,24,32,34:辞書選択手段(辞書選
択部) 16−1:空白用辞書 16−2:文字用辞書 18:ユニバーサル復号化手段(ユニバーサル復号器) 20:中間復号化手段(パターン・ランレングス復号
器) 28:辞書機構 30−1〜30−2:辞書
10: Intermediate Coding Means (Pattern Run Length Encoder) 12: Universal Coding Means (Universal Encoder) 14, 22, 24, 32, 34: Dictionary Selection Means (Dictionary Selection Unit) 16-1: Blank Dictionary 16-2: Character dictionary 18: Universal decoding means (universal decoder) 20: Intermediate decoding means (pattern run length decoder) 28: Dictionary mechanism 30-1 to 30-2: Dictionary

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】1次元のビットストリームで構成される画
像データを、所定長のラインデータに分割して2次元デ
ータに変換し、該2次元データを所定ライン数毎に分割
方向でのパターンとライン方向での同一パターンの連続
数を示すランレングスの組からなる中間データに変換す
る中間符号化手段(10)と、該中間符号化手段(1
0)で変換した中間データを辞書を用いてユニバーサル
符号に符号化するユニバーサル符号化手段(12)とを
備えた画像データ圧縮装置に於いて、 前記ユニバーサル符号化に用いる辞書として空白用辞書
(16−1)と非空白用辞書(16−2)を設け、予め
与えられた文字のピッチ情報により前記中間データへの
変換対象となった複数ラインが空白か否か判断して前記
2つの辞書から1つを選択する辞書選択手段(14)と
を設けたことを特徴とする画像データ圧縮装置。
1. Image data composed of a one-dimensional bit stream is divided into line data of a predetermined length and converted into two-dimensional data, and the two-dimensional data is divided into patterns in a dividing direction for every predetermined number of lines. Intermediate coding means (10) for converting into intermediate data consisting of a set of run lengths indicating the number of consecutive identical patterns in the line direction, and the intermediate coding means (1)
In the image data compression apparatus provided with a universal encoding means (12) for encoding the intermediate data converted in 0) into a universal code using the dictionary, a blank dictionary (16) is used as the dictionary for the universal encoding. -1) and a non-blank dictionary (16-2) are provided, and it is judged from the two dictionaries whether or not a plurality of lines to be converted into the intermediate data are blank based on the pitch information of the character given in advance. An image data compression apparatus, characterized in that a dictionary selection means (14) for selecting one is provided.
【請求項2】辞書を用いてユニバーサル符号化した符号
データから、所定ライン数毎に分割方向でのパターンと
ライン方向での同一パターンの連続数を示すランレング
スとの組からなる2次元の中間データを復号するユニバ
ーサル復号化手段(18)と、該ユニバーサル復号化手
段(18)で復号した2次元の中間データを1次元のビ
ットストリームで構成する画像データに逆変換する中間
復号化手段(20)とを備えた画像データ復元装置に於
いて、 前記ユニバーサル復号化に用いる辞書として、空白用辞
書(16−1)と非空白用辞書(16−2)を設け、予
め与えられた文字のピッチ情報により前記中間データへ
の変換対象となる複数ラインが空白か否か判断して前記
2つの辞書から1つを選択する辞書選択手段(14)を
設けたことを特徴とする画像データ圧縮装置。
2. A two-dimensional intermediate consisting of a set of a pattern in a dividing direction and a run length indicating the number of consecutive identical patterns in a line direction for every predetermined number of lines from code data universally coded using a dictionary. Universal decoding means (18) for decoding data, and intermediate decoding means (20) for inversely converting the two-dimensional intermediate data decoded by the universal decoding means (18) into image data composed of a one-dimensional bit stream. ) And an image data decompression device including a blank dictionary (16-1) and a non-blank dictionary (16-2) as dictionaries to be used for the universal decoding, and a predetermined pitch of characters is provided. A dictionary selecting means (14) for selecting one of the two dictionaries by judging whether or not a plurality of lines to be converted into the intermediate data are blank based on information is provided. An image data compression device characterized by:
【請求項3】1次元のビットストリームで構成される画
像データを、所定長のラインデータに分割して2次元デ
ータに変換し、該2次元データを所定ライン数毎に分割
方向でのパターンとライン方向での同一パターンの連続
数を示すランレングスの組からなる中間データに変換す
る中間符号化手段(10)と、該中間符号化手段(1
0)で変換した中間データを辞書を用いてユニバーサル
符号に符号化するユニバーサル符号化手段(12)とを
備えた画像データ圧縮装置に於いて、 前記ユニバーサル符号化に用いる辞書として、空白用辞
書(16−1)と非空白用辞書(16−2)を設け、前
記中間データへの変換対象となった複数ライン毎に前記
パターンの出現頻度を求めて空白か否か判断し、前記2
つの辞書の1つを選択すると共に選択した辞書番号を符
号化させる辞書選択手段(22)を設けたことを特徴と
する画像データ圧縮装置。
3. Image data composed of a one-dimensional bit stream is divided into line data of a predetermined length and converted into two-dimensional data, and the two-dimensional data is divided into patterns in a dividing direction for every predetermined number of lines. Intermediate coding means (10) for converting into intermediate data consisting of a set of run lengths indicating the number of consecutive identical patterns in the line direction, and the intermediate coding means (1)
In the image data compression apparatus provided with the universal encoding means (12) for encoding the intermediate data converted in 0) into a universal code using the dictionary, a blank dictionary ( 16-1) and a non-blank dictionary (16-2) are provided, the appearance frequency of the pattern is determined for each of a plurality of lines that have been converted to the intermediate data, and it is determined whether the pattern is blank or not.
An image data compression apparatus comprising a dictionary selection means (22) for selecting one of the two dictionaries and encoding the selected dictionary number.
【請求項4】辞書を用いてユニバーサル符号化した符号
データから、所定ライン数毎に分割方向でのパターンと
ライン方向での同一パターンの連続数を示すランレング
スとの組からなる2次元の中間データを復号するユニバ
ーサル復号化手段(18)と、該ユニバーサル復号化手
段(18)で復号した2次元の中間データを1次元のビ
ットストリームで構成する画像データに逆変換する中間
復号化手段(20)とを備えた画像データ復元装置に於
いて、 前記ユニバーサル復号化に用いる辞書として、空白用辞
書(16−1)と非空白用辞書(16−2)を設け、前
記符号データから復元した辞書番号により、前記2つの
辞書の1つを選択する辞書選択手段(24)を設けたこ
とを特徴とする画像データ圧縮装置。
4. A two-dimensional intermediate consisting of a set of a pattern in the dividing direction and a run length indicating the number of consecutive identical patterns in the line direction for every predetermined number of lines from the code data universally encoded using a dictionary. Universal decoding means (18) for decoding data, and intermediate decoding means (20) for inversely converting the two-dimensional intermediate data decoded by the universal decoding means (18) into image data composed of a one-dimensional bit stream. ) And a blank dictionary (16-1) and a non-blank dictionary (16-2) are provided as dictionaries used for the universal decoding, and the dictionaries restored from the code data are provided. An image data compression apparatus, characterized by further comprising dictionary selection means (24) for selecting one of the two dictionaries according to a number.
【請求項5】1次元のビットストリームで構成される画
像データを、所定長のラインデータに分割して2次元デ
ータに変換し、該2次元データを所定ライン数毎に分割
方向でのパターンとライン方向での同一パターンの連続
数を示すランレングスの組からなる中間データに変換す
る中間符号化手段(10)と、該中間符号化手段(1
0)で変換した中間データを辞書を用いてユニバーサル
符号に符号化するユニバーサル符号化手段(12)とを
備えた画像データ圧縮装置に於いて、 前記ユニバーサル符号化に用いる辞書として、網点周期
に対応した複数の辞書(32−1〜32−n)を設け、
予め与えられた網点周期情報により前記中間データへの
変換対象となった複数ラインに対応した1つの辞書を前
記複数の辞書(32−1〜32−n)から選択する辞書
選択手段(26)とを設けたことを特徴とする画像デー
タ圧縮装置。
5. Image data composed of a one-dimensional bit stream is divided into line data of a predetermined length and converted into two-dimensional data, and the two-dimensional data is divided into patterns in a dividing direction for every predetermined number of lines. Intermediate coding means (10) for converting into intermediate data consisting of a set of run lengths indicating the number of consecutive identical patterns in the line direction, and the intermediate coding means (1)
In the image data compression apparatus provided with the universal encoding means (12) for encoding the intermediate data converted in 0) into the universal code using the dictionary, the dictionary used in the universal encoding has a halftone dot cycle. A plurality of corresponding dictionaries (32-1 to 32-n) are provided,
Dictionary selecting means (26) for selecting, from the plurality of dictionaries (32-1 to 32-n), one dictionary corresponding to a plurality of lines which have been converted into the intermediate data according to halftone dot period information given in advance. An image data compression device, characterized by being provided with.
【請求項6】辞書を用いてユニバーサル符号化した符号
データから、所定ライン数毎に分割方向でのパターンと
ライン方向での同一パターンの連続数を示すランレング
スとの組からなる2次元の中間データを復号するユニバ
ーサル復号化手段(18)と、該ユニバーサル復号化手
段(18)で復号した2次元の中間データを1次元のビ
ットストリームで構成する画像データに逆変換する中間
復号化手段(20)とを備えた画像データ復元装置に於
いて、 前記ユニバーサル復号化に用いる辞書として、網点周期
に対応した複数の辞書(32−1〜32−n)を設け、
予め与えられた網点周期情報により前記中間データへの
変換対象となる複数ラインに対応した1つの辞書を前記
複数の辞書(32−1〜32−n)から選択する網点辞
書選択手段(26)を設けたことを特徴とする画像デー
タ圧縮装置。
6. A two-dimensional intermediate consisting of a set of a pattern in a dividing direction and a run length indicating the number of consecutive identical patterns in a line direction for every predetermined number of lines from code data universally coded using a dictionary. Universal decoding means (18) for decoding data, and intermediate decoding means (20) for inversely converting the two-dimensional intermediate data decoded by the universal decoding means (18) into image data composed of a one-dimensional bit stream. ), And a plurality of dictionaries (32-1 to 32-n) corresponding to halftone dot periods are provided as dictionaries used for the universal decoding.
Halftone dot dictionary selecting means (26) for selecting one dictionary corresponding to a plurality of lines to be converted into the intermediate data from the plurality of dictionaries (32-1 to 32-n) according to halftone dot period information given in advance. ) Is provided, the image data compression device.
【請求項7】1次元のビットストリームで構成される画
像データを、所定長のラインデータに分割して2次元デ
ータに変換し、該2次元データを所定ライン数毎に分割
方向でのパターンとライン方向での同一パターンの連続
数を示すランレングスの組からなる中間データに変換す
る中間符号化手段(10)と、該中間符号化手段(1
0)で変換した中間データを辞書を用いてユニバーサル
符号に符号化するユニバーサル符号化手段(12)とを
備えた画像データ圧縮装置に於いて、 前記ユニバーサル符号化に用いる辞書として、網点周期
に対応した複数の辞書(32−1〜32−n)を設け、
前記中間データへの変換対象となった複数ライン毎に前
記パターンの出現頻度の分布を求め、過去に求めた出現
頻度との差から前記複数の辞書(32−1〜32−n)
の1つを選択するか又は新たな作成辞書を選択し、該選
択辞書の辞書番号と共に符号化させる辞書選択手段(3
2)を設けたことを特徴とする画像データ圧縮装置。
7. Image data composed of a one-dimensional bit stream is divided into line data of a predetermined length and converted into two-dimensional data, and the two-dimensional data is divided into patterns in a dividing direction for every predetermined number of lines. Intermediate coding means (10) for converting into intermediate data consisting of a set of run lengths indicating the number of consecutive identical patterns in the line direction, and the intermediate coding means (1)
In an image data compression apparatus equipped with a universal encoding means (12) for encoding the intermediate data converted in 0) into a universal code using a dictionary, a dictionary used for the universal encoding is A plurality of corresponding dictionaries (32-1 to 32-n) are provided,
The distribution of the appearance frequency of the pattern is obtained for each of the plurality of lines that are the conversion targets to the intermediate data, and the plurality of dictionaries (32-1 to 32-n) are obtained from the difference with the appearance frequency obtained in the past.
Dictionary selecting means (3) for selecting one of the selected dictionary or a newly created dictionary and encoding with the dictionary number of the selected dictionary.
2. An image data compression device characterized by being provided with 2).
【請求項8】辞書を用いてユニバーサル符号化した符号
データから、所定ライン数毎に分割方向でのパターンと
ライン方向での同一パターンの連続数を示すランレング
スとの組からなる2次元の中間データを復号するユニバ
ーサル復号化手段(18)と、該ユニバーサル復号化手
段(18)で復号した2次元の中間データを1次元のビ
ットストリームで構成する画像データに逆変換する中間
復号化手段(20)とを備えた画像データ復元装置に於
いて、 前記ユニバーサル復号化に用いる辞書として、網点周期
に対応した複数の辞書(32−1〜32−n)を設け、
前記符号データから復元した辞書番号により前記複数の
辞書(32−1〜32−n)の1つを選択するか又は新
たな作成辞書を選択して復号化を行わせる辞書選択手段
(34)を設けたことを特徴とする画像データ圧縮装
置。
8. A two-dimensional intermediate consisting of a set of a pattern in the dividing direction and a run length indicating the continuous number of the same pattern in the line direction for every predetermined number of lines from code data universally encoded using a dictionary. Universal decoding means (18) for decoding the data, and intermediate decoding means (20) for inversely converting the two-dimensional intermediate data decoded by the universal decoding means (18) into image data composed of a one-dimensional bit stream. ), And a plurality of dictionaries (32-1 to 32-n) corresponding to halftone dot periods are provided as dictionaries used for the universal decoding.
Dictionary selection means (34) for selecting one of the plurality of dictionaries (32-1 to 32-n) according to the dictionary number restored from the code data or selecting a new created dictionary and performing decoding. An image data compression device characterized by being provided.
【請求項9】請求項7又は8記載の画像データ圧縮又は
復元装置に於いて、 網点周期と変換対象とするライン数の最小公倍数を求
め、該最小公倍数を前記変換対象とする複数ラインで割
った値を辞書の分割数とすることを特徴とする画像デー
タ圧縮又は復元装置。
9. The image data compression or decompression device according to claim 7 or 8, wherein the least common multiple of the halftone dot period and the number of lines to be converted is obtained, and the least common multiple is converted into a plurality of lines to be converted. An image data compression or decompression device characterized in that a divided value is used as the number of divisions of a dictionary.
JP5153094A 1993-06-24 1993-06-24 Picture data compression and decoding device Withdrawn JPH0723238A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5153094A JPH0723238A (en) 1993-06-24 1993-06-24 Picture data compression and decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5153094A JPH0723238A (en) 1993-06-24 1993-06-24 Picture data compression and decoding device

Publications (1)

Publication Number Publication Date
JPH0723238A true JPH0723238A (en) 1995-01-24

Family

ID=15554847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5153094A Withdrawn JPH0723238A (en) 1993-06-24 1993-06-24 Picture data compression and decoding device

Country Status (1)

Country Link
JP (1) JPH0723238A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11168389A (en) * 1997-12-05 1999-06-22 Toshiba Corp Data compression device
JP2006270174A (en) * 2005-03-22 2006-10-05 Fuji Xerox Co Ltd Coder, decoder, coding method, decoding method, and programs thereof
JP2006324713A (en) * 2005-05-17 2006-11-30 Fuji Xerox Co Ltd Image coding apparatus, image decoding apparatus, image coding method, image decoding method, and program for them
JP2006324714A (en) * 2005-05-17 2006-11-30 Fuji Xerox Co Ltd Image coding apparatus, image decoding apparatus, image coding method, image decoding method, and program for them
JP2012178735A (en) * 2011-02-25 2012-09-13 Canon Inc Image processing system and control method of the same

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11168389A (en) * 1997-12-05 1999-06-22 Toshiba Corp Data compression device
JP2006270174A (en) * 2005-03-22 2006-10-05 Fuji Xerox Co Ltd Coder, decoder, coding method, decoding method, and programs thereof
JP4735806B2 (en) * 2005-03-22 2011-07-27 富士ゼロックス株式会社 Encoding device, decoding device, and programs thereof
JP2006324713A (en) * 2005-05-17 2006-11-30 Fuji Xerox Co Ltd Image coding apparatus, image decoding apparatus, image coding method, image decoding method, and program for them
JP2006324714A (en) * 2005-05-17 2006-11-30 Fuji Xerox Co Ltd Image coding apparatus, image decoding apparatus, image coding method, image decoding method, and program for them
JP2012178735A (en) * 2011-02-25 2012-09-13 Canon Inc Image processing system and control method of the same

Similar Documents

Publication Publication Date Title
US5045852A (en) Dynamic model selection during data compression
US5363099A (en) Method and apparatus for entropy coding
US4028731A (en) Apparatus for compression coding using cross-array correlation between two-dimensional matrices derived from two-valued digital images
EP0412047A1 (en) Method and system for arithmetic coding and decoding
EP1175100A2 (en) Method and apparatus for image encoding and decoding
KR950026293A (en) Binarization Apparatus and Method for Compression of Color Image and Bitwise Coding of M Alphabets therefor
JPH0723238A (en) Picture data compression and decoding device
JP4000266B2 (en) Data encoding apparatus, data encoding method, and program thereof
US6947606B2 (en) Skim encoding method for compression of a two dimensional array of data
JPH05151349A (en) Image data compressing method and encoding circuit
JP3676078B2 (en) Run-length encoding method and compression apparatus
JPH08130652A (en) Compression and expansion system for two-dimension image data
JP3105330B2 (en) Image data compression / decompression method
JP3073072B2 (en) Image data compression and decompression method
JP2755464B2 (en) Image data compression method
JP2798767B2 (en) Image data compression method
JP3034016B2 (en) Data compression and decompression method
JPH0884260A (en) Compression system and expansion system for two-dimension image data
JP2755463B2 (en) Image data compression method
JP2615215B2 (en) Image data compression method
JPH0629861A (en) Data compression method
JPH06152988A (en) Decoder for variable length encoding
JPS6364948B2 (en)
JPH10163880A (en) Data decoder
JP2840420B2 (en) Image data compression and decompression method

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000905