JPH06195063A - Character pattern data compressing device - Google Patents

Character pattern data compressing device

Info

Publication number
JPH06195063A
JPH06195063A JP4357883A JP35788392A JPH06195063A JP H06195063 A JPH06195063 A JP H06195063A JP 4357883 A JP4357883 A JP 4357883A JP 35788392 A JP35788392 A JP 35788392A JP H06195063 A JPH06195063 A JP H06195063A
Authority
JP
Japan
Prior art keywords
data
character pattern
compression
combination
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4357883A
Other languages
Japanese (ja)
Inventor
Shin Mikuni
伸 三国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP4357883A priority Critical patent/JPH06195063A/en
Publication of JPH06195063A publication Critical patent/JPH06195063A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To compress character pattern data with the use of a compressing method which suppresses redundancy by making the appearance frequency of data partial while making the combination pattern of one data constituting the character pattern data and last data correspond to fixed data for reproduc tion when the combination pattern appears frequently. CONSTITUTION:An uncompressed font pattern data storage part 101 aims at respective data constituting a character pattern and detects the frequency of the combination of the aimed data and its last data and a key word selection part 105 generates a key word table when the combination is high in frequency. A data appearance frequency counting part 107 makes this key word table correspond to command codes for reproduction to allow the appearance frequency of the data to be deviated. A compressed code table generation part 109 generates a compressed code string having its redundant part cut corresponding to the appearance frequency of the data. A compressive encoding part 112 substitutes the compressed code string for the character pattern data.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、ワードプロセッサ等
の文書作成装置に組み込まれる文字パターンデータを圧
縮する文字パターンデータ圧縮装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character pattern data compression device for compressing character pattern data incorporated in a document creation device such as a word processor.

【0002】[0002]

【従来の技術】一般に、ワードプロセッサにおいて、入
力作成された文書データはテキストメモリにコード形式
で記憶されており、文書印刷指令が与えられると、文字
パターンメモリを参照することによってテキストメモリ
内の文書データが1文字ずつドットパターンに変換され
て印字出力される。ここで、文字パターンメモリは半導
体読み出し専用メモリ(ROM)等により構成され、こ
の文字パターンメモリ内に標準装備されている書体の文
字パターンで文書印刷が行われる。
2. Description of the Related Art Generally, in a word processor, input and created document data is stored in a code format in a text memory, and when a document print command is given, the document data in the text memory is referred to by referring to a character pattern memory. Is converted into a dot pattern character by character and printed out. Here, the character pattern memory is composed of a semiconductor read-only memory (ROM) or the like, and a document is printed with a character pattern of a typeface provided as standard in the character pattern memory.

【0003】[0003]

【発明が解決しようとする課題】ところで、文字パター
ンデータは例えば48ドットフォントの場合、1文字に
含まれるドット数は48×48=2304ドットとな
り、1文字288バイト要することになる。これが、例
えば、JIS第1、第2水準の漢字、仮名記号全体では
7000文字以上となり、その容量は2Mバイトと大変
巨大なものとなってしまう。この為、書体の異なる複数
種の文字パターンを予め文字パターンメモリ内に標準装
備しておくことは、文字パターンメモリが膨大化し、コ
スト高となる。また、フロッピーディスク等の外部記憶
装置から文字パターンを供給するものにおいても、書体
毎に複数の外部記憶装置が必要となり、コスト高とな
る。そこで、従来においては、文字パターンデータを圧
縮して記憶させておき、文書印刷時にこの圧縮パターン
を元の文字パターンに復元するようにしたものが知られ
ている。この種のものは、例えば、文字パターンデータ
を構成する“0”のビットデータが連続する場合、その
連続する数をその“0”のビット列データに置き換えて
記憶させることによって文字パターンを圧縮するように
しているが、このような圧縮法では圧縮率が低く、余り
実効が上らないのが実状であった。この発明の課題は、
文字パターンデータを構成するあるデータとその前のデ
ータとの組み合せパターンが頻繁に出現する場合にこれ
を再生用の固定データに対応付けてデータの出現頻度を
偏らせておくことにより冗長性を抑制する圧縮手法を用
いて文字パターンデータを圧縮できるようにすることで
ある。
By the way, when the character pattern data is, for example, a 48-dot font, the number of dots contained in one character is 48 × 48 = 2304 dots, and one character requires 288 bytes. This is, for example, 7,000 characters or more for the JIS kanji and JIS kana symbols as a whole of JIS, and the capacity is very huge, 2 Mbytes. For this reason, if a plurality of types of character patterns having different typefaces are provided as standard equipment in the character pattern memory in advance, the character pattern memory becomes huge and the cost becomes high. Further, even in the case of supplying a character pattern from an external storage device such as a floppy disk, a plurality of external storage devices are required for each typeface, resulting in high cost. Therefore, conventionally, it is known that the character pattern data is compressed and stored, and the compressed pattern is restored to the original character pattern when the document is printed. In this type, for example, when the bit data of “0” forming the character pattern data is continuous, the character pattern is compressed by replacing the continuous number with the bit string data of “0” and storing it. However, with such a compression method, the compression rate is low, and the actual situation is that the effectiveness is not so high. The subject of this invention is
Redundancy is suppressed by associating this with fixed data for reproduction and biasing the appearance frequency of data when a combination pattern of certain data that constitutes character pattern data and the data before it frequently appears. That is, the character pattern data can be compressed by using the compression method.

【0004】[0004]

【課題を解決するための手段】この発明の手段は次の通
りである。ビットマップ方式の各文字パターンデータを
それぞれ圧縮して文書作成装置に組み込む文字パターン
データ圧縮装置において、組み合せ頻度検出手段は文字
パターンデータを構成する各データに順次着目し、この
着目データとその前のデータとの組み合せに応じてその
組み合せ頻度を検出する動作を全ての文字に対して行
う。テーブル作成手段はこの組み合せ頻度検出手段によ
って頻度の高い組み合せが検出された場合に、前のデー
タがこの組み合せならば着目データはこれであるという
データ候補を各組み合せ毎に記憶する候補テーブルを作
成する。圧縮符号発生手段は前記候補テーブルを再生用
の固定データに対応させることでデータの出現頻度を偏
らせ、このデータの出現頻度に応じて冗長部分を抑制し
た圧縮符号列を発生する。圧縮手段は各文字パターンデ
ータを前記圧縮符号発生手段によって発生された圧縮符
号列に置き換えることで文字パターンデータを圧縮す
る。なお、例えば、前記組み合せ頻度検出手段によって
頻度の高い組み合せが検出された場合に、前記テーブル
作成手段は前のデータの1つの組み合せに対して着目デ
ータの異なる複数の候補テーブルを作成し、前記圧縮符
号発生手段は複数の候補テーブルのそれぞれに固定デー
タを対応させるようにしてもよい。また、例えば、文字
パターンデータを構成する各データの単位は、ビットマ
ップ方式でデータを持つ際の1アドレスを占有する1ワ
ードを構成するビット群となるようにしてもよい。
The means of the present invention are as follows. In a character pattern data compression device that compresses each character pattern data of the bit map system and incorporates it in the document creation device, the combination frequency detection means sequentially focuses on each data forming the character pattern data, and The operation of detecting the combination frequency is performed for all characters according to the combination with the data. When a combination having a high frequency is detected by the combination frequency detecting means, the table creating means creates a candidate table for storing, for each combination, a data candidate that the data of interest is this if the previous data is this combination. . The compression code generation means biases the appearance frequency of the data by associating the candidate table with the fixed data for reproduction, and generates the compression code string in which the redundant portion is suppressed according to the appearance frequency of the data. The compressing means compresses the character pattern data by replacing each character pattern data with the compression code string generated by the compression code generating means. It should be noted that, for example, when the combination frequency detecting means detects a combination having a high frequency, the table creating means creates a plurality of candidate tables having different focused data for one combination of the previous data, and compresses The code generating means may associate fixed data with each of the plurality of candidate tables. Further, for example, the unit of each data forming the character pattern data may be a bit group forming one word occupying one address when the data is held by the bitmap method.

【0005】[0005]

【作用】この発明の手段の作用は次の通りである。先
ず、文字パターンデータを構成する各データに順次着目
し、この着目データとその前のデータとの組み合せに応
じてその組み合せ頻度を検出する動作が全ての文字に対
して行われる。これによって頻度の高い組み合せが検出
されると、前のデータがこの組み合せならば着目データ
はこれであるというデータ候補を各組み合せ毎に記憶す
る候補テーブルが作成される。すると、この候補テーブ
ルを再生用の固定データに対応させることでデータの出
現頻度を偏らせ、このデータ出現頻度に応じて冗長部分
を抑制した圧縮符号列を発生させて各文字パターンデー
タをこの圧縮符号列で置き換えることで文字パターンデ
ータを圧縮する。したがって、文字パターンデータを構
成するあるデータとその前のデータとの組み合せパター
ンが頻繁に出現する場合にこれを再生用の固定データに
対応付けてデータの出現頻度を偏らせておくことにより
冗長性を抑制する圧縮手法を用いて文字パターンデータ
を圧縮することができる。
The operation of the means of the present invention is as follows. First, attention is sequentially paid to each data forming the character pattern data, and an operation of detecting the combination frequency is performed for all the characters in accordance with the combination of the focused data and the previous data. When a combination with a high frequency is detected in this way, a candidate table is created for storing, for each combination, a data candidate that the data of interest is this if the previous data is this combination. Then, by making this candidate table correspond to the fixed data for reproduction, the appearance frequency of the data is biased, and the compression code string in which the redundant part is suppressed is generated according to the appearance frequency of the data to compress each character pattern data. Character pattern data is compressed by replacing it with a code string. Therefore, when a combination pattern of a certain data forming the character pattern data and the data before it frequently appears, it is associated with the fixed data for reproduction and the frequency of appearance of the data is biased to achieve redundancy. Character pattern data can be compressed using a compression method that suppresses

【0006】[0006]

【第1実施例】以下、図1〜図16を参照して第1実施
例を説明する。図1は文字パターンデータの圧縮/再生
過程を概略的に示したもので、文字パターンデータ圧縮
装置100は文書作成装置200の製品完成時におい
て、例えば13000文字の文字パターンデータを本実
施例特有の規則にしたがってデータ圧縮し、それによっ
て得られた各種のデータ(後述する圧縮フォントデー
タ、インデックステーブル、逆変換テーブル、キーワー
ドテーブル)を文書作成装置200に組み込む。つま
り、文字パターンデータ圧縮装置100と文書作成装置
200とは別個独立した装置であり、文字パターンデー
タ圧縮装置100は文書作成装置200に圧縮文字デー
タを格納させる為の装置で、文書作成装置200の製品
完成時に圧縮文字データの書き込みが行われる。
[First Embodiment] A first embodiment will be described below with reference to FIGS. FIG. 1 schematically shows a process of compressing / reproducing character pattern data. The character pattern data compressing device 100, when the product of the document creating device 200 is completed, converts the character pattern data of, for example, 13000 characters into a peculiar embodiment. Data is compressed according to the rules, and various data (compressed font data, index table, inverse conversion table, keyword table described later) obtained by the compression are incorporated in the document creating apparatus 200. That is, the character pattern data compression device 100 and the document creation device 200 are separate and independent devices. The character pattern data compression device 100 is a device for storing compressed character data in the document creation device 200. The compressed character data is written when the product is completed.

【0007】文書作成装置200は本実施例特有の文字
パターン再生装置201と通常備えられている文書作成
機主装置202とを有する構成で、文字パターン再生装
置201には圧縮文字データメモリ203が設けられて
いる。この圧縮文字データメモリ203は圧縮フォント
格納部204、インデックステーブル格納部205、逆
変換テーブル格納部206、キーワードテーブル格納部
207を有する構成で、文字パターンデータ圧縮装置1
00から発生出力された圧縮フォントデータ、インデッ
クステーブル、逆変換テーブル、キーワードテーブルが
圧縮文字データメモリ203内の対応する格納部204
〜207に書き込まれる。文書印刷時において文字パタ
ーン再生装置201は圧縮文字パターンを本実施例特有
の規則にしたがって逆変換し、通常と同様の無圧縮文字
パターンに復元再生し、文書作成機主装置202に与え
る。これによって通常と同様の印字結果を得るようにし
ている。
The document creating apparatus 200 has a character pattern reproducing apparatus 201 peculiar to this embodiment and a document creating machine main apparatus 202 which is usually provided. The character pattern reproducing apparatus 201 is provided with a compressed character data memory 203. Has been. The compressed character data memory 203 includes a compressed font storage unit 204, an index table storage unit 205, an inverse conversion table storage unit 206, and a keyword table storage unit 207.
The compressed font data, the index table, the inverse conversion table, and the keyword table generated and output from 00 correspond to the corresponding storage unit 204 in the compressed character data memory 203.
To 207. At the time of printing the document, the character pattern reproducing device 201 reversely converts the compressed character pattern according to the rules peculiar to the present embodiment, restores and reproduces the same uncompressed character pattern as usual, and gives it to the document creator main unit 202. As a result, the same printing result as usual is obtained.

【0008】なお、上述した「圧縮フォントデータ」、
「インデックステーブル」、「逆変換テーブル」、「キ
ーワードテーブル」については後で詳細に説明するの
で、ここでは簡単に説明しておくものとする。「圧縮フ
ォントデータ」は文字パターンデータを構成するデータ
のうち頻繁に出現するデータパターンを特定のコード
(固定値)に対応させることによってデータの出現頻度
を偏らせ、データの出現頻度に応じて冗長部分をカット
する特性の圧縮方法を用いて圧縮することによって得ら
れたデータであり、1文字毎に通常の文字パターンデー
タは上述した圧縮手法にしたがって圧縮され、文書作成
装置200内の圧縮フォント格納部204に全文字分の
圧縮フォントデータが書き込まれる。「インデックステ
ーブル」はどの文字が「圧縮フォントデータ」の中の何
バイト目から入っているかを示すテーブルである。「逆
変換テーブル」および「キーワードテーブル」は圧縮フ
ォントデータを通常の文字パターンデータに復元再生す
る際に用いられるテーブルである。
The above-mentioned "compressed font data",
The “index table”, the “inverse conversion table”, and the “keyword table” will be described in detail later, and therefore will be briefly described here. "Compressed font data" biases the appearance frequency of data by associating frequently appearing data patterns of the data forming the character pattern data with a specific code (fixed value), and makes them redundant according to the appearance frequency of data. Data obtained by compression using a compression method having a characteristic of cutting a part, and normal character pattern data is compressed for each character according to the compression method described above, and stored in the compressed font in the document creation device 200. Compressed font data for all characters is written in the section 204. The "index table" is a table indicating which character is included in which byte of the "compressed font data". The "inverse conversion table" and the "keyword table" are tables used when the compressed font data is restored to normal character pattern data and reproduced.

【0009】図2は文字パターンデータ圧縮装置100
のブロック構成図である。無圧縮フォントパターンデー
タ格納部101には文書作成装置200に搭載すべき全
ての文字(例えば13000文字)が収められている。
図3は、無圧縮フォントパターンデータ格納部101に
収められている文字パターンのデータ構造を示してい
る。文字パターンは1文字48×48ドット構成で、8
ビット構成のメモリを縦方向に配置し、それを横に48
バイト並べ、更にこれを縦方向に6段重ねた構造のメモ
リにドットマップ方式で格納されている。したがって、
1文字分の文字パターンは縦8ビット×6段=48ドッ
ト、横48ドットで288バイト構成となっている。な
お、この場合のアドレスで一番若いのは文字パターンの
左上隅部に対応するアドレスであり、次に若いのは右
隣、……最後は右下隅部に対応するアドレスとなる。こ
の右下隅部のアドレスに続くアドレス領域には次の文字
の左上隅部に対応するデータが格納されている。また、
ビット並びはMSBが図中、上に来るように配置されて
いる。
FIG. 2 shows a character pattern data compression device 100.
It is a block configuration diagram of. The uncompressed font pattern data storage unit 101 stores all the characters (for example, 13000 characters) to be installed in the document creating apparatus 200.
FIG. 3 shows the data structure of character patterns stored in the uncompressed font pattern data storage unit 101. The character pattern consists of 48 x 48 dots per character, 8
Arrange the bit-structured memory vertically and set it horizontally 48
The data is stored in a dot-map manner in a memory having a structure in which bytes are arranged and further vertically stacked in six stages. Therefore,
A character pattern for one character has a structure of 288 bytes consisting of vertical 8 bits × 6 rows = 48 dots and horizontal 48 dots. In this case, the youngest address is the address corresponding to the upper left corner of the character pattern, the youngest is the address next to the right, and the last is the address corresponding to the lower right corner. Data corresponding to the upper left corner of the next character is stored in the address area following the address of the lower right corner. Also,
The bit arrangement is arranged so that the MSB is at the top in the figure.

【0010】ソース・バッファ102は無圧縮フォント
パターンデータ格納部101から読み出された1文字分
の文字パターンデータを一時的に記憶するもので、無圧
縮フォントパターンデータ格納部101の内容が1文字
ずつソース・バッファ102に格納される。このように
処理対象の文字パターンデータを1文字ずつ無圧縮フォ
ントパターンデータ格納部101から取り出してソース
・バッファ102に一時記憶させることにより処理速度
の低下を防止するようにしている。なお、ソース・バッ
ファ102には図3で示したデータ構造のまま文字パタ
ーンデータが格納される。
The source buffer 102 temporarily stores the character pattern data for one character read from the uncompressed font pattern data storage unit 101, and the content of the uncompressed font pattern data storage unit 101 is one character. Are stored in the source buffer 102 one by one. In this way, the character pattern data to be processed is taken out character by character from the uncompressed font pattern data storage unit 101 and temporarily stored in the source buffer 102 to prevent the processing speed from decreasing. The source buffer 102 stores the character pattern data with the data structure shown in FIG.

【0011】キーワード選定用計数制御部103は2つ
の機能を有し、その1つはソース・バッファ102の内
容に基づいてキーワード選定用カウンタアレイ104に
対するカウンタアドレスを算出する機能、他の1つは算
出したアドレスによって指定されるカウンタの値をカウ
ントアップする機能である。
The keyword selection counting control unit 103 has two functions, one of which is for calculating a counter address for the keyword selection counter array 104 based on the contents of the source buffer 102, and the other is for the other. It is a function of counting up the value of the counter designated by the calculated address.

【0012】図4はキーワード選定用計数制御部103
の第1機能を説明する為の図である。キーワード選定用
計数制御部103はソース・バッファ102から連続す
る3バイトのデータ、つまり、隣り合う8ビット×3の
データを抽出し、現在着目しているデータを「DR」、
1つ前(左隣)のデータを「DM」、更にもう1つ前の
データを「DL」とすると、キーワード選定用計数制御
部103は先ず、2つ前のデータ「DL」の上位4ビッ
トと下位4ビットのイクスクルーシブオアXOR(記号
「∀」を付して示す)を取り、これをキーワード選定用
カウンタアレイ104をアクセスする為の第1要素アド
レスの最上位4ビットとする。この第1要素アドレスは
本実施例の場合、12ビットアドレスで、この下位8ビ
ットは1つ前のデータ「DM」そのものとなる。つま
り、第1要素アドレスは2つ前のデータ「DL」のイク
スクルージブオアXORの演算結果と1つ前のデータ
「DM」を組み合せたものとなる。ここで、図示の例で
は2つ前のデータ「DL」は「70h」(hは16進表
記を示す記号)、そのイクスクルーシブオアXORの演
算結果は「7h」、1つ前のデータ「DM」が「3c
h」である為、第1要素アドレスは「73ch」の12
ビットアドレスとなる。一方、キーワード選定用計数制
御部103は着目データ「DR」そのものをキーワード
選定用カウンタアレイ104の第2要素アドレス(8ビ
ットアドレス)とする。したがって、図4の例ではアド
レス算出機能によって「73ch、1Eh」というアド
レスが算出される。このようなアドレス算出処理はソー
ス・バッファ102内の3バイト目(1、2バイト目を
除く)から最後の288バイト目まで1バイト毎に着目
しながら行われる。なお、3バイト目から開始するのは
2バイト前からデータを参照する為であり、しかも文字
パターンデータの最初の2バイトは空白であることが多
く、特に問題にならないからである。
FIG. 4 is a count control unit 103 for keyword selection.
3 is a diagram for explaining the first function of FIG. The keyword selection counting control unit 103 extracts continuous 3 bytes of data from the source buffer 102, that is, adjacent 8 bits × 3 data, and the currently focused data is “DR”,
Assuming that the immediately preceding data (on the left) is “DM” and the further previous data is “DL”, the keyword selection counting control unit 103 first determines the upper 4 bits of the immediately preceding data “DL”. And the lower 4 bits of the exclusive OR XOR (indicated by the symbol “∀”) are used as the upper 4 bits of the first element address for accessing the keyword selection counter array 104. In the case of the present embodiment, this first element address is a 12-bit address, and the lower 8 bits are the previous data "DM" itself. That is, the first element address is a combination of the operation result of the exclusive OR XOR of the data "DL" two before and the data "DM" one before. Here, in the illustrated example, the data “DL” two data before is “70h” (h is a symbol indicating hexadecimal notation), the operation result of the exclusive OR XOR is “7h”, and the data before one is “ "DM" is "3c
Since it is "h", the first element address is 12 of "73ch".
It becomes a bit address. On the other hand, the keyword selection counting control unit 103 sets the focused data “DR” itself as the second element address (8-bit address) of the keyword selection counter array 104. Therefore, in the example of FIG. 4, the address “73ch, 1Eh” is calculated by the address calculation function. Such address calculation processing is performed while paying attention to each byte from the third byte (excluding the first and second bytes) to the last 288th byte in the source buffer 102. The reason for starting from the 3rd byte is that the data is referred to from 2 bytes before, and moreover, the first 2 bytes of the character pattern data are often blank, which is not a problem.

【0013】キーワード選定用計数制御部103の第2
機能はアドレス算出機能によって求められたアドレスで
キーワード選定用カウンタアレイ104をアクセスし、
該当するカウンタの値に「1」を加算するもので、該当
カウンタをアクセスする毎にその内容をカウントアップ
してゆく。
Second of count control unit 103 for keyword selection
The function is to access the keyword selection counter array 104 at the address obtained by the address calculation function,
"1" is added to the value of the corresponding counter, and the content is incremented each time the corresponding counter is accessed.

【0014】キーワード選定用カウンタアレイ104は
連続する3バイトのデータの組み合せ頻度を計数するカ
ウンタ群で、前2つのデータがこの組み合せならば次に
来るデータはこれであるという定義表(キーワードテー
ブル)を作成する際に用いられる。ここで、無圧縮フォ
ントパターンデータ格納部101内の全文字について、
データの組み合せ頻度が調べられる。つまり、キーワー
ド選定用計数制御部103は全文字が13000文字で
あれば、1文字毎にその3バイト目から288バイト目
までのデータに順次着目し、連続する3バイトのデータ
の組み合せ頻度を調べる動作を13000文字分繰り返
す。
The keyword selection counter array 104 is a group of counters for counting the combination frequency of consecutive 3-byte data. If the previous two data are this combination, the next data is this definition table (keyword table). Used when creating a. Here, for all characters in the uncompressed font pattern data storage unit 101,
The frequency of data combination is examined. That is, if all the characters are 13000, the keyword selection counting control unit 103 sequentially looks at the data from the 3rd byte to the 288th byte for each character, and checks the combination frequency of consecutive 3 bytes of data. The operation is repeated for 13,000 characters.

【0015】図5はキーワード選定用カウンタアレイ1
04の構成を示したもので、キーワード選定用カウンタ
アレイ104は2次元の広がりを持っており、キーワー
ド選定用計数制御部103からの第1要素アドレス(1
2ビット)と第2要素アドレス(8ビット)とによって
1つのカウンタが指定されてその値がカウントアップさ
れる。なお、このカウントアレイ104は列方向に28
=256列、行方向に212=4096行のカウンタ群に
よって構成されている。また各カウンタの初期値として
本実施例においては「0」がセットされている。
FIG. 5 shows a keyword selection counter array 1.
In the configuration of No. 04, the keyword selection counter array 104 has a two-dimensional spread, and the first element address (1
One counter is designated by 2 bits) and the second element address (8 bits), and the value is incremented. The count array 104 is 2 8 in the column direction.
= 256 columns and 2 12 = 4096 rows in the row direction. Further, "0" is set as the initial value of each counter in this embodiment.

【0016】キーワード選定部105は無圧縮フォント
パターンデータ格納部101内の全文字分のデータの組
み合せ頻度がキーワード選定用カウンタアレイ104に
計数されると、キーワード選定用カウンタアレイ104
の第1要素アドレス毎にカウント値が最大な第2要素ア
ドレス(着目データ「DR」の値)を調べ、それをキー
ワードテーブル格納部106の第1候補キーワードとし
て登録する。図6はキーワードテーブルの構成例で、図
示の例ではキーワード選定用計数制御部103からのア
ドレス「73Ch、1Eh」でアドレッシングされるカ
ウンタ「C73C1E(先頭の「C」はカウンタ識別用
の記号)」が第1要素アドレス「73Ch」のカウンタ
群の中で1番大きな値を持っていた場合である。この場
合、第1候補キーワードの「73Ch」の項目に着目デ
ータDR「1Eh」が登録され、2バイト前のイクスク
ルーシブオアXORの演算結果が「7h」、1バイト前
のデータが「3Ch」であれば、着目データは「1E
h」である可能性が大きいことを表わしている。更に2
番目に大きな値を持っている第2要素アドレスの値が第
2候補キーワードに、同様に3番目、4番目に大きなカ
ウント値を持っている第2要素アドレスの値が第3候
補、第4候補キーワードとして登録される。このように
本実施例においてはデータの組み合せに応じて4種類の
データ候補を登録するようにしている。
When the keyword selection counter array 104 counts the combination frequency of the data for all characters in the uncompressed font pattern data storage unit 101, the keyword selection counter array 104 outputs the keyword selection counter array 104.
The second element address (value of the focused data “DR”) having the maximum count value is checked for each of the first element addresses of, and it is registered as the first candidate keyword in the keyword table storage unit 106. FIG. 6 shows an example of the configuration of the keyword table. In the illustrated example, the counter "C73C1E (the leading" C "is a counter identification symbol)" addressed by the address "73Ch, 1Eh" from the keyword selection counting control unit 103. Has the largest value in the counter group of the first element address “73Ch”. In this case, the focused data DR “1Eh” is registered in the item “73Ch” of the first candidate keyword, the operation result of the exclusive OR XOR two bytes before is “7h”, and the data one byte before is “3Ch”. If so, the data of interest is "1E
It means that there is a high possibility that it is “h”. 2 more
The value of the second element address having the second largest value is the second candidate keyword, and the values of the second element address having the third and fourth largest count values are the third and fourth candidates. Registered as a keyword. As described above, in this embodiment, four types of data candidates are registered according to the combination of data.

【0017】キーワードテーブル格納部106内に格納
されたキーワードテーブルは前2つのデータがこの組み
合せの場合には次に来る着目データはこれであるという
定義表であり、前2つのデータから1つのデータを導き
出す為のテーブルであるので、本来は前2つ分の16ビ
ットのアドレスを持つことになる。しかし、そのような
テーブルは容量が64Kバイトにもなってしまう。ま
た、文字パターンにはこのようなテーブルを埋め尽くす
全ての組み合せが存在する可能性は低く、テーブル自体
に冗長性が出てしまう。そこで、本実施例ではテーブル
容量を通常の16分の1に縮小する手法が用いられてい
る。
The keyword table stored in the keyword table storage unit 106 is a definition table in which when the previous two data are this combination, the next data of interest is this definition table. Since it is a table for deriving, the address originally has 16 bits for the previous two. However, such a table has a capacity of 64 Kbytes. Further, it is unlikely that the character pattern has all the combinations that fill up such a table, and the table itself becomes redundant. Therefore, in this embodiment, a method of reducing the table capacity to 1/16 of the normal size is used.

【0018】即ち、キーワード選定用カウンタアレイ1
04の第1要素アドレスは着目データ「DR」に対して
1つ前のデータ「DM」と2つ前のデータ「DL」とを
組み合せたものであるが、2つ前のデータ「DL」は上
位4ビットと下位4ビットとのイクスクルーシブオアX
ORの演算によって得られた4ビットデータに縮小され
る為、本来の16ビットアドレスは12ビットアドレス
となり、これによってキーワードテーブルの容量は212
/216=1/16となる。ここで、2つ前のデータ「D
L」を縮小したのは着目データ「DR」に対する影響が
1つ前のデータ「DM」よりも少ないからであり、また
イクスクルーシブオアXORの演算を選んだのは全ての
ビットの影響が結果の4ビットに残るからである。更に
上位と下位の4ビットで演算を行うのはパターンデータ
の連続性を考慮した為である。なお、この方法によれ
ば、同一アドレスとなってしまう組み合せが16種存在
することになるが、その内、頻度の高い4種類の組み合
せでそのほとんどをカバーできることが実験的に確認さ
れた。なお、2種類でも十分であるが、本実施例では4
種類の組み合せを選定するようにしている。
That is, the keyword selection counter array 1
The first element address 04 is a combination of the previous data "DM" and the previous two data "DL" with respect to the data of interest "DR", but the previous two data "DL" is Exclusive or X of upper 4 bits and lower 4 bits
Since the original 16-bit address becomes a 12-bit address because it is reduced to 4-bit data obtained by the OR operation, the capacity of the keyword table is 2 12
/ 2 16 = 1/16. Here, the previous data “D
L is reduced because it has less influence on the focused data “DR” than the previous data “DM”. Also, the exclusive OR XOR operation is selected because of the influence of all bits. This is because the remaining 4 bits remain. Further, the reason that the upper 4 bits and the lower 4 bits are calculated is because the continuity of the pattern data is taken into consideration. According to this method, there are 16 kinds of combinations having the same address, but it has been experimentally confirmed that most of them can be covered by 4 kinds of combinations which have a high frequency. Two types are sufficient, but in this embodiment, four
I try to select a combination of types.

【0019】データ出現回数計数部107はキーワード
テーブルが作成された後に動作するもので、キーワード
テーブルだけでは全てのデータがキーワードにヒットす
るとは限らない為、キーワード選定用計数制御部103
と略同様に再度、データの出現回数を計数する。ここ
で、ヒットしなかったデータについてもその出現回数が
計数される。データ出現回数計数部107が動作を開始
すると、無圧縮フォントパターンデータ格納部101内
の全ての文字が1文字ずつソース・バッファ102に格
納されてゆき、データ出現回数計数部107によって1
文字ずつ処理される。
The data appearance frequency counting unit 107 operates after the keyword table is created, and not all the data hits the keyword only with the keyword table. Therefore, the keyword selection counting control unit 103
The number of appearances of data is counted again in the same manner as. Here, the number of appearances of the data that did not hit is counted. When the data appearance number counting unit 107 starts its operation, all the characters in the uncompressed font pattern data storage unit 101 are stored in the source buffer 102 one by one, and the data appearance number counting unit 107 sets the number of characters to 1.
It is processed character by character.

【0020】即ち、データ出現回数計数部107はキー
ワード選定用計数制御部103で述べた方法で着目デー
タ「DR」に対して前2つのデータ「DL」および1つ
前のデータ「DM」から12ビットアドレスを求め、こ
の12ビットアドレスでキーワードテーブル格納部10
6をアクセスし、着目データ「DR」が第1候補キーワ
ード〜第4候補キーワードに一致するか否かをチェック
する。ここで、着目データ「DR」が第1候補キーワー
ド〜第4候補キーワードの何れかに一致する場合には、
それに対応する回数カウントアレイ108内のカウンタ
の値をカウントアップ「+1」させる。また、何れのキ
ーワードにも一致しない場合にはその着目データに対応
する回数カウントアレイ108内のカウンタの値をカウ
ントアップ「+1」させる。
That is, the data appearance frequency counting unit 107 uses the method described in the keyword selection counting control unit 103 to select the data from the previous two data "DL" and the previous data "DM" to the target data "DR". The bit address is obtained, and the keyword table storage unit 10 is calculated using this 12-bit address.
6 is accessed to check whether the focused data “DR” matches the first to fourth candidate keywords. Here, when the focused data “DR” matches any of the first to fourth candidate keywords,
The value of the counter in the count counter array 108 corresponding thereto is incremented by "+1". If none of the keywords matches, the value of the counter in the number-of-times count array 108 corresponding to the data of interest is incremented by "+1".

【0021】図7は回数カウントアレイ108の構成を
示したもので、回数カウントアレイ108には着目デー
タ「DR」がキーワードに一致しない場合において着目
データ「00」〜「FF」に対応してそのデータの出現
回数を計数するカウンタ「C000h」、「C001
h」……「C0FFh」と、第1〜第4候補のキーワー
ドの何れかに一致する場合のデータの出現回数を計数す
るカウンタ「C100h」、「C101h」、「C10
2h」、「C103h」が設けられている。ここで、各
カウンタは特定のコード「000h」〜「0FFh」、
「100h」、「101h」、「102h」、「103
h」に対応付けられており、各コードは圧縮文字データ
を元の文字パターンデータに復元再生させる為の再生コ
マンドを定義している。
FIG. 7 shows the structure of the frequency count array 108. In the frequency count array 108, when the data of interest "DR" does not match the keyword, the data of interest "00" to "FF" are displayed. Counters "C000h" and "C001" that count the number of times data appears
h "..." C0FFh "and counters" C100h "," C101h ", and" C10 "that count the number of appearances of data in the case of matching with any of the first to fourth candidate keywords.
2h ”and“ C103h ”are provided. Here, each counter has a specific code “000h” to “0FFh”,
"100h", "101h", "102h", "103"
Each code is associated with “h” and defines a reproduction command for restoring and reproducing the compressed character data to the original character pattern data.

【0022】図8は各コマンドコードとその実行コマン
ドの内容を示したもので、コマンドコード「000h」
〜「0FFh」は“コマンドコードの下位8ビットの内
容(着目データ)をストアせよ”を意味し、コマンドコ
ード「100h」は“第1候補キーワードを参照してそ
の内容(着目データ)をストアせよ”を意味する。更
に、コマンドコード「101h」は“第2候補キーワー
ドを参照してその内容をストアせよ”を意味し、またコ
マンドコード「102h」は“第3候補のキーワードを
参照してその内容をストアせよ”を意味し、コマンドコ
ード「103h」は“第4候補のキーワードを参照して
その内容をストアせよ”を意味する。このようにコマン
ドの内容はコマンドデータの一部をそのままデータとし
て再生させるものと、キーワードテーブルを参照してそ
の内容をデータとして再生させるものとがある。
FIG. 8 shows the contents of each command code and its execution command. Command code "000h"
~ "0FFh" means "store the contents (focused data) of the lower 8 bits of the command code", and the command code "100h" refers to the first candidate keyword and stores the contents (focused data). Means. Furthermore, the command code "101h" means "store the contents by referring to the second candidate keyword", and the command code "102h""stores the contents by referring to the third candidate keyword". The command code “103h” means “store the contents by referring to the fourth candidate keyword”. As described above, as for the content of the command, there is one in which a part of the command data is directly reproduced as data, and the other in which the content is reproduced as data by referring to the keyword table.

【0023】このようにデータ出現回数計数部107は
着目データ「DR」が第1候補〜第4候補のキーワード
に一致するときには、対応するカウンタの値をカウント
アップするが、かなりのデータは第1候補〜第4候補の
キーワードと一致する為、回数カウントアレイ108内
のカウント値はコマンドコード「100h」〜「103
h」に対応するカウンタ値が極端に大きくなり、偏りが
発生する。このようにデータの出現頻度に偏りが発生す
る為、効果的なデータ圧縮を実現することが可能とな
る。
As described above, the data appearance frequency counting unit 107 counts up the value of the corresponding counter when the focused data “DR” matches the keywords of the first to fourth candidates, but a considerable amount of data is the first. Since the keywords match the candidates to the fourth candidate, the count values in the count array 108 are command codes “100h” to “103”.
The counter value corresponding to “h” becomes extremely large, and a bias occurs. Since the occurrence frequency of data is biased in this way, effective data compression can be realized.

【0024】圧縮符号表発生部109はデータ出現回数
計数部107が全文字についての処理を終了した時点で
回数カウントアレイ108内のカウント値を用いて圧縮
符号を発生する。この場合、例えばハフマン符号の発生
アルゴリズムなどの冗長性をカットする特性の符号であ
れば、その内容は問わない。なお、ハフマン符号化法な
どは広く知られた技術であるので、ここではその説明は
省略するものとする。この圧縮符号表発生部109によ
って発生された符号表は圧縮符号表格納部110に書き
込まれる。
The compression code table generation unit 109 generates a compression code using the count value in the number count array 108 when the data appearance frequency counting unit 107 finishes processing for all characters. In this case, as long as the code has a characteristic of cutting redundancy such as a Huffman code generation algorithm, its content does not matter. Note that the Huffman coding method and the like are widely known techniques, and therefore description thereof will be omitted here. The code table generated by the compression code table generating unit 109 is written in the compression code table storage unit 110.

【0025】図9は圧縮符号表を示し、圧縮符号表はコ
マンドコードに対応して圧縮符号列とそのビット数とか
ら成り、この圧縮符号列は可変長データであり、ハフマ
ン符号化法にしたがってデータの出現頻度の大きいもの
は少ないビット数の圧縮符号列で表わされている。な
お、圧縮符号表の内容は図中、見易くする為にビット数
の少ないものから並べてあるが、実際にはこのように並
べる必要はない。この圧縮符号表は2つの使われ方をす
る。その1つは無圧縮フォントパターンを圧縮コマンド
列に変換するときであり、他の1つは圧縮コマンド列を
伸長するときに使われる逆変換テーブルの作成時であ
る。
FIG. 9 shows a compression code table. The compression code table is composed of a compression code string and the number of bits thereof corresponding to a command code. This compression code string is variable length data, and according to the Huffman coding method. A data having a high appearance frequency is represented by a compression code string having a small number of bits. It should be noted that the contents of the compression code table are arranged in order from the one having the smallest number of bits in order to make it easy to see in the figure, but it is not actually necessary to arrange them in this way. This compression code table has two uses. One is when converting a non-compressed font pattern into a compressed command string, and the other is when creating an inverse conversion table used when decompressing a compressed command string.

【0026】圧縮符号化部112はデータ出現回数計数
部107と略同様の動作を行うものであるが、データ出
現回数計数部107で回数カウントアレイ108のカウ
ンタをカウントアップしていた代わりにキーワードテー
ブル格納部106の内容を参照しながら、圧縮符号表格
納部110に格納されているビット列(圧縮符号列)を
データ書き込み部113を介して圧縮フォント格納部1
14に吐き出す動作を行う。
The compression encoding unit 112 performs substantially the same operation as the data appearance number counting unit 107, but instead of counting up the counter of the number counting array 108 in the data appearance number counting unit 107, the keyword table is used. Referring to the contents of the storage unit 106, the bit sequence (compression code sequence) stored in the compression code table storage unit 110 is stored in the compressed font storage unit 1 via the data writing unit 113.
The operation of exhaling to 14 is performed.

【0027】即ち、無圧縮フォントパターンデータ格納
部101内の全ての文字が1文字ずつソース・バッファ
102に格納されてゆき、圧縮符号化部112によって
1文字ずつ処理される。この場合、圧縮符号化部112
は上述した方法で着目データ「DR」に対して前2つの
データ「DL」、「DM」から12ビットアドレスを求
め、この12ビットアドレスでキーワードテーブル格納
部106をアクセスし、着目データ「DR」が第1候補
キーワード〜第4候補キーワードの何れかに一致するか
否かをチェックする。ここで、着目データ「DR」が第
1候補キーワード〜第4候補キーワードの何れかに一致
する場合には圧縮符号表を参照し、該当候補に対応する
コマンドコードを指定してその圧縮符号列を読み出す。
この圧縮符号列はデータ書き込み部113に与えられ圧
縮フォント格納部114に書き込まれる。一方、不一致
の場合には着目データに対応するコマンドコードを指定
してその圧縮符号列を読み出す。この圧縮符号列はデー
タ書き込み部113に与えられ、圧縮フォント格納部1
14に書き込まれる。このようにして圧縮フォント格納
部114内に書き込まれた1文字分の圧縮符号列は可変
長データとなる。そして、1文字分の圧縮符号列が圧縮
フォント格納部114に書き込まれると、データ書き込
み部113はその文字が圧縮フォント格納部114の何
バイト目から書き始められているかを示す為のアドレス
がインデックステーブル格納部115にセットされる。
That is, all the characters in the uncompressed font pattern data storage unit 101 are stored character by character in the source buffer 102 and processed by the compression encoding unit 112 character by character. In this case, the compression encoding unit 112
Obtains a 12-bit address from the previous two data "DL" and "DM" for the data of interest "DR" by the method described above, accesses the keyword table storage unit 106 with this 12-bit address, and obtains the data of interest "DR". Checks whether any of the first to fourth candidate keywords matches. Here, when the focused data “DR” matches any of the first candidate keyword to the fourth candidate keyword, the compression code table is referred to, the command code corresponding to the candidate is designated, and the compression code string is selected. read out.
This compressed code string is given to the data writing unit 113 and written in the compressed font storage unit 114. On the other hand, if they do not match, the command code corresponding to the data of interest is designated and the compression code string is read. This compressed code string is given to the data writing unit 113, and the compressed font storage unit 1
14 is written. The compression code string for one character written in the compressed font storage unit 114 in this manner becomes variable length data. Then, when a compression code string for one character is written in the compressed font storage unit 114, the data writing unit 113 uses an index as an address for indicating from which byte of the compressed font storage unit 114 the character is started to be written. It is set in the table storage unit 115.

【0028】逆変換テーブル発生部116は圧縮符号表
を構成する圧縮符号列を数値に見立ててその数値の小さ
い順に並べ変える。この時、逆変換テーブル発生部11
6は最大ビット長を持つ符号に合せて残りは右側に
「0」を付加して数値に見立てる。例えばコマンドコー
ド「101h」の符号列は「10」であるが、最大ビッ
ト長が16ビットであるならば、この右側に「0」を1
4個付加して「8000h」として取り扱う。このよう
にして圧縮符号表格納部110の内容を数値的な重み順
に並べ変えると、図10に示す様な並びとなる。
The inverse conversion table generating section 116 rearranges the compression code sequences forming the compression code table into numerical values and rearranges them in ascending order of numerical values. At this time, the inverse conversion table generating unit 11
6 is regarded as a numerical value by adding "0" to the right side according to the code having the maximum bit length. For example, the code string of the command code “101h” is “10”, but if the maximum bit length is 16 bits, “0” is set to 1 to the right of this.
Add four and handle as "8000h". When the contents of the compression code table storage unit 110 are rearranged in the numerical order in this manner, the arrangement is as shown in FIG.

【0029】ここで、圧縮フォント格納部114の内容
を復元再生する際において、あるビット列が与えられた
とき、そのコマンドコードが何かを調べるにはそのビッ
ト列の先頭から1ビットずつ取り出して調べてゆき、コ
マンドコードの符号列と一致したところで解析終了とな
れば処理速度等の点において極めて好都合である。そこ
で、図10を見てみると、先頭のビットが「0」ならば
それはコマンドコード「100h」であると結論できる
ことが解る。しかし、「1」ならば次のビットを見なけ
ればならない。いま、次のビットを見た場合、それが
「0」ならばコマンドコード「101h」であるが、
「1」であれば更に次のビットを見なければならない。
ここで、図11は図10の圧縮符号表を木リスト構造で
表わしたものである。
Here, when a certain bit string is given when the contents of the compressed font storage unit 114 are restored and reproduced, in order to check what the command code is, one bit is taken out from the beginning of the bit string and checked. At the end, if the analysis ends when the code string of the command code matches, it is extremely convenient in terms of processing speed. Therefore, looking at FIG. 10, it is understood that if the leading bit is “0”, it can be concluded that it is the command code “100h”. However, if it is a "1", then the next bit must be seen. Now, when looking at the next bit, if it is "0", the command code is "101h",
If it is "1", then the next bit must be seen.
Here, FIG. 11 shows the compression code table of FIG. 10 in a tree list structure.

【0030】この2進の木リスト構造において、「ni
l」と書かれている分岐点はそこでコマンドコードが確
定するところを表し、また「dir」と書かれている分
岐点は次のビットを見る必要があるということを表わし
ている。そこで、「dir」の部分を図12に示す様な
構造で表わしてやると非常に効率の良い逆変換テーブル
を得ることが可能となる。ここで、「dir」は対象と
するビットが「0」の場合と「1」の場合の2通りに
「振舞い」が分けられる。よって、1つの「dir」を
表わすのに16ビットのデータを2組、即ち4バイトで
表わすことにする。「アドレス+0(16ビット)」は
「0」のときの振舞い、「アドレス+2(16ビッ
ト)」は「1」のときの振舞いを表わす。また、テーブ
ルアドレスはリストの根元(Root)より「00
0」、「004」、「008」……に割り当てられてい
る。図13は逆変換テーブルにおける振舞いデータの構
造を示し、「振舞い」にはそこで「nil」となり、デ
ータが確定する場合と、また新たに「dir」となる場
合とがある。そこで、図13に示す様に16ビットデー
タのMSBに「dir」か「nil」の識別子を置き、
残りの15ビットで次の「dir」が記述されている逆
変換テーブル上のアドレスを表わすか、コマンドコード
の値を表わす。なお、MSBの識別子が「1」のときに
は「nil」で、続く15ビットはコマンドコードを表
わし、MSBの識別子が「0」のときには「dir」
で、続く15ビットは次の「dir」アドレスであるこ
とを表わす。図14は逆変換テーブルの内容を具体的に
示したもので、逆変換テーブル発生部116は図10で
示した圧縮符号表にしたがって図14に示す様な構造の
逆変換テーブルを作成し、逆変換テーブル格納部117
に格納する。
In this binary tree list structure, "ni
The branch point labeled "l" indicates where the command code is fixed, and the branch point labeled "dir" indicates that the next bit needs to be seen. Therefore, if the "dir" portion is represented by a structure as shown in FIG. 12, it is possible to obtain a very efficient inverse conversion table. Here, as for “dir”, “behavior” is divided into two cases, where the target bit is “0” and “1”. Therefore, one set of "dir" is represented by two sets of 16-bit data, that is, four bytes. "Address + 0 (16 bits)" represents the behavior when "0", and "Address + 2 (16 bits)" represents the behavior when "1". The table address is "00" from the root of the list.
It is assigned to 0 ”,“ 004 ”,“ 008 ”.... FIG. 13 shows the structure of the behavior data in the inverse conversion table. The "behavior" may be "nil" there, and the data may be fixed or may be newly "dir". Therefore, as shown in FIG. 13, an identifier of "dir" or "nil" is placed in the MSB of 16-bit data,
The remaining 15 bits represent the address on the inverse conversion table in which the next "dir" is described, or the value of the command code. When the MSB identifier is "1", it is "nil", and the following 15 bits represent a command code, and when the MSB identifier is "0", it is "dir".
Then, the following 15 bits represent the next "dir" address. FIG. 14 specifically shows the contents of the inverse conversion table. The inverse conversion table generator 116 creates an inverse conversion table having a structure as shown in FIG. 14 according to the compression code table shown in FIG. Conversion table storage unit 117
To store.

【0031】次に、文書作成装置200の構成を図1
5、図16を参照して説明する。図15は文書作成装置
200の全体構成を示したブロック図である。主制御部
210は各種プログラムにしたがってこの文書作成装置
200の全体動作を制御するもので、キー操作部211
から入力された文書データは主制御部210に取り込ま
れ、表示制御部212を介して表示装置213から表示
出力されたり、文書メモリ214に格納される。この文
書メモリ214は文書データをコード形式で記憶するも
ので、その内容はキー操作部211からの登録指令に応
答して外部記憶制御装置215に与えられ、外部記憶装
置216に登録保存されたり、キー操作部211からの
印字指令に応答して読み出され、文字パターン再生装置
201によって対応する文字パターンデータに変換され
たのち、印刷制御部217を介して印刷装置218から
印字出力される。
Next, the configuration of the document creating apparatus 200 is shown in FIG.
5, and will be described with reference to FIG. FIG. 15 is a block diagram showing the overall configuration of the document creation device 200. The main control unit 210 controls the overall operation of the document creating apparatus 200 according to various programs, and the key operation unit 211.
The document data input from the main control unit 210 is fetched, displayed and output from the display device 213 via the display control unit 212, or stored in the document memory 214. The document memory 214 stores the document data in a code format, the content of which is given to the external storage control device 215 in response to a registration command from the key operation unit 211, registered and stored in the external storage device 216, The data is read in response to a print command from the key operation unit 211, converted into corresponding character pattern data by the character pattern reproducing device 201, and then printed out from the printing device 218 via the print control unit 217.

【0032】文字パターン再生装置201は上述した圧
縮文字データメモリ203の他、展開制御部219、文
字パターンバッファ220を有する構成で、この圧縮文
字データメモリ203には図1で示した様に文字パター
ンデータ圧縮装置100から供給された各種のデータを
記憶する圧縮フォント格納部204、インデックステー
ブル格納部205、逆変換テーブル格納部206、キー
ワードテーブル格納部207が設けられており、展開制
御部219はこれらのデータに基づいて圧縮文字データ
を通常の文字パターンデータに復元再生し、文字パター
ンバッファ220に書き込む。
The character pattern reproducing device 201 is configured to have a decompression control unit 219 and a character pattern buffer 220 in addition to the above-mentioned compressed character data memory 203. In the compressed character data memory 203, as shown in FIG. A compressed font storage unit 204, an index table storage unit 205, an inverse conversion table storage unit 206, and a keyword table storage unit 207, which store various data supplied from the data compression apparatus 100, are provided. The compressed character data is restored to normal character pattern data on the basis of the above data and reproduced and written in the character pattern buffer 220.

【0033】図16は文字パターン再生装置201を詳
細に示したブロック構成図である。展開制御部219は
文字コードレジスタ221、インデックステーブルアク
セス部222、圧縮データアクセス部223、圧縮パタ
ーンバッファ224、再生コマンド発生部225、再生
コマンド実行部226を有する構成で、文書作成機主装
置202から印刷対象の文字コードが文字コードレジス
タ221にセットされると、インデックステーブルアク
セス部222はその文字が圧縮フォント格納部204の
どこに書き込まれているかをアクセスする為にインデッ
クステーブル格納部205を検索する。この場合、イン
デックステーブル格納部205の内容はJISの並び順
にしたがっている為、インデックステーブルアクセス部
222は文字コードに基づいてインデックステーブル格
納部205から該当アドレスを検索することができる。
このようにして検索されたアドレスは圧縮データアクセ
ス部223に送られる。圧縮データアクセス部223は
このアドレスにしたがって圧縮フォント格納部204を
アクセスし、1文字分の圧縮文字データを読み出して圧
縮パターンバッファ224に転送する。
FIG. 16 is a block diagram showing in detail the character pattern reproducing device 201. The expansion control unit 219 has a character code register 221, an index table access unit 222, a compressed data access unit 223, a compression pattern buffer 224, a reproduction command generation unit 225, and a reproduction command execution unit 226. When the character code to be printed is set in the character code register 221, the index table access unit 222 searches the index table storage unit 205 to access where in the compressed font storage unit 204 the character is written. In this case, since the contents of the index table storage unit 205 follow the order of JIS, the index table access unit 222 can retrieve the corresponding address from the index table storage unit 205 based on the character code.
The address thus retrieved is sent to the compressed data access unit 223. The compressed data access unit 223 accesses the compressed font storage unit 204 according to this address, reads the compressed character data for one character, and transfers it to the compressed pattern buffer 224.

【0034】再生コマンド発生部225は逆変換テーブ
ル用のポインタ(図示せず)を持ち、圧縮パターンバッ
ファ224内の圧縮文字データ(圧縮符号列)を逆変換
テーブル格納部206の内容にしたがってコマンドコー
ドに変換するもので、これによって変換されたコマンド
コードは1コマンド毎に再生コマンド実行部226に送
られる。
The reproduction command generation section 225 has a pointer (not shown) for the inverse conversion table, and the compressed character data (compression code string) in the compression pattern buffer 224 is converted into a command code according to the contents of the inverse conversion table storage section 206. The command code thus converted is sent to the reproduction command execution section 226 for each command.

【0035】再生コマンド実行部226は図8で示した
実行コマンドの内容にしたがったストア処理を再生コマ
ンド発生部225からのコマンドコードにしたがって逐
次実行するもので、その際、キーワードテーブル格納部
207から必要に応じてデータを抽出し、そのデータを
文字パターンバッファ220に書き込む。ここで、コマ
ンドコードが「100h」〜「103h」、つまり、そ
の内容が“第1候補キーワード〜第4候補キーワードを
参照してストアせよ”の場合には、文字パターンバッフ
ァ220に書き込まれている2つ前のデータを文字パタ
ーンバッファ220から読み出すと共に、このデータか
ら上述した方法でキーワードテーブルのアドレスを生成
し、このアドレスで指定されるテーブル内容を再生デー
タとして文字パターンバッファ220に書き込む。これ
により文字パターンバッファ220には復元再生された
文字パターンデータが格納される。ここで、文書作成機
主装置202は通常と同様に文字パターンバッファ22
0から文字パターンデータを読み出して印字出力させ
る。
The reproduction command execution unit 226 sequentially executes the store processing according to the contents of the execution command shown in FIG. 8 in accordance with the command code from the reproduction command generation unit 225. Data is extracted as necessary, and the data is written in the character pattern buffer 220. Here, when the command code is “100h” to “103h”, that is, the content is “store with reference to first candidate keyword to fourth candidate keyword”, it is written in the character pattern buffer 220. The data two bytes before is read from the character pattern buffer 220, the address of the keyword table is generated from this data by the method described above, and the table contents designated by this address are written in the character pattern buffer 220 as reproduction data. As a result, the restored and reproduced character pattern data is stored in the character pattern buffer 220. Here, the document creator main unit 202 uses the character pattern buffer 22 as usual.
The character pattern data is read from 0 and printed out.

【0036】次に、本実施例の動作を説明する。先ず、
文字パターンデータ圧縮装置100によるパターン圧縮
動作について説明する。ソース・バッファ102には無
圧縮フォントパターンデータ格納部101にビットマッ
プ方式で格納されている各種の文字パターンデータをそ
の先頭文字から1文字ずつ転送される。すると、キーワ
ード選定用計数制御部103は先ずソース・バッファ1
02から1バイト目〜3バイト目のデータを切り出すと
共に3バイト目のデータに着目し、この着目データ「D
R」に対して1つ前の2バイト目のデータを「DR」、
更に1つ前の1バイト目のデータを「DL」とする。こ
こで、キーワード選定用計数制御部103は2つ前のデ
ータ「DL」の上位4ビットと下位4ビットとのイクス
クルーブオアXORを取り、これをキーワード選定用カ
ウンタアレイ104をアクセスする為の第1要素アドレ
スの最上位4ビットとする。いま、図4の例では2つ前
のデータ、つまり1バイト目のデータは「011100
00(70h)」で、そのXORの結果は「0111
(7h)」となる。そして、1つ前の2バイト目のデー
タ「DM」が「00111100(3Ch)」である
為、第1要素アドレスは「011100111100
(73Ch)」の12ビットアドレスとなる。一方、キ
ーワード選定用計数制御部103は着目している3バイ
ト目のデータ「DR」そのものをキーワード選定用カウ
ンタアレイ104の第2要素アドレス「0001111
0(1Eh)」とする。したがって、図4の例では「7
3Ch、1Eh」というアドレスが算出されることにな
る。
Next, the operation of this embodiment will be described. First,
A pattern compression operation by the character pattern data compression device 100 will be described. Various character pattern data stored in the uncompressed font pattern data storage unit 101 by the bitmap method is transferred to the source buffer 102 one by one from the first character. Then, the keyword selection counting control unit 103 first determines the source buffer 1
The data of the 1st to 3rd bytes is cut out from 02, and the data of the 3rd byte is focused.
The 2nd byte data immediately before “R” is “DR”,
The data of the immediately preceding first byte is “DL”. Here, the keyword selection counting control unit 103 takes an exclusive OR XOR of the upper 4 bits and the lower 4 bits of the data “DL” two before, and uses this to access the keyword selection counter array 104. The most significant 4 bits of the first element address. Now, in the example of FIG. 4, the second previous data, that is, the data of the first byte is "011100".
00 (70h) ”, the result of the XOR is“ 0111 ”.
(7h) ”. Then, since the data “DM” of the immediately preceding second byte is “00111100 (3Ch)”, the first element address is “011100111100”.
(73 Ch) ”is a 12-bit address. On the other hand, the keyword selection counting control unit 103 sets the focused third byte data “DR” itself to the second element address “0001111” of the keyword selection counter array 104.
0 (1 Eh) ". Therefore, in the example of FIG.
The address “3Ch, 1Eh” is calculated.

【0037】次に、キーワード選定用計数制御部103
はソース・バッファ102の4バイト目に着目し、2つ
前の2バイト目のデータと1つ前の3バイト目のデータ
とに基づいてキーワード選定用カウンタアレイ104の
アドレスを算出する。このようなアドレス算出処理は1
バイト毎に最後の288バイト目まで1バイト毎に繰り
返し実行される。これと同時にキーワード選定用計数制
御部103は算出アドレスにしたがってキーワード選定
用カウンタアレイ104をアクセスし、該当するカウン
タ値をカウントアップしてゆく。これによってデータの
組み合せ頻度がキーワード選定用カウンタアレイ104
で計数されることになる。
Next, the keyword selection counting control unit 103
Pays attention to the 4th byte of the source buffer 102, and calculates the address of the keyword selection counter array 104 based on the 2nd previous data of the 2nd byte and the 1st previous data of the 3rd byte. Such address calculation processing is 1
It is repeatedly executed byte by byte up to the last 288th byte. At the same time, the keyword selection counting control unit 103 accesses the keyword selection counter array 104 according to the calculated address and counts up the corresponding counter value. As a result, the combination frequency of the data is determined by the keyword selection counter array 104.
Will be counted.

【0038】このようにして無圧縮フォントパターンデ
ータ格納部101内の全ての文字についての組み合せ頻
度を計数し終ると、キーワード選定部105はキーワー
ド選定用カウンタアレイ104の内容を解析し、キーワ
ードテーブルを作成する。即ち、キーワード選定部10
5はキーワード選定用カウンタアレイ104の第1要素
アドレス毎に最も大きいカウンタ値の第2要素アドレ
ス、つまり、組み合せ頻度が最も高い着目データを第1
候補キーワードとして登録し、次に大きいカウンタ値の
第2要素アドレスを第2候補キーワードとして登録し、
同様に3番目、4番目に大きなカウンタ値の第2要素ア
ドレスを第3候補キーワード、第4候補キーワードとし
て登録する。このようにデータの組み合せ頻度に基づい
てそれに続く着目データはこれであるという候補が4種
類抽出されてキーワードテーブル格納部106に格納さ
れる。
After counting the combination frequencies of all the characters in the uncompressed font pattern data storage unit 101 in this way, the keyword selection unit 105 analyzes the contents of the keyword selection counter array 104 and opens the keyword table. create. That is, the keyword selection unit 10
5 is the second element address having the largest counter value for each first element address of the keyword selection counter array 104, that is, the focused data having the highest combination frequency is the first
Register as a candidate keyword, register the second element address of the next largest counter value as the second candidate keyword,
Similarly, the second element address having the third and fourth largest counter values is registered as the third candidate keyword and the fourth candidate keyword. As described above, four types of candidates that the following data of interest is this are extracted based on the combination frequency of the data and stored in the keyword table storage unit 106.

【0039】いま、キーワードテーブルの作成が終わる
と、それを参照しながらデータ出現回数計数部107が
動作を始める。この場合にも無圧縮フォントパターンデ
ータ格納部101からソース・バッファ102に1文字
ずつ文字パターンデータが順次格納されてゆく。ここ
で、データ出現回数計数部107は上述した様にキーワ
ード選定用計数制御部103と同様にデータの出現回数
を計数するが、今度はキーワードテーブル格納部106
内のキーワードに一致する場合における第1候補〜第4
候補毎の出現回数と、キーワードに一致しなかった場合
におけるデータ毎の出現回数を計数する。
Now, when the creation of the keyword table is completed, the data appearance frequency counting section 107 starts its operation while referring to it. Also in this case, the character pattern data is sequentially stored in the source buffer 102 from the uncompressed font pattern data storage unit 101 one character at a time. Here, the data appearance number counting unit 107 counts the number of times the data appears as in the keyword selection counting control unit 103 as described above, but this time, the keyword table storage unit 106.
First to fourth candidates in the case of matching with the keyword in
The number of appearances for each candidate and the number of appearances for each data when the keywords do not match are counted.

【0040】即ち、データ出現回数計数部107は着目
データに対して前2つのデータから求めた12ビットア
ドレスでキーワードテーブル格納部106をアクセス
し、着目データが第1候補〜第4候補の何れかのキーワ
ードに一致する場合にはそれに対応する回数カウントア
レイ108内のカウンタ値をカウントアップさせる。例
えば、12ビットアドレスが「73Ch」で、図6に示
す如く第1候補キーワードの「73Ch」の項目に「1
Eh」が登録されている場合、着目データが「1Eh」
であれば、この着目データは第1候補キーワードと一致
するので、回数カウントアレイ108内のカウンタ「C
100h」の値が「+1」される。一方、何れのキーワ
ードにも一致しなかった場合にはその着目データに対応
する回数カウントアレイ108内のカウンタ値がカウン
トアップされる。例えば、着目データが「01h」であ
れば、回数カウントアレイ108内のカウンタ「C00
1h」の値が「+1」される。このような動作は1文字
の最後まで1文字毎に全文字分繰り返し実行される。こ
の結果、かなりのデータがキーワードと一致する様にな
る為、カウンタ「C100h」〜「C103h」の値が
極端に大きくなり、データ圧縮に最適な偏りを発生す
る。ここで、回数カウントアレイ108内の各カウンタ
は圧縮文字データを元の文字パターンデータに再生させ
る際に用いられる再生コマンドコード(図8参照)に対
応付けられている為、かなりのデータがこの再生コマン
ド「100h」〜「103h」に書き換えることが可能
となる。
That is, the data appearance number counting unit 107 accesses the keyword table storage unit 106 with the 12-bit address obtained from the previous two data with respect to the data of interest, and the data of interest is one of the first to fourth candidates. If it matches the keyword, the counter value in the number-of-times count array 108 corresponding to the keyword is incremented. For example, the 12-bit address is "73Ch", and the first candidate keyword "73Ch" has an item "1" as shown in FIG.
When “Eh” is registered, the data of interest is “1Eh”
If this is the case, this focused data matches the first candidate keyword, so the counter “C
The value of “100h” is incremented by “+1”. On the other hand, if none of the keywords matches, the counter value in the number-of-times count array 108 corresponding to the focused data is counted up. For example, if the data of interest is "01h", the counter "C00 in the count counter array 108
The value of "1h" is incremented by "+1". Such an operation is repeatedly executed for every character until the end of one character. As a result, since a considerable amount of data matches the keyword, the values of the counters "C100h" to "C103h" become extremely large, and the optimum bias for data compression occurs. Here, since each counter in the count counter array 108 is associated with a reproduction command code (see FIG. 8) used when reproducing the compressed character data into the original character pattern data, a considerable amount of data is reproduced. It is possible to rewrite the commands "100h" to "103h".

【0041】次に、圧縮符号表発生部109は回数カウ
ントアレイ108の計数データを用いて圧縮符号をハフ
マン符号化法などの様にデータの出現頻度に応じて冗長
部分を抑制する方法で発生し、圧縮符号表格納部110
に格納する。このようにして発生された圧縮符号表にお
いて、データの出現頻度の大きいものは図9で示す様に
少ないビット数の符号列で表わされることになる。
Next, the compression code table generator 109 uses the count data of the number count array 108 to generate a compression code by a method such as the Huffman coding method that suppresses the redundant portion according to the appearance frequency of the data. , Compression code table storage unit 110
To store. In the compression code table generated in this way, a code string having a high data appearance frequency is represented by a code string having a small number of bits as shown in FIG.

【0042】このようにして圧縮符号表が完成すると、
圧縮符号化部112が動作し始める。この場合において
も無圧縮フォントパターンデータ格納部101内の文字
パターンデータが1文字ずつソース・バッファ102に
順次格納されてゆく。ここで、圧縮符号化部112は着
目データに対して前2つのデータから求めた12ビット
アドレスでキーワードテーブル格納部106をアクセス
し、着目データが第1候補〜第4候補のキーワードと一
致する場合には、圧縮符号表を参照し、該当候補に対応
するコマンドコードを指定してその圧縮符号列を読み出
す。一方、不一致の場合には着目データに対応するコマ
ンドコードを指定してその圧縮符号列を読み出す。
When the compression code table is completed in this way,
The compression encoding unit 112 starts operating. Also in this case, the character pattern data in the uncompressed font pattern data storage unit 101 is sequentially stored character by character in the source buffer 102. Here, when the compression encoding unit 112 accesses the keyword table storage unit 106 with the 12-bit address obtained from the previous two data for the data of interest, and the data of interest matches the keywords of the first to fourth candidates. , The compression code table is referred to, the command code corresponding to the candidate is designated, and the compression code string is read. On the other hand, if they do not match, the command code corresponding to the data of interest is designated and the compression code string is read.

【0043】いま、例えば、文字パターンデータの左上
のデータ列がコマンドコードで表現した場合に「100
h+100h+0FFh+102h+101h+……」
という並び方をしているものとする。この場合、圧縮符
号表を参照し、コマンドコードを対応する圧縮符号列で
書き換えると、上述したコマンド列は「0+0+110
10000+1100+10+……」となる。これを8
ビット毎に区切って表現すると「00110100+0
0110010+……」となり、これを16進で表わす
と「34h+32h+……」となる。なお、本実施例で
は文字パターンデータの3バイト目から着目するように
しているが、最初の2バイトは文字の左上の16ドット
となり、「0」(空白)であることが多い。そこで、特
例的にこのエリアが「0」のときは第1候補キーワード
を参照するコマンド(図8の例では「100h」)に書
き換えることとしている。このようにして再生コマンド
を実行するときに最初の2バイトでこのコマンドコード
「100h」が来たら「0」を書き込む約束にしておけ
ば何の問題も生じない。
Now, for example, if the upper left data string of the character pattern data is represented by a command code, "100
h + 100h + 0FFh + 102h + 101h + ... ”
It is assumed that they are arranged. In this case, referring to the compression code table and rewriting the command code with the corresponding compression code string, the above-mentioned command string becomes "0 + 0 + 110".
10000 + 1100 + 10 + ... ”. This 8
When expressed by dividing each bit, "00110100 + 0"
"0110010 + ...", and when expressed in hexadecimal, it becomes "34h + 32h + ...". In the present embodiment, attention is focused on the third byte of the character pattern data, but the first two bytes are the upper left 16 dots of the character, and are often "0" (blank). Therefore, as a special case, when this area is “0”, it is rewritten to a command (“100h” in the example of FIG. 8) that refers to the first candidate keyword. In this way, when the playback command is executed, if the command code "100h" comes in the first 2 bytes, if "0" is promised to be written, no problem will occur.

【0044】このように圧縮符号化部112は文字パタ
ーンデータの左上から順次処理してゆき、1文字288
バイトを処理したところでいったん区切られ、1文字の
最後のビット列が8ビットとなるまで「0」が挿入され
る。これは文字毎にデータのスタートビットを揃えるた
めであり、このようにしないと、各文字の「インデック
ステーブル」の内容は「アドレス××××の第×ビット
から」という様に多くのデータを持たねばならず、テー
ブル容量が多くなり、その結果、全体の圧縮率に悪い影
響を与えるのみならず、展開時の処理速度にも不都合を
きたすからである。
In this way, the compression encoding unit 112 sequentially processes the character pattern data from the upper left, and one character 288 is processed.
When the bytes are processed, they are separated once, and "0" is inserted until the last bit string of one character is 8 bits. This is because the start bits of the data are aligned for each character. If this is not done, the contents of the "index table" for each character will be a lot of data, such as "from the xth bit of the address XXXXX". This is because the storage capacity must be increased and the table capacity increases, resulting in not only adversely affecting the overall compression ratio, but also inconvenient for the processing speed during expansion.

【0045】このようにして得られた圧縮符号列は1文
字毎にデータ書き込み部113に与えられて圧縮フォン
ト格納部114に書き込まれてゆく。この際、データ書
き込み部113はインデックステーブルを作成してイン
デックステーブル格納部115に書き込む。このインデ
ックステーブルには圧縮フォント格納部114に格納さ
れた各文字の最初のアドレスが記憶される。他方、逆変
換テーブル発生部116は圧縮符号表格納部110の内
容を数値的な重み順に並べ換えて図10に示す様な圧縮
符号表に変換すると共に、この圧縮符号表を2進の木リ
スト構造を持った図14に示す様な逆変換テーブルに変
換し、逆変換テーブル格納部117に格納する。
The compression code string thus obtained is supplied to the data writing unit 113 for each character and written in the compressed font storage unit 114. At this time, the data writing unit 113 creates an index table and writes it in the index table storage unit 115. The index table stores the first address of each character stored in the compressed font storage unit 114. On the other hand, the inverse conversion table generating unit 116 rearranges the contents of the compression code table storage unit 110 in numerical weight order and converts the contents into a compression code table as shown in FIG. 10, and also converts this compression code table into a binary tree list structure. 14 is stored in the reverse conversion table storage unit 117.

【0046】この結果、文字パターンデータ圧縮装置1
00内の圧縮フォント格納部114、インデックステー
ブル格納部115、逆変換テーブル格納部117、キー
ワードテーブル格納部106にそれぞれデータが揃う
と、文字パターンデータ圧縮装置100の動作は終了す
る。この圧縮フォント格納部114、インデックステー
ブル格納部115、逆変換テーブル格納部117、キー
ワードテーブル格納部106の内容は文書作成装置20
0の製品完成時において、通常のビットマップ方式の文
字パターンデータに代えて文書作成装置200内の対応
する圧縮フォント格納部204、インデックステーブル
格納部205、逆変換テーブル格納部206、キーワー
ドテーブル格納部207に組み込まれる。
As a result, the character pattern data compression device 1
When the compressed font storage unit 114, the index table storage unit 115, the inverse conversion table storage unit 117, and the keyword table storage unit 106 in 00 all have data, the operation of the character pattern data compression device 100 ends. The contents of the compressed font storage unit 114, the index table storage unit 115, the inverse conversion table storage unit 117, and the keyword table storage unit 106 are the contents of the document creation device 20.
When the product of No. 0 is completed, the corresponding compressed font storage unit 204, index table storage unit 205, inverse conversion table storage unit 206, keyword table storage unit in the document creation apparatus 200 are replaced with the normal bitmap character pattern data. It is installed in 207.

【0047】上述のようにして圧縮フォントデータ、イ
ンデックステーブル、逆変換テーブル、キーワードテー
ブルが組み込まれた状態において、文書作成装置200
は次の如く動作する。いま、文書印刷時において、印刷
対象のコードは文字文書メモリ214から読み出されて
主制御部210を介して主制御部210に与えられる。
すると、この文字コードは文字パターン再生装置201
内の文字コードレジスタ221にセットされるので、イ
ンデックステーブルアクセス部222はこの文字コード
に基づいてインデックステーブル格納部205から該当
アドレスを検索し、圧縮データアクセス部223はこの
アドレスに対応する1文字分の圧縮文字データ(圧縮符
号列)を読み出して圧縮パターンバッファ224に転送
する。
With the compressed font data, index table, inverse conversion table, and keyword table incorporated as described above, the document creation device 200
Operates as follows. When printing a document, the code to be printed is read from the character document memory 214 and given to the main control unit 210 via the main control unit 210.
Then, this character code corresponds to the character pattern reproducing device 201.
Since it is set in the character code register 221, the index table access unit 222 retrieves the corresponding address from the index table storage unit 205 based on this character code, and the compressed data access unit 223 stores one character corresponding to this address. The compressed character data (compressed code string) is read and transferred to the compressed pattern buffer 224.

【0048】ここで、再生コマンド発生部225は逆変
換テーブル格納部206の内容を参照し、圧縮パターン
バッファ224内の圧縮符号列を対応するコマンドコー
ドに変換するが、この場合、再生コマンド発生部225
内には逆変換テーブル用のポインタ(図示せず)が設け
られており、先ず、木リスト構造のRootの「di
r」アドレスである「0」をポインタの初期値として設
定しておく。この状態において、圧縮パターンバッファ
224内の圧縮符号列の先頭から1ビットのデータを読
み出し、それが“0”か“1”かのチェックを行う。い
ま、先頭ビットが“0”であれば、「ポインタ値+0」
でアドレッシングされる逆変換テーブルの内容を読み出
し、その16ビットデータのMSBが“0”か否かをチ
ェックする。ここで、MSBが“1”であれば「振舞
い」は「nil」となり、そこでデータが確定し、その
下位15ビットのデータはコマンドコードとなり、これ
を再生コマンド実行部226に与える。一方、MSBが
“0”であれば、「振舞い」は「dir」となり、次の
ビットを見る必要がある為、その下位15ビットのデー
タは次のテーブルアドレスとなり、これをポインタに格
納する。
Here, the reproduction command generator 225 refers to the contents of the inverse conversion table storage 206 and converts the compression code string in the compression pattern buffer 224 into a corresponding command code. In this case, the reproduction command generator 225 is used. 225
A pointer (not shown) for the inverse conversion table is provided inside, and first, "di" of Root of the tree list structure is provided.
The “r” address “0” is set as the initial value of the pointer. In this state, 1-bit data is read from the head of the compression code string in the compression pattern buffer 224, and it is checked whether it is "0" or "1". If the first bit is "0", "pointer value + 0"
The contents of the inverse conversion table addressed by are read, and it is checked whether the MSB of the 16-bit data is "0". Here, if the MSB is “1”, the “behavior” becomes “nil”, the data is fixed there, and the data of the lower 15 bits becomes a command code, which is given to the reproduction command execution unit 226. On the other hand, if the MSB is "0", the "behavior" is "dir" and the next bit needs to be seen. Therefore, the data of the lower 15 bits becomes the next table address, which is stored in the pointer.

【0049】他方、圧縮符号の先頭ビットが“1”であ
れば、「ポインタ値+2」でアドレッシングされる逆変
換テーブルの内容を読み出し、その16ビットデータの
MSBが“0”か否かをチェックする。この場合におい
てもMSBが“1”であれば「振舞い」は「nil」と
なり、その下位15ビットのデータはコマンドコードと
なり、これを再生コマンド実行部226に与えるが、
“0”であれば「振舞い」は「dir」となり、その下
位15ビットのデータは次のテーブルアドレスとなり、
これをポインタに格納する。このような動作を圧縮符号
列に対して1ビットずつ繰り返し実行される。
On the other hand, if the first bit of the compression code is "1", the contents of the inverse conversion table addressed by "pointer value + 2" are read and it is checked whether the MSB of the 16-bit data is "0". To do. Even in this case, if the MSB is “1”, the “behavior” becomes “nil”, and the lower 15 bits of the data become a command code, which is given to the reproduction command execution unit 226.
If it is “0”, the “behavior” becomes “dir”, and the lower 15 bits of data become the next table address,
This is stored in the pointer. Such an operation is repeatedly performed on the compression code string bit by bit.

【0050】いま、例えば、圧縮符号列が「00110
100+00110010+……」であり、逆変換テー
ブル格納部206の内容が図14に示すデータ構造であ
るものとする。この場合、圧縮符号列の1ビット目は
「0」、「ポインタ値+0」でアドレッシングされるテ
ーブル内容は「8100h」、したがって、このテーブ
ル内容の下位15ビットのデータ「100h」がコマン
ドコードとして送出される。次に、2ビット目の符号も
「0」であるから上述と同様にコマンドコード「100
h」が送出される。次に、3ビット目の符号は「1」で
あり、最初にアドレッシングされるテーブル内容は「0
004h」、したがってテーブル内容の下位15ビット
のデータが次のテーブルアドレス「0004」としてポ
インタにセットされる。ここで、次の4ビット目の符号
も「1」であるから「ポインタ値(0004)+2」で
アドレッシングされるテーブル内容が読み出されるが、
この場合、テーブル内容は「0008h」、したがっ
て、このテーブル内容の下位15ビットのデータが次の
テーブルアドレス「0008」としてポインタにセット
される。次に、5ビット目のデータは「0」であり、
「ポインタ値(0008)+0」でアドレッシングされ
るテーブル内容「000Ch」が読み出され、その下位
15ビットのデータが次のテーブルアドレス「000
C」としてポインタにセットされる。
Now, for example, the compression code string is "00110".
100 + 00110010 + ... ”, and the contents of the inverse conversion table storage unit 206 have the data structure shown in FIG. In this case, the first bit of the compression code string is "0", the table content addressed by "pointer value + 0" is "8100h", and therefore the lower 15-bit data "100h" of this table content is transmitted as a command code. To be done. Next, since the code of the second bit is also “0”, the command code “100
h "is sent. Next, the code of the third bit is "1", and the content of the table addressed first is "0".
004h ”, that is, the lower 15-bit data of the table contents is set in the pointer as the next table address“ 0004 ”. Here, since the code of the next 4th bit is also "1", the table content addressed by "pointer value (0004) +2" is read out.
In this case, the table content is "0008h", and therefore the lower 15 bits of data of this table content are set in the pointer as the next table address "0008". Next, the data of the 5th bit is “0”,
The table content “000Ch” addressed by “pointer value (0008) +0” is read, and the lower 15 bits of data are read to the next table address “000”.
"C" is set in the pointer.

【0051】以下、同様に、次の6ビット目の符号は
「1」であり、テーブルアドレスは「000C」から
「0010」番地にジャンプし、更に7ビット目〜9ビ
ット目の符号も「0」であるからテーブルアドレスは
「0014番地」、「0018番地」、「001C番
地」に順次ジャンプする。そして、10ビット目の符号
も「0」であるが、この場合、テーブル内容は「80F
Eh」であり、その下位15ビットのデータ「0FE
h」がコマンドコードとして送出される。このように圧
縮符号列の3ビット目〜10ビット目のデータはコマン
ドコード「0FEh」に変換される。同様に、圧縮符号
列の11ビット目〜14ビット目のデータ(1100)
を順次読み出すことによってテーブルアドレスは「00
00番地」から「0004番地」、「0008番地」、
「000C番地」に順次ジャンプし、「000C番地」
のテーブル内容「8102h」が読み出された際に、そ
の下位15ビットのデータ「102h」がコマンドコー
ドとして送出される。このように再生コマンド発生部2
25は圧縮パターンバッファ224の内容を逆変換テー
ブルを参照することによってコマンドコードに順次変換
してゆく。
Similarly, the code of the next 6th bit is "1", the table address jumps from "000C" to the address "0010", and the code of the 7th to 9th bits is "0". Therefore, the table address jumps to “address 0014”, “address 0018”, and “address 001C” in order. The code of the 10th bit is also "0", but in this case, the table content is "80F.
Eh ", and the lower 15 bits of data" 0FE "
h ”is sent as a command code. In this way, the data of the third bit to the 10th bit of the compression code string is converted into the command code “0FEh”. Similarly, the 11th to 14th bits of the compression code string (1100)
Table address is read as "00".
"00" to "0004", "0008",
Jump to "000C address" in sequence, and go to "000C address"
When the table content "8102h" of the above is read, the lower 15-bit data "102h" is sent out as a command code. In this way, the reproduction command generator 2
25 sequentially converts the contents of the compression pattern buffer 224 into command codes by referring to the inverse conversion table.

【0052】すると、再生コマンド実行部226はキー
ワードテーブル格納部207の内容を参照しながらコマ
ンドコードにしたがった処理を実行する。即ち、再生コ
マンド実行部226は再生コマンド発生部225から1
コマンド毎に送られてくるコマンドコードにしたがって
図8で示す実行コマンドの内容にしたがった処理を実行
してゆく。ここで、1文字の最初の2バイトについて上
述した様にコマンドコード「100h」が発生された場
合には、固定値「0(空白)」を文字パターンバッファ
220に書き込むものとする。いま、コマンドコードが
「000h」〜「0FFh」であればこのコマンドコー
ドの下位8ビットの内容がそのまま再生データとなり、
文字パターンバッファ220にストアされる。一方、コ
マンドコードが「100h」、「101h」、「102
h」、「103h」であれば、再生コマンド実行部22
6は文字パターンバッファ220から前2つのデータを
読み出し、このデータに基づいてキーワードテーブルの
アドレスを算出する。そして、キーワードテーブル格納
部207をアクセスし、コマンドコード「100h」、
「101h」、「102h」、「103h」に対応する
第1候補キーワード〜第4候補キーワードを指定すると
共に、指定されたキーワードの中から算出アドレスに対
応するデータを抽出する。このデータがコマンドコード
「100h」〜「103h」についての再生データとな
り、文字パターンバッファ220にストアされる。この
ような処理が1文字288バイト分繰り出されることに
よって文字パターンバッファ220には1文字分のパタ
ーンデータが再生されることになる。
Then, the reproduction command execution section 226 executes the processing according to the command code while referring to the contents of the keyword table storage section 207. That is, the reproduction command execution unit 226 outputs the reproduction command generation unit 225
The processing according to the contents of the execution command shown in FIG. 8 is executed according to the command code sent for each command. Here, when the command code "100h" is generated for the first two bytes of one character as described above, the fixed value "0 (blank)" is written in the character pattern buffer 220. Now, if the command code is "000h" to "0FFh", the contents of the lower 8 bits of this command code become the reproduction data as they are,
It is stored in the character pattern buffer 220. On the other hand, the command codes are "100h", "101h", "102".
If h ”and“ 103h ”, the reproduction command execution unit 22
6 reads the previous two data from the character pattern buffer 220 and calculates the address of the keyword table based on this data. Then, the keyword table storage unit 207 is accessed, and the command code “100h”,
The first to fourth candidate keywords corresponding to "101h", "102h", and "103h" are designated, and data corresponding to the calculated address is extracted from the designated keywords. This data becomes the reproduction data for the command codes “100h” to “103h” and is stored in the character pattern buffer 220. By repeating such processing for one character of 288 bytes, one character of pattern data is reproduced in the character pattern buffer 220.

【0053】以上の如く、文字パターンデータ圧縮装置
100は頻度の高いデータの組み合せ毎に第1候補〜第
4候補のキーワードテーブルを作成して各キーワードテ
ーブルをコマンドコード「100h」〜「103h」に
対応させておくことにより、コマンドのデータ出現頻度
を極端に偏らせ、それを冗長性をカットする特性を持つ
ハフマン符号化法によって圧縮することにより高い圧縮
率を得ることができる。つまり、かなり多くのデータが
コマンドコード「100h」〜「103h」に対応する
少ないビット数の圧縮符号列に置き換えられる為、圧縮
率を極めて高くすることができる。この場合、本実施例
においては第1候補〜第4候補までのキーワードテーブ
ルを作成するので、キーワードテーブルがそれよりも少
ない場合よりもヒットする確率が高くなり、高圧縮が可
能となる。例えば、無圧縮フォントパターンデータ格納
部101の容量が約7Mバイト(13000文字×文字
×2書体)とすると、圧縮フォント格納部204は2M
バイト、インデックステーブル格納部205は3バイト
×文字数、逆変換テーブル格納部206は1Kバイト/
書体、つまり2Kバイト、キーワードテーブル格納部2
07は16Kバイト/書体、つまり、32Kバイトとな
り、全体で略1/3のメモリ容量となり、極めて高いデ
ータ圧縮が可能となる。ここで、キーワードテーブルの
アドレスを16ビットアドレスから12ビットアドレス
に縮小したので、16ビットアドレスに比べてキーワー
ドテーブルの容量は16分の1となり、テーブル容量の
大幅な縮小が可能となり、全体の圧縮率の向上に寄与し
ている。また、このようにして圧縮された圧縮フォント
データを元の文字パターンデータに再生する際、文書作
成装置200は圧縮符号をコマンドコードに変換したの
ち、このコマンドを実行するだけで容易に復元再生する
ことが可能である。この場合、2進の木リストにしたが
って圧縮符号をコマンドコードに変換するので、高速再
生が可能となる。
As described above, the character pattern data compression apparatus 100 creates the keyword table of the first candidate to the fourth candidate for each combination of frequently used data, and converts each keyword table into command codes "100h" to "103h". By making them correspond to each other, the data appearance frequency of the command is extremely biased, and it is possible to obtain a high compression rate by compressing it by the Huffman coding method having a characteristic of cutting redundancy. That is, a considerable amount of data is replaced with a compression code string having a small number of bits corresponding to the command codes “100h” to “103h”, so that the compression rate can be made extremely high. In this case, in the present embodiment, since the keyword tables of the first to fourth candidates are created, the probability of hitting is higher than in the case where the number of keyword tables is smaller, and high compression is possible. For example, when the capacity of the uncompressed font pattern data storage unit 101 is about 7 Mbytes (13000 characters × characters × 2 typefaces), the compressed font storage unit 204 has 2M bytes.
Bytes, the index table storage unit 205 is 3 bytes x the number of characters, and the inverse conversion table storage unit 206 is 1 Kbyte /
Typeface, that is, 2K bytes, keyword table storage 2
07 is 16 Kbytes / typeface, that is, 32 Kbytes, which has a memory capacity of about 1/3 as a whole and enables extremely high data compression. Here, since the address of the keyword table is reduced from the 16-bit address to the 12-bit address, the capacity of the keyword table is 1/16 of that of the 16-bit address, and the table capacity can be significantly reduced, resulting in the entire compression. It contributes to the improvement of the rate. Further, when reproducing the compressed font data compressed in this way into the original character pattern data, the document creation apparatus 200 converts the compression code into a command code, and then simply executes this command to easily restore and reproduce. It is possible. In this case, since the compression code is converted into the command code according to the binary tree list, high speed reproduction is possible.

【0054】[0054]

【第2実施例】次に、図17および図18を参照して第
2実施例を説明する。ここで、本実施例においては文字
パターンデータ圧縮装置100によって生成された1組
の書体データ、つまり、圧縮フォントデータ、インデッ
クステーブル、逆変換テーブル、キーワードテーブルを
予め文書作成装置200に組み込んでおくようにした
が、本実施例においては、多書体システムの文書作成装
置に適用したもので、2組分の書体データを予め文書作
成装置200内に組み込んでおく他、必要に応じて他の
書体データをフロッピーディスク等の外部記憶装置から
供給するようにしたものである。この場合、外部記憶装
置からは圧縮フォントデータとそのインデックステーブ
ルのみを供給するようにしたのが、本実施例の特徴であ
る。
Second Embodiment Next, a second embodiment will be described with reference to FIGS. 17 and 18. Here, in this embodiment, one set of typeface data generated by the character pattern data compression apparatus 100, that is, compressed font data, an index table, an inverse conversion table, and a keyword table should be incorporated in the document creation apparatus 200 in advance. However, in the present embodiment, the present invention is applied to the document creating apparatus of the multi-face type system, and two sets of typeface data are incorporated in the document creating apparatus 200 in advance, and other typeface data may be added as necessary. Is supplied from an external storage device such as a floppy disk. In this case, the feature of the present embodiment is that only the compressed font data and its index table are supplied from the external storage device.

【0055】図17は本実施例に係る文書作成装置30
0のブロック構成図である。文書作成装置300は文書
作成機主装置および文字パターン再生装置301と、圧
縮文字パターンメモリを構成するROM302、303
と、圧縮パターンバッファを構成するRAM304と、
フロッピーディスク等の外部記憶装置305を有する構
成となっている。ROM302には2種類の書体に対応
して2組の圧縮フォントデータA−1、A−2とインデ
ックステーブルB−1、B−2が格納されており、また
ROM303には4種類の書体に対応して4組のキーワ
ードテーブルC−1、C−2、C−3、C−4、逆変換
テーブルD−1、D−2、D−3、D−4が格納されて
いる。ここで、圧縮フォントデータA−1、インデック
ステーブルB−1、キーワードテーブルC−1、逆変換
テーブルD−1は第1の書体データに対応し、また圧縮
フォントデータA−2、インデックステーブルB−2、
キーワードテーブルC−2、逆変換テーブルD−2は第
2の書体データに対応するものであり、第1の書体ある
いは第2の書体が選択された場合には、上記第1実施例
と同様に対応するテーブル内容を参照することによって
復元再生処理が行われる。
FIG. 17 shows a document creating apparatus 30 according to this embodiment.
It is a block block diagram of 0. The document creation device 300 includes a document creation device main device and a character pattern reproduction device 301, and ROMs 302 and 303 forming a compressed character pattern memory.
And a RAM 304 forming a compression pattern buffer,
It is configured to have an external storage device 305 such as a floppy disk. The ROM 302 stores two sets of compressed font data A-1, A-2 and index tables B-1, B-2 corresponding to two types of fonts, and the ROM 303 supports four types of fonts. Then, four sets of keyword tables C-1, C-2, C-3, C-4 and inverse conversion tables D-1, D-2, D-3, D-4 are stored. Here, the compressed font data A-1, the index table B-1, the keyword table C-1, and the inverse conversion table D-1 correspond to the first typeface data, and the compressed font data A-2 and the index table B-. 2,
The keyword table C-2 and the inverse conversion table D-2 correspond to the second typeface data, and when the first typeface or the second typeface is selected, the same as in the first embodiment. Restoration reproduction processing is performed by referring to the corresponding table contents.

【0056】ここで、本実施例において第3書体以降は
外部記憶装置305から供給されるものであり、任意の
文字が指定されると、外部記憶装置305内のインデッ
クステーブルB−3が参照されて圧縮フォントデータA
−3から1文字分のデータが読み出され、圧縮パターン
バッファを構成するRAM304にセットされる。ここ
で、文字パターン再生装置は上記第1実施例と同様にR
AM304内のデータを逆変換テーブルを参照してコマ
ンドコードに変換すると共に、キーワードテーブルを参
照してコマンドを実行してゆくが、その際、どの逆変換
テーブル、キーワードテーブルを参照するかは、4種類
の全てのものが参照可能であり、その指定は外部記憶装
置305の中の固定アドレスの1バイト(テーブル指定
情報)を参照することにより行われる。これは外部記憶
装置305からの多くの書体供給に対応させるときに、
文書作成装置300に内蔵した各種のテーブルのうち供
給書体に最適なもの(高圧縮が可能なもの)を選ぶこと
ができる様にする為であり、これにより、外部記憶装置
305には圧縮フォントデータA−3、インデックステ
ーブルB−3のみを記憶させておけばよいことになる。
In the present embodiment, the third and subsequent typefaces are supplied from the external storage device 305, and when any character is designated, the index table B-3 in the external storage device 305 is referred to. Compressed font data A
Data for one character is read from -3 and set in the RAM 304 which constitutes the compression pattern buffer. Here, the character pattern reproducing apparatus is the same as the above-mentioned first embodiment.
The data in the AM 304 is converted into a command code by referring to the inverse conversion table, and the command is executed by referring to the keyword table. At that time, which inverse conversion table or keyword table is referred to is 4 All types can be referenced, and the designation is performed by referring to 1 byte (table designation information) of a fixed address in the external storage device 305. When dealing with many typefaces supplied from the external storage device 305,
This is because it is possible to select the most suitable table (the one that can be highly compressed) for the supplied typeface from the various tables built in the document creation apparatus 300, whereby the compressed font data is stored in the external storage device 305. It is sufficient to store only A-3 and the index table B-3.

【0057】なお、文書作成装置300に内蔵された圧
縮フォントデータA−1、A−2、インデックステーブ
ルB−1、B−2、キーワードテーブルC−1、C−
2、C−3、C−4、逆変換テーブルD−1、D−2、
D−3、D−4は上記第1実施例と同様に文字パターン
圧縮装置から転送されて組み込まれたものであるが、第
3書体、第4書体に対応する圧縮フォントデータやイン
デックステーブルは文書作成装置300内に常駐させず
に削除されている。
The compressed font data A-1, A-2, the index tables B-1, B-2, the keyword tables C-1, C- built in the document creating apparatus 300 are included.
2, C-3, C-4, inverse conversion tables D-1, D-2,
D-3 and D-4 are transferred and incorporated from the character pattern compression device as in the first embodiment, but the compressed font data and index table corresponding to the third and fourth typefaces are the documents. It is deleted without being made resident in the creating apparatus 300.

【0058】また、上記第1実施例においては、文字パ
ターンデータ圧縮装置100を構成する回数カウントア
レイ108の初期値として「0」を設定するようにした
が、微妙に違う多くの書体を外部記憶装置305から供
給し、キーワードテーブルと逆変換テーブルだけをRO
Mに持たせて共有するときには、回数カウントアレイ1
08の初期値として「1」を設定しておく。これはどの
ようなデータでも最低1回はデータが存在したものとみ
なす為であり、第1実施例の様にカウンタ回数値の初期
値を「0」としておくと、そのコマンドに対する圧縮符
号列が存在しなくなるという冗長性をカットする特性の
圧縮符号発生手法による不都合を回避するためである。
これによって、データが出現しなかったデータに対して
も圧縮符号列が発生されるので、微妙に相違する書体の
文字パターンデータを外部供給してもそれに対応できる
ようになる。
Further, in the first embodiment described above, "0" is set as the initial value of the number-of-times count array 108 which constitutes the character pattern data compression apparatus 100. However, many subtly different typefaces are externally stored. Only the keyword table and the inverse conversion table supplied from the device 305 are RO
When it is shared with M, the count array 1
“1” is set as the initial value of 08. This is because it is assumed that data exists at least once in any data, and if the initial value of the counter count value is set to "0" as in the first embodiment, the compression code string for the command is This is to avoid the inconvenience caused by the compression code generation method having the characteristic of cutting the redundancy that it does not exist.
As a result, the compression code string is generated even for the data in which the data does not appear, so that the character pattern data of a slightly different typeface can be dealt with even if supplied externally.

【0059】図18は外部記憶装置305に対して圧縮
フォントデータやインデックステーブルを書き込む際の
処理過程を示している。先ず、第1書体〜第4書体に対
応する無圧縮フォントパターンデータP−1、P−2、
P−3、P−4を上記第1実施例における文字パターン
データ圧縮装置100を用いて圧縮すると、各書体毎に
圧縮フォントデータ、インデックステーブル、逆変換テ
ーブル、キーワードテーブルが生成されると共に、この
生成過程において圧縮符号表が生成される。このうち、
各書体毎にキーワードテーブルX−1、X−2、X−
3、X−4と圧縮符号表Y−1、Y−2、Y−3、Y−
4を取り出しておく。
FIG. 18 shows a process of writing compressed font data and an index table in the external storage device 305. First, uncompressed font pattern data P-1, P-2 corresponding to the first to fourth typefaces,
When P-3 and P-4 are compressed using the character pattern data compression apparatus 100 in the first embodiment, compressed font data, index table, inverse conversion table, and keyword table are generated for each typeface, and A compression code table is generated in the generation process. this house,
Keyword tables X-1, X-2, X- for each typeface
3, X-4 and compression code tables Y-1, Y-2, Y-3, Y-
Take 4 out.

【0060】次に、外部記憶装置305によって文書作
成装置300に供給する書体(無圧縮フォントパターン
データP−n)を上記第1実施例の文字パターンデータ
圧縮装置100によって圧縮する際に、第1書体〜第4
書体に対応して予め取り出しておいた各キーワードテー
ブルX−1〜X−4と圧縮符号表Y−1〜Y−4のう
ち、外部記憶装置305によって供給する書体に最も適
したもの(つまり、実際に各書体毎に圧縮してみて最も
圧縮率が高かったもの)を選択装置400によって選択
する。そして、選択されたキーワードテーブルと圧縮符
号表を上記第1実施例の文字パターンデータ圧縮装置1
00を構成するキーワードテーブル格納部106、圧縮
符号表格納部110に格納しておく。この状態におい
て、圧縮符号化部112から動作を始めさせる。これに
よって得られた圧縮フォントデータn、インデックステ
ーブルnは外部記憶装置305に書き込まれる。
Next, when compressing the typeface (uncompressed font pattern data P-n) supplied to the document creating apparatus 300 by the external storage device 305 by the character pattern data compressing apparatus 100 of the first embodiment, Typeface-4th
Among the keyword tables X-1 to X-4 and the compression code tables Y-1 to Y-4 that have been extracted in advance corresponding to the typeface, the one most suitable for the typeface supplied by the external storage device 305 (that is, The compression device having the highest compression rate when actually compressed for each typeface is selected by the selection device 400. Then, the selected keyword table and compression code table are used as the character pattern data compression apparatus 1 of the first embodiment.
00 is stored in the keyword table storage unit 106 and the compression code table storage unit 110. In this state, the compression coding unit 112 starts the operation. The compressed font data n and the index table n thus obtained are written in the external storage device 305.

【0061】このように構成された本実施例においても
上記第1実施例と同様の効果を有する他、外部記憶装置
305から圧縮フォントデータとインデックステーブル
のみを供給するだけでよく、外部記憶装置305にはキ
ーワードテーブル、逆変換テーブルが不要となる為、そ
れだけ外部記憶装置305の容量を効果的に使用するこ
とが可能となる。また、回数カウントアレイ108の初
期値として「1」を設定したからデータの出現頻度を調
べたときに出現しなかったデータに対しても圧縮符号を
発生させることができる。
In this embodiment having the above-mentioned structure, the same effects as those of the first embodiment can be obtained. In addition, only the compressed font data and the index table need be supplied from the external storage device 305, and the external storage device 305 can be used. Since the keyword table and the inverse conversion table are not required for this, the capacity of the external storage device 305 can be effectively used. Further, since “1” is set as the initial value of the number-of-times count array 108, the compression code can be generated even for data that does not appear when the appearance frequency of the data is checked.

【0062】なお、上記実施例においては第1候補キー
ワードから第4候補キーワードを用意したが、2種類の
キーワードだけでもよく、その数は任意である。また、
上記実施例は着目データに対して前2つのデータとの組
み合せ頻度を調べたが、1つ前のデータとの組み合せ頻
度を調べたり、前3つのデータとの組み合せ頻度を調べ
るようにしてもよい。更に、上記実施例はキーワードテ
ーブルの第1要素アドレスを縮小する手法として2つ前
のデータ「DL」の上位4ビットと下位4ビットとのイ
クスクルーシブオアXORを取る方法を用いたが、オア
演算によって縮小するようにしてもよい。この場合、例
えば、1ビットずつ交互にオア演算を行う等の方法が考
えられる。また、この発明はプログラム制御によるソフ
トウェアでも構成することができ、これによって高速で
ローコストな文字パターンデータ圧縮装置100を提供
することが可能である。
Although the first to fourth candidate keywords are prepared in the above embodiment, only two kinds of keywords may be used and the number thereof is arbitrary. Also,
In the above embodiment, the combination frequency of the data of interest with the previous two data is checked, but the combination frequency with the previous data or the combination frequency with the previous three data may be checked. . Further, in the above-described embodiment, as a method of reducing the first element address of the keyword table, a method of taking an exclusive OR XOR of the upper 4 bits and the lower 4 bits of the data "DL" two before is used. You may make it reduce by calculation. In this case, for example, a method of alternately performing an OR operation bit by bit can be considered. Further, the present invention can also be configured by software controlled by a program, which makes it possible to provide a high-speed and low-cost character pattern data compression device 100.

【0063】[0063]

【発明の効果】この発明によれば、文字パターンデータ
を構成するあるデータとその前のデータとの組み合せパ
ターンが頻繁に出現する場合にこれを再生用の固定デー
タに対応付けてデータの出現頻度を偏らせておくことに
より冗長性を抑制する圧縮手法を用いて文字パターンデ
ータを圧縮することができるので、高圧縮が可能とな
り、圧縮フォントデータを文書作成装置のROM等に組
み込んだ場合、容量の少ないメモリに効果的に圧縮フォ
ントデータを組み込むことが可能となる。
According to the present invention, when a combination pattern of a certain data forming the character pattern data and the preceding data frequently appears, this is associated with the fixed data for reproduction and the appearance frequency of the data. Since the character pattern data can be compressed by using a compression method that suppresses redundancy by biasing the, the high compression becomes possible, and when the compressed font data is incorporated in the ROM of the document creation device, It is possible to effectively incorporate compressed font data into a memory with less memory.

【図面の簡単な説明】[Brief description of drawings]

【図1】第1実施例において、文字パターンデータの圧
縮/再生過程を概略的に示した図。
FIG. 1 is a diagram schematically showing a compression / reproduction process of character pattern data in the first embodiment.

【図2】文字パターンデータ圧縮装置100のブロック
構成図。
FIG. 2 is a block configuration diagram of a character pattern data compression device 100.

【図3】無圧縮フォントパターンデータ格納部101に
収められている文字パターンのデータ構造を示した図。
FIG. 3 is a diagram showing a data structure of a character pattern stored in an uncompressed font pattern data storage unit 101.

【図4】キーワード選定用計数制御部103の第1機能
を説明する為の図。
FIG. 4 is a diagram for explaining a first function of a keyword selection counting control unit 103.

【図5】キーワード選定用カウンタアレイ104の構成
を示した図。
FIG. 5 is a diagram showing a configuration of a keyword selection counter array 104.

【図6】キーワードテーブルの構成を示した図。FIG. 6 is a diagram showing a configuration of a keyword table.

【図7】回数カウントアレイ108の構成を示した図。FIG. 7 is a diagram showing a configuration of a frequency counting array 108.

【図8】各コマンドコードとその実行コマンドの内容を
示した図。
FIG. 8 is a diagram showing the contents of each command code and its execution command.

【図9】圧縮符号表を示した図。FIG. 9 is a diagram showing a compression code table.

【図10】数値的な重み順に並べ変えられた圧縮符号表
を示した図。
FIG. 10 is a diagram showing a compression code table sorted in numerical weight order.

【図11】図10の圧縮符号表を木リスト構造で表わし
た図。
11 is a diagram showing the compression code table of FIG. 10 in a tree list structure.

【図12】逆変換テーブルの構成図。FIG. 12 is a configuration diagram of an inverse conversion table.

【図13】逆変換テーブルにおける「振舞い」データの
構造を示した図。
FIG. 13 is a diagram showing the structure of “behavior” data in the inverse conversion table.

【図14】逆変換テーブルの内容を具体的に示した図。FIG. 14 is a diagram specifically showing the contents of an inverse conversion table.

【図15】文書作成装置200の全体構成を示した図。FIG. 15 is a diagram showing the overall configuration of a document creation device 200.

【図16】文字パターン再生装置201のブロック構成
図。
16 is a block configuration diagram of a character pattern reproducing device 201. FIG.

【図17】第2実施例において、文書作成装置300の
ブロック構成図。
FIG. 17 is a block configuration diagram of the document creation device 300 in the second embodiment.

【図18】外部記憶装置305に対して圧縮フォントデ
ータやインデックステーブルを書き込む際の処理過程を
示した図。
FIG. 18 is a diagram showing a process of writing compressed font data and an index table in the external storage device 305.

【符号の説明】[Explanation of symbols]

100 文字パターンデータ圧縮装置 101 無圧縮フォントパターンデータ格納部 103 キーワード選定用計数制御部 104 キーワード選定用カウンタアレイ 105 キーワード選定部 106 キーワードテーブル格納部 107 データ出現回数計数部 108 回数カウントアレイ 109 圧縮符号表発生部 110 圧縮符号表格納部 112 圧縮符号化部 113 データ書き込み部 114 圧縮フォント格納部 115 インデックステーブル格納部 116 逆変換テーブル発生部 117 逆変換テーブル格納部 200 文書作成装置 100 Character Pattern Data Compressor 101 Uncompressed Font Pattern Data Storage Unit 103 Keyword Selection Counting Control Unit 104 Keyword Selection Counter Array 105 Keyword Selection Unit 106 Keyword Table Storage Unit 107 Data Appearance Counting Unit 108 Number Counting Array 109 Compression Code Table Generation unit 110 Compression code table storage unit 112 Compression coding unit 113 Data writing unit 114 Compressed font storage unit 115 Index table storage unit 116 Inverse conversion table generation unit 117 Inverse conversion table storage unit 200 Document creation device

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】ビットマップ方式の各文字パターンデータ
をそれぞれ圧縮して文書作成装置に組み込む文字パター
ンデータ圧縮装置において、 文字パターンデータを構成する各データに順次着目し、
この着目データとその前のデータとの組み合せに応じて
その組み合せ頻度を検出する動作を全ての文字に対して
行う組み合せ頻度検出手段と、 この組み合せ頻度検出手段によって頻度の高い組み合せ
が検出された場合に、前のデータがこの組み合せならば
着目データはこれであるというデータ候補を各組み合せ
毎に記憶する候補テーブルを作成するテーブル作成手段
と、 前記候補テーブルを再生用の固定データに対応させるこ
とでデータの出現頻度を偏らせ、このデータの出現頻度
に応じて冗長部分を抑制した圧縮符号列を発生する圧縮
符号発生手段と、 各文字パターンデータを前記圧縮符号発生手段によって
発生された圧縮符号列に置き換えることで文字パターン
データを圧縮する圧縮手段と、 を具備したことを特徴とする文字パターンデータ圧縮装
置。
1. A character pattern data compression apparatus for compressing each character pattern data of a bit map system and incorporating it in a document creation apparatus, focusing on each data constituting the character pattern data sequentially,
A combination frequency detecting means for detecting the combination frequency of all the characters in accordance with the combination of the data of interest and the preceding data, and a case where a high frequency combination is detected by the combination frequency detecting means. If the previous data is this combination, the data of interest is this table creation means for creating a candidate table that stores data candidates for each combination, and by making the candidate table correspond to the fixed data for reproduction. A compression code generation means for generating a compression code string in which the appearance frequency of the data is biased and a redundant portion is suppressed according to the appearance frequency of the data, and a compression code string generated by the compression code generation means for each character pattern data. A character pattern comprising: a compression unit that compresses the character pattern data by replacing Data compression device.
【請求項2】前記組み合せ頻度検出手段によって頻度の
高い組み合せが検出された場合に、前記テーブル作成手
段は前のデータの1つの組み合せに対して着目データの
異なる複数の候補テーブルを作成し、前記圧縮符号発生
手段は複数の候補テーブルのそれぞれに固定データを対
応させるようにしたことを特徴とする請求項(1)記載
の文字パターンデータ圧縮装置。
2. When a combination having a high frequency is detected by the combination frequency detecting means, the table creating means creates a plurality of candidate tables having different data of interest for one combination of previous data, 4. The character pattern data compression apparatus according to claim 1, wherein the compression code generation means is adapted to associate fixed data with each of the plurality of candidate tables.
【請求項3】文字パターンデータを構成する各データの
単位は、ビットマップ方式でデータを持つ際の1アドレ
スを占有する1ワードを構成するビット群であることを
特徴とする請求項(1)記載の文字パターンデータ圧縮
装置。
3. The unit of each data forming the character pattern data is a bit group forming one word occupying one address when the data is held by the bit map method. Character pattern data compression device described.
JP4357883A 1992-12-25 1992-12-25 Character pattern data compressing device Pending JPH06195063A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4357883A JPH06195063A (en) 1992-12-25 1992-12-25 Character pattern data compressing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4357883A JPH06195063A (en) 1992-12-25 1992-12-25 Character pattern data compressing device

Publications (1)

Publication Number Publication Date
JPH06195063A true JPH06195063A (en) 1994-07-15

Family

ID=18456429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4357883A Pending JPH06195063A (en) 1992-12-25 1992-12-25 Character pattern data compressing device

Country Status (1)

Country Link
JP (1) JPH06195063A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7212679B2 (en) 2001-02-27 2007-05-01 Telefonaktiebolaget Lm Ericsson (Publ) Font compression and retrieval

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7212679B2 (en) 2001-02-27 2007-05-01 Telefonaktiebolaget Lm Ericsson (Publ) Font compression and retrieval

Similar Documents

Publication Publication Date Title
US6873986B2 (en) Method and system for mapping strings for comparison
EP0293161B1 (en) Character processing system with spelling check function
US5659737A (en) Methods and apparatus for data compression that preserves order by using failure greater than and failure less than tokens
US5995118A (en) Data coding system and decoding circuit of compressed code
EP0584992B1 (en) Text compression technique using frequency ordered array of word number mappers
EP0083393B1 (en) Method of compressing information and an apparatus for compressing english text
US5999949A (en) Text file compression system utilizing word terminators
US8712977B2 (en) Computer product, information retrieval method, and information retrieval apparatus
US4295124A (en) Communication method and system
JPH026252B2 (en)
JPH11274941A (en) Error correction method and system thereof
JP4003854B2 (en) Data compression apparatus, decompression apparatus and method thereof
EP0127815B1 (en) Data compression method
US5815096A (en) Method for compressing sequential data into compression symbols using double-indirect indexing into a dictionary data structure
CN1154350C (en) Television on-screen display system by using version data compression
JPH06195058A (en) Character pattern data compressing device
JP3360334B2 (en) Compressed character pattern playback device
JPH06195063A (en) Character pattern data compressing device
JPH06195064A (en) Compressed character pattern reproducing device
US8463759B2 (en) Method and system for compressing data
JPH06195060A (en) Compressed character pattern reproducing device
JPH06195059A (en) Character pattern data compressing device
JPH06195061A (en) Character pattern data compressing device
JPH0554077A (en) Word dictionary retriever
JPH07199894A (en) Method for compressing character font