JPS59222880A - 文字パタ−ン圧縮方法 - Google Patents

文字パタ−ン圧縮方法

Info

Publication number
JPS59222880A
JPS59222880A JP58095125A JP9512583A JPS59222880A JP S59222880 A JPS59222880 A JP S59222880A JP 58095125 A JP58095125 A JP 58095125A JP 9512583 A JP9512583 A JP 9512583A JP S59222880 A JPS59222880 A JP S59222880A
Authority
JP
Japan
Prior art keywords
pattern
sub
character
patterns
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58095125A
Other languages
English (en)
Other versions
JPS6365149B2 (ja
Inventor
サミユエル・シ−・ツエン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP58095125A priority Critical patent/JPS59222880A/ja
Publication of JPS59222880A publication Critical patent/JPS59222880A/ja
Publication of JPS6365149B2 publication Critical patent/JPS6365149B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Controls And Circuits For Display Device (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明はドット・マトリクスで表わされる文字パターン
を圧縮する技術に関する。
〔背景技術〕
コンピュータ・システムの端末装置としてドント式プリ
ンタあるいはディスプレイ装置が使用されることが多い
が、文字、特に漢字を明瞭に表現するには少くとも16
×16ドット、好ましくは24X24ドットで表示する
必要がある。1文字’e24X24ドット・マトリクス
で表わすと8000文字では576キロバイトになり、
大きなメモリ8%k占めることになる。パーソナル・コ
ンピュータ、ワード・プロセソサ等の小型コンピュータ
は内部メモリが小さいばかシでなく、外部メモリとして
フロッピィ・テイスク等の比較的小容量のもの全使用す
るため、文字パターンを圧縮符号化してメモリに記憶し
、使用する文字ごとにもとのドット・マトリクスK&元
することが提案されている。
漢字パターン全いくつかの画素に分割すると、各画素の
状態はその周囲の画素の状態に対して互いに独立ではな
く、上下左右の画素の間に極めて強い相関関係がある。
このような漢字パターンの11−竹をオリ用した圧縮法
が既に幾つか提案されている。
特開昭55−39956号公報には、例えば24×24
のドツl・・マトリクスを2×2のサブマトリクスに分
割し、個々のサブマトリクスに対してその隣りのサブマ
トリクスを条件とする出現頻度に基づいてハフマンの符
号化を行えば高い圧縮率が得られるが、ノ・フマン符号
化法では1つの基準となるサブパターンに対して16個
の符号語からなる1組の符号が得ら扛るから全部で16
通りの異なる符号が得られ、各事象に与えられる符号は
長さに規則性のない符号となってしまい、文字パターン
の復元が難しく非常に複雑な復元回路を要することが指
摘されている。
同公報のものは符号の長さに規則性を持たせるために、
条件となる16通シのサブパターンに対して16個の出
現頻度に応じた順位と等しい長さをもつ可変長符号語を
割当てることを提案しているが、圧縮率が比較的低いと
いう欠点がある。
〔発明の概要〕
本発明は圧縮率が高く且つ復元の容易な文字パターン圧
縮方法を提供することを目的とする。本発明によると文
字パターンは1組の符号により圧縮符号化され、対照表
を参照して復元されるので、復元が簡単且つ迅速であり
複雑な後元回路を必要としない。
本発明によるとM行×N列のドット・マトリクスで表現
される文字パターンkpドットのサブパターンに分割し
、予定の規則で選択される左右又は」一下の1つ又は複
数個のサブバクーン(こうして求められたパターンをそ
れそれ以下基準パターンと呼ぶ)を条件とする各サブバ
クーンの出現頻度を対象とする相尚数の文字について求
め、基準パターンすべてにわたって同順位の出現頻度を
集計しその出現頻度分布に基づいて各順位に可変長符号
全割当て、これと同時又は前後して前記基準パターンの
それぞれを条件とするサブバクーンと前記順位との対照
表を作り、前記文字パターンの各サブパターンをその基
準パターンを条件として前記対照表により関係付けられ
る前記順位に割当てられた可変長符号で表わすことにJ
:9文字パターンの圧縮が行なわれる。
すなわち、qを基準パターンのピント数として基準パタ
ーンをa(0)、a(1)、・・・・・a(2q一1)
で表わすと、各基準パターンごとにサブパターン・g(
0)、g(1)、・・・・・g(2p.−1)の出現頻
度が得られるが、これを全基準パターンにわたって同順
位の出現頻度を集計して合計出現頻度のヒストグラムS
(k)’i得る。その隙、サブパターンの出現頻度の順
位は基準パターンごとに異なるから、基準パターンai
条件とするサブパターンgと出現頻度の順位kとの対照
表g=T(a,k)’ji7作る。そして2p個の順位
ki出現頻度の高いもの程短い符号語が割当てられるよ
うに可変長符号化する。圧縮すべきそれぞれの文字パタ
ーンの各サブバクーンについて、基準パターンを条件と
して前記対照辰から出現頻度の順位ki見出し、そのサ
ブパターンikに割当てられた可変長符号で置換する。
こうして各文字パターンが圧縮データに変換される。
このように本発明によると文字パターンは2p個(pは
サブパターンのピント数)の符号語からなるただ1組の
可変長符号で圧縮されるから後元が簡単で複雑な後元回
路を必要としない。捷た、本発明によると圧縮はサブパ
ターンの出現頻度の順位及び出現頻度分布を利用して行
なわれるから、高い圧縮率が達成される。
ハフマン符号化法によるとサブパターンの出現頻度分布
が急な程、高い圧縮率が得られる。従来のように基準バ
クーンごとにー・フマン符号化法を適用すると全体とし
て符号の長さに規則性がなくなるほか、出現頻度分布の
緩やかな基準パターンについては圧縮率が低くなシ全体
的な圧縮率が制約されたが、本発明によるとこ汎らの問
題が解消する。
〔発明v.(H施するための最良の形態〕M行XN列の
ドット・パターンで表現される文字パターンF(m,n
.)、m=0、1、2、・・・・−M,n=0,1、2
、・・・・・・Nをコンピュータのメモリに記憶する場
合、通常8個の画素を1バイトとして扱う。圧縮及ひ復
元の処理時間を短くするため数ピントを1組として処理
するのが望ましいが、情報がバイト単位で記憶されてい
るのでその半分の4ビットを1単位としで選ぶのがよい
この場合、文字バクーンは4ビントを1サブバターンと
する行列G(m,j)、j=0、1、2、・・・・・・
N/4−1とみなすことができる。例えば第1図に示す
24行24列の576ピントからなる漢字パターンは1
44個のサブバクーンとして扱われる。注目するサブパ
ターンtG(m,j)とすると、その土のサブパターン
はG(m−1、J)であシ、さらにその上のサブパター
ンはG(m2、.+)である。サブパターンG(mXj
)を圧縮する際の基準パターンA.(m,j)としてG
(’m−2、J)、G(m−1、J)の連続でなる8ビ
ントを用いると良好な圧縮率が得られることがわかった
。A(m,j)のとりうるビット・パターンは256種
類めシ、これをa(0)、a(1)、・・・・・a(2
55)で表わす。
処理対象である多数の文字について基準パターンaのそ
れぞれを条件とするサブパターンg(0)、g(1)、
・・・・・g(15)の出現頻度を求めてヒストグラム
H(a1g)を作る。基準パターンa(i)k条件とす
るサブパターンg(k)の出現頻度i(aikで表わす
とヒストグラムH(asg)は次の表1のように表わさ
れる。a(256)は文字バクーンの第1行を処理する
際に使用する基準パターンであり、すべて1からなる8
ビットである。
文字パターンの最初の行を処理するとき条件とすべき基
準パターンが存在しない。仮にすべて0ビットで構成さ
れるバイトを基準パターンとして処理すると、最初の行
のサブパターンの出現頻度は実際にすべてOビットの基
準パターンを条件とするザブパターンの出現頻度に加算
されることになり、ヒストグラムH(0、g)のエント
ロビイを増大させ圧縮率全低下させることになる。従っ
て、第1行についてはすべて1からなる8ビントを基準
パターンとして処理することにする。これを表1におい
てヒストグラムH(256、g)で表わしてある。第2
行目の処理の際には第1行の上にすべて1からなる行が
あるものとして処理する。
基準パターンa(0)乃至a(256)について得られ
る257組のヒストグラムを同順位の出現頻度ごとに集
計して1組の合計ヒストグラムを作り、これに基づいて
1組の可変長符号を生成する。約4000個の漢字につ
いて表1の出現頻度ヒストグラム+i(asg)k求め
出現頻度の太きい順k=o,1、・・・・・・15に並
べると表2に示すようなヒストグラムh(a.,k)が
得られる。
元のヒストグラムH(azg)におけるgの位fmと大
きさ順ヒストグラムh(a,k)における順位kとの対
照表g=T(a,k)は表6のようになる。表6でgの
値はビット・パターン全10進数で表示してある。
このように257組のヒストグラムのそれぞれ全大きさ
の順に配列した後、a(0)がらa(256)にわたっ
て同順位の出現頻度全足し合せて1つのヒストグラムS
(k)’e作る。S(k,)においては出現頻度全確率
に変換して用いるのがよい0すなわち、衣2の各列を足
し合わせ確率に変換するとS(k)が得られる。このS
(.k)における確率分布に基づいてk二011、・・
・・・づ5にそれぞれ可変長符号を割当てる。可変長符
号法にはハフマン符号法及びその改良ないし変形がある
が、S(k)iハフマン符号法により可変長符号を割渦
てると表4のようになる。
表4 k可変長符号 00 1100 2110 31011 41111 510101 6’11101 7101(100 8111000 9111001 101010011 1110100101 12101001001 131010010000 1410100100010 1510100100011 こうして対照表g−T(a1k)及び表4の可変長符号
が準備された後、個々の文字パターンは、注目するサブ
パターンに関しその基準パターンa全見出し、対照表g
=T(a,k)またはその反転表k−t(a1、g)か
らki見出し、表4の可変長符号表からkに割当てられ
た符号を見出し、該サブバクーンをこの符号で表わすこ
とにエシ圧縮データに変換される。圧縮データからもと
の文字パターンを復元するには、可変長符号を復号して
k全見出し、注目しているサブパターンの上2つのサブ
パターンから基準パターンa′ff:見出し、対照表g
”T(a%k)からサブパターンgk得ればよい。
第1図の文字バクーンの場合、最初の行の6個のザブパ
ターンgはすべてOであるので、6個のサブパターンに
ついて対照表のa(256,).1それぞれk二Ok得
る。表4の符号衣によりk二〇の可変長符号はOなので
、第1行の6個のサブパターンは”oooooo”の6
ビントで表わされる。同様にして順次、次の行のサブパ
ターン全可変長符号化する。もう1つのサブパターンの
例として17行9列乃至12列のサブバターをとると、
その規準パターンは11001100、すなわち10進
数表示でu=204であり、゛リ゜ゾパターン1100
は10進数表示でg−12である。
対照表のa(204)の行からk=0が得られ、その可
変長符号はOであるから、とのザプパターン0で表わさ
れる。このようにして文字パターンが圧縮データに変換
される。この方法によると、8000の文字について約
50係の圧縮率が得られる。
以上、最良の実施形態を説明したが、本発明の方法によ
9文字バクーンを圧縮した後、この圧縮データに周知の
ランレングス圧縮法を適用することに.r.!ll文字
パターンを2段階に圧縮するとさらに高い圧縮率が得ら
れる。ランレングス圧縮法はたとえば特開昭55−69
842号公報に記載されている。
第2図は本発明によって圧縮された文字パターンを復元
するための復元装置のブロック図である。
圧縮データはフロッピィ・ディスク等の外部記憶装置に
記憶され、使用するときパーソナル・コンピュータ又は
ワードグロセッザの内部メモリに読込まれる。また、圧
縮データはパーソナル・コンピュータ又はワードプロセ
ッサ内の読取専用メモリに記憶されていてもよい。第2
図のノモリ1はこのような圧縮データを記憶する内部メ
モリ又は読取専用メモリである。漢字は2バイトの文字
コードで表わされるのが一般的である。文字コードによ
って同定される文字の圧縮データがメモリ1から胱出さ
れる。圧縮データはハフマン符号デコーダ乙に1ピント
ずつ順次送られ復号されてkの値がデコーダ乙の出力に
得られる。kは0から15の値であるから4ビットで表
わされる。
kは参照表5のインデソクス・レジスタ7に送られ、基
準バター/a全条件として参照表5から対応ずるサブバ
クーンgを得るのに使用される。
gは4ビットの出力レジスタ9を経て12段の並列4ビ
ットのシフトレジスタ11に送られ、壕タ文字パターン
・メモリに送られて復元文字バターンの一部分となる。
シフトレジスタ11の6段目は庄目するサブパターンの
直土のサブパターンを含み、12段目はさらにその土の
サブパターンを含む。従って、シフトレジスタ11の6
段目の値及び12段目の値が基準バクーンaとしてレジ
スタ16を経てインデックス・レジスタ7にインプット
される。こうしてk及びaの値に基づいて参照表g=T
(a.,k).1:りサブパターンgが得られる。
圧縮データの最初の部分を復号するときは、シフトレジ
スタ11の各段をすべて1にセントすることに.l:9
すべで1からなる基準パターンa(256)がインデッ
クス・レジスタ7に印加されるようにすればよい。後号
が進むにつれてシフトレジスタ11にザプパターンgが
送シ込まれ、レジスク13で基準パターンaが形成され
る。
【図面の簡単な説明】
第1図は圧縮すべき文字バクーンの一例を示す図、第2
図は文字バクーン復元装置のブロンク図である。

Claims (4)

    【特許請求の範囲】
  1. (1)M行N列のドット・マ1・リクスで表わされる文
    字パターンを圧縮するための方法であって、対象とする
    多数の文字について文字パターンを数ドットごとのザブ
    パターンに分割し、各サブパターンについて該ザブパタ
    ーンに隣接する1つ又fd[数個のサブパターンからな
    る基準パターンを条件とする該サブパターンの出現頻度
    を求め、基準パターンすべてにわたって同順位の出現頻
    度を集計しその出現頻度分布に基づいて各順位に可変長
    符号を割当てるとともに前記基準パターンのそれぞれ全
    条件とするザブパターンと前記順位との対照表を作り、
    前記文字パターンの各サブパターンをその基準パターン
    全条件として前記対照表により関係伺けられる前記順位
    に割当てられた可変長符号で表わすことを特徴とする文
    字パターン圧縮方法。
  2. (2)上記可変長符号はハフマン符号である特許請求の
    範囲第(1)項の方法。
  3. (3)上記サブパターンは横又は縦に連続する4ドット
    である特許請求の範囲第(2)項の方法。
  4. (4)上記基準パターンは注目するサブバクーンの真上
    のサブパターン及びさらにその上のサブパターンで構成
    する特許請求の範囲第(3)項の方法。
JP58095125A 1983-05-31 1983-05-31 文字パタ−ン圧縮方法 Granted JPS59222880A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58095125A JPS59222880A (ja) 1983-05-31 1983-05-31 文字パタ−ン圧縮方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58095125A JPS59222880A (ja) 1983-05-31 1983-05-31 文字パタ−ン圧縮方法

Publications (2)

Publication Number Publication Date
JPS59222880A true JPS59222880A (ja) 1984-12-14
JPS6365149B2 JPS6365149B2 (ja) 1988-12-14

Family

ID=14129103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58095125A Granted JPS59222880A (ja) 1983-05-31 1983-05-31 文字パタ−ン圧縮方法

Country Status (1)

Country Link
JP (1) JPS59222880A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0249260A (ja) * 1988-08-10 1990-02-19 Matsushita Electric Ind Co Ltd カセット装着装置

Also Published As

Publication number Publication date
JPS6365149B2 (ja) 1988-12-14

Similar Documents

Publication Publication Date Title
US6333951B1 (en) Image processing system
KR100289589B1 (ko) 디지탈 신호의 부호화 방법,부호화용 테이블 생성 방법,부호화 장치 및 부호화 방법
US5838964A (en) Dynamic numeric compression methods
KR100241792B1 (ko) 이미지데이터를 부호화하고 해독하는 방법 및 장치
JPH07502632A (ja) ハフマンコードの復号化のための回路
US5832037A (en) Method of compressing and expanding data
KR100573527B1 (ko) 그래픽 이미지 압축 및 복원 방법
JPH03503708A (ja) デジタル・サンプルのコード化装置およびコード化法、およびビデオ信号処理システム
US4382286A (en) Method and apparatus for compressing and decompressing strings of electrical digital data bits
JPH08317227A (ja) 復号化装置
JPS59222880A (ja) 文字パタ−ン圧縮方法
JPS6192073A (ja) 画像デ−タ圧縮方式
JP3277425B2 (ja) ディジタル信号の符号化方法、符号化用テーブル生成方法、符号化装置及び符号化方法
JP2738136B2 (ja) ブロック化装置
US20070177814A1 (en) Method and recording format for image compression
JPH07168933A (ja) ジグザグスキャンアドレス発生回路
Alexandrov et al. Recursive pyramids and their use for image coding
JPH08130652A (ja) 2次元画像データの圧縮方式および伸長方式
JPH11317673A (ja) ランレングス符号化方法及び復号化方法
JPS581275A (ja) 画像のぼかし処理装置
JP3532137B2 (ja) データ発生回路
US6456742B1 (en) Method for image processing
EP1069691A1 (en) Decoding method for a Huffman code
JP2000261803A (ja) 画像情報の符号化方法及び復号化方法
JP2775790B2 (ja) 情報処理装置