JPH10134192A - パタンマッチング符号化装置及び方法 - Google Patents

パタンマッチング符号化装置及び方法

Info

Publication number
JPH10134192A
JPH10134192A JP8308771A JP30877196A JPH10134192A JP H10134192 A JPH10134192 A JP H10134192A JP 8308771 A JP8308771 A JP 8308771A JP 30877196 A JP30877196 A JP 30877196A JP H10134192 A JPH10134192 A JP H10134192A
Authority
JP
Japan
Prior art keywords
pattern
library
font
unit
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8308771A
Other languages
English (en)
Other versions
JP2940496B2 (ja
Inventor
Takahiro Motomiya
隆広 本宮
Koichiro Hirao
浩一郎 平尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8308771A priority Critical patent/JP2940496B2/ja
Priority to EP97308868A priority patent/EP0840498B1/en
Priority to US08/964,633 priority patent/US6016361A/en
Publication of JPH10134192A publication Critical patent/JPH10134192A/ja
Application granted granted Critical
Publication of JP2940496B2 publication Critical patent/JP2940496B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/4115Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Character Discrimination (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 画像品質を劣化させることなく圧縮率を向上
させることができるパタンマッチング符号化方法及び装
置を提供する。 【解決手段】 入力された2値画像データから切り出さ
れた文字パタンに基づいて更新可能なテンポラリビット
マップパタンTBMDを格納するテンポラリ更新ライブ
ラリ6とは別にフォントビットマップライブラリ11を
設け、入力文字パタンのフォント検出あるいはユーザ指
定により指定されたフォントのフォントビットマップパ
タンFBMDを格納する。文字パタンをテンポラリビッ
トマップパタンTBMBD及びフォントビットマップパ
タンFBMDと比較することでパタンマッチング処理を
行う。その際、文字パタンがテンポラリビットマップパ
タンTBMDとのみマッチすると判定された場合あるい
はテンポラリビットマップパタンTBMBD及びフォン
トビットマップパタンFBMDのいずれともアンマッチ
であると判定された場合に、文字パタンをテンポラリ更
新ライブラリ6に新規登録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像データ圧縮装置
に係り、特に2値画像データをパタンマッチングを用い
て圧縮するパタンマッチング符号化装置及び方法に関す
る。
【0002】
【従来の技術】スキャナを用いて2値静止画像を入力
し、そのビットマップデータを圧縮する方法の1つが米
国特許第5,303,313号公報に開示されている。
この公報によれば、スキャナ等で入力した画像データは
先ずランレングス符号化等により予め圧縮され、その後
でパタンの切り出しを行い、切り出されたパタンと登録
テンプレートとのマッチングによりテンプレートデータ
及びパタン位置データを生成する。これによって、入力
ビットマップデータはテンプレートコードやパタン位置
からなるデータへ圧縮される。
【0003】また、手書き文字や不特定のタイプの文字
等のデータ圧縮率を向上させるために、入力ビットマッ
プデータと比較されるビットマップデータを入力データ
に応じて新規登録や更新を行うことができるテンポラリ
ライブラリを設けた画像データ圧縮装置も提案されてい
る。
【0004】図7は、テンポラリ更新ライブラリを有す
る従来の2値静止画像のパタンマッチング符号化装置の
一例を示すにブロック図である。同図において、原稿入
カスキャナから入力されたドキュメント原稿の画像デー
タは、符号化の際の圧縮率の向上や視覚的な画質改善の
ために2値化処理及びスムージング処理が施される。パ
タン抽出処理部101はスムージング処理後のデータか
らパタン抽出を行い、マークパタンのビットマップデー
タをマッチング処理部102へ出力する。マッチング処
理部102では、マークパタンとテンポラリ更新ライブ
ラリ103に保存されているビットマップパタンとが比
較される。マッチング処理部102では、全画素中の不
一致画素の比率が一定値以下であればマッチと判定さ
れ、その一定値を上回る場合にはアンマッチと判定され
る。
【0005】マッチング処理部22でマッチしていると
判断された場合には、マッチしたテンポラリ更新ライブ
ラリ内のビットマップの識別IDとマッチングをとった
際の位置合わせデータとをマルチシンボル算術符号化部
へ出力してデータ圧縮が行われる。マッチしていると判
断されたマークパタンのビットマップデータは、マッチ
補正処理部104においてマッチエラー画素について反
転処理が実行された後、またアンマッチと判定されたマ
ークパタンのビットマップデータは補正処理を行うこと
なく、それぞれテンポラリ更新ライブラリ103にID
登録される。テンポラリ更新ライブラリ103では、マ
ッチ頻度の低いライブラリビットマップは消去される。
【0006】なお、マークパタンのビットマップデータ
のデータ圧縮を行うにあたり、アンマッチのマークパタ
ンに対してはアンマッチ用テンプレート作成部で生成さ
れた予測テンプレート画素が使用され、マッチしたマー
クパタンにはマッチ用テンプレート作成部で生成された
予測テンプレート画素が使用される。
【0007】
【発明が解決しようとする課題】しかしながら、従来の
方式では、マッチング処理を行う前にデータ圧縮率を向
上させるために前圧縮処理やスムージング処理を行った
り、マッチエラー補正後のデータによってテンポラリラ
イブラリを更新したりするために、次のような問題点が
生じていた。
【0008】第1に、画像品質の問題である。テンポラ
リ更新ライブラリとのマッチング処理を実行した後のマ
ッチエラー補正処理でマッチエラー画素の反転処理を行
う。この処理は、圧縮率を向上させるために行うのであ
るが、本処理によって画像品質が損なわれる。また、マ
ッチエラー補正処理後のマークパタンのビットマップデ
ータを逐次ライブラリに登録していくので、マッチエラ
ー補正処理の画像の歪みが蓄積される。特に、現在使用
頻度が高くなってきているパーソナルコンピュータ、ワ
ードプロセッサ等のフォント印字されたドキュメント原
稿に対しては、画像品質の劣化が顕著になる。
【0009】第2に、圧縮率を向上させる点で最適化さ
れていない問題である。例えば、同一文字のマークパタ
ンのビットマップデータであってもスキャナの精度で微
妙に変形されるため、テンポラリ更新ライブラリに対し
て同一文字のマークパタンのビットマップデータが更新
される。このため、テンポラリ更新ライブラリ内に数種
類の同一文字データが存在することとなり、有限のライ
ブラリメモリにおいては、マッチングをとるためのビッ
トマップデータの文字マーク種類が不足してくる。
【0010】そこで、本発明の目的は、画像品質を劣化
させることなく圧縮率を向上させることができるパタン
マッチング符号化方法及び装置を提供することにある。
【0011】
【課題を解決するための手段】本発明によるパタンマッ
チング符号化装置は、入力された2値画像データから単
位パタンをそれぞれ識別し、ライブラリパタンとのパタ
ンマッチングを行った結果に基づいて前記単位パタンの
符号化を行う装置であって、前記単位パタンに基づいて
更新可能な第1ライブラリパタンを格納する第1記憶手
段と、予め指定されたフォントの第2ライブラリパタン
を格納する第2記憶手段と、前記単位パタンを第1ライ
ブラリパタン及び第2ライブラリパタンと比較すること
でパタンマッチング処理を行うパタンマッチング手段
と、からなることを特徴とする。
【0012】また、本発明によるパタンマッチング符号
化方法は、前記単位パタンが前記第1ライブラリパタン
とのみマッチすると判定され且つ前記第1ライブラリパ
タンと同一ではない場合あるいは前記単位パタンが前記
第1ライブラリパタン及び第2ライブラリパタンのいず
れともアンマッチであると判定された場合に、前記単位
パタンを第1ライブラリパタンとして新規登録すること
を特徴とする。
【0013】本発明によれば、第1ライブラリパタンを
格納した第1記憶手段に加えて、指定フォントの第2ラ
イブラリパタンを格納した第2記憶手段を設けているた
めに、第1ライブラリパタンと併行して例えば標準のフ
ォントビットマップパタンをマッチング処理に用いるこ
とができ、画像品質の大幅な改善を達成できる。
【0014】更に、入力画像パタンが第1ライブラリパ
タンと第2ライブラリパタンとのいずれにもマッチしな
い場合あるいは第1ライブラリパタンだけにマッチした
場合のみ第1記憶手段へ新規登録を行うことにより、第
1記憶手段の無駄な登録を回避でき効率的な使用を達成
できる。従って、第2記憶手段にパーソナルコンピュー
タやワードプロセッサ等で使用されるフォントを格納し
ておけば、フォント印字されたドキュメント原稿のマー
クパタンとのマッチ率を向上させることができ、画像デ
ータ圧縮率を大幅に改善することができる。
【0015】
【発明の実施の形態】図1は、本発明によるパタンマッ
チング符号化装置の一実施形態を示すブロック図であ
る。同図において、原稿入カスキャナ1から入力された
ドキュメント原稿の読み込みデータは2値化処理部2に
おいて白黒の2値画像データに変換される。その2値画
像データは、スムージング処理部3に入力されノッチ及
び孤立点画素の除去が行われ、符号化の際の圧縮率が向
上、視覚的な画質改善がなされる。スムージング処理後
のデータはパタン抽出処理部4に入力し、そこで後述す
るように文字単位の切り出し処理及び切り出された単位
からのパタン抽出処理が行われる。
【0016】パタン抽出処理によって得られたマークパ
タンビットマップデータMBMDはマッチング処理部5
へ出力され、後述するようにテンポラリビットマップデ
ータ及びフォントビットマップデータとのマッチング処
理が行われる。テンポラリ更新ライブラリ6には、テン
ポラリビットマップデータが格納されており、マッチン
グ処理部5の指示に従って比較すべき類似したビットマ
ップデータ候補をマッチング処理部5へ出力する。
【0017】また、パタン抽出処理によって得られたマ
ークパタンのサイズデータは、フォントサイズタイプ検
出部8へ出力され、入力原稿のフォントタイプが特定さ
れる。なお、入力原稿のフォントタイプや文字サイズが
予め分かっている場合には、ユーザが操作部7を通して
フォントサイズタイプ検出部8へそれらの文字タイプデ
ータを入力してもよい。特定されたフォントタイプデー
タはフォント9へ出力される。フォント9には、一般的
にパーソナルコンピュータやワードプロセッサで使用さ
れる標準フォントデータが蓄積されており、フォントサ
イズタイプ検出部8から入力した文字タイプデータに従
ったフォントをフォントビットマップ展開部10へ出力
する。フォントビットマップ展開部10では、フォント
データをビットマップ展開し、そのビットマップデータ
をフォントビットマップライブラリ11に識別IDを付
加して登録する。
【0018】マッチング処理部5では、パタン抽出処理
部4から入力したマークパタンビットマップデータMB
MDが先ずフォントビットマップライブラリ11から入
力したフォントビットマップデータFBMDと比較さ
れ、アンマッチと判定された場合には更にテンポラリ更
新ライブラリ6から入力したテンポラリビットマップデ
ータTBMDと比較される。この比較の結果によって不
一致画素が存在すればマッチエラーデータMEDとして
マッチエラー補正処理部12へ出力され、マッチエラー
補正が行われる。ただし、マッチング処理部5において
いずれもアンマッチであると判定された場合には補正処
理は行われない。エラー補正処理部12は、いずれもア
ンマッチであると判定された場合あるいはテンポラリビ
ットマップデータTBMDと部分的な不一致はあるがマ
ッチしていると判定された場合のみテンポラリ更新ライ
ブラリの更新を行う。より詳しくは、いずれもアンマッ
チであると判定された場合にはマークパタンビットマッ
プデータMBMDがそのままテンポラリ更新ライブラリ
に新規ID登録され、テンポラリビットマップデータT
BMDとマッチしている場合には補正されたマークパタ
ンのビットマップデータが新規ID登録される。その
際、マッチ頻度の低いライブラリビットマップはテンポ
ラリ更新ライブラリ6から消去される。
【0019】マークパタンのビットマップデータのデー
タ圧縮を行うにあたり、アンマッチのマークパタンはア
ンマッチ用テンプレート作成部13で作られた予測テン
プレート画素が使用され、マッチしたマークパタンはマ
ッチ用テンプレート14で作成された予測テンプレート
画素が使用される。テンプレート選択部15は、マッチ
ング処理部5からのマッチング判定信号に従ってアンマ
ッチ用あるいはマッチ用のいずれかの予測テンプレート
画素を選択し、2シンボル算術符号化部17で圧縮され
る。またマークパタンのサイズデータ及び値データはマ
ルチシンボル算術符号化部16へ出力される。
【0020】このような構成を有する本実施形態の動作
を図2〜図6を参照しながらより詳細に説明する。
【0021】(パタン抽出処理)図2はパタン抽出処理
部4で文字単位の切り出しを行う投影分割法を説明する
ための模式図である。ここでは、4行(L1−L4)7列
(C1−C7)に文字が記載されたテキスト原稿がスキャ
ンされて2値画像データがパタン抽出処理部4に入力さ
れたものと仮定する。パタン抽出処理部4では、次に述
べるような投影分割法及びバウンダリトレース法を併用
することによって各文字の切り出し及びパタン抽出を行
う。
【0022】図2に示すように、投影分割法では、主走
査方向及び副走査方向でそれぞれ黒画素をカウントし、
その累積分布を測定することによってマークパタンの切
り出しを行う。まず主走査1ライン単位に黒画素をカウ
ントする。そのとき、文字が並んでいるラインは黒画素
の数が大きくなり、行間はほとんど黒画素が存在しな
い。従って、副走査方向に黒画素数の多寡に応じた累積
波形20が得られ、この波形のピーク間隔を検出するこ
とで行単位の分離が可能となる。同様な黒画素数の測定
を副走査方向でも実行することによって主走査方向に黒
画素数の多寡に応じた累積波形21が得られ、この波形
のピーク間隔を検出することで列単位の分離が可能とな
る。このような黒画素数測定によって各行における一文
字単位の切り出しが可能となる。
【0023】図3は、パタン抽出処理部4で文字単位の
切り出しを行うバウンダリトレース法を説明するための
文字パタンを示す模式図である。バウンダリトレースに
よって、2値画像データの黒画素の連結する集合が検出
され、その黒画素の連結を包含する最小の矩形のビット
マップを1つのマークパタンとする。図3に示す例で
は、アルファベットの「a」及び「b」をマーク化した
例を示す。抽出されたマークパタンについては、その矩
形22及び23のビットマップデータと矩形の高さh、
幅w、そしてドキュメント原稿におけるそのマークの位
置データが生成される。なお、バウンダリトレースだけ
を用いる方法では、例えば「i」や「j」といった黒画
素が連給していない文字についてはマークパタンが2分
割されてしまうので、文字切り出し精度を向上させるた
めには上記投影分割法との併用が有効である。
【0024】パタン抽出処理部4で作成されたマークパ
タンのサイズデータ、位置データは、マルチシンボル算
術符号化部16に入力され、データ圧縮処理が施され
る。また、サイズデータはフォントサイズタイプ検出部
8に出力され、ここでそのフォントサイズに最もマッチ
するフォントタイプの解析を行い、その決定を行う。こ
のフォントサイズタイプ検出部8からフォント9へ出力
されるデータは、例えば、フォントタイプ:ゴシック、
文字サイズ:10ポイントといった文字タイプデータで
ある。
【0025】(マッチング処理)パタン抽出処理部4で
作成されたマークパタンのビットマップデータは、マッ
チング処理部5に入力し、マッチング処理部5では、マ
ークパタンとフォントビットマップライブラリ11及び
テンポラリ更新ライブラリ6に保存されているビットマ
ップパタンが比較される。
【0026】図4は、本実施形態におけるマッチング処
理を説明するためのビットマップパタンの一例を示す模
式図である。ここでは、アルファベット「c]に関する
マッチング処理が示されている。同図(B)に示すスキ
ャナ入力されたマークパタンビットマップデータMBM
Dを入力すると、マッチング処理部5はフォントビット
マップライブラリ11及びテンポラリ更新ライブラリ6
に保存されているビットマップデータFBMD及びTB
MDとの比較を行うが、実際にはこれらライブラリに保
存されているビットマップをすべて比較するのではな
く、候補の絞り込みが行われる。例えば、マークパタン
のサイズ等が比較的近似しているライブラリ内の矩形ビ
ットマップをマッチング処理の候補とする。マークパタ
ンサイズを絞り込み条件とすれば、フォントビットマッ
プライブラリ11あるいはテンポラリ更新ライブラリ6
に格納されているアルファベット「c]は矩形のサイズ
が比較的近似しているのでマッチングの候補となり得
る。
【0027】マッチングは矩形の4つの角にあわせて行
われ、そのなかで最もマッチエラーの少なくなる位置が
選択される。ここでは、右上角Pに合わせた場合にその
マッチエラー画素数が最も少なくなるので、右上角に合
わせた形でそのマッチエラーが求められる。こうして候
補として読み出されたライブラリ内のビットマップデー
タとの間でマッチエラーが求められ、最も少ないものが
マッチするライブラリパタンであると判定される。
【0028】より具体的には、まずマークパタンのビッ
トマップMBMDとフォントビットマップライブラリ1
1内に保存されているビットマップFBMDとのマッチ
ング処理が実行される。この時にアンマッチと判定され
た場合には、つまりマッチエラー画素が多かった場合に
は、標準フォント以外のマークパタン(例えば手書き文
字、グラフィック)と判断され、続いてテンポラリ更新
ライブラリ6に保存されているビットマップTBMDと
のマッチング処理が実行される。これら一連のマッチン
グ処理において、最もマッチエラーが少ないマッチエラ
ーパタンとマークパタンのビットマップが、マッチエラ
ー補正処理部12へ出力される。
【0029】マッチ及びアンマッチの判定は、最も少な
いマッチエラーの画素数のマークパタンの全画素数に対
する比率に従って行われる。例えば、図4に示す例で
は、候補のビットマップからマッチエラーが最も少ない
「c」が最終的に選択され、そのマークパタンの全画素
素数88に対してマッチエラー画素数が7画素であれば
アンマッチ率は約8%となる。アンマッチ率が10%以
下であればマッチしていると判断するものとすれば、ス
キャナ入力のビットマップMBMDはライブラリ内のビ
ットマップ「c」とマッチしていると判定される。
【0030】こうしてマッチしていると判断されたマー
クパタンについては、マッチしたフォントビットマップ
ライブラリ11もしくはテンポラリ更新ライブラリ6内
のビットマップの識別IDと、マッチングをとった際の
矩形の位置合わせデータとがマルチシンボル算術符号化
部16へ出力されデータ圧縮が行われる。また、マッチ
していると判断されたマークパタンのビットマップ及び
マッチエラーデータMEDはマッチ補正処理部12へ出
力され、次に述べるマッチ補正処理が行われる。
【0031】(マッチエラー補正)図4(C)に示すよ
うに上記マッチング処理によってマッチエラー画素31
〜34が検出されたものとすると、マッチエラー補正処
理部12ではこれらのマッチエラー画素について反転処
理が実行される。ただし、単純に反転するだけでなく、
マッチエラー補正処理に関して条件処理を付加すること
も可能である。例えば、図4(C)に示す場合、孤立し
ているマッチエラー画素31〜33についてはマークパ
タンビットマップの反転処理を行い、2画素以上連続し
ているマッチエラー画素群34については反転処理を行
わない。また、マッチング処理部5でフォントビットマ
ップライブラリ11及びテンポラリ更新ライブラリ6の
いずれのビットマップともアンマッチであると判断され
たマークパタンについては、マッチエラー補正処理部1
2では特に補正処理を行わない。
【0032】このマッチエラー補正処理部12から出力
されたマークパタンのビットマップデータは、上述した
ようにアンマッチと判断された場合とテンポラリ更新ラ
イブラリ6内のビットマップデータとマッチしていた場
合にのみ、テンポラリ更新ライブラリ6に新規ID登録
され、その際マッチ頻度の低いライブラリビットマップ
がテンポラリ更新ライブラリから消去される。
【0033】(予測テンプレートの生成)マークパタン
のビットマップデータのデータ圧縮を行うにあたり、ア
ンマッチのマークパタンはアンマッチ用テンプレート作
成部13で作られた予測テンプレート画素が使用され、
マッチしたマークパタンはマッチ用テンプレート14で
作成された予測テンプレート画素が使用される。
【0034】図5はアンマッチ用テンプレートの一例を
示す模式図であり、符号化されるべき画素xの周辺に存
在する10画素を予測画素として用い圧縮を行う。図中
の抽出パタンとはマークパタンのビットマップを意味す
る。
【0035】図6はマッチ用テンプレートの一例を示す
模式図であり、同図(A)に示す符号化されるべき画素
xの周辺4画素と同図(B)に示すマッチしたライブラ
リ内のビットマップデータ7画素を利用して圧縮を行
う。図中の抽出パタンとはマークパタンのビットマップ
を意味し、ライブラリパタンとはマッチしたライブラリ
のビットマップを意味する。ここでは、ライブラリパタ
ンの7番の位置の画素が符号化されるべき画素xと同一
位置にあたる。
【0036】アンマッチ用テンプレート作成部13及び
マッチ用テンプレート14で作成された予測テンプレー
ト画素及び符号化されるべき画素xは、テンプレート選
択部15に出力され、マッチング処理部5の判定結果に
基いていずれのテンプレートを利用して圧縮すべきかが
選択される。選択されたテンプレート画素及び符号化さ
れるべき画素xが2シンボル算術符号化部17に出力さ
れ、マークパタン単位にビットマップデータの圧縮が実
行される。
【0037】以上説明した第1実施形態の他に、本発明
の第2実施形態としては、原稿入カスキャナ1で原稿を
読みとる前に、そのドキュメント原稿が作成された時の
フォントタイプ及びフォントサイズを操作部9から入力
することによって、そのフォントサイズとタイプデータ
をフォントタイプ検出部8へ出力する方法も考えられ
る。本操作を実施する事によって、フォントビットマッ
プライブラリ11とパタン抽出処理部4で作られるマー
クパタンのビットマップデータのマッチする確率が高く
なり、画像品質の改善、データ圧縮効率のさらなる向上
が期待できる。
【0038】さらに、本発明の第3実施形態として、テ
ンポラリ更新ライブラリ6に対して新規ID登録を行う
条件を次のように緩和することも可能である。すなわ
ち、第1実施形態ではマッチング補正処理部12からの
マークパタンのビットマップデータはアンマッチと判断
された場合とテンポラリ更新ライブラリ6内のビットマ
ップデータとマッチしていた場合にのみテンポラリ更新
ライブラリ6に新規ID登録する限定をもうけていた
が、フォントビットマップライブラリ11内のビットマ
ップデータとマッチした場合にもテンポラリ更新ライブ
ラリ6に新規ID登録することも可能である。この実施
形態は、例えば通信上のデータ圧縮に適用可能となる。
通信相手側がフォント及びフォントビットマップライブ
ラリを持たない場合でもテンポラリ更新ライブラリだけ
を有していれば、上記圧縮データの通信を実現できるか
らである。
【0039】本発明によれば、テンポラリ更新ライブラ
リに登録するビットマップデータと併行して標準のフォ
ントビットマップパタンをマッチング処理に用いること
によって画像品質の大幅な改善を達成できる。更に、入
力画像パタンがテンポラリビットマップパタンと標準の
フォントビットマップパタンとのいずれにもマッチしな
い場合あるいはテンポラリビットマップパタンだけにマ
ッチし且つ補正された場合のみテンポラリ更新ライブラ
リへ新規登録を行うことにより、テンポラリ更新ライブ
ラリの無駄な登録を回避でき効率的な使用を達成でき
る。従って、パーソナルコンピュータやワードプロセッ
サ等で使用されるフォントを格納しておけば、フォント
印字されたドキュメント原稿のマークパタンとのマッチ
率を向上させることができ、画像データ圧縮率を大幅に
改善することができる。
【図面の簡単な説明】
【図1】本発明によるパタンマッチング符号化装置の一
実施形態を示すブロック構成図である。
【図2】パタン抽出処理部4で文字単位の切り出しを行
う投影分割法を説明するための模式図である。
【図3】パタン抽出処理部4で文字単位の切り出しを行
うバウンダリトレース法を説明するための文字パタンを
示す模式図である。
【図4】本実施形態におけるマッチング処理を説明する
ためのビットマップパタンの一例を示す模式図である。
【図5】アンマッチ用テンプレートの一例を示す模式図
である。
【図6】マッチ用テンプレートの一例を示す模式図であ
り、(A)は符号化されるべき画素xの周辺4画素を示
し、(B)はマッチしたライブラリ内のビットマップデ
ータ7画素を示す。
【符号の説明】
1 原稿入カスキャナ 2 2値化処理部 3 スムージング処理部 4 パタン抽出処理部 5 マッチング処理部 6 テンポラリ更新ライブラリ 7 操作部 8 フォントサイズタイプ検出部 9 フォント 10 フォントビットマップ展開部 11 フォントビットマップライブラリ 12 マッチエラー補正処理部 13 アンマッチ用テンプレート作成部 14 マッチ用テンプレート作成部 15 テンプレート選択部 16 マルチシンボル算術符号化部 17 2シンボル算術符号化部
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成9年1月16日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】変更
【補正内容】
【図面の簡単な説明】
【図1】本発明によるパタンマッチング符号化装置の一
実施形態を示すブロック構成図である。
【図2】パタン抽出処理部4で文字単位の切り出しを行
う投影分割法を説明するための模式図である。
【図3】パタン抽出処理部4で文字単位の切り出しを行
うバウンダリトレース法を説明するための文字パタンを
示す模式図である。
【図4】本実施形態におけるマッチング処理を説明する
ためのビットマップパタンの一例を示す模式図である。
【図5】アンマッチ用テンプレートの一例を示す模式図
である。
【図6】マッチ用テンプレートの一例を示す模式図であ
り、(A)は符号化されるべき画素xの周辺4画素を示
し、(B)はマッチしたライブラリ内のビットマップデ
ータ7画素を示す。
【図7】テンポラリ更新ライブラリを有する従来の2値
静止画像のパタンマッチング符号化装置の一例を示すに
ブロック図である。
【符号の説明】 1 原稿入カスキャナ 2 2値化処理部 3 スムージング処理部 4 パタン抽出処理部 5 マッチング処理部 6 テンポラリ更新ライブラリ 7 操作部 8 フォントサイズタイプ検出部 9 フォント 10 フォントビットマップ展開部 11 フォントビットマップライブラリ 12 マッチエラー補正処理部 13 アンマッチ用テンプレート作成部 14 マッチ用テンプレート作成部 15 テンプレート選択部 16 マルチシンボル算術符号化部 17 2シンボル算術符号化部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力された2値画像データから単位パタ
    ンをそれぞれ識別し、ライブラリパタンとのパタンマッ
    チングを行った結果に基づいて前記単位パタンの符号化
    を行う装置において、 前記単位パタンに基づいて更新可能な第1ライブラリパ
    タンを格納する第1記憶手段と、 予め指定されたフォントの第2ライブラリパタンを格納
    する第2記憶手段と、 前記単位パタンを第1ライブラリパタン及び第2ライブ
    ラリパタンと比較することでパタンマッチング処理を行
    うパタンマッチング手段と、 からなることを特徴とするパタンマッチング符号化装
    置。
  2. 【請求項2】 請求項1記載のパタンマッチング符号化
    装置は、更に、更新制御手段を有し、 前記更新制御手段は、前記パタンマッチング処理によっ
    て前記単位パタンが前記第1ライブラリパタンとのみマ
    ッチすると判定され且つ前記第1ライブラリパタンと同
    一ではない場合、前記単位パタンを前記第1記憶手段に
    新規登録することを特徴とするパタンマッチング符号化
    装置。
  3. 【請求項3】 前記更新制御手段は、更に、前記パタン
    マッチング処理によって前記単位パタンが前記第1ライ
    ブラリパタン及び第2ライブラリパタンのいずれともア
    ンマッチであると判定された場合、前記単位パタンを前
    記第1記憶手段に新規登録することを特徴とする請求項
    2記載のパタンマッチング符号化装置。
  4. 【請求項4】 前記マッチング処理は、前記単位パタン
    のビットマップデータと前記第1ライブラリパタン及び
    第2ライブラリパタンのビットマップデータとの比較を
    行い、これらビットマップの不一致画素数の割合が予め
    定められた値より小さい場合にマッチすると判定し、そ
    れより大きい場合にアンマッチと判定することを特徴と
    する請求項1ないし3のいずれかに記載のパタンマッチ
    ング符号化装置。
  5. 【請求項5】 複数種類のフォントを格納するフォント
    格納手段と、 前記フォントのうちの1つを指定するフォント指定手段
    と、 前記指定されたフォントをフォントビットマップへ展開
    し前記第2ライブラリパタンを生成するフォント展開手
    段と、 を更に有することを特徴とする請求項1記載のパタンマ
    ッチング符号化装置。
  6. 【請求項6】 前記フォント指定手段は、前記単位パタ
    ンからフォントサイズ及びフォントタイプを検出し、前
    記フォントを指定することを特徴とする請求項5記載の
    パタンマッチング符号化装置。
  7. 【請求項7】 前記フォント指定手段は、外部から前記
    フォント指定を行う入力手段からなることを特徴とする
    請求項5記載のパタンマッチング符号化装置。
  8. 【請求項8】 入力された2値画像データから単位パタ
    ンをそれぞれ識別し、ライブラリパタンとのパタンマッ
    チングを行った結果に基づいて前記単位パタンの符号化
    を行う方法において、 前記単位パタンに基づいて更新可能な第1ライブラリパ
    タンを格納するステップと、 予め指定されたフォントの第2ライブラリパタンを格納
    するステップと、 前記単位パタンと第1ライブラリパタン及び第2ライブ
    ラリパタンとを比較するステップと、 前記単位パタンが前記第1ライブラリパタンとのみマッ
    チすると判定され且つ前記第1ライブラリパタンと同一
    ではない場合あるいは前記単位パタンが前記第1ライブ
    ラリパタン及び第2ライブラリパタンのいずれともアン
    マッチであると判定された場合に、前記単位パタンを第
    1ライブラリパタンとして新規登録するステップと、 からなることを特徴とするパタンマッチング符号化方
    法。
JP8308771A 1996-11-05 1996-11-05 パタンマッチング符号化装置及び方法 Expired - Fee Related JP2940496B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP8308771A JP2940496B2 (ja) 1996-11-05 1996-11-05 パタンマッチング符号化装置及び方法
EP97308868A EP0840498B1 (en) 1996-11-05 1997-11-05 Method and apparatus for pattern matching encoding
US08/964,633 US6016361A (en) 1996-11-05 1997-11-05 Method and apparatus for compressing binary data using pattern matching encoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8308771A JP2940496B2 (ja) 1996-11-05 1996-11-05 パタンマッチング符号化装置及び方法

Publications (2)

Publication Number Publication Date
JPH10134192A true JPH10134192A (ja) 1998-05-22
JP2940496B2 JP2940496B2 (ja) 1999-08-25

Family

ID=17985111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8308771A Expired - Fee Related JP2940496B2 (ja) 1996-11-05 1996-11-05 パタンマッチング符号化装置及び方法

Country Status (3)

Country Link
US (1) US6016361A (ja)
EP (1) EP0840498B1 (ja)
JP (1) JP2940496B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6701022B2 (en) 2000-01-18 2004-03-02 Nec Corporation Pattern matching coding device and method thereof

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3095071B2 (ja) * 1998-04-21 2000-10-03 日本電気株式会社 パタンマッチング符号化装置、及びその符号化方法
JP2004304424A (ja) * 2003-03-31 2004-10-28 Fujitsu Ltd 画像圧縮方法、プログラム、記憶媒体及び装置
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US7697074B2 (en) * 2006-02-08 2010-04-13 Broadcom Corporation System and method for video processing demonstration
US20080050017A1 (en) * 2006-08-25 2008-02-28 Via Telecom Co., Ltd Transmission and reception of handwritten data on wireless devices without character recognition
US20100138575A1 (en) 2008-12-01 2010-06-03 Micron Technology, Inc. Devices, systems, and methods to synchronize simultaneous dma parallel processing of a single data stream by multiple devices
US8140780B2 (en) * 2008-12-31 2012-03-20 Micron Technology, Inc. Systems, methods, and devices for configuring a device
US20100174887A1 (en) 2009-01-07 2010-07-08 Micron Technology Inc. Buses for Pattern-Recognition Processors
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9323994B2 (en) 2009-12-15 2016-04-26 Micron Technology, Inc. Multi-level hierarchical routing matrices for pattern-recognition processors
US8515208B2 (en) * 2010-04-05 2013-08-20 Kofax, Inc. Method for document to template alignment
US8832621B1 (en) 2011-11-28 2014-09-09 Cadence Design Systems, Inc. Topology design using squish patterns
US9053259B1 (en) * 2011-11-28 2015-06-09 Cadence Design Systems, Inc. Methods, systems, and articles of manufacture for implementing pattern-based design enabled manufacturing of electronic circuit designs
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US8855375B2 (en) 2012-01-12 2014-10-07 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US20130275709A1 (en) 2012-04-12 2013-10-17 Micron Technology, Inc. Methods for reading data from a storage buffer including delaying activation of a column select
US9524248B2 (en) 2012-07-18 2016-12-20 Micron Technology, Inc. Memory management for a hierarchical memory system
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
WO2014160426A1 (en) 2013-03-13 2014-10-02 Kofax, Inc. Classifying objects in digital images captured using mobile devices
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US9703574B2 (en) 2013-03-15 2017-07-11 Micron Technology, Inc. Overflow detection and correction in state machine engines
US9448965B2 (en) 2013-03-15 2016-09-20 Micron Technology, Inc. Receiving data streams in parallel and providing a first portion of data to a first state machine engine and a second portion to a second state machine
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
JP2016518790A (ja) 2013-05-03 2016-06-23 コファックス, インコーポレイテッド モバイル装置を用いて取込まれたビデオにおけるオブジェクトを検出および分類するためのシステムおよび方法
WO2015073920A1 (en) 2013-11-15 2015-05-21 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
WO2016109571A1 (en) 2014-12-30 2016-07-07 Micron Technology, Inc Devices for time division multiplexing of state machine engine signals
WO2016109570A1 (en) 2014-12-30 2016-07-07 Micron Technology, Inc Systems and devices for accessing a state machine
US11366675B2 (en) 2014-12-30 2022-06-21 Micron Technology, Inc. Systems and devices for accessing a state machine
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10691964B2 (en) 2015-10-06 2020-06-23 Micron Technology, Inc. Methods and systems for event reporting
US10977309B2 (en) 2015-10-06 2021-04-13 Micron Technology, Inc. Methods and systems for creating networks
US10846103B2 (en) 2015-10-06 2020-11-24 Micron Technology, Inc. Methods and systems for representing processing resources
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10146555B2 (en) 2016-07-21 2018-12-04 Micron Technology, Inc. Adaptive routing to avoid non-repairable memory and logic defects on automata processor
US10019311B2 (en) 2016-09-29 2018-07-10 Micron Technology, Inc. Validation of a symbol response memory
US10268602B2 (en) 2016-09-29 2019-04-23 Micron Technology, Inc. System and method for individual addressing
US10592450B2 (en) 2016-10-20 2020-03-17 Micron Technology, Inc. Custom compute cores in integrated circuit devices
US10929764B2 (en) 2016-10-20 2021-02-23 Micron Technology, Inc. Boolean satisfiability
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
CN109032616A (zh) * 2018-06-08 2018-12-18 重庆洋逸乐科技有限公司 一种字库烧写方法、电子设备和存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3191150A (en) * 1962-10-30 1965-06-22 Ibm Specimen identification system with adaptive and non-adaptive storage comparators
US4410916A (en) * 1979-08-24 1983-10-18 Compression Labs, Inc. Dual mode facsimile coding system and method
JPS57178578A (en) * 1981-04-27 1982-11-02 Toshiba Corp Pattern recognition system
US4606069A (en) * 1983-06-10 1986-08-12 At&T Bell Laboratories Apparatus and method for compression of facsimile information by pattern matching
JPS60254871A (ja) * 1984-05-31 1985-12-16 Kokusai Denshin Denwa Co Ltd <Kdd> フアクシミリ画像の符号化方法
US4944022A (en) * 1986-12-19 1990-07-24 Ricoh Company, Ltd. Method of creating dictionary for character recognition
JPH01118966A (ja) * 1987-10-31 1989-05-11 Toshiba Corp パタン認識装置
JP3008403B2 (ja) * 1989-01-24 2000-02-14 株式会社日立製作所 符号化方法及び符号化装置
JPH03240173A (ja) * 1990-02-16 1991-10-25 Fujitsu Ltd 画像データ圧縮方式
US5303313A (en) * 1991-12-16 1994-04-12 Cartesian Products, Inc. Method and apparatus for compression of images
CN1027472C (zh) * 1992-01-27 1995-01-18 富士通株式会社 文字生成方法及其装置
JP3193140B2 (ja) * 1992-07-17 2001-07-30 株式会社リコー 画像と符号のデータ圧縮方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6701022B2 (en) 2000-01-18 2004-03-02 Nec Corporation Pattern matching coding device and method thereof

Also Published As

Publication number Publication date
JP2940496B2 (ja) 1999-08-25
EP0840498B1 (en) 2006-01-11
EP0840498A3 (en) 1999-07-14
US6016361A (en) 2000-01-18
EP0840498A2 (en) 1998-05-06

Similar Documents

Publication Publication Date Title
JP2940496B2 (ja) パタンマッチング符号化装置及び方法
US7889926B2 (en) Image dictionary creating apparatus, coding apparatus, image dictionary creating method
US6532461B2 (en) Apparatus and methodology for submitting search oueries
US7664321B2 (en) Image processing method, system, program, program storage medium and information processing apparatus
US6226402B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP4742404B2 (ja) 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
US6701022B2 (en) Pattern matching coding device and method thereof
JPH07505024A (ja) イメージ圧縮の方法および装置
JP2001092919A (ja) 2次元バーコードのねじれ角決定法
JPH10143604A (ja) パタン抽出装置
US20030048949A1 (en) Document matching and annotation lifting
US20050226516A1 (en) Image dictionary creating apparatus and method
US7406201B2 (en) Correcting segmentation errors in OCR
US5357602A (en) Apparatus for transforming a two-level image into contour vectors by decomposing composite figures into &#34;unitary&#34; (open) and closed-loop figures, especially suitable for minimizing memory use while maintaining system processing speed
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
JP3082837B2 (ja) パタンマッチング符号化装置、復号化装置及び記録媒体
JP3261208B2 (ja) 画情報予測符号化および復号化装置
JP2000076378A (ja) 文字認識方法
JPH1013842A (ja) マルコフモデル画像符号化装置
US5666440A (en) Method and apparatus for extracting outline data from bi-level image data
JP2697790B2 (ja) 文字タイプ決定方法
JPS58125183A (ja) 光学文字読取装置における認識不能文字表示方法
JP3486246B2 (ja) 文字認識装置
JP4084535B2 (ja) 圧縮画像の修正装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990518

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080618

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090618

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100618

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100618

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110618

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110618

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120618

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120618

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees