JPH07168948A - 文書イメージ品質改善方法 - Google Patents

文書イメージ品質改善方法

Info

Publication number
JPH07168948A
JPH07168948A JP6240667A JP24066794A JPH07168948A JP H07168948 A JPH07168948 A JP H07168948A JP 6240667 A JP6240667 A JP 6240667A JP 24066794 A JP24066794 A JP 24066794A JP H07168948 A JPH07168948 A JP H07168948A
Authority
JP
Japan
Prior art keywords
character
pattern
document
prototype
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6240667A
Other languages
English (en)
Other versions
JP3359433B2 (ja
Inventor
Piaasu Maaku
ピアース マーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JPH07168948A publication Critical patent/JPH07168948A/ja
Application granted granted Critical
Publication of JP3359433B2 publication Critical patent/JP3359433B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【構成】 ビットマップイメージ140の中の文字パタ
ーンの文字認識を行ない、各文字パターンを文字種類に
従って分類する。文字種類毎に、そのビットマップイメ
ージ中のパターンを用いて”理想的な”プロトタイプ文
字を作る。そして、ビットマップイメージ中の文字パタ
ーンを、該当文字種のプロトタイプ文字で置き換える。
例えば、文字”e”のパターン150,152,154
等々より、文字種”e”に対するプロトタイプ文字を作
成し、このプロトタイプ文字でパターン150,15
2,154等々を置き換える。 【効果】 ビットマップイメージの品質を向上し、文字
の統一性を与える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、デジタルイメージ処理
に係り、特に、デジタル表現の文字イメージの品質改善
のための技術に関する。
【0002】
【従来の技術】現在、デジタル技術は情報転送のために
様々な形で利用されている。一般的な一つの方法は、フ
ァクシミリつまり”fax”マシンを使用して文書(do
cument)をある場所から別の場所へ伝送する。普通、文
書は送信する場所でデジタルビットマップ表現に変換さ
れる。次に、このビットマップのビットが電気信号に変
換され、例えば電話回線によって、受信側へ伝送され
る。受信側で、この電気信号は再びオリジナル文書のビ
ットマップ表現へ変換され、このビットマップを用いて
オリジナル文書の精密に近似したものがペーパー上に再
生される。
【0003】しかし、よく知られていることであるが、
faxにより文書を伝送すると、受信側で得られる文書
の品質が低下する。この品質低下の要因は、送信機構、
伝送機構または受信機構の”ノイズ”、オリジナル文書
のしみや汚れ、送信側faxにおける文書読み取りの低
解像度など様々である。これらの問題点を修正するため
の従来の試みとして、Lim及びAdachiによる方法があ
る(J.S. Lim,"Two-Dimmensional Signal and
Image Processing,” pp.570-575,Prentice-
Hall,1990;Adach,Kawanishi,Kobayashi, "
Improvementof Character Recognitionand Generat
ion Techniques in FacsimileCommunication Syste
ms,” pp.732-738,Proceedings SeventhAnnu
al Joint Conference of the IEEE Computer an
d CommunicationSocieties,1988)。Limの方法
はページサイズ単位の分析をする方法であるが、Adach
iの方法は個々の文字の表現の平滑化をする方法であ
る。
【0004】したがって、受信側faxマシンで受信文
書の再生品質を向上させるための方法及び装置が望まれ
る。
【0005】
【発明が解決しようとする課題】本発明の目的は、受信
側faxマシンにおいてテキスト文書の再生品質を向上
させる用途に好適で、かつ、テキスト文書のあらゆるビ
ットマップ表現の品質改善に一般的に適用できる文書イ
メージ品質改善方法を提供することにある。
【0006】
【課題を解決するための手段】本発明は、この目的を達
成するため、ビットマップ中の各文字パターン(instan
ce)について光学的文字認識を行ない、ビットマップ中
に存在する各文字種類に1カテゴリーずつ、複数のカテ
ゴリーに各パターンを分類する。各カテゴリーにつ
き、”理想的な”プロトタイプ文字を導出する。このプ
ロトタイプ文字を文字のパターンより導出する方法とし
て、様々な方法を用い得る。そして、プロトタイプ文字
によって、ビットマップ中の当該プロトタイプ文字と同
じカテゴリーに属する文字のパターンを置き換える。以
上のステップを各カテゴリーについて実行後に、得られ
た”再生”(regenerated)ビットマップイメージを用
い、文書の最終的な印刷イメージを作成する。
【0007】
【作用】プロトタイプ文字を導出し、このプロトタイプ
文字によって同種類の各文字を置き換えることにより、
文書の見映えが向上する。これは、文字の表現より、汚
れ、エッジのぎざぎざ等の”ノイズ”が減らされ、ある
いは除去されるからである。また、同一のプロトタイプ
文字が、同じ種類の文字のすべてのパターンの代わりに
用いられるため、文字種類の表現が統一された文書を得
られる。
【0008】
【実施例】本発明の方法の好適な実施例は、プロセッ
サ、メモリ、ユーザ入力装置及び出力装置からなるデジ
タルシステム上で実行されるソフトウエアを含む。この
方法は、ビットマップイメージ中の文字パターンを検出
するステップ、各文字の第1及び第2のパターンを選ぶ
ステップ、選んだパターンを用いてプロトタイプ文字を
導出するステップ、ビットマップ中の選択されたパター
ンをプロトタイプ文字に置き換えることにより再生ビッ
トマップイメージを作るステップ、及び、再生ビットマ
ップイメージを出力するステップからなる。
【0009】ステップをいくつか追加することにより、
以上のステップ中に生じる可能性のあるエラー、例えば
文字パターン選択のエラーの影響が少なくなる。好適な
実施例においては、パターンと各カテゴリーのプロトタ
イプ文字との比較が行なわれる。パターンが、その初め
に関係付けられたカテゴリーのプロトタイプ文字より以
上に、別のカテゴリーのプロトタイプ文字に似ている場
合には、このパターンを初めのカテゴリーより廃棄し、
当該廃棄されたパターンを用いないで、当該カテゴリー
に関するプロトタイプ文字の導出をやり直す。
【0010】以下、本発明の好適実施例について、図面
を参照し詳細に説明する。図1は、本発明のソフトウエ
アを実行するために使用される一般的なコンピュータシ
ステムの構成図である。このコンピュータシステム10
0は、プロセッサ102、システムメモリ104、I/
Oコントローラ106、ディスプレイアダプター10
8、モニター110、シリアルポート112、キーボー
ド114、固定ディスク装置116、外部インターフェ
ース118、プリンタ120といったサブシステムから
なる。
【0011】本発明用に好適なデジタルシステムはこれ
に限られるものではなく、サブシステムを増加または減
少した他のデジタルシステムでもよい。例えば、プロセ
ッサ102を2個以上持つデジタルシステム(つまりマ
ルチプロセッサ・システム)でもよい。また、キャッシ
ュメモリを持つシステムでもよい。ディスプレイアダプ
ター108、モニター110のようなサブシステムは、
本発明のある実施例では必要でなく、それらの機能は例
えば、発光ダイオード(”LED”)ディスプレイでな
される。
【0012】122等の矢印はコンピュータシステム1
00のシステムバス・アーキテクチャを示している。し
かし、これらの矢印は、サブシステムの結合のための内
部接続関係を例示しているにすぎない。例えば、プリン
タ120は、あるポート(図示されていない)を介して
他のサブシステムに接続してもよい。好適な実施例にお
いては、電話回線がコンピュータシステム100に接続
される。この電話回線は、コンピュータシステム100
を外部のfaxマシンに接続するために利用される。コ
ンピュータシステム100はそれ自体、次に述べるよう
に、文書のビットマップイメージを受信して印刷するの
に適したfax受信機の基本的コンポーネントを備えて
いる。
【0013】コンピュータシステム100がfax受信
機として動作する時には、文書のビットマップイメージ
を表わすデジタルデータが、例えばシリアルポート11
2を通じて受信されて、システムメモリ104に格納さ
れる。後述のように、プロセッサ102は、このビット
マップイメージ及びシステムメモリ104を処理して、
品質を向上させたビットマップイメージを作る。この品
質の向上したビットマップイメージがプリンタ120よ
り出力されて、ぺーパー文書が作られるが、このペーパ
ー文書はfax送信機より伝送された文書のイメージで
ある。
【0014】図1に示したコンピュータシステム100
は、本発明に使用するのに適したコンピュータシステム
の一例にすぎない。当業者にとって、本発明に利用する
のに適した別のサブシステム構成は容易にわかるであろ
う。faxに応用するものとしての好適実施例について
本発明を説明しているが、スキャナから入力するイメー
ジの品質向上など、本発明の他の用途は明らかであろ
う。
【0015】図2は、本発明の一実施例の説明に使用す
るためのビットマップイメージの一例として、図1のシ
ステムメモリ104内にあるビットマップイメージの一
部140を示す。図2を見れば分かるように、このビッ
トマップイメージの部分には、文字から構成されたワー
ドが含まれているが、その文字は小矩形つまり”画素”
(picture element)から構成され、その1つの画素は
ビットマップイメージ中の1つのビットに対応してい
る。一般的なfaxの読み取り解像度である100〜2
00ドット/インチ(”dpi”)では、一般的な文字
は15〜30画素幅となろう。なお、ここでは100〜
200dpiの読み取り解像度の例を用いて本発明を説
明するが、任意の解像度で表現された文字について本発
明を適用し得るものである。
【0016】ここでは図2のような図をビットマップイ
メージ、マトリクス、文字パターン等々の説明のために
使用するが、このような表現は、例えば、ビットマップ
イメージ、マトリクス、文字パターンをプリントアウト
した時に通常得られる人間に判読可能な唯一の形式であ
ると理解される。当該技術分野において周知のように、
ビットマップイメージ等は、メモリ内のワードからなる
配列または他のデータ構造により表わされ、当該ワード
は連続的に並んでいることが多い。各画素の(グレース
ケール、色、輝度等を表わす)値の数に応じて、各画素
を表現するのにメモリの1ワード、メモリの1ワードの
一部、あるいはメモリの複数ワードが使用される。本明
細書で扱う位置合わせ(aligning)、加算等の操作は、
各図に示された人間に判読可能なフォームを対象にして
説明するが、当該技術分野において周知の、コンピュー
タによる同様操作もある。例えば、2つの文字パターン
の”位置合わせ”は、視覚的には、一方の文字パターン
の人間に判読可能なフォームを、他方の文字パターンの
人間に判読可能なフォームの上に重ねることにより行な
われるが、この処理はFig.1のコンピュータシステ
ムのようなコンピュータシステムでビットストリング、
配列等(これは内部データ表現方法によって決まる)を
操作及び比較することによって行なわれる。
【0017】図2のビットマップイメージ中の各文字が
切り出され、そして、その文字イメージが抽出される、
すなわち文字パターンがシステムメモリの1つの独立し
た領域へコピーされる。1つの文字が抽出される時に、
その文字の構成画素と、それに隣接した領域の空白画素
とをあわせたものが、その文字の”パターン”(instan
ce)であると考えられる。ビットマップイメージ中の個
々の文字の識別は、当該技術分野において周知の光学的
文字認識(”OCR”)方法または方式によって行なわ
れる。
【0018】図2に、文字”e”の3個のパターン15
0,152,154を境界枠で囲んで示す。文字”e”
の各パターンは、境界枠内の”オン”画素つまり黒画素
と”オフ”画素つまり白画素から構成される。
【0019】この認識及び抽出プロセスは、ビットマッ
プイメージ中の異なった文字種類それぞれについて実行
される。ビットマップイメージ中の各文字種類は、別々
の文字クラスまたは文字カテゴリーと考えられる。そこ
で、例えば、アルファベットの大文字と小文字の場合は
52個の文字種類ないし文字カテゴリーがある。最後
に、各カテゴリー毎の文字のクラスタを用いて、クラス
タ中の抽出文字パターンの大部分よりも初めに伝送され
た文字によく近似しているところのプロトタイプ文字を
導出する。換言すれば、本発明は、モデル文字を用意
し、これをビットマップイメージ中の文字種類の各パタ
ーンの位置に用いることにより、受信側で印刷した文書
に文字の統一性を持たせる。
【0020】図3は、図2に示したビットマップイメー
ジの一部のようなビットマップイメージより切り出し抽
出した文字種類”e”のクラスタを示す。なお、文字”
e”の各パターンは1つ1つ多少異なっている。ここで
は解像度を粗くしているので、各”e”文字を構成して
いる矩形画素がはっきり見えている。特定カテゴリーの
文字の各パターンを識別してグループにまとめるステッ
プは、”クラスタリング”と呼ばれる。図3に示すよう
な文字のクラスタは、それぞが文字パターンのビットマ
ップを含む配列群に対するポインタによって、メモリ内
に管理することができる。
【0021】ここでは、本発明に関するビットマップイ
メージは、文字”e”の16個のパターンを含むものと
仮定する。そうすると、図3は文字”e”のカテゴリー
のための文字パターンのクラスタ全体を示していること
になる。
【0022】図4は、図3にクラスタが示された文字種
類”e”のためのプロトタイプ文字を示してる。このプ
ロトタイプ文字は格子つまりマトリクスにより示されて
いる。このプロトタイプ文字を導出するために、図3の
クラスタ中の全部の文字が1つの文字にマージされた。
本発明の他の実施例では、後述のように、プロトタイプ
文字の導出の際に文字パターンを全部は使わない。
【0023】図4に示されるように、マージ後のプロト
タイプ”e”は、様々なグレーレベルの画素からなる。
これは、図3のクラスタ中の各パターンをマトリクス
へ”加算”することによって、図4のプロトタイプ文字
が生成されたからである。図4において、色の濃い画素
は、クラスタ中のパターンが高頻度で現われる場所の画
素であり、他方、色の淡い画素はクラスタ中のパターン
の出現頻度が少ない場所の画素を意味する。
【0024】図5は、図3のクラスタに対するプロトタ
イプ文字を示している。図5のプロトタイプ文字を得る
ためには、図4のマージされた文字に”閾値処理”が施
される。この閾値処理は、プロトタイプ文字から、所定
の閾値未満のグレーレベルの画素を除去する。
【0025】次に、図6及び図7のフローチャート並び
に図8(A)乃至図8(D)の説明図を参照して、本発
明を詳細に説明する。
【0026】図6は、本発明の文字再生方法の基本ステ
ップの説明のために用いるフローチャート200を示
す。
【0027】図6において、フローチャート200は、
Fig.1のコンピュータシステムのようなデジタルシ
ステム上で実行される1つまたは複数のソフトウエアル
ーチンを示している。このフローチャート200は、当
該技術分野で知られている任意の手段によって実現し得
るものである。例えば、”C”、Pascal、FOR
TRAN、アセンブリ言語等々、どのようなコンピュー
タプログラミング言語を使用してもよい。さらに、手続
きまたは”オブジェクト指向”プログラミング、人工知
能手法のような種々のプログラミング技法を採用してよ
い。
【0028】フローチャート200の各ステップは、1
つまたは2つ以上のソフトウエアルーチン、プロセス、
サブルーチン、モジュール等々によって実現できる。言
うまでもないが、フローチャート200は本発明の方法
の大まかな論理フローを説明しているだけであって、フ
ローチャート200に別のステップを追加し、あるいは
一部ステップを取り除くことも許される。説明を簡単に
するため、フローチャート200(他のフローチャート
も同様)を、あたかも単一の”ルーチン”であるかのよ
うに扱って説明する。
【0029】フローチャート200のルーチンに202
より入る。テキスト文書のビットマップイメージがコン
ピュータシステムのシステムメモリ内に存在していると
仮定する。ステップ204において、ビットマップイメ
ージ中の文字が切り出されて文字”パターン”とされ
る。ステップ206において、切り出された文字が適当
な光学的文字認識方式によって”認識”されることによ
り、各パターンはある既知の文字種類に関係付けられ
る。ステップ208において、各パターンはその文字種
類に関するクラスタに入れられる。かくして、ステップ
208を終了すると、文書のビットマップイメージ中の
文字全てが切り出されてクラスタに入れられている。こ
こで、各クラスタは、文書のビットマップイメージ中に
現われた1つの文字種類に対応している。
【0030】なお、ステップ204,206,208
は、一般的に、典型的な光学文字認識方式の一部である
ことに注意されたい。また、ステップ204,206,
208の遂行に、適当なOCR方式であれば、どのよう
なものを使用してもよい。
【0031】ステップ208を終了すると、文書のビッ
トマップイメージ中の全ての文字がクラスタに入れら
れ、かつ文字種類との関係付けがなされている。
【0032】ステップ204,206,208は、文字
毎のパターンクラスタに文字を分類するほかに、各パタ
ーンの位置のレコードも作成する。このレコードは、例
えば、1つまたは2つ以上の位置番号を用いて文書ビッ
トマップイメージ内の文字の位置または順序を管理する
配列の形にすることができる。位置番号には、その場所
のパターンの文字種類を指示するための識別子が関係付
けられる。
【0033】ステップ210において、マージのための
1つのカテゴリが選択される。ステップ210の最初の
実行時には、ステップ204,206,208により生
成されたカテゴリ中の任意の1つが、最初に処理すべき
カテゴリとして選択される。ステップ212において、
選択されたカテゴリのクラスタ中の各文字パターンがマ
ージされ、上に述べた小文字”e”のカテゴリに対する
図4のマージ(merged)文字のような、単一の文字が作
られる。マージのステップ212の詳細は、図7と関連
させて後述する。
【0034】ステップ214において、マージすべきク
ラスタの残っている他のカテゴリがあるか確認するため
のテストが行なわれる。残っているならば、ルーチンの
実行はステップ210に戻り、次に処理するカテゴリが
選択される。このようにして、クラスタの全部が最終的
にマージされ、各クラスタ毎に1個のマージ文字が得ら
れる。
【0035】全てのクラスタのマージが済んだ後、ステ
ップ216が実行されて、ビットマップ中の各文字を、
そのカテゴリに対応したマージ文字すなわちプロトタイ
プ文字で置き換える。元のビットマップイメージ中の文
字の位置及び種類に関する情報がステップ204で集め
られたが、この情報は文字のパターンを対応したプロト
タイプ文字で置換するために利用される。このようにし
て得られるビットマップイメージが”再生”(regenera
ted)ビットマップである。なお、再生ビットマップを
新しいビットマップとしてメモリ内に生成し、元のビッ
トマップをそのまま活かしておいてもよい。
【0036】ステップ218において、”再生”ビット
マップイメージを用いてハードコピー文書をプリントア
ウトする。このハードコピー文書は、最初のビットマッ
プイメージに似ているが、各文字種類のプロトタイプ文
字が、ビットマップにおいて当該文字種類のパターンが
出現した全ての場所に使用されるため、同じ文字の各パ
ターンが全く同一である点が違う。
【0037】再生ビットマップイメージをプリントアウ
トした後、ステップ220よりルーチンを抜ける。
【0038】全文字の切り出し、全文字のクラスタリン
グ、全文字のマージ、全文字の置換、全文字のプリント
アウトという独立した概念的ステップの連続として、フ
ローチャート200を説明したが、これらのステップ
を”インターリーブ”または”マルチタスク”方式で実
行してもよい。例えば、印刷用ハードウエアが低速であ
るためシステムに”ボトルネック”を生じる場合、ビッ
トマップの文字の置換を1行ずつ行なって、最初の1行
の置換が済んだ後に印刷を開始するようにする。ビット
マップの後続行は、その後に置換が行なわれ、プリンタ
より要求される前に印刷可能になる。このフローチャー
ト200及び他のフローチャートの処理の編成方法は他
に様々あるが、それは当業者には明らかであろう。
【0039】図7は、図6のステップ212を実行する
ために使用されるサブステップを説明するためのフロー
チャートである。すなわち、ステップ224〜234
は、Fig.6のステップ212のマージ機能を実現す
る。ステップ210及びステップ214がサブステップ
群236の上下にそれぞれ示されているが、これはサブ
ステップ群236がFig.6のフローチャートのステ
ップ210とステップ214の間で実行されるものであ
ることを示すためである。
【0040】図6に関連して述べたように、ステップ2
10が終了すると、1つのカテゴリーがつぎの処理のた
めに選択される。
【0041】この例では引き続き、文字”e”を処理中
のカテゴリーとして用いる。図8の(A)は内部に文
字”e”の画素表現が定義されたマトリクス300を示
している。図8の(A)において、マトリクス300の
格子パターン中の各正方形は1つの画素であり、これは
例えばディスプレイ画像または文字の印刷されるペーパ
ー上で、”オン”または”オフ”のいずれかの状態をと
る。
【0042】なお、マトリクス300は、文字の上下左
右に空白がある。マトリクス300は図6のステップ2
04においてテキストのビットマップイメージより文字
を切り出すために用いられる”境界枠”(bounding bo
x)である。文字を構成する画素は図8(A)に示すも
のより多いことも少ないこともあり、また、境界枠内の
文字の周りの画素はそれより多いことも少ないこともあ
る。
【0043】図7のステップ224において、図8
(A)のマトリクス300によって示されるように、マ
トリクスに1番目のパターンを初期設定する。ステップ
226において、2番目のパターンを取得する。必要な
らば、パターンを”オン”画素の個数に従って順序付け
て1つのリストにしておくことにより、後述のようにパ
ターンを選択し処理する順序を予め決めてもよい。
【0044】図8(B)は本例における2番目のパター
ン302の一例を示している。この例については画素境
界(”境界枠”)が示されていないが、この2番目のパ
ターン302が”オン”画素39個で構成されているこ
とが分かる。2番目のパターン302が、ここでは”選
択”あるいは”現在”パターンであり、図7のステップ
228,230による処理を施される。
【0045】図7のステップ228において、図8
(B)の2番目のパターン302は図8(A)のマトリ
クス300に位置合わせされる。この位置合わせプロセ
スは、選択パターンをマトリクス内で”シフト”させる
ことと、重なり合った”オン”画素の数をカウントする
ことからなる。選択パターンについて、異なったいくつ
かの位置が選ばれ、その”ベストフィット”(best fi
t)が選択される。このベストフィットは、マトリクス
中の”オン”画素と重なる選択パターンの画素数が最大
になるマトリクス内での選択パターンの位置である。
【0046】図8の(C)から(E)は、ステップ22
8の位置合わせプロセスを説明するものである。図8
(C)にマトリクス300が示されている(ここでも、
説明簡略化のため画素境界は示されていない)。最初の
パターン301は図8(A)と同様に示されているが、
重なりが分かるようにするため塗り潰されてはいない。
2番目のパターン302は最初のパターン301と部分
的に重なった位置に示されている。図8(C)より分か
るように、最初のパターン301と選択パターン302
の重なり合う画素の合計数は17個である。
【0047】図8(D)において、最初のパターン30
1は依然としてマトリクス内の一定位置にあるが、選択
パターン302のほうはマトリクス内の新しい位置まで
下側及び左側へシフトされている。図8(D)から分か
るように、最初のパターンと選択パターンの重なり合っ
た”オン”画素の合計数は16個である。
【0048】図8(E)は、最初のパターン301と選
択パターン302とがマトリクス300内でぴったり重
なり合っている状態を示している。図8(E)において
は、重なり合う画素の合計数は34個である。よって、
この簡単な例の場合、図8(E)がまさに最初のパター
ン301と選択パターン302とが最高の重なり状態で
ある。
【0049】図7のステップ230において、上述のよ
うにステップ228によって得られたベストフィットの
位置で、選択パターンが最初のパターンを含むマトリク
スに加算される。図9(A)は、図8(E)と同じマト
リクスを示している。すなわち、図9(A)は、ステッ
プ228の位置合わせ手順により得られた、最初のパタ
ーンと選択パターンとの間の最高の重なり状態を示して
いる。図9(B)は、図9(A)の2つのパターンを”
加算”した結果を示している。
【0050】なお、図9(B)はマトリクス内の2パタ
ーンの加算結果の図的表現を示したものである。好適な
実施例においては、図9(A)のマトリクス300内の
各要素は、例えば1バイトのデータによる数値で表現さ
れる。これらのバイトはマトリクス300と同じサイズ
の配列に格納される。
【0051】図9(B)においてマトリクスの要素の位
置にある1は、そのマトリクス要素に対応したバイトの
値が1であることを表わしている。同様に、数値の2
は、そのマトリクス要素の位置に対応したバイトの値が
2であることを意味する。対応したマトリクス要素位置
に数値が示されていない場合、そのマトリクス要素位置
の値は0である。したがって、マトリクス300に対応
したデータ配列が、クラスタ中の文字のパターンが重ね
られ、位置合わせされて”加算”された時の、”オン”
画素の個数の現在合計数を保存していることが、図9
(B)から分かる。 図7のステップ232において、
このカテゴリーに同じ文字のパターンが他にあるか確認
するための判定が行なわれる。他にパターンが存在する
ならば、処理はステップ226に進み記憶リストより次
のパターンが取得される。好適な実施例にあっては、次
のパターンがそれぞれ、ベストフィットとなるように現
在合計数マトリクスと位置合わせされる。次のパターン
の画素と重なり合う現在合計数マトリクス中の画素が全
て検出される。この重なり合った画素の位置は、データ
配列のどの値(重なり合った画素位置に対応)をインク
リメントすべきか指定するために用いられる。好適な実
施例では、インクリメント量を1とする。
【0052】図9(C)は、文字”e”の16個のパタ
ーンからなるクラスタに対してステップ226〜ステッ
プ232を実行した結果を示している。なお、図9
(C)のデータは、説明のためのものに過ぎず、図3の
クラスタの実際のマージ結果に必ずしも対応していな
い。
【0053】図9(C)から分かるように、データ配列
中のいくつかのバイトの値が16である。これは、対応
したマトリクス要素位置ですべてのパターンが”オン”
画素を持っていたことを意味する。要素位置に数値が示
されていない場合、その位置に対応したデータ配列のバ
イトの値は0である。数値が1から16の間にある場
合、その数値は、そのマトリクス位置に”オン”画素を
有するパターンの個数を示している。
【0054】図7のステップ234において、閾値処理
が行なわれる。閾値処理のための簡単な方法は、クラス
タ中のパターン数を2で割った値を閾値に設定すること
である。クラスタ中のパターン数を16とした当該例に
おいては、閾値は8ということになる。
【0055】図9(C)を参照して、閾値として8を用
い、配列値が8以下のマトリクス要素をオフにし、対応
した配列値が9以上のマトリクス要素をオンにするとい
うルールを用いると、図9(D)の理想化された文字、
すなわちプロトタイプ文字が得られる。このプロトタイ
プ文字が、図6に関連して上に述べた置換ステップ21
6に用いられる文字である。
【0056】なお、この例では、簡単なモノクロ文字表
現(すなわち、画素は”オン”または”オフ”である)
を採用したが、本発明は、グレースケールで表現された
文字にも適用可能である。すなわち、各画素が”オン”
と”オフ”の2つの状態を取り得る1ビットで表わされ
たビットマップ表現ではなく、複数ビットを用いて画素
の濃淡(grayness) を表わす(例えば、0がオフ、最大
値が最暗、中間の値が最低値と最大値に対応した最明と
最暗の間の範囲を表わす)。この場合、図7の位置合わ
せステップ228は、モノクロ文字に関して上に述べた
ところと同様であるが、ただし、ベストフィットの検出
を、マトリクス内の最初の文字と重なる画素のグレース
ケール値を合計することによって行なうことが異なる。
これと同様に、加算ステップ230は、選択パターンの
グレースケール値を、マトリクス要素のデータ配列の対
応バイトに加算することによって行なうことができる。
閾値処理ステップ234は上に述べたと同様ではある
が、ただし、その閾値は、グレースケール画素の最大値
を掛けた値となる。例えば、画素の濃淡度合が4種類あ
る、すなわち2ビットで0,1,2及び3の値を持つ画
素を表現する、とすると、上に述べたところのパターン
数を2で割って得られる値の8に、例えば3が掛け合わ
され、閾値として24が得られる。あるいは、閾値に最
大のグレースケール値を掛けるかわりに、平均グレース
ケール値を用いてもよい。また、グレースケールで表示
または印刷の可能な出力装置であるならば、出力装置は
そのスケールの範囲の値を使用できるので、閾値処理は
必要でなくなる。
【0057】別の効果を得るための前記実施例の変形例
も本発明に包含される。例えば、OCRによる文字認識
結果が信頼できないときは、図6のステップ214とス
テップ216の間に追加のステップを導入できる。この
追加ステップは、ある文字の各パターンと各プロトタイ
プ文字とを、図7の位置合わせステップ228と同様の
方法で比較することになろう。あるパターンが、図6の
ステップ212で当該パターンを用いて導出されたプロ
トタイプ文字以外の、あるプロトタイプ文字とぴったり
一致するときには、当該パターンに分類間違いのフラグ
が立てられる。そして、そのプロトタイプ文字の導出
が、分類間違いのパターンを用いずに改めて行なわれ、
また、そのパターンは他のカテゴリーつまり文字種類に
属するとみなされる。そうすれば、図6のステップ21
6において文字が置換される時に、よりぴったり一致す
るプロトタイプを用いて文字の置換が行なわれることに
なる。あるいは、パターンの初めのビットマップイメー
ジをもとの場所に残すこともできる(すなわちパターン
は置換されない)。
【0058】OCRの文字記述で字体情報が得られない
かもしれない。イタリック体やボールド体のワードを識
別する必要がある。それらワードが標準字体で再現され
ないようにするためである。この識別は、ワード中の各
文字と、そのカテゴリーに関し導出されたプロトタイプ
との距離を調べることによって行なうことができる。各
文字の形状が、そのプロトタイプとよく一致しない場合
は、当該ワードが別の字体である可能性がある。そのよ
うな文字については、最初のビットマップイメージをそ
のまま用いてもよいであろうし、あるいは、特殊字体用
のプロトタイプを導出してもよいであろう。
【0059】導出したプロトタイプの輪郭のきざぎさが
目立つときには、このプロトタイプに既存の文字平滑化
の方法を適用してもよい。
【0060】以上説明した再生アルゴリズムでは、その
処理時間がファクシミリのユーザによっては負担になる
こともあろう。より高速な方法は、文字パターンのサプ
セットを用いてプロトタイプを作ることであろう。出力
品質の調整を可能にする、ある種の制御手段をユーザに
提供することもできるであろう。並列処理が可能なら
ば、複数のプロトタイプを同時に計算できるでうあろ
う。
【0061】本発明は、上に述べた以外の応用も可能で
ある。一例として、デジタルコピアに応用することも可
能である。例えば、テキストの濃すぎる原稿の場合、そ
の読み取り入力に本発明方法を利用できる。そして、使
用する閾値を上げることにより、得られるテキスト品質
が改善されるであろう。もう一つの応用は、最初のビッ
トマップイメージに標準的な英数文字や句読点などと違
ったシンボルが含まれてる場合であろう。これらのシン
ボル、例えば数学記号や手書き文字は、適切に調整され
たOCRシステムによって認識できるであろうから、本
明細書に述べた方法を用い、それらを同様に処理しプロ
トタイプを導出できるであろう。
【0062】本発明の再生方法によれば、テキスト行
の”スキュー”及び文字の不揃いも自動修正される。す
なわち、テキスト中の文字が他の文字と1列に並ばない
場合(不揃い)、あるいはページのテキスト全体がペー
ジの縁に対し整列しない場合(スキュー)、以上説明し
たような再生及び印刷によって、テキストは正しく整列
したものとなる。
【0063】以上、特定の実施例に関して本発明を説明
したが、本発明の範囲内で様々な修正及び変形が可能で
あることは明らかであろう。
【0064】
【発明の効果】以上、詳細に説明したように、本発明に
よれば、ファクシミリ受信機の受信文書イメージ、その
他のビットマップ表現された文書イメージについて、文
字パターンをプロトタイプ文字で置換することによっ
て、文書イメージ中の汚れ、エッジのぎざぎざ等の”ノ
イズ”を減らし、あるいは除去し、さらに文字表現の統
一性を与えて、元の文書イメージより見映えのよい高品
質の文書イメージを生成することができる。また、ビッ
トマップイメージ中の文字パターンと、各カテゴリー
(文字種)に対するプロトタイプ文字との比較を行なう
ことにより、文字パターンの分類の誤り等の悪影響を受
け難くできる等、多くの効果を得られる。
【図面の簡単な説明】
【図1】本発明のソフトウエアの実行に用いられる一般
的なコンピュータシステムのブロック図である。
【図2】文書のビットマップイメージの一部を示す図で
ある。
【図3】文字種類”e”のためのクラスタを示す図であ
る。
【図4】文字種類”e”のためのプロトタイプ文字を示
す図である。
【図5】図3のクラスタのための閾値処理後のプロトタ
イプ文字を示す図である。
【図6】文字再生方法の基本ステップを示すフローチャ
ートである。
【図7】図6のフローチャート中のステップ212を実
現するために用いられるサブステップを示すフローチャ
ートである。
【図8】(A) 文字”e”の第1パターンを含むマト
リックスを示す図である。 (B) 文字”e”の第2パターンを示す図である。 (C)〜(E) 図7のフローチャート中のステップ2
28の位置合わせプロセスを説明するための図である。
【図9】(A) 図8(A)及び図8(B)のパターン
を図8(A)のマトリックスの内部に重ねて示す図であ
る。 (B) 上記(A)の2つのパターンの”加算”の結果
を示す図である。 (C) 文字”e”の16個のパターンのクラスタに対
して図7のステップ226〜232を実行した結果を示
す図である。 (D) 上記(B)または(C)のデータに基づいたプ
ロトタイプ文字を示す図である。
【符号の説明】
100 コンピュータシステム 102 プロセッサ 104 システムメモリ 106 I/Oコントローラ 108 ディスプレイアダプター 110 モニター 112 シリアルポート 114 キーボード 116 固定ディスク装置 118 外部インターフェース 120 プリンタ

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 文書のビットマップイメージから品質の
    改善された文書表現を生成するために、プロセッサ、メ
    モリ、ユーザ入力装置及び出力装置を有するデジタルシ
    ステム上で実行される方法であって、該ビットマップイ
    メージは第1のテキスト文字の複数のパターンを含み、
    ここにおいて該ビットマップイメージは該メモリに格納
    された複数の画素からなり、 (i) 該ビットマップイメージ中の該第1のテキスト文
    字の第1及び第2のパターンを検出するステップ、 (ii) 該ビットマップイメージの該第1パターンを含む
    第1の領域を選択するステップ、 (iii) 該ビットマップイメージの該第2パターンを含む
    第2の領域を選択するステップ、 (iv) 該第1領域及び該第2領域を用いて第1のプロト
    タイプ文字を導出するステップ、及び (v) 該第1テキスト文字の各パターンを該第1プロト
    タイプ文字で置換することにより該文書表現を生成する
    ステップ、 からなる文書イメージ品質改善方法。
  2. 【請求項2】 請求項1記載の文書イメージ品質改善方
    法において、該第1及び第2の領域は実質的に画素単位
    で1対1に対応しており、該ステップ(iv)は (i) 該第1領域の各画素に関し (1) 該第2領域内の対応した画素を識別するサブステ
    ップ; (2) 該第1領域内の画素と該第2領域内の対応画素の
    画素値の平均を求めるサブステップ; (3) 該画素値の平均値を、該第1領域と画素単位で1
    対1に対応した第3の領域中の画素に割り付けるサブス
    テップ;及び (ii) 該第3領域を該第1プロトタイプ文字として指定
    するサブステップ、 からなることを特徴とする文書イメージ品質改善方法。
  3. 【請求項3】 請求項1記載の文書イメージ品質改善方
    法において、該デジタルシステムはファクシミリ装置か
    らなる、ことを特徴とする文書イメージ品質改善方法。
  4. 【請求項4】 文書のビットマップイメージから品質の
    改善された文書表現を生成するために、プロセッサ、メ
    モリ、ユーザ入力装置及び出力装置を有するデジタルシ
    ステム上で実行される方法であって、該ビットマップイ
    メージは第1のテキスト文字の複数のパターン及び第2
    のテキスト文字のパターンを含み、ここにおいて該ビッ
    トマップイメージは該メモリに格納された複数の画素か
    らなり、 (i) 該ビットマップイメージ中の該第1のテキスト文
    字の第1、第2及び第3のパターンを検出するステッ
    プ; (ii) 検出された該第1、第2及び第3のパターンを使
    用して第1のプロトタイプ文字を導出するステップ; (iii) 該第2テキスト文字のパターンを検出するステッ
    プ; (iv) 該第2テキスト文字の該パターンを使用して第2
    のプロトタイプ文字を導出するステップ;及び (v) 該第1テキスト文字の各パターンを該第1プロト
    タイプ文字で置換することにより該文書表現を生成する
    ステップ、 からなる文書イメージ品質改善方法。
  5. 【請求項5】 請求項4記載の文書イメージ品質改善方
    法において、該ステップ(v)は、該パターンのフォント
    を該プロトタイプ文字と比較するサブステップを含む、
    ことを特徴とする文書イメージ品質改善方法。
  6. 【請求項6】 該ステップ(v)を実行する前に該プロト
    タイプ文字の輪郭を平滑化するステップをさらに有す
    る、ことを特徴とする請求項1記載の文書イメージ品質
    改善方法。
  7. 【請求項7】 請求項1記載の文書イメージ品質改善方
    法において、該ユーザ入力装置を使用して、該プロトタ
    イプ文字の導出に用いられる1つの文字のパターン数を
    指定する、ことを特徴とする文書イメージ品質改善方
    法。
JP24066794A 1993-09-20 1994-09-08 文書イメージ品質改善方法 Expired - Fee Related JP3359433B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12432593A 1993-09-20 1993-09-20
US08/124325 1993-09-20

Publications (2)

Publication Number Publication Date
JPH07168948A true JPH07168948A (ja) 1995-07-04
JP3359433B2 JP3359433B2 (ja) 2002-12-24

Family

ID=22414206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24066794A Expired - Fee Related JP3359433B2 (ja) 1993-09-20 1994-09-08 文書イメージ品質改善方法

Country Status (4)

Country Link
US (1) US6069978A (ja)
JP (1) JP3359433B2 (ja)
DE (1) DE4427992C2 (ja)
GB (1) GB2281997B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007221794A (ja) * 2006-02-16 2007-08-30 Adobe Systems Inc 低解像度のグリフ・イメージから高忠実度のグリフ・プロトタイプを作成するための方法および装置
JP2009187168A (ja) * 2008-02-05 2009-08-20 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2010081053A (ja) * 2008-09-24 2010-04-08 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5677997A (en) * 1993-02-11 1997-10-14 Talatik; Kirit K. Method and apparatus for automated conformance and enforcement of behavior in application processing systems
US6298154B1 (en) * 1999-03-29 2001-10-02 Eastman Kodak Company Method for rendering improved personal handwriting
EP1128278B1 (en) * 2000-02-23 2003-09-17 SER Solutions, Inc Method and apparatus for processing electronic documents
US9177828B2 (en) 2011-02-10 2015-11-03 Micron Technology, Inc. External gettering method and device
DK1288792T3 (da) 2001-08-27 2012-04-02 Bdgb Entpr Software Sarl Fremgangsmåde til automatisk indeksering af dokumenter
EP1503297A1 (en) * 2003-07-30 2005-02-02 Sap Ag Computer implemented methods of retrieving hit count data from a data base system and according computer program product
US7519221B1 (en) * 2005-02-28 2009-04-14 Adobe Systems Incorporated Reconstructing high-fidelity electronic documents from images via generation of synthetic fonts
US7873228B2 (en) * 2006-02-21 2011-01-18 Adobe Systems Incorporated System and method for creating synthetic ligatures as quality prototypes for sparse multi-character clusters
US8913833B2 (en) * 2006-05-08 2014-12-16 Fuji Xerox Co., Ltd. Image processing apparatus, image enlarging apparatus, image coding apparatus, image decoding apparatus, image processing system and medium storing program
US8175394B2 (en) 2006-09-08 2012-05-08 Google Inc. Shape clustering in post optical character recognition processing
EP2116971A3 (en) * 2006-09-08 2013-07-31 Google Inc. Shape clustering in document image processing
US7646921B2 (en) * 2006-09-11 2010-01-12 Google Inc. High resolution replication of document based on shape clustering
US7650035B2 (en) * 2006-09-11 2010-01-19 Google Inc. Optical character recognition based on shape clustering and multiple optical character recognition processes
US7697758B2 (en) * 2006-09-11 2010-04-13 Google Inc. Shape clustering and cluster-level manual identification in post optical character recognition processing
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
JP4661921B2 (ja) * 2008-08-26 2011-03-30 富士ゼロックス株式会社 文書処理装置およびプログラム
JP5321109B2 (ja) * 2009-02-13 2013-10-23 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
US9158833B2 (en) 2009-11-02 2015-10-13 Harry Urbschat System and method for obtaining document information
US9152883B2 (en) * 2009-11-02 2015-10-06 Harry Urbschat System and method for increasing the accuracy of optical character recognition (OCR)
US9213756B2 (en) * 2009-11-02 2015-12-15 Harry Urbschat System and method of using dynamic variance networks
KR20130128681A (ko) * 2012-05-17 2013-11-27 삼성전자주식회사 서체 보정을 수행하도록 하기 위한 방법 및 그 전자 장치

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3188609A (en) * 1962-05-04 1965-06-08 Bell Telephone Labor Inc Method and apparatus for correcting errors in mutilated text
JPS604505B2 (ja) * 1972-07-10 1985-02-04 スキヤン − オプテイクス インコ−ポレ−テツド マルチ・フオント光学式文字認識装置
US4058795A (en) * 1972-10-03 1977-11-15 International Business Machines Corporation Method and apparatus for context-aided recognition
JPS5218136A (en) * 1975-08-01 1977-02-10 Hitachi Ltd Signal processing unit
JPS5398739A (en) * 1977-02-09 1978-08-29 Nippon Telegr & Teleph Corp <Ntt> Communication system with character recognition
US4383307A (en) * 1981-05-04 1983-05-10 Software Concepts, Inc. Spelling error detector apparatus and methods
US4674065A (en) * 1982-04-30 1987-06-16 International Business Machines Corporation System for detecting and correcting contextual errors in a text processing system
JPS59121478A (ja) * 1982-12-27 1984-07-13 Casio Comput Co Ltd 文字認識装置
JPS6145372A (ja) * 1984-08-10 1986-03-05 Canon Inc 画像文字認識装置
JP2607457B2 (ja) * 1984-09-17 1997-05-07 株式会社東芝 パターン認識装置
JPH0743755B2 (ja) * 1985-10-09 1995-05-15 日本電気株式会社 文字認識装置
JPH0715703B2 (ja) * 1986-05-16 1995-02-22 富士電機株式会社 文字読取方式
JPH0642268B2 (ja) * 1986-10-31 1994-06-01 日本電気株式会社 文字認識装置
US5233672A (en) * 1987-12-11 1993-08-03 Kabushiki Kaisha Toshiba Character reader and recognizer with a specialized editing function
US5121441A (en) * 1990-09-21 1992-06-09 International Business Machines Corporation Robust prototype establishment in an on-line handwriting recognition system
US5272766A (en) * 1991-01-14 1993-12-21 Ncr Corporation OCR system for recognizing user-specified custom fonts in addition to standard fonts using three-layer templates
US5285505A (en) * 1991-03-11 1994-02-08 International Business Machines Corporation Method and apparatus for improving prototypes of similar characters in on-line handwriting recognition
US5319721A (en) * 1992-04-14 1994-06-07 International Business Machines Corporation Methods and apparatus for evolving a starter set of handwriting prototypes into a user-specific set

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007221794A (ja) * 2006-02-16 2007-08-30 Adobe Systems Inc 低解像度のグリフ・イメージから高忠実度のグリフ・プロトタイプを作成するための方法および装置
JP2009187168A (ja) * 2008-02-05 2009-08-20 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2010081053A (ja) * 2008-09-24 2010-04-08 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
GB2281997A (en) 1995-03-22
GB9415502D0 (en) 1994-09-21
DE4427992A1 (de) 1995-03-30
GB2281997B (en) 1997-10-15
DE4427992C2 (de) 1996-07-18
US6069978A (en) 2000-05-30
JP3359433B2 (ja) 2002-12-24

Similar Documents

Publication Publication Date Title
JP3359433B2 (ja) 文書イメージ品質改善方法
US5956468A (en) Document segmentation system
JP4098087B2 (ja) 画像を分析するための方法及び装置
US5706364A (en) Method of producing character templates using unsegmented samples
US6944341B2 (en) Loose gray-scale template matching for image processing of anti-aliased lines
EP0713329B1 (en) Method and apparatus for automatic image segmentation using template matching filters
US5956419A (en) Unsupervised training of character templates using unsegmented samples
EP0477712B1 (en) Edge enhancement method and apparatus for dot matrix devices
US5250934A (en) Method and apparatus for thinning printed images
US5856877A (en) Apparatus and method for processing and reproducing image information
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JPH08212298A (ja) 文書方向自動判別装置、及び文書方向自動補正装置
JP2000132690A (ja) ト―クン化によるイメ―ジ分割を用いたイメ―ジ処理方法および装置
EP0642256B1 (en) A single pass marker enclosed area detection system and method for a photocopier
CN112861865A (zh) 一种基于ocr技术的辅助审计方法
US20220319215A1 (en) Image processing method, device, electronic apparatus, and storage medium
US20060285167A1 (en) Image processing method and a recording medium storing image processing program
CN111242829A (zh) 一种水印提取方法、装置、设备及存储介质
JPH05233786A (ja) 異なるデータ型のインテリジェント後処理が可能な方法及び装置
US6661921B2 (en) Image process apparatus, image process method and storage medium
US6389178B1 (en) Method of downsampling documents
US5995658A (en) Image processing device and image output device converting binary image into multi-valued image
EP3842918A1 (en) Defect size detection mechanism
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
US7251061B2 (en) Resolution enhancement apparatus, systems, and methods

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees