JP3264999B2 - 文字認識方法及びその装置 - Google Patents

文字認識方法及びその装置

Info

Publication number
JP3264999B2
JP3264999B2 JP26443892A JP26443892A JP3264999B2 JP 3264999 B2 JP3264999 B2 JP 3264999B2 JP 26443892 A JP26443892 A JP 26443892A JP 26443892 A JP26443892 A JP 26443892A JP 3264999 B2 JP3264999 B2 JP 3264999B2
Authority
JP
Japan
Prior art keywords
image data
image
filter
pixel
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26443892A
Other languages
English (en)
Other versions
JPH05225388A (ja
Inventor
メザードゥ・レザ・バエズィー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH05225388A publication Critical patent/JPH05225388A/ja
Application granted granted Critical
Publication of JP3264999B2 publication Critical patent/JP3264999B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/168Smoothing or thinning of the pattern; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識方法及びその装
置に関し、例えば、カメラ画像、スキャナ画像、ファク
シミリ伝送画像、及び、アルファベット・かな・数字・
記号・漢字などのような質の低下した画像を平滑化した
り細線化したりする処理を含み、特に、画質を向上する
ために画像データを処理する文字認識方法及びその装置
に関するものである。
【0002】
【従来の技術】今日、文字或は絵画的画像はしばしば、
複写、ファクシミリ伝送、記憶装置に格納されたスキャ
ナ画像など、種々の技術によって複製されたり転送され
たりする。種々の要因のために、画像の複製或は伝送過
程が、画像の質を低下させてしまう結果となることがし
ばしばある。そのような質が低下した画像には、ノイズ
による点、輪郭がぼけた或はづれたエッジ、重なり合っ
たり、くっついてしまった文字、形が歪んでしまった像
などが特徴として表れる。質が低下した複製画像や伝送
画像は、ある場合には使用することができないかもしれ
ない。例えば、その複製画像や伝送画像が文字認識装置
と関連して使用されるなら、ノイズによるしみ、輪郭が
ぼけたエッジ、くっついてしまった文字などは、画像か
らの正確で精度の高い文字認識を妨げるものとなる。ま
た、質が低下した画像がプリント出力されたり、可視化
された場合には、その画像は解読はより困難なものとな
り、視覚的により不明瞭なものとなる。
【0003】図6は単語“This”が質が低下した画像と
なった例である。図6に示されているように、ノイズに
よる点1は画像解析を困難なものとする。加えて、アル
ファベット“T”と“h”は2において接触しており、
また、アルファベット“h”は3において分断された歪
んだものとなっている。
【0004】
【発明が解決しようとする課題】画質を向上させるため
には、コンピュータメモリに格納された画素データの場
合には、ローパスフィルタをそのデータに適用すること
によって、格納された画像データの質を向上させること
が提案されている。典型的なものはガウス関数のような
特性をもつフィルタをかけて、その画像データを平滑化
することである。そのようなフィルタはノイズによる点
を除去すると言われているが、これは、画像輪郭をさら
にぼやけさせたり、或は/及び、画像の接触、エッジ部
鮮明度の低下などの別の問題を発生させてしまう。
【0005】本発明は上記従来例に鑑みてなされたもの
で、画像輪郭のぼやけやエッジ部鮮明度の低下をおこさ
ずに、ノイズを除去し、画質を向上させることが可能な
文字認識方法及びその装置を提供することを目的とす
る。
【0006】
【本発明の要約】本発明は上記問題を解決する方法とそ
の装置に関わるものであり、例えば、画像再生或はパタ
ーン・文字認識処理などの高度な処理に先立ち、画像デ
ータを平滑化し、細線化する。その平滑化によってノイ
ズによる点を除去する一方、細線化によって線幅を細く
して、上述した画像輪郭のぼやけを補正する。その結
果、画像データには本質的な部分のみが残され、そのよ
うなデータからの再生画像はより鮮明なものとなる。特
に、これを文字画像に適用した場合、そのフィルタはノ
イズによる点を除去し線幅を細くするので、画像をより
明瞭なものとし、より正確で精度の高い文字認識ができ
るようになる。さらに、そのフィルタによって画像デー
タには本質的な部分のみが残されるので、類似の文字画
像パターンが多くの異なる入力文字フォントに対して生
成される。従って、本発明が文字認識装置に利用された
り文字認識処理に先立って用いられたりする場合、文字
辞書のサイズを削減することが可能になる。
【0007】
【課題を解決するための手段】上記目的を達成するため
に本発明の文字認識方法は以下の様な工程からなる。即
ち、多値画像に含まれる画素各々に対して、当該画素と
周辺画素との濃度変化に基づいてフィルタを定め、前記
画素各々で定めたフィルタを前記画素各々に適用し、フ
ィルタされた画像データを得るフィルタ適用工程と、前
記フィルタされた画像データを微分して、微分画像デー
タを取得する微分画像データ取得工程と、前記微分画像
データの反転画像を導出する反転画像導出工程と、前記
反転画像と前記フィルタされた画像データとの積をとっ
て、平滑化細線化された画像データを得る乗算工程と、
前記平滑化細線化された画像データに含まれる文字を切
り出す切り出し工程と、前記切り出された文字を認識す
る認識工程とを有することを特徴とする文字認識方法を
備える。
【0008】また他の発明によれば、画像データを入力
する入力手段と、多値画像に含まれる画素各々に対し
て、当該画素と周辺画素との濃度変化に基づいてフィル
タを定め、前記画素各々で定めたフィルタを前記画素各
々に適用し、フィルタされた画像データを得るフィルタ
手段と、前記フィルタされた画像データを微分して、微
分画像データを取得する微分画像データ取得手段と、前
記微分画像データの反転画像を導出する反転画像導出手
段と、前記反転画像と前記フィルタされた画像データと
の積をとって、平滑化細線化された画像データを得る乗
算工程と、前記平滑化細線化された画像データに含まれ
る文字を切り出す切り出し手段と、前記切り出された文
字を認識する認識工程とを有することを特徴とする文字
認識装置を備える。
【0009】
【0010】
【実施例】本発明は画像強調処理が望まれる様々な装
置、例えば、複写機・ファクシミリ・ビデオカメラ或は
静止画ビデオカメラ、レーザビームプリンタなどの画像
処理或は画像再生を専用に行う装置に応用して組み込む
ことができる。また、パーソナルコンピュータや多くの
事務機器の機能を備えた統合オフィスオートメーション
機器などの汎用コンピュータ、オフィス機器にもに応用
して組み込むことができる。
【0011】以下添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0012】図1はスキャナ、ファクシミリ、データ処
理やワードプロセッシング能力をも含む情報処理能力を
備えた統合オフィスオートメーション機器に関連して、
本発明を適用した代表的な実施例のブロック図である。
図1に示す装置は本発明を応用して、文字認識処理に先
立ってその処理に用いる質の低い画像データを処理す
る。
【0013】図1に示された装置においては、質の低い
画像データが例えばファクシミリ伝送によって本装置に
送信される。本実施例によれば、その質の低い画像デー
タの文字を認識し、認識文字からコンピュータ文書ファ
イルを創成することが可能であり、ワードプロセッシン
グの処理、帳票処理、或は、装置の他の情報処理機能を
利用してその文書ファイルを加工して、データの再伝送
や他の出力を行うことができる。
【0014】図1において、プログラマブルマイクロプ
ロセッサのような中央処理装置(“CPU”)10はデ
ータバス11に接続されている。多くの他の装置もま
た、データバス11に接続されている。特に、画像を画
素ごとに走査して画像メモリ(後述のRAM17)に格
納するスキャナ12は、データバス11に接続され、フ
ァクシミリ装置13(オプションとして不図示の電話を
含む)は電話線14によって画像データを送受信し、読
み出し専用メモリ(“ROM”)15はCPU10が実
行する1つ以上のコンピュータプログラムを格納する。
さらに、データバス11には、入力文字の比較対象とな
る文字辞書を格納するメモリ16、入力画像データのよ
うな中間データ、中間生成物、処理画像データ、導出さ
れた画像フィルタなどを格納するランダムアクセスメモ
リ(“RAM”)17、入力画像データから認識された
文字の特徴を出力する出力装置18(ディスク、モデム
など)、装置によって処理された画像を表示するプリン
タ/ディスプレイ19、オペレータが装置制御を行うた
めのキーボード20が接続される。
【0015】データバス11に接続された装置は統合オ
フィスオートメーション機器に組み込まれるが、これら
装置の一部或は全てはそれ独自でも提供することができ
る。スキャナ12とファクシミリ13は装置へ画像デー
タを入力する入力手段の異なる形である。スキャナ12
の場合、原画像はラインごと、画素ごとに走査される。
そして、CPU10の制御によって、画像データの各画
素は、後で詳述するようにビットマップ形式でRAM1
7の画像メモリに格納される。ファクシミリ13の場
合、画像データは電話線14を通して圧縮形式で受信さ
れる。その圧縮画像データは従来技術に従って圧縮が解
かれ、画素データになる。そして、CPU10は画像デ
ータの各画素をビットマップ形式でRAM17の画像メ
モリに格納する。もちろん、他の入力手段も可能であ
り、画像データは単にディスクのような大容量記憶媒体
から読み出されたり、ビデオカメラから導出される。
【0016】ファクシミリ13とプリンタ/ディスプレ
イ19は出力手段としての異なる形であり、処理画像デ
ータを画素ごとに出力して装置(この場合はプリンタ/
ディスプレイ19)に表示したり、或は、離れた場所
(この場合はファクシミリ13)で表示する。CPU1
0の制御によって、処理画像データはRAM17の処理
画像データメモリから検索される。
【0017】出力装置18は画像データから認識された
文字の特徴を、例えば、ASCIIコードで出力する手
段である。その文字の特徴は装置(例えば、ディスク)
に出力されたり、或は、遠隔地へ伝送(例えば、モデム
によって)出力される。出力装置18はまた、文字の特
徴を表す形式を変える、例えば、ASCIIコードから
ファクシミリ互換形式への変換のような手段を含み、こ
れによって遠隔地のファクシミリ装置への伝送が可能と
なる。
【0018】図2は、図1で示した装置の動作を説明す
る機能ブロック図である。図2で表されている過程はプ
ログラムROM(以下、PROMという)15に格納さ
れたコンピュータプログラムに従ってCPU10によっ
て実行される。参照番号21で示されているように、画
像データはCPU10によってスキャナ12或はファク
シミリ13から得られる、そして、RAM17の画像メ
モリに格納される。
【0019】好適には、その画像データは濃淡をもつデ
ータ及び/或はカラー画像データのような多値画像デー
タであって、2値画像データではない。もし、画像デー
タが2値データであるなら、それはCPU10が図3に
示す処理を実行することによって擬似多値画像データに
変換される。その図に表されている手順によれば、2値
画像データにフィルタをかけることによって、2値画像
データは擬似多値画像データに変換される。好適には円
対称に分布するガウス関数がその2値画像データに適用
されるが、他の形をもつ、例えば、三角形状、矩形状、
指数関数状、放物線状の形の関数を満足するフィルタを
用いることもできる。特に、その拡がりがσ=1におい
て一定であるガウス関数が好ましい結果をもたらすこと
が経験的に認められている。他の拡がりをもつことも可
能であるが、異なる拡がりは、特別な画像データに適切
であることを考慮することが必要であるなら、用いられ
るかもしれない。数学的には、ガウス関数が全体積(或
は1次元フィルタに関しては領域)の99.7%をその
平均から±3σ、即ち、6σの範囲内に含むことが知ら
れている。ここで用いられるガウス関数に関してはσ=
1なので、全体積の99.7%が6×6の画素格子内に
含まれる。次の最大奇数は唯一の識別可能な中心画素で
あるように選ばれる。従って、ステップS31では7×
7格子は次のようにガウス関数を満足する。
【0020】 G( m,n;σ=1)=(1/ √(2π))・exp{−(1/2)(m2+n2) } (1) ここで、mとnは中心画素(0,0)のまわりで−3か
ら3まで変化する。
【0021】ステップS32において、入力2値画像デ
ータZは、ステップS31で導出されるガウス関数でた
たみ込まれ、擬似多値画像データZMが得られる。従っ
て、各画素のZM(k,l)は次のように導出される。
【0022】 ZM(k,l)=ΣΣG(i-k,j-l ;σ=1)Z(i,j) (2) ここで、左の総和はi=k−3からk+3まででとら
れ、右の総和はj=i−3からi+3まででとられる。
入力画像データのエッジの外側ではZ(i,j)にはゼ
ロがセットされる。また、その代わりに、Z(i,j)
はエッジを伸ばすようにとられる。即ち、エッジにおけ
るZ(i,j)の値がエッジの外側で用いられる。
【0023】さて再び、図2を参照すると、CPU10
はRAM17(図1)内の多値画像メモリ22に結果と
して得られる擬似多値画像データを格納する。もちろ
ん、もし、画像メモリ21が既に多値画像データを格納
しているなら、そのデータは何の処理もなされずに直接
にメモリ22に格納される。
【0024】次に、図2に示されているように、可変マ
スクフィルタが参照番号23で示されているように、多
値画像データの各画素に関して導出される。すべての画
素に関して導出されたフィルタは、多値画像データに適
用される。そのフィルタがかけられた結果はフィルター
画像メモリ24に格納される。
【0025】図4はこの過程を詳細に示している。ステ
ップS41は、メモリ22に格納された多値画像データ
の微分(導関数)を得ることによって、画像濃度の変化
を決定する。画像データは離散的な画素データであるの
で、その導関数は第1次差分データd(i,j)とな
り、次のように各画素ZM(i,j)について得られ
る。
【0026】 dx(i,j)=ZM(i+1,j)−ZM(i,j)(3) dy(i,j)=ZM(i,j+1)−ZM(i,j) (4) d(i,j)=√{dx2 (i,j)+dy2 (i,j)} (5) 第1次差分データd(i,j)に基づき、画像データの
各画素ZM(i,j)について、フィルタが導出され
る。各フィルタについての拡がりはステップS42にお
いて、次の式に従って決定される。
【0027】 σ(i,j)=1/[8/5+10/13{d(i,j)}] (6) 方程式(6)は次のような一般形をもつ。
【0028】 1/σ(i,j)=a+b{d(i,j)} (7) そして、式(6)におけるパラメータa=8/5、b=
10/13は、この適用に関しては、以下に説明するよ
うに導出される。式(7)は、各フィルタの拡がりが入
力画像濃度とある定数との和の変化に対して逆比例する
ことを示している。CPU10とPROM15に式
(7)を組み込むことを容易にするために、aとbの値
はわずかに変えられるかもしれない。特に、方程式
(6)で与えられた値は最適な結果を生み出すけれど
も、a=1、b=1であるときにも満足のゆく結果が得
られることが実験的に見いだされている。
【0029】ここで、パラメータa、bの導出方法につ
いて説明する。
【0030】雑音がある画像のガウス関数G(σ)は次
のようにモデル化される。
【0031】 (I+n)*G(σ)=R (A1) ここで、Iは理想的な雑音のない画像、RはIの最良の
評価値、nは通常はゼロ平均の単位分散のガウス関数の
ランダム変数であると仮定される雑音画像である。ガウ
ス関数のフィルタG(σ)はσの関数として記述され、
そのフィルタのスケールは一定ではないことを表す。そ
のかわり、それは決定されることになる変数の関数であ
る。式(A1)は逆フィルタ問題として以下のように書
き直される。
【0032】 I+n=G-1(σ)*-1R (A2) ここでG-1(σ)は逆ガウス関数を表し、*-1は逆フィ
ルタ操作を意味する。2つの拘束条件が式(A2)の解
には与えられ、その1つは出力画像の平滑度であり、も
う1つはエッジが明瞭に局所化していること(即ち、出
力ではエッジ幅が最小になること)である。それゆえ
に、次のような関数が記述される。
【0033】 Q=‖I−g‖2 +λ1 ‖g”‖2 +λ2 β (A3) ここでλ1 とλ2 とはラグラジアンのパラメータであ
り、g=G-1(σ)*-1Rと‖g”‖2 とは平滑度の拘
束条件である。この拘束条件は出力画像Rのゼロ交点に
比例する。βはエッジ局所化度のパラメータである。そ
れゆえに、式(A3)は次のような解を提出している。
即ち、雑音のある画像I+nが与えられたとき、フィル
タG(σ)は画像雑音が最小になりフィルタ出力が平滑
でかつエッジが局所化するように見いだされる。
【0034】Poggio,Voorhees,Yuilleは、“規則化され
たエッジ検出(Regularized EdgeDetection) ”(MI
T、AI研究所、紀要(MIT AI Lab Memo) 、No. 776 (1
984))において、最適化パラメータλ1 は最適化された
スケールのフィルタに関して、フィルタの拡がりに逆比
例することを示した。即ち、次のようになる。
【0035】 λ1 =1/σ (A4) Cornsweet とYellott は、“拡がりの総和に依存する濃
度(Intensity Depend-ent Spread Summation) ”(JOS
A, Vol. 2, No. 10, pp.1769-1786,(1985年11月))に
おいて、濃度依存フィルタの出力におけるエッジ幅は、
そのフィルタの拡がりの約6倍であることを述べてい
る。従って、これは次のようになる。
【0036】 β=6/σ (A5) さて、式(A3)、(A4)、及び、(A5)を合わせ
て考慮すると、Qは次のように書き下せる。
【0037】 Q=‖I−g‖2 +(1/σ)・{‖g”‖2 +6} (A6) 式(A6)の関数を解くために、未知のgはλ1 の関数
として拡張される。
【0038】 そのとき、式(A7)をgに関して式(A6)に代入
し、オイラーラグランジェの方程式に適用すると、次の
ようになる。
【0039】 Qg +(d2/dx2) Qg" = 0 (A8) ここで、Qg とQg"とは各々、gとg”に関するQの偏
導関数である。g”はgのスペースパラメータに関する
第2次の導関数である。いくらかの演算の後、式(A
8)は、式(A7)に関する係数相互の次のような再帰
的な関係をもつようになる。
【0040】 C2k+1=C0 2k+2 /(2I)2k+1 k = 0,1,2,… (A9) ここで、式(A9)、(A7)、及び、(A6)を合わ
せて考慮すると、λ1によって関数が得られる。それゆ
えに、オイラーラグランジェの方程式が再び、λ1 に関
して適用されると次のようになる。
【0041】 Qλ− (d/dx)Qλ' = 0 (A10) 式(A10)を式(A6)に適用すると、次のような結
果が得られる。
【0042】 λ1 =1/σ=8/5+10Z′/13 (A11) 式(A11)の右辺の定数は、最小エッジの局所化(ガ
ウス関数フィルタの出力におけるエッジ幅)と雑音を最
小化することに関して得られる。それは、gの拡張係数
でk=7とセットすることによって得られる。また、
Z′はスペースパラメータに関して、入力される雑音を
含む画像の導関数を表す。係数比(13X8/10X
5)は画像SNRの関数であることに注目されたい。
【0043】フィルタに関するマスクは次のようにして
得られる。m(i)とn(i)をそれぞれ、i番目の画
素のマスク値とマスクサイズとすると、次の式が得られ
る。 m(i)=G(σi ) (|n(i)|<3σi である場合) (A12) ここで、G(σi )=G(σ=σi )でG(σi )は以
下の式によって定義されるガウス関数である。
【0044】 G(σ)={1/√(2πσ)}/exp{−x2/(2σ2)} ここで、xは平均からの距離、σi は上述したと同じよ
うに、以下のように定義される。
【0045】 σi =1/{8/5+(10/13)・(Zi+1 −Zi )} (A13) ここで、Zi+1 とZi は(i+1)番目とi番目の画素
の画像濃度値を示す。さて、Mを固定サイズのマスク長
とする。もし、マスクがMより小さいなら、ゼロ詰めが
続く。
【0046】m(i)<Mであれば、m(i)の両辺に
{M−m(i)}/2個のゼロを加えるので、ゼロ詰め
されたm(i)、mz (i)が得られる。それゆえに、
一次元のフィルタ操作は次のように定義される。
【0047】 ここで、y(k)はk番目画素の出力画像を定義する。
【0048】2値画像に関して、画質の低下は閾値操作
に関連したぼやけ(blurring)過程とその過程によるノイ
ズの混入が原因となる。このことは数学的には、次のよ
うに表される。
【0049】 Rb = T〔I*G+n〕 (A15) ここで、Rb は質の低下した2値画像であり、T[
.]は閾値操作を表す。そのとき、次のような関数が
得られる(式(A6)に類似)。
【0050】 Qb =‖T〔I*G(σ)〕−Rb2 +λ1 〔‖I‖2 +6〕(A16) 式(16)の関数は次のような問題を提出している。即
ち、与えられた質の低下した2値画像Rb に対して、入
力画像Iが平滑度拘束条件とエッジ局所化(非線形性が
関係する回復問題)に従うように得られるようなガウス
関数のフィルタσのスケールを見いだす。
【0051】方程式(A16)の解は、右辺の第1項が
グレースケールの対応部分で置換される以外は上記に定
義されたと同じ手順に従って得られる。即ち、以下の通
りである。
【0052】 ‖I*G(σ)−Rb2 ≡‖I*G(σg )−Rb *G2 (σ0 )‖2 (A17) ここで、σ0 は一定のスケールであり、一般性を失うこ
となく、σ0 =1(その定数はシミュレーションの結果
から得られる)がセットされ、σg はσのように未知数
として残る。前の節で導出されたステップの処理を経た
後、次のような結果が得られる。
【0053】 λ=1/σg = 8/5±(10/13)d/dx〔Rb *G2 (σ0 =1)〕(A18) 負の記号を除いて絶対値を用いると、次のような式が得
られる。
【0054】 λ= 8/5+(10/13)|d/dx[Rb *G2 (σ0 =1)]| (A19) 式(A19)で得られたフィルタスケールが式(A1
6)に代入され、(I)に関する解は,次のように表さ
れる。
【0055】 I=h(1−|h′|) (A20) ここで、h=Rb *G2 (σ0 =1)であり、h′はス
ペースパラメータに関するhの導関数である。
【0056】さて、ステップS43では、最大フィルタ
マスクサイズが考慮中の画像データZMに関して決定さ
れる。特に、前述のように、ガウス関数に関して、全体
積の99.7%は中心より±3σの領域内、即ち、6σ
の範囲にあることが知られている。従って、最大マスク
サイズMは、ステップS42で計算された最大σ(i,
j)の6倍の次の最大奇数(識別可能な中心画素を与え
る)である。
【0057】替わりに、最大マスクサイズMは、前もっ
て、おそらく遭遇するであろう全ての画像に対して適切
である所定の値にセットすることもできる。実験的に
は、M=15は検証された全ての2値画像に関して満足
のゆく結果をだしたことが分かっている。
【0058】ステップS44では、フィルタは各画素Z
M(i,j)に関して、ステップS42で計算された拡
がりとステップS43で計算された最大マスクサイズM
に基づいて、選択される。本実施例では、フィルタは円
対称に分布するガウス関数であるが、そのフィルタは他
の形、例えば、矩形や三角形や指数関数の形や、放物線
の形の関数を満足するものを用いることもできる。適当
な円対称に分布するガウス関数のフィルタは次のように
表される。
【0059】 G[m,n:σ(i,j)]=[1/√{2πσ(I,J)}]exp[(-1/2){m2+n2}/ σ(I,J)](8) ステップS45では、ガウス関数についてのフィルタ値
のM×M格子、mzを形成する。ガウス関数はガウス関
数の拡がりに基づいて変化してマスクされ、M×M格子
がガウス関数でその中心部が形成され、その周辺部はゼ
ロとなる。ゼロ詰めの拡がりは、各画素についてそのフ
ィルタの拡がりσ(i,j)によって決定され、即ち、
[M−6σ(i,j)]/2個のゼロがガウス関数の両
側に詰められ、M×M格子を満たす。この過程は以下に
示す方程式系で与えられる。
【0060】 mz(i,j)= G[m,n:σ(i,j)] (|m|<3σ(i,j) 及び|n|<3σ(i,j) である場合) =0 (上記以外の場合) (9) ここで、mとnの値とは、中心画素(0,0)の回りで
−(M−1)/2から(M−1)/2まで変化する。従
って、可変マスクmzは、各画素ZM(i,j)に関し
て導出され、格子中央から±3σに渡るフィルタをも
ち、それ以外の領域ではゼロであるM×M格子である。
【0061】各画素に関して可変マスクガウス関数を計
算することに替えて、ステップS45で説明したよう
に、いろいろな拡がりをもつ可変マスクガウス関数を前
もって計算し、ルックアップテーブルにその計算された
ガウス関数を格納しておくこともできる。ステップS4
2で計算された拡がりに基づいて、適切な前もって計算
されたフィルタがルックアップテーブルから選択され
る。
【0062】ステップS46では、CPU10は可変マ
スクフィルタGを含むM×M格子を画像データZMに適
用して、次のようにフィルタされた画像データZF
(i,j)の1画素が得られる。
【0063】 ZF(i,j)=ΣΣmz(m,n)ZM(m−1,n−j) (10) ここで、左の総和はm=−(M−1)/2からm=+
(M−1)/2までで求められ、右の総和はn=−(M
−1)/2からn=+(M−1)/2までで求められ
る。
【0064】ステップS47では、多値画像データにお
いて各画素に関して、ステップS44、S45、S46
の処理を実行したかどうかを調べ、必要ならこれらの処
理を繰り返す。
【0065】ステップS48では、フィルタされた画像
データZFがRAM17内のフィルタード画像メモリ2
4に格納される。
【0066】このようにして、CPU10とPROM1
5に関連して、種々のメモリ22、23、24と、ステ
ップS41からS48の処理は、画像処理方法とその装
置を提供しており、これによって、フィルタが多値画像
データの各画素に関して周辺画素の濃度変化に基づいて
導出される。これによって、そのフィルタは画像データ
に適用され、フィルタされた画像データが得られる。好
適には、そのフィルタはガウス関数であり、その拡がり
は画像濃度と定数との和の変化に逆比例する。これによ
って、雑音のあるしみなどに関しては平滑化されるが、
エッジのディテイルはエッジの鮮明度やエッジの局所化
に関して保存されるようにフィルタされた画像データが
生成される。
【0067】その画像処理の効果は図5Aと図5Bとを
比較することによって理解できる。図5Aは、単語“t
est”の形をしたオリジナル2値画像を示している。
処理後、図5Bにおける単語“test”にはエッジ局
所化と鮮明度が残されているが、雑音によるしみは平滑
化されて取り除かれている。
【0068】さて図2に戻り、フィルタされた画像デー
タZFは微分され、微分された画像データZDはRAM
17内の差分メモリ25に格納される。前述のように、
微分は次のような、また図5Cに示されているような第
1次差分操作によって行われる。
【0069】 dx(i,j) = ZF(i+1,j) - ZF(i,j) (11) dy(i,j) = ZF(i,j+1) - ZF(i,j) (12) ZD(i,j) = √{dx2(i,j) + dy2(i,j)} (13) 微分データZDは次のように、また、図5Dに示されて
いるように反転がとられる(即ち、白画素は黒画素によ
って置換され、黒画素は白画素に置換される)。
【0070】 ZI(i,j)=255 − ZD(i,j) (14) ここで、数値255はこのデータに関する最大グレース
ケールを示す。反転された画像データZIはRAM17
内の反転画像データメモリ26に格納される。乗算器は
参照番号27で示されている。乗算器27によって各ガ
ウス関数ごとにフィルタード画像メモリ24に格納され
たフィルタされた画像データと反転画像データメモリ2
6に格納された反転画像データZIとの積が、次のよう
に、また、図5Eに示されるように得られる。
【0071】 ZP(i,j)=ZF(i,j)・ZI(i,j) (15) 結果として得られる積ZPは平滑化かつ細線化された画
像データであり、RAM17内の平滑細線化画像データ
メモリ28に格納される。もし望むなら、積ZPには、
図5Fに示されているように閾値操作が施され、多値画
像データZPが平滑化かつ細線化された2値画像データ
に変換される。多値レベル(0〜255)の内、85と
105との間にセットされた閾値が満足のゆく結果を生
み出すことがわかった。その閾値はRAM17内の閾値
メモリ29に格納される。
【0072】閾値或は多値形式での処理済画像は、プリ
ンタ/ディスプレイ19の装置で目視することができ、
また、ファクシミリ13を経由して電話線14によって
伝送されて遠隔地において目視することができる。
【0073】従って、CPU10、PROM15と連動
して、各メモリと乗算器22〜29とは平滑化かつ細線
化された画像データを方法と装置を提供しており、これ
によって画像データ濃度の変化に依存したフィルタが画
像データの各画素に関して導出され、そのフィルタが画
像データに適用されてフィルタされた画像を得ることが
でき、反転画像がフィルタされた画像データの第1次差
分から導出され、そして、その反転画像とフィルタされ
た画像との積がとられて平滑化かつ細線化された画像デ
ータが形成される。図1に示した装置に適したC言語で
書かれたコンピュータプログラムについて以下に示す。 main( ) { template F; //ぼやけた質の低い入力画像 template I; //出力 template tl, t2, t3, t4ref, t4deg; template t5ref, t5deg; template temp; template dummyl, dummy2; grey_image deg, blurdeg; // 入力画像とぼやけた画像 grey_image plot_out; grey_image ref; double sigma; //シグマ(σ) char strn[200]; //スクリーンへのプリントに使用 char filename1[200], filename2[200]; double before, after; //本方法がどれ程良く作用するか double s; int i,j; fg_coord_t xl, yl, x2, y2; int u,d,l,r; int thresh1, thresh2; int tempsize; //////////σ = 1の場合のぼやけた質の低い画像 ///////////// t1.convolve(ref, temp); // t1 = ぼやけた画像 t2.computeddt(tl); // t2 =ぼやけた画像の導関数 t2.scale(0,255); t3.fill(0,t2.sizeR, t2.sizeC); // t3 =ぼやけた画像の反転導関数 for (i=0; i<t2.sizeR; i++) for (j=0; j<t2.sizeC; j++) t3.pixel[i]tj] = 255.0 - t2.pixel[i][j]; product(t4ref, t3, t1); // t4 = ぼやけた画像とその導関数の積 t4ref.plotbox(x2,y2); y2 += t4ref.sizeR + 10; ///////////////////////////////////////////////////////////////////// //テンプレートをガウス関数で詰める template::makegauss(double sigma, int size) { int i,j; double center; // ガウス関数の中心 double x,y; allocate(size, size); //所定サイズのメモリ割り当て center = O.5 * (size - 1); for (i=0; i<size; i++) for (j=0; j<size; j++) { x=i; y=j; // 中心値にロード x-=center; y-=center; //中心に移動 pixel[i][j] = exp(-(x*x+y*y)/2.0/sigma/sigma) /2.0/3.14159/sigma/ sigma; } } //画像をテンプレートにたたみ込む:画像がテンプレートにたたみ込まれる template::convolve(grey_image, image, template, temp) { int i,j,r,c,a,b; double sum; allocate(image.sizeR + temp.sizeR - 1, // サイズxがセットされる image.sizeC + temp.sizeC - 1); for (r=0; r<sizeR; r++) for (c=0; c<sizeC; c++) { sum = 0.0; for (i=0; i<temp.sizeR; i++) for (j=0; j<temp.sizeC; j++) { a = r+i-temp.sizeR+1; b = c+j-temp.sizeC+1; if ((a >= 0)||(a < image.sizeR)||(b >= 0)||(b < image.sizeC)) sum += temp.pixel[i][j] * image.pixel[a][b]; } pixel[r][c] = sum; } //テンプレートの導関数を計算 template::computeddt(template, image) { double r1,r2,c1,c2; //隣接矩形について用いる値 double dr, dc; // 縦及び横の傾き int i,j; // インデックス変数 allocate(image.sizeR, image.sizeC); for (i=0; i<sizeR; i++) //非境界画素についての導関数計算 for (j=0; j<sizeC; j++) r1 = r2 = c1 = c2 = 0; //隣接矩形の値にロード if (i != 0) //上側 r1 = image.pixel[i-1][j]; if (i != sizeR-1) //下側 r2 = image.pixel[i+1][j]; if (j != 0) //左側 c1 = image.pixel[i][j-1]; if (j != sizeC-1) //右側 c2 = image.pixel[i][j+1]; dr = (r2 - r1)/2.0; dc = (c2 - c1)/2.0; pixel[i][j] = sqrt(dr*dr + dc*dc); pixel[i][j] = fabs(dr); } } ////////////////////////////////////////////////////////////////////// //単一値を用いたテンプレートの作成: value = value, XとY はサイズの値 template::fill(double value, int R, int C) { allocate(R,C); // 新テンプレートの作成 (サイズ調整されることに注意) for (int i=O; i<sizeR; i++) for (int j=O; j<sizeC; j++) pixel[i][j] = value; }; ////////////////////////////////////////////////////////////////////// //******************************************************************** //オーバラップ: C=AがBとオーバラップする回数 (同次元) product(template C, template A, template B) { int i,j; C.fill(O, A.sizeR, A.sizeC); for (i=O; i<A.sizeR; i++) for (j=O; j<A.sizeC; j++) C.pixel[i][j] = A.pixel[i][j] * B.pixel[i][j] / 255.0; } もし望むなら、CPU10はPROM15によってプロ
グラムされ、オペレータが文字認識動作に先立って画像
データを平滑化し細線化するかどうかを選択できるよう
にする。即ち、高品質の画像である場合、画像データを
平滑化し細線化することは、文字認識処理に必要となる
文字辞書のサイズを削減できるので、利点がある。も
し、この利点を必要としないなら、CPU10は平滑化
し細線化過程を選択しないようにして後述する文字認識
動作に直接続くようにするオプションをオペレータに与
えるようにプログラムできる。これに対して、画像が質
の低いものであったり、高品質の画像について小さなサ
イズの文字辞書を望むなら、文字認識動作に先立つ平滑
化し細線化する処理を選択するように動作できる。
【0074】さて図2に戻り、平滑細線化過程が画像の
歪みによって接触した文字を切り出すとき、付加的な切
り出しが必要であるかもしれない。従って、付加的なそ
してより完全な文字切り出しを行うために、装置には修
正用文字切り出し器30が提供されている。
【0075】文字認識装置は参照番号31で示されてい
る。その文字認識装置は公知の技術によるものなので、
その詳細の説明はここでは行わない。一般的に、文字認
識装置31は文字切り出し器30によって切り出された
切り出し文字各々を処理し、辞書16に格納された所定
の文字辞書と切り出し文字各々を比較する。平滑化及び
細線化によって入力画像をその本質的な部分だけに減ら
すので、たとえフォントが異なっていても、同じ文字は
同じに見えるという利点がある。従って、文字辞書16
のサイズが削減でき、装置を単純化することができる。
【0076】文字認識装置31は切り出された文字を処
理し、識別された文字はRAM17内のデコーデッド文
字メモリ32に格納される。デコードされた文字は、必
須なことではないが、ASCII形式によって文書ファ
イルに格納されるのが典型的である。
【0077】デコードされた文字がメモリ32に格納さ
れた後、この文字はさらに続く処理、例えば、ワード或
は文書或は帳票処理に用いられる。従来技術に従うと、
オペレータはキーボード20を用いてメモリ32に格納
されたデコードされた文字を取り出し、図1に示したオ
フィスオートメーション機器のデータ処理機能を用いて
そのデコードされた文字を加工する。その操作によっ
て、CPU10は加工された文字(或は、望むなら加工
されていない文字)を扱って、例えば、モデムによって
遠隔地の装置に対する再伝送のために装置18に出力す
る。もし望むなら、出力装置18はASCII形式から
ファクシミリ互換形式への変換のような、文字形式を変
換するように構成される。
【0078】従って、図1に示す装置は、オペレータに
対してファクシミリ13を経て画像を受信する機能を提
供し、ファクシミリ伝送による画質の低下を補償するよ
うに画像を強調し、その強調画像によって文字認識を実
行したり、その認識文字に対して加工を加えたり、ま
た、他のデータ処理を実行し、例えば、他のファクシミ
リ装置に加工された文字を再伝送する。
【0079】なお本発明は、複数の機器から構成される
システムに適用しても良いし、1つの機器からなる装置
に適用しても良い。また本発明はシステム或は装置にプ
ログラムを供給することによって達成される場合にも適
用できることは言うまでもない。
【0080】
【発明の効果】以上説明したように本発明によれば、例
えば、画像再生或はパターン・文字認識処理などの高度
な処理に先立ち、画像データを平滑化及び細線化するの
で、その平滑化によってノイズによる点を除去する一
方、細線化によって線幅を細くして画像輪郭のぼやけを
補正する。その結果、画像データには本質的な部分のみ
が残され、そのデータからの再生画像はより鮮明なもの
となる。
【0081】特に、これを文字画像に適用した場合には
ノイズによる点が除去され線幅が細くなるので、接触し
た文字からの部分的な文字切り出しが可能となるので、
より正確で精度の高い文字認識ができるようになる。
【0082】さらにノイズ除去によって画像データには
本質的な部分のみが残されるので、類似の文字画像パタ
ーンが多くの異なる入力文字フォントに対して生成され
る。
【0083】従って、本発明を文字認識装置に適用した
り文字認識処理に先立つ処理に用いられる場合、文字辞
書のサイズを削減することが可能になるという利点もあ
る。
【図面の簡単な説明】
【図1】本発明の代表的な実施例である装置の構成を示
すブロック図である。
【図2】図1に示す装置によって実行される本発明の画
像処理方法の実施例を示す機能ブロック図である。
【図3】2値画像データから多値画像データを生成する
手順を示す詳細なフローチャートである。
【図4】本発明を応用して用いられる可変マスクフィル
タを示す詳細なフローチャートである。
【図5A】本実施例の処理に従う画像データの変化を示
す図である。
【図5B】本実施例の処理に従う画像データの変化を示
す図である。
【図5C】本実施例の処理に従う画像データの変化を示
す図である。
【図5D】本実施例の処理に従う画像データの変化を示
す図である。
【図5E】本実施例の処理に従う画像データの変化を示
す図である。
【図5F】本実施例の処理に従う画像データの変化を示
す図である。
【図6】本発明の効果を説明するために用いられる画像
データの典型例である。
【符号の説明】
10 CPU 11 データバス 12 スキャナ 13 ファクシミリ 14 電話線 15 プログラムROM 16 文字辞書 17 RAM 18 出力装置 19 プリンタ/ディスプレイ 20 キーボード
フロントページの続き (56)参考文献 特開 平1−266682(JP,A) 特開 平3−144788(JP,A) 特開 平3−51967(JP,A) 特開 平3−36672(JP,A) 実開 昭61−185158(JP,U) (58)調査した分野(Int.Cl.7,DB名) G06K 9/36 G06T 5/20

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】 多値画像に含まれる画素各々に対して、
    当該画素と周辺画素の濃度変化に基づいてフィルタを
    定め、前記画素各々で定めたフィルタを前記画素各々に
    適用し、フィルタされた画像データを得るフィルタ適用
    工程と、 前記フィルタされた画像データを微分して、微分画像デ
    ータを取得する微分画像データ取得工程と、 前記 微分画像データ反転画像を導出する反転画像導出
    工程と、 前記反転画像と前記フィルタされた画像データとの積を
    とって、平滑化細線化された画像データを得る乗算工程
    と、 前記平滑化細線化された画像データに含まれる文字を切
    り出す切り出し工程と、 前記切り出された文字を認識する認識工程とを有するこ
    とを特徴とする文字認識方法。
  2. 【請求項2】 前記フィルタ適用工程において得られた
    前記フィルタされた画像データは、ノイズ部分が平滑化
    された画像であることを特徴とする請求項1に記載の文
    字認識方法。
  3. 【請求項3】 前記フィルタ各々は、前記画素と周辺画
    素との濃度変化に基づいて拡がりが定められたガウス関
    を用いて決定されたフィルタであることを特徴とする
    請求項に記載の文字認識方法。
  4. 【請求項4】 前記乗算工程において得られた平滑化細
    線化された画像データを所定の閾値で2値画像に変換す
    る2値化工程をさらに有し、 前記切り出し工程では、前記2値画像から前記文字を切
    り出す ことを特徴とする請求項に記載の文字認識方
    法。
  5. 【請求項5】 前記微分画像データ取得工程では、前記
    フィルタされた画像データ内の隣り合う画素間の差分デ
    ータを前記微分画像データとして取得することを特徴と
    する請求項1に記載の文字認識方法。
  6. 【請求項6】 入力画像が2値画像である場合、前記2
    値画像を表現する2値画像データから擬似多値画像デー
    タを導出する多値化工程をさらに有し、 前記多値画像は、前記2値画像データを前記多値化工程
    において多値化するこ とにより得られた画像であること
    を特徴とする請求項1に記載の文字認識方法。
  7. 【請求項7】 画像データを入力する入力手段と、多値画像に含まれる 画素各々に対して、当該画素と周辺
    画素の濃度変化に基づいてフィルタを定め、前記画素
    各々で定めたフィルタを前記画素各々に適用し、フィル
    タされた画像データを得るフィルタ手段と、 前記フィルタされた画像データを微分して、微分画像デ
    ータを取得する微分画像データ取得手段と、 前記 微分画像データ反転画像を導出する反転画像導出
    手段と、 前記反転画像と前記フィルタされた画像データとの積を
    とって、平滑化細線化された画像データを得る乗算工程
    と、 前記平滑化細線化された画像データに含まれる文字を切
    り出す切り出し手段と、 前記切り出された文字を認識する認識工程とを有するこ
    とを特徴とする文字認識装置。
  8. 【請求項8】 前記フィルタ適用工程において得られた
    前記フィルタされた画像データは、ノイズ部分が平滑化
    された画像であることを特徴とする請求項7に記載の文
    字認識装置。
  9. 【請求項9】 前記フィルタ各々は、前記画素と周辺画
    素との濃度変化に基づいて拡がりが定められたガウス関
    を用いて決定されたフィルタであることを特徴とする
    請求項に記載の文字認識装置。
  10. 【請求項10】 前記乗算手段において得られた平滑化
    細線化された画像データを所定の閾値で2値画像に変換
    する2値化手段をさらに有し、 前記切り出し手段では、前記2値画像から前記文字を切
    り出す ことを特徴とする請求項に記載の文字認識装
    置。
  11. 【請求項11】 前記微分画像データ取得手段では、前
    記フィルタされた画像データ内の隣り合う画素間の差分
    データを前記微分画像データとして取得することを特徴
    とする請求項7に記載の文字認識装置。
  12. 【請求項12】 入力手段によって入力される画像デー
    タが2値画像データである場合、前記2値画像データか
    ら擬似多値画像データを導出する多値画像データ導出手
    段をさらに有し、 前記多値画像は、前記2値画像データを前記多値データ
    導出手段により多値化することにより得られた画像であ
    ことを特徴とする請求項に記載の文字認識装置。
JP26443892A 1991-10-04 1992-10-02 文字認識方法及びその装置 Expired - Fee Related JP3264999B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US771220 1991-10-04
US07/771,220 US5351314A (en) 1991-10-04 1991-10-04 Method and apparatus for image enhancement using intensity dependent spread filtering

Publications (2)

Publication Number Publication Date
JPH05225388A JPH05225388A (ja) 1993-09-03
JP3264999B2 true JP3264999B2 (ja) 2002-03-11

Family

ID=25091106

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26443892A Expired - Fee Related JP3264999B2 (ja) 1991-10-04 1992-10-02 文字認識方法及びその装置

Country Status (4)

Country Link
US (1) US5351314A (ja)
EP (1) EP0535992B1 (ja)
JP (1) JP3264999B2 (ja)
DE (1) DE69230629T2 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4105517C2 (de) * 1991-02-22 1995-11-16 Hell Ag Linotype Verfahren und Vorrichtung zur verbesserten Wiedergabe von Konturen
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
GB2282514B (en) * 1993-10-04 1997-11-05 Aston Electronic Designs Limit Video signal processors
JP3059615B2 (ja) * 1993-10-27 2000-07-04 キヤノン株式会社 印刷システム及び印刷制御装置及び制御方法
JPH07131641A (ja) * 1993-11-08 1995-05-19 Canon Inc 画像処理装置
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JPH07220091A (ja) * 1994-02-04 1995-08-18 Canon Inc 画像処理装置及び方法
US5563962A (en) * 1994-03-08 1996-10-08 The University Of Connecticut Two dimensional digital hysteresis filter for smoothing digital images
US5802257A (en) * 1994-11-25 1998-09-01 Canon Kabushiki Kaisha Information processing apparatus, method and memory medium that control a bold process in accordance with the setting of a facsimile mode
US5764307A (en) * 1995-07-24 1998-06-09 Motorola, Inc. Method and apparatus for spatially adaptive filtering for video encoding
US6005978A (en) * 1996-02-07 1999-12-21 Cognex Corporation Robust search for image features across image sequences exhibiting non-uniform changes in brightness
US6389162B2 (en) 1996-02-15 2002-05-14 Canon Kabushiki Kaisha Image processing apparatus and method and medium
US5893127A (en) * 1996-11-18 1999-04-06 Canon Information Systems, Inc. Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document
US6512848B2 (en) 1996-11-18 2003-01-28 Canon Kabushiki Kaisha Page analysis system
US5892843A (en) * 1997-01-21 1999-04-06 Matsushita Electric Industrial Co., Ltd. Title, caption and photo extraction from scanned document images
DE19707046A1 (de) 1997-02-21 1998-08-27 Rolf Prof Dr Ing Eckmiller Lernfähiger "Active Vision" Implant Encoder
CA2288758C (en) * 1997-05-05 2007-07-17 Alexander R. Roustaei Optical scanner and image reader for reading images and decoding optical information including one and two dimensional symbologies at variable depth of field
US6298173B1 (en) 1997-10-03 2001-10-02 Matsushita Electric Corporation Of America Storage management system for document image database
US6457032B1 (en) 1997-11-15 2002-09-24 Cognex Corporation Efficient flexible digital filtering
US6501565B1 (en) * 1998-07-07 2002-12-31 Electronics For Imaging, Inc. Method and apparatus for smoothing text outlines
US6310697B1 (en) 1998-07-07 2001-10-30 Electronics For Imaging, Inc. Text enhancement system
US6327388B1 (en) 1998-08-14 2001-12-04 Matsushita Electric Industrial Co., Ltd. Identification of logos from document images
JP3594889B2 (ja) * 2000-08-07 2004-12-02 日本電信電話株式会社 画像処理方法、画像処理装置、及び画像処理方法を実行するプログラムを記録した記録媒体
US6947178B2 (en) * 2001-02-26 2005-09-20 International Business Machines Corporation De-screening halftones using sigma filters
US7203337B2 (en) * 2001-06-21 2007-04-10 Wespot Ab Adjusted filters
US7433084B2 (en) * 2002-07-01 2008-10-07 Xerox Corporation Digital de-screening technique for scanned documents
US8144984B2 (en) * 2006-12-08 2012-03-27 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program for color fringing estimation and compensation
EP2034437A1 (en) * 2007-09-06 2009-03-11 Thomson Licensing Spatial diffusion in images
WO2009128798A1 (en) * 2008-04-16 2009-10-22 Nikon Corporation Method for deblurring an image that produces less ringing
JP5223702B2 (ja) * 2008-07-29 2013-06-26 株式会社リコー 画像処理装置、ノイズ低減方法、プログラム、記憶媒体
JP5419491B2 (ja) * 2009-02-20 2014-02-19 三菱重工業株式会社 文字認識装置及び文字認識方法
US9117263B2 (en) * 2012-05-03 2015-08-25 Qualcomm Incorporated Noise removal from images containing text
CN109766890B (zh) 2013-06-03 2020-11-06 支付宝(中国)网络技术有限公司 信息识别方法、设备和系统
CN106296578B (zh) * 2015-05-29 2020-04-28 阿里巴巴集团控股有限公司 一种图像处理方法及装置
WO2017080420A1 (en) * 2015-11-09 2017-05-18 Versitech Limited Auxiliary data for artifacts –aware view synthesis
KR102151780B1 (ko) * 2018-11-28 2020-09-03 안희철 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 필체를 통해 생성한 폰트를 이용하는 드로잉 방법, 상기 방법을 실행하기 위해 컴퓨터 판독가능 저장매체에 저장된 컴퓨터 프로그램 및 필체를 통해 생성한 폰트를 이용하는 드로잉 시스템
CN111709344B (zh) * 2020-06-09 2023-10-17 上海海事大学 一种基于高斯混合模型的epll图像去光照识别处理方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4197583A (en) * 1978-05-03 1980-04-08 Baird Corporation Image display system
DE3347645C1 (de) * 1983-12-30 1985-10-10 Dr.-Ing. Ludwig Pietzsch Gmbh & Co, 7505 Ettlingen Verfahren und Einrichtung zum opto-elektronischen Pruefen eines Flaechenmusters an einem Objekt
JPS60178588A (ja) * 1984-02-24 1985-09-12 Fujitsu Ltd 画像処理装置
US5119444A (en) * 1986-07-22 1992-06-02 Schlumberger Technologies, Inc. System for expedited computation of laplacian and gaussian filters and correlation of their outputs for image processing
US4891750A (en) * 1986-10-29 1990-01-02 Pitney Bowes Inc. Optical character recognition by forming and detecting matrices of geo features
JPS63265371A (ja) * 1986-12-15 1988-11-01 Toshiba Corp 線図形つなぎ装置
US4884225A (en) * 1987-04-03 1989-11-28 University Of Massachusetts Medical Center Filtering in 3-D visual system
JP2675303B2 (ja) * 1987-04-28 1997-11-12 キヤノン株式会社 文字認識方法

Also Published As

Publication number Publication date
DE69230629T2 (de) 2000-06-21
EP0535992B1 (en) 2000-02-02
EP0535992A3 (en) 1993-12-01
EP0535992A2 (en) 1993-04-07
DE69230629D1 (de) 2000-03-09
US5351314A (en) 1994-09-27
JPH05225388A (ja) 1993-09-03

Similar Documents

Publication Publication Date Title
JP3264999B2 (ja) 文字認識方法及びその装置
Loce et al. Enhancement and restoration of digital documents: Statistical design of nonlinear algorithms
EP0874330B1 (en) Area based interpolation for image enhancement
US6807304B2 (en) Feature recognition using loose gray scale template matching
US6757431B2 (en) Resolution conversion for anti-aliased images using loose gray scale template matching
KR20190109732A (ko) 한자 인쇄 문자 이미지 합성 방법 및 장치
US7525694B2 (en) Image processing device, image processing method, image processing program, and recording medium
US5359423A (en) Method for statistical generation of density preserving templates for print enhancement
US7787703B2 (en) Method and system for extending binary image data to contone image data
JP2006333495A (ja) 画像処理方法、文書表示方法及びコンピュータ実行操作選択方法
JP2004320701A (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JPH08279896A (ja) 文書生成方法
US10592766B2 (en) Image processing apparatus and medium storing program executable by image processing apparatus
JP2002185800A (ja) 適合画像強調フィルター及び強調画像データの生成方法
US8369614B2 (en) Edge control in a digital color image via tone and size dependent dilation of pixels
US5539866A (en) Method and apparatus for accurately rendering half-bitted image pixels
JP2994581B2 (ja) ドキュメントのダウンサンプリング方法
Zhang et al. Image inverse halftoning and descreening: a review
EP0680194B1 (en) Image processing device and image output device converting binary image into multi-valued image
US6567565B1 (en) Antialiased image rendering algorithm
JP4337386B2 (ja) 画像処理方法、画像処理装置、画像処理プログラム及び画像記録装置
Konya et al. Adaptive methods for robust document image understanding
KR100416496B1 (ko) 다중 역치값을 이용한 이치화 방법
JP2004240955A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び画像記録装置
JPH03146996A (ja) 画像処理装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20011207

LAPS Cancellation because of no payment of annual fees