JPH05225388A - 画像処理方法及びその装置と、文字認識方法及びその装置と、統合オフィスオートメーション機器 - Google Patents

画像処理方法及びその装置と、文字認識方法及びその装置と、統合オフィスオートメーション機器

Info

Publication number
JPH05225388A
JPH05225388A JP4264438A JP26443892A JPH05225388A JP H05225388 A JPH05225388 A JP H05225388A JP 4264438 A JP4264438 A JP 4264438A JP 26443892 A JP26443892 A JP 26443892A JP H05225388 A JPH05225388 A JP H05225388A
Authority
JP
Japan
Prior art keywords
image
image data
pixel
character
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4264438A
Other languages
English (en)
Other versions
JP3264999B2 (ja
Inventor
Mehrzad R Vaezi
メザードゥ・レザ・バエズィー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Canon Information Systems Inc
Original Assignee
Canon Inc
Canon Information Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc, Canon Information Systems Inc filed Critical Canon Inc
Publication of JPH05225388A publication Critical patent/JPH05225388A/ja
Application granted granted Critical
Publication of JP3264999B2 publication Critical patent/JP3264999B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/168Smoothing or thinning of the pattern; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【目的】 画像の鮮明度を高め、かつ、低画質画像のノ
イズを除去して画質の向上を図る。 【構成】 本発明は入力画像を平滑化細線化して、その
画像から隣接する文字を切り出し、文字辞書と切り出さ
れた文字との比較に基づいて、切り出し文字から文字認
識を行う方法と装置に関するものである。その平滑化と
細線化は入力画像の各画素に対して、周辺画素の画像濃
度の変化に依存する拡がりをもつフィルタをかけて、フ
ィルタされた画像データを得、そのフィルタされた画像
データの第1次差分データから反転画像データを導出
し、その反転画像データとフィルタされた画像データと
の積をとることによってなされる。そのフィルタはガウ
ス関数の形をした特性をもち、その拡がりは入力画像濃
度とある定数との和の変化に逆比例する。また、そのフ
ィルタはフィルタ値可変詰め込みマスクを用いて、画像
データに適用される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像処理方法及びその装
置と、文字認識方法及びその装置と、統合オフィスオー
トメーション機器に関し、例えば、カメラ画像、スキャ
ナ画像、ファクシミリ伝送画像、及び、アルファベット
・かな・数字・記号・漢字などのような質の低下した画
像を平滑化したり細線化したりする処理を含み、特に、
画質を向上するために画像データを処理する画像処理方
法及びその装置と、文字認識方法及びその装置と、統合
オフィスオートメーション機器に関するものである。
【0002】
【従来の技術】今日、文字或は絵画的画像はしばしば、
複写、ファクシミリ伝送、記憶装置に格納されたスキャ
ナ画像など、種々の技術によって複製されたり転送され
たりする。種々の要因のために、画像の複製或は伝送過
程が、画像の質を低下させてしまう結果となることがし
ばしばある。そのような質が低下した画像には、ノイズ
による点、輪郭がぼけた或はづれたエッジ、重なり合っ
たり、くっついてしまった文字、形が歪んでしまった像
などが特徴として表れる。質が低下した複製画像や伝送
画像は、ある場合には使用することができないかもしれ
ない。例えば、その複製画像や伝送画像が文字認識装置
と関連して使用されるなら、ノイズによるしみ、輪郭が
ぼけたエッジ、くっついてしまった文字などは、画像か
らの正確で精度の高い文字認識を妨げるものとなる。ま
た、質が低下した画像がプリント出力されたり、可視化
された場合には、その画像は解読はより困難なものとな
り、視覚的により不明瞭なものとなる。
【0003】図6は単語“This”が質が低下した画像と
なった例である。図6に示されているように、ノイズに
よる点1は画像解析を困難なものとする。加えて、アル
ファベット“T”と“h”は2において接触しており、
また、アルファベット“h”は3において分断された歪
んだものとなっている。
【0004】
【発明が解決しようとする課題】画質を向上させるため
には、コンピュータメモリに格納された画素データの場
合には、ローパスフィルタをそのデータに適用すること
によって、格納された画像データの質を向上させること
が提案されている。典型的なものはガウス関数のような
特性をもつフィルタをかけて、その画像データを平滑化
することである。そのようなフィルタはノイズによる点
を除去すると言われているが、これは、画像輪郭をさら
にぼやけさせたり、或は/及び、画像の接触、エッジ部
鮮明度の低下などの別の問題を発生させてしまう。
【0005】本発明は上記従来例に鑑みてなされたもの
で、画像輪郭のぼやけやエッジ部鮮明度の低下をおこさ
ずに、ノイズを除去し、画質を向上させることが可能な
画像処理方法及びその装置と、文字認識方法及びその装
置と、統合オフィスオートメーション機器を提供するこ
とを目的とする。
【0006】
【本発明の要約】本発明は上記問題を解決する方法とそ
の装置に関わるものであり、例えば、画像再生或はパタ
ーン・文字認識処理などの高度な処理に先立ち、画像デ
ータを平滑化し、細線化する。その平滑化によってノイ
ズによる点を除去する一方、細線化によって線幅を細く
して、上述した画像輪郭のぼやけを補正する。その結
果、画像データには本質的な部分のみが残され、そのよ
うなデータからの再生画像はより鮮明なものとなる。特
に、これを文字画像に適用した場合、そのフィルタはノ
イズによる点を除去し線幅を細くするので、接触した文
字からの部分的な文字切り出しが可能となり、これによ
って、画像をより明瞭なものとし、さらなる文字切り出
しが可能となり、より正確で精度の高い文字認識ができ
るようになる。さらに、そのフィルタによって画像デー
タには本質的な部分のみが残されるので、類似の文字画
像パターンが多くの異なる入力文字フォントに対して生
成される。もし、その文字にアンダラインが付された
り、四角(例えば、数字の表など)で囲まれている場
合、本発明に従えば、そのような余計な特徴を除去する
ことが可能となる。従って、本発明が文字認識装置に利
用されたり文字認識処理に先立って用いられたりする場
合、文字辞書のサイズを削減することが可能になる。
【0007】
【課題を解決するための手段】上記目的を達成するため
に本発明の画像処理方法は以下の様な工程からなる。即
ち、各画素データについて、周辺画素の画像濃度の変化
に依存した拡がりをもつ陪フィルタを導出する導出工程
と、フィルタされた画像データを得るために、前記画素
データに前記対応するフィルタをかける適用工程とを有
する。そのフィルタ各々は、ガウス関数の形をした特性
をもち、前記ガウス関数の拡がりは周辺画素の画像濃度
に定数を加えたものの変化におおよそ逆比例することを
特徴とする。また、そのフィルタ各々は所定の大きさを
もつマスクを用いて画像データにかけられ、そのマスク
はフィルタの広がりに基づいてゼロ値が詰められる。
【0008】また他の発明によれば、以下の工程からな
る画像データの平滑化及び細線化の方法を備える。即
ち、フィルタされた画像データを得るために画像データ
各画素に前記画像データ濃度の変化に依存するフィルタ
をかける適用工程と、前記フィルタされた画像データの
第1次差分から反転データを導出する導出工程と、平滑
化、細線化された画像を得るために前記反転データと前
記フィルタされたデータとの積をとる乗算工程とを有す
る。そのフィルタ各々は、ガウス関数の形をした特性を
もち、前記ガウス関数の拡がりは周辺画素の画像濃度に
定数を加えたものの変化におおよそ逆比例することを特
徴とする。また、そのフィルタ各々は所定の大きさをも
つマスクを用いてかけられ、そのマスクには計算された
広がりに基づいてゼロ値が詰められる。
【0009】また他の発明によれば、以下の工程からな
る文字認識方法を備える。即ち、入力画像データを平滑
化及び細線化する平滑細線化工程と、前記平滑化、細線
化された画像において隣接する文字を切り出す切り出し
工程と、切り出された文字の特徴を前記切り出された文
字と文字辞書との比較に基づいて決定する決定工程とを
有する。
【0010】
【実施例】本発明は画像強調処理が望まれる様々な装
置、例えば、複写機・ファクシミリ・ビデオカメラ或は
静止画ビデオカメラ、レーザビームプリンタなどの画像
処理或は画像再生を専用に行う装置に応用して組み込む
ことができる。また、パーソナルコンピュータや多くの
事務機器の機能を備えた統合オフィスオートメーション
機器などの汎用コンピュータ、オフィス機器にもに応用
して組み込むことができる。
【0011】以下添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0012】図1はスキャナ、ファクシミリ、データ処
理やワードプロセッシング能力をも含む情報処理能力を
備えた統合オフィスオートメーション機器に関連して、
本発明を適用した代表的な実施例のブロック図である。
図1に示す装置は本発明を応用して、文字認識処理に先
立ってその処理に用いる質の低い画像データを処理す
る。
【0013】図1に示された装置においては、質の低い
画像データが例えばファクシミリ伝送によって本装置に
送信される。本実施例によれば、その質の低い画像デー
タの文字を認識し、認識文字からコンピュータ文書ファ
イルを創成することが可能であり、ワードプロセッシン
グの処理、帳票処理、或は、装置の他の情報処理機能を
利用してその文書ファイルを加工して、データの再伝送
や他の出力を行うことができる。
【0014】図1において、プログラマブルマイクロプ
ロセッサのような中央処理装置(“CPU”)10はデ
ータバス11に接続されている。多くの他の装置もま
た、データバス11に接続されている。特に、画像を画
素ごとに走査して画像メモリ(後述のRAM17)に格
納するスキャナ12は、データバス11に接続され、フ
ァクシミリ装置13(オプションとして不図示の電話を
含む)は電話線14によって画像データを送受信し、読
み出し専用メモリ(“ROM”)15はCPU10が実
行する1つ以上のコンピュータプログラムを格納する。
さらに、データバス11には、入力文字の比較対象とな
る文字辞書を格納するメモリ16、入力画像データのよ
うな中間データ、中間生成物、処理画像データ、導出さ
れた画像フィルタなどを格納するランダムアクセスメモ
リ(“RAM”)17、入力画像データから認識された
文字の特徴を出力する出力装置18(ディスク、モデム
など)、装置によって処理された画像を表示するプリン
タ/ディスプレイ19、オペレータが装置制御を行うた
めのキーボード20が接続される。
【0015】データバス11に接続された装置は統合オ
フィスオートメーション機器に組み込まれるが、これら
装置の一部或は全てはそれ独自でも提供することができ
る。スキャナ12とファクシミリ13は装置へ画像デー
タを入力する入力手段の異なる形である。スキャナ12
の場合、原画像はラインごと、画素ごとに走査される。
そして、CPU10の制御によって、画像データの各画
素は、後で詳述するようにビットマップ形式でRAM1
7の画像メモリに格納される。ファクシミリ13の場
合、画像データは電話線14を通して圧縮形式で受信さ
れる。その圧縮画像データは従来技術に従って圧縮が解
かれ、画素データになる。そして、CPU10は画像デ
ータの各画素をビットマップ形式でRAM17の画像メ
モリに格納する。もちろん、他の入力手段も可能であ
り、画像データは単にディスクのような大容量記憶媒体
から読み出されたり、ビデオカメラから導出される。
【0016】ファクシミリ13とプリンタ/ディスプレ
イ19は出力手段としての異なる形であり、処理画像デ
ータを画素ごとに出力して装置(この場合はプリンタ/
ディスプレイ19)に表示したり、或は、離れた場所
(この場合はファクシミリ13)で表示する。CPU1
0の制御によって、処理画像データはRAM17の処理
画像データメモリから検索される。
【0017】出力装置18は画像データから認識された
文字の特徴を、例えば、ASCIIコードで出力する手
段である。その文字の特徴は装置(例えば、ディスク)
に出力されたり、或は、遠隔地へ伝送(例えば、モデム
によって)出力される。出力装置18はまた、文字の特
徴を表す形式を変える、例えば、ASCIIコードから
ファクシミリ互換形式への変換のような手段を含み、こ
れによって遠隔地のファクシミリ装置への伝送が可能と
なる。
【0018】図2は、図1で示した装置の動作を説明す
る機能ブロック図である。図2で表されている過程はプ
ログラムROM(以下、PROMという)15に格納さ
れたコンピュータプログラムに従ってCPU10によっ
て実行される。参照番号21で示されているように、画
像データはCPU10によってスキャナ12或はファク
シミリ13から得られる、そして、RAM17の画像メ
モリに格納される。
【0019】好適には、その画像データは濃淡をもつデ
ータ及び/或はカラー画像データのような多値画像デー
タであって、2値画像データではない。もし、画像デー
タが2値データであるなら、それはCPU10が図3に
示す処理を実行することによって擬似多値画像データに
変換される。その図に表されている手順によれば、2値
画像データにフィルタをかけることによって、2値画像
データは擬似多値画像データに変換される。好適には円
対象のガウス関数がその2値画像データに適用される
が、他の形をもつ、例えば、三角形状、矩形状、指数関
数状、放物線状の形をしたフィルタを用いることもでき
る。特に、その拡がりがσ=1において一定であるガウ
ス関数が好ましい結果をもたらすことが経験的に認めら
れている。他の拡がりをもつことも可能であるが、異な
る拡がりは、特別な画像データに適切であることを考慮
することが必要であるなら、用いられるかもしれない。
数学的には、ガウス関数が全体積(或は1次元フィルタ
に関しては領域)の99.7%をその平均から±3σ、
即ち、6σの範囲内に含むことが知られている。ここで
用いられるガウス関数に関してはσ=1なので、全体積
の99.7%が6×6の画素格子内に含まれる。次の最
大奇数は唯一の識別可能な中心画素であるように選ばれ
る。従って、ステップS31では7×7格子は次のよう
にガウス関数を満足する。
【0020】 G( m,n;σ=1)=(1/ √(2π))・exp{−(1/2)(m2+n2) } (1) ここで、mとnは中心画素(0,0)のまわりで−3か
ら3まで変化する。
【0021】ステップS32において、入力2値画像デ
ータZは、ステップS31で導出されるガウス関数でた
たみ込まれ、擬似多値画像データZMが得られる。従っ
て、各画素のZM(k,l)は次のように導出される。
【0022】 ZM(k,l)=ΣΣG(i-k,j-l ;σ=1)Z(i,j) (2) ここで、左の総和はi=k−3からk+3まででとら
れ、右の総和はj=i−3からi+3まででとられる。
入力画像データのエッジの外側ではZ(i,j)にはゼ
ロがセットされる。また、その代わりに、Z(i,j)
はエッジを伸ばすようにとられる。即ち、エッジにおけ
るZ(i,j)の値がエッジの外側で用いられる。
【0023】さて再び、図2を参照すると、CPU10
はRAM17(図1)内の多値画像メモリ22に結果と
して得られる擬似多値画像データを格納する。もちろ
ん、もし、画像メモリ21が既に多値画像データを格納
しているなら、そのデータは何の処理もなされずに直接
にメモリ22に格納される。
【0024】次に、図2に示されているように、可変マ
スクフィルタが参照番号23で示されているように、多
値画像データの各画素に関して導出される。すべての画
素に関して導出されたフィルタは、多値画像データに適
用される。そのフィルタがかけられた結果はフィルタ画
像メモリ24に格納される。
【0025】図4はこの過程を詳細に示している。ステ
ップS41は、メモリ22に格納された多値画像データ
の微分(導関数)を得ることによって、画像濃度の変化
を決定する。画像データは離散的な画素データであるの
で、その導関数は第1次差分データd(i,j)とな
り、次のように各画素ZM(i,j)について得られ
る。
【0026】 dx(i,j)=ZM(i+1,j)−ZM(i,j)(3) dy(i,j)=ZM(i,j+1)−ZM(i,j) (4) d(i,j)=√{dx2 (i,j)+dy2 (i,j)} (5) 第1次差分データd(i,j)に基づき、画像データの
各画素ZM(i,j)について、フィルタが導出され
る。各フィルタについての拡がりはステップS42にお
いて、次の式に従って決定される。
【0027】 σ(i,j)=1/[8/5+10/13{d(i,j)}] (6) 方程式(6)は次のような一般形をもつ。
【0028】 1/σ(i,j)=a+b{d(i,j)} (7) そして、式(6)におけるパラメータa=8/5、b=
10/13は、この適用に関しては、以下に説明するよ
うに導出される。式(7)は、各フィルタの拡がりが入
力画像濃度とある定数との和の変化に対して逆比例する
ことを示している。CPU10とPROM15に式
(7)を組み込むことを容易にするために、aとbの値
はわずかに変えられるかもしれない。特に、方程式
(6)で与えられた値は最適な結果を生み出すけれど
も、a=1、b=1であるときにも満足のゆく結果が得
られることが実験的に見いだされている。
【0029】ここで、パラメータa、bの導出方法につ
いて説明する。
【0030】雑音がある画像のガウス関数G(σ)は次
のようにモデル化される。
【0031】 (I+n)*G(σ)=R (A1) ここで、Iは理想的な雑音のない画像、RはIの最良の
評価値、nは通常はゼロ平均の単位分散のガウス関数の
ランダム変数であると仮定される雑音画像である。ガウ
ス関数のフィルタG(σ)はσの関数として記述され、
そのフィルタのスケールは一定ではないことを表す。そ
のかわり、それは決定されることになる変数の関数であ
る。式(A1)は逆フィルタ問題として以下のように書
き直される。
【0032】 I+n=G-1(σ)*-1R (A2) ここでG-1(σ)は逆ガウス関数を表し、*-1は逆フィ
ルタ操作を意味する。2つの拘束条件が式(A2)の解
には与えられ、その1つは出力画像の平滑度であり、も
う1つはエッジが明瞭に局所化していること(即ち、出
力ではエッジ幅が最小になること)である。それゆえ
に、次のような関数が記述される。
【0033】 Q=‖I−g‖2 +λ1 ‖g”‖2 +λ2 β (A3) ここでλ1 とλ2 とはラグラジアンのパラメータであ
り、g=G-1(σ)*-1Rと‖g”‖2 とは平滑度の拘
束条件である。この拘束条件は出力画像Rのゼロ交点に
比例する。βはエッジ局所化度のパラメータである。そ
れゆえに、式(A3)は次のような解を提出している。
即ち、雑音のある画像I+nが与えられたとき、フィル
タG(σ)は画像雑音が最小になりフィルタ出力が平滑
でかつエッジが局所化するように見いだされる。
【0034】Poggio,Voorhees,Yuilleは、“規則化され
たエッジ検出(Regularized EdgeDetection) ”(MI
T、AI研究所、紀要(MIT AI Lab Memo) 、No. 776 (1
984))において、最適化パラメータλ1 は最適化された
スケールのフィルタに関して、フィルタの拡がりに逆比
例することを示した。即ち、次のようになる。
【0035】 λ1 =1/σ (A4) Cornsweet とYellott は、“拡がりの総和に依存する濃
度(Intensity Depend-ent Spread Summation) ”(JOS
A, Vol. 2, No. 10, pp.1769-1786,(1985年11月))に
おいて、濃度依存フィルタの出力におけるエッジ幅は、
そのフィルタの拡がりの約6倍であることを述べてい
る。従って、これは次のようになる。
【0036】 β=6/σ (A5) さて、式(A3)、(A4)、及び、(A5)を合わせ
て考慮すると、Qは次のように書き下せる。
【0037】 Q=‖I−g‖2 +(1/σ)・{‖g”‖2 +6} (A6) 式(A6)の関数を解くために、未知のgはλ1 の関数
として拡張される。
【0038】 そのとき、式(A7)をgに関して式(A6)に代入
し、オイラーラグランジェの方程式に適用すると、次の
ようになる。
【0039】 Qg +(d2/dx2) Qg" = 0 (A8) ここで、Qg とQg"とは各々、gとg”に関するQの偏
導関数である。g”はgのスペースパラメータに関する
第2次の導関数である。いくらかの演算の後、式(A
8)は、式(A7)に関する係数相互の次のような再帰
的な関係をもつようになる。
【0040】 C2k+1=C0 2k+2 /(2I)2k+1 k = 0,1,2,… (A9) ここで、式(A9)、(A7)、及び、(A6)を合わ
せて考慮すると、λ1によって関数が得られる。それゆ
えに、オイラーラグランジェの方程式が再び、λ1 に関
して適用されると次のようになる。
【0041】 Qλ− (d/dx)Qλ' = 0 (A10) 式(A10)を式(A6)に適用すると、次のような結
果が得られる。
【0042】 λ1 =1/σ=8/5+10Z′/13 (A11) 式(A11)の右辺の定数は、最小エッジの局所化(ガ
ウス関数フィルタの出力におけるエッジ幅)と雑音を最
小化することに関して得られる。それは、gの拡張係数
でk=7とセットすることによって得られる。また、
Z′はスペースパラメータに関して、入力される雑音を
含む画像の導関数を表す。係数比(13X8/10X
5)は画像SNRの関数であることに注目されたい。
【0043】フィルタに関するマスクは次のようにして
得られる。m(i)とn(i)をそれぞれ、i番目の画
素のマスク値とマスクサイズとすると、次の式が得られ
る。 m(i)=G(σi ) (|n(i)|<3σi である場合) (A12) ここで、G(σi )=G(σ=σi )でG(σi )は以
下の式によって定義されるガウス関数である。
【0044】 G(σ)={1/√(2πσ)}/exp{−x2/(2σ2)} ここで、xは平均からの距離、σi は上述したと同じよ
うに、以下のように定義される。
【0045】 σi =1/{8/5+(10/13)・(Zi+1 −Zi )} (A13) ここで、Zi+1 とZi は(i+1)番目とi番目の画素
の画像濃度値を示す。さて、Mを固定サイズのマスク長
とする。もし、マスクがMより小さいなら、ゼロ詰めが
続く。
【0046】m(i)<Mであれば、m(i)の両辺に
{M−m(i)}/2個のゼロを加えるので、ゼロ詰め
されたm(i)、mz (i)が得られる。それゆえに、
一次元のフィルタ操作は次のように定義される。
【0047】 ここで、y(k)はk番目画素の出力画像を定義する。
【0048】2値画像に関して、画質の低下は閾値操作
に関連したぼやけ(blurring)過程とその過程によるノイ
ズの混入が原因となる。このことは数学的には、次のよ
うに表される。
【0049】 Rb = T〔I*G+n〕 (A15) ここで、Rb は質の低下した2値画像であり、T
[ .]は閾値操作を表す。そのとき、次のような関数
が得られる(式(A6)に類似)。
【0050】 Qb =‖T〔I*G(σ)〕−Rb2 +λ1 〔‖I‖2 +6〕(A16) 式(16)の関数は次のような問題を提出している。即
ち、与えられた質の低下した2値画像Rb に対して、入
力画像Iが平滑度拘束条件とエッジ局所化(非線形性が
関係する回復問題)に従うように得られるようなガウス
関数のフィルタσのスケールを見いだす。
【0051】方程式(A16)の解は、右辺の第1項が
グレースケールの対応部分で置換される以外は上記に定
義されたと同じ手順に従って得られる。即ち、以下の通
りである。
【0052】 ‖I*G(σ)−Rb2 ≡‖I*G(σg )−Rb *G2 (σ0 )‖2 (A17) ここで、σ0 は一定のスケールであり、一般性を失うこ
となく、σ0 =1(その定数はシミュレーションの結果
から得られる)がセットされ、σg はσのように未知数
として残る。前の節で導出されたステップの処理を経た
後、次のような結果が得られる。
【0053】 λ=1/σg = 8/5±(10/13)d/dx〔Rb *G2 (σ0 =1)〕(A18) 負の記号を除いて絶対値を用いると、次のような式が得
られる。
【0054】 λ= 8/5+(10/13)|d/dx[Rb *G2 (σ0 =1)]| (A19) 式(A19)で得られたフィルタスケールが式(A1
6)に代入され、(I)に関する解は,次のように表さ
れる。
【0055】 I=h(1−|h′|) (A20) ここで、h=Rb *G2 (σ0 =1)であり、h′はス
ペースパラメータに関するhの導関数である。
【0056】さて、ステップS43では、最大フィルタ
マスクサイズが考慮中の画像データZMに関して決定さ
れる。特に、前述のように、ガウス関数に関して、全体
積の99.7%は中心より±3σの領域内、即ち、6σ
の範囲にあることが知られている。従って、最大マスク
サイズMは、ステップS42で計算された最大σ(i,
j)の6倍の次の最大奇数(識別可能な中心画素を与え
る)である。
【0057】替わりに、最大マスクサイズMは、前もっ
て、おそらく遭遇するであろう全ての画像に対して適切
である所定の値にセットすることもできる。実験的に
は、M=15は検証された全ての2値画像に関して満足
のゆく結果をだしたことが分かっている。
【0058】ステップS44では、フィルタは各画素Z
M(i,j)に関して、ステップS42で計算された拡
がりとステップS43で計算された最大マスクサイズM
に基づいて、選択される。本実施例では、フィルタは円
対象のガウス関数であるが、そのフィルタは他の形、例
えば、矩形や三角形や指数関数の形や、放物線の形のも
のを用いることもできる。適当な円対象のガウス関数の
フィルタは次のように表される。
【0059】 G[m,n:σ(i,j)]=[1/√{2πσ(I,J)}]exp[(-1/2){m2+n2}/ σ(I,J)](8) ステップS45では、ガウス関数についてのフィルタ値
のM×M格子、mzを形成する。ガウス関数はガウス関
数の拡がりに基づいて変化してマスクされ、M×M格子
がガウス関数でその中心部が形成され、その周辺部はゼ
ロとなる。ゼロ詰めの拡がりは、各画素についてそのフ
ィルタの拡がりσ(i,j)によって決定され、即ち、
[M−6σ(i,j)]/2個のゼロがガウス関数の両
側に詰められ、M×M格子を満たす。この過程は以下に
示す方程式系で与えられる。
【0060】 mz(i,j)= G[m,n:σ(i,j)] (|m|<3σ(i,j) 及び|n|<3σ(i,j) である場合) =0 (上記以外の場合) (9) ここで、mとnの値とは、中心画素(0,0)の回りで
−(M−1)/2から(M−1)/2まで変化する。従
って、可変マスクmzは、各画素ZM(i,j)に関し
て導出され、格子中央から±3σに渡るフィルタをも
ち、それ以外の領域ではゼロであるM×M格子である。
【0061】各画素に関して可変マスクガウス関数を計
算することに替えて、ステップS45で説明したよう
に、いろいろな拡がりをもつ可変マスクガウス関数を前
もって計算し、ルックアップテーブルにその計算された
ガウス関数を格納しておくこともできる。ステップS4
2で計算された拡がりに基づいて、適切な前もって計算
されたフィルタがルックアップテーブルから選択され
る。
【0062】ステップS46では、CPU10は可変マ
スクフィルタGを含むM×M格子を画像データZMに適
用して、次のようにフィルタされた画像データZF
(i,j)の1画素が得られる。
【0063】 ZF(i,j)=ΣΣmz(m,n)ZM(m−1,n−j) (10) ここで、左辺の総和はm=−(M−1)/2からm=+
(M−1)/2までで求められ、右辺の総和はn=−
(M−1)/2からn=+(M−1)/2までで求めら
れる。
【0064】ステップS47では、多値画像データにお
いて各画素に関して、ステップS44、S45、S46
の処理を実行したかどうかを調べ、必要ならこれらの処
理を繰り返す。
【0065】ステップS48では、フィルタされた画像
データZFがRAM17内のフィルタード画像メモリ2
4に格納される。
【0066】このようにして、CPU10とPROM1
5に関連して、種々のメモリ22、23、24と、ステ
ップS41からS48の処理は、画像処理方法とその装
置を提供しており、これによって、フィルタが多値画像
データの各画素に関して周辺画素の濃度変化に基づいて
導出される。これによって、そのフィルタは画像データ
に適用され、フィルタされた画像データが得られる。好
適には、そのフィルタはガウス関数であり、その拡がり
は画像濃度と定数との和の変化に逆比例する。これによ
って、雑音のあるしみなどに関しては平滑化されるが、
エッジのディテイルはエッジの鮮明度やエッジの局所化
に関して保存されるようにフィルタされた画像データが
生成される。
【0067】その画像処理の効果は図5Aと図5Bとを
比較することによって理解できる。図5Aは、単語“t
est”の形をしたオリジナル2値画像を示している。
処理後、図5Bにおける単語“test”にはエッジ局
所化と鮮明度が残されているが、雑音によるしみは平滑
化されて取り除かれている。
【0068】さて図2に戻り、フィルタされた画像デー
タZFは微分され、微分された画像データZDはRAM
17内の差分メモリ25に格納される。前述のように、
微分は次のような、また図5Cに示されているような第
1次差分操作によって行われる。
【0069】 dx(i,j) = ZF(i+1,j) - ZF(i,j) (11) dy(i,j) = ZF(i,j+1) - ZF(i,j) (12) ZD(i,j) = √{dx2(i,j) + dy2(i,j)} (13) 微分データZDは次のように、また、図5Dに示されて
いるように逆数がとられる(即ち、白画素は黒画素によ
って置換され、黒画素は白画素に置換される)。
【0070】 ZI(i,j)=255 − ZD(i,j) (14) ここで、数値255はこのデータに関する最大グレース
ケールを示す。反転された画像データZIはRAM17
内の反転画像データメモリ26に格納される。乗算器は
参照番号27で示されている。乗算器27によって各ガ
ウス関数ごとにフィルタード画像メモリ24に格納され
たフィルタされた画像データと反転画像データメモリ2
6に格納された反転画像データZIとの積が、次のよう
に、また、図5Eに示されるように得られる。
【0071】 ZP(i,j)=ZF(i,j)・ZI(i,j) (15) 結果として得られる積ZPは平滑化かつ細線化された画
像データであり、RAM17内の平滑細線化画像データ
メモリ28に格納される。もし望むなら、積ZPには、
図5Fに示されているように閾値操作が施され、多値画
像データZPが平滑化かつ細線化された2値画像データ
に変換される。多値レベル(0〜255)の内、85と
105との間にセットされた閾値が満足のゆく結果を生
み出すことがわかった。その閾値はRAM17内の閾値
メモリ29に格納される。
【0072】閾値或は多値形式での処理済画像は、プリ
ンタ/ディスプレイ19の装置で目視することができ、
また、ファクシミリ13を経由して電話線14によって
伝送されて遠隔地において目視することができる。
【0073】従って、CPU10、PROM15と連動
して、各メモリと乗算器22〜29とは平滑化かつ細線
化された画像データを方法と装置を提供しており、これ
によって画像データ濃度の変化に依存したフィルタが画
像データの各画素に関して導出され、そのフィルタが画
像データに適用されてフィルタされた画像を得ることが
でき、反転画像がフィルタされた画像データの第1次差
分から導出され、そして、その反転画像とフィルタされ
た画像との積がとられて平滑化かつ細線化された画像デ
ータが形成される。図1に示した装置に適したC言語で
書かれたコンピュータプログラムについて以下に示す。 main( ) { template F; //ぼやけた質の低い入力画像 template I; //出力 template tl, t2, t3, t4ref, t4deg; template t5ref, t5deg; template temp; template dummyl, dummy2; grey_image deg, blurdeg; // 入力画像とぼやけた画像 grey_image plot_out; grey_image ref; double sigma; //シグマ(σ) char strn[200]; //スクリーンへのプリントに使用 char filename1[200], filename2[200]; double before, after; //本方法がどれ程良く作用するか double s; int i,j; fg_coord_t xl, yl, x2, y2; int u,d,l,r; int thresh1, thresh2; int tempsize; //////////σ = 1の場合のぼやけた質の低い画像 ///////////// t1.convolve(ref, temp); // t1 = ぼやけた画像 t2.computeddt(tl); // t2 =ぼやけた画像の導関数 t2.scale(0,255); t3.fill(0,t2.sizeR, t2.sizeC); // t3 =ぼやけた画像の反転導関数 for (i=0; i<t2.sizeR; i++) for (j=0; j<t2.sizeC; j++) t3.pixel[i]tj] = 255.0 - t2.pixel[i][j]; product(t4ref, t3, t1); // t4 = ぼやけた画像とその導関数の積 t4ref.plotbox(x2,y2); y2 += t4ref.sizeR + 10; ///////////////////////////////////////////////////////////////////// //テンプレートをガウス関数で詰める template::makegauss(double sigma, int size) { int i,j; double center; // ガウス関数の中心 double x,y; allocate(size, size); //所定サイズのメモリ割り当て center = O.5 * (size - 1); for (i=0; i<size; i++) for (j=0; j<size; j++) { x=i; y=j; // 中心値にロード x-=center; y-=center; //中心に移動 pixel[i][j] = exp(-(x*x+y*y)/2.0/sigma/sigma) /2.0/3.14159/sigma/ sigma; } } //画像をテンプレートにたたみ込む:画像がテンプレートにたたみ込まれる template::convolve(grey_image, image, template, temp) { int i,j,r,c,a,b; double sum; allocate(image.sizeR + temp.sizeR - 1, // サイズxがセットされる image.sizeC + temp.sizeC - 1); for (r=0; r<sizeR; r++) for (c=0; c<sizeC; c++) { sum = 0.0; for (i=0; i<temp.sizeR; i++) for (j=0; j<temp.sizeC; j++) { a = r+i-temp.sizeR+1; b = c+j-temp.sizeC+1; if ((a >= 0)||(a < image.sizeR)||(b >= 0)||(b < image.sizeC)) sum += temp.pixel[i][j] * image.pixel[a][b]; } pixel[r][c] = sum; } //テンプレートの導関数を計算 template::computeddt(template, image) { double r1,r2,c1,c2; //隣接矩形について用いる値 double dr, dc; // 縦及び横の傾き int i,j; // インデックス変数 allocate(image.sizeR, image.sizeC); for (i=0; i<sizeR; i++) //非境界画素についての導関数計算 for (j=0; j<sizeC; j++) r1 = r2 = c1 = c2 = 0; //隣接矩形の値にロード if (i != 0) //上側 r1 = image.pixel[i-1][j]; if (i != sizeR-1) //下側 r2 = image.pixel[i+1][j]; if (j != 0) //左側 c1 = image.pixel[i][j-1]; if (j != sizeC-1) //右側 c2 = image.pixel[i][j+1]; dr = (r2 - r1)/2.0; dc = (c2 - c1)/2.0; pixel[i][j] = sqrt(dr*dr + dc*dc); pixel[i][j] = fabs(dr); } } ////////////////////////////////////////////////////////////////////// //単一値を用いたテンプレートの作成: value = value, XとY はサイズの値 template::fill(double value, int R, int C) { allocate(R,C); // 新テンプレートの作成 (サイズ調整されることに注意) for (int i=O; i<sizeR; i++) for (int j=O; j<sizeC; j++) pixel[i][j] = value; }; ////////////////////////////////////////////////////////////////////// //******************************************************************** //オーバラップ: C=AがBとオーバラップする回数 (同次元) product(template C, template A, template B) { int i,j; C.fill(O, A.sizeR, A.sizeC); for (i=O; i<A.sizeR; i++) for (j=O; j<A.sizeC; j++) C.pixel[i][j] = A.pixel[i][j] * B.pixel[i][j] / 255.0; } もし望むなら、CPU10はPROM15によってプロ
グラムされ、オペレータが文字認識動作に先立って画像
データを平滑化し細線化するかどうかを選択できるよう
にする。即ち、高品質の画像である場合、画像データを
平滑化し細線化することは、文字認識処理に必要となる
文字辞書のサイズを削減できるので、利点がある。も
し、この利点を必要としないなら、CPU10は平滑化
し細線化過程を選択しないようにして後述する文字認識
動作に直接続くようにするオプションをオペレータに与
えるようにプログラムできる。これに対して、画像が質
の低いものであったり、高品質の画像について小さなサ
イズの文字辞書を望むなら、文字認識動作に先立つ平滑
化し細線化する処理を選択するように動作できる。
【0074】さて図2に戻り、平滑細線化過程が画像の
歪みによって接触した文字を切り出すとき、付加的な切
り出しが必要であるかもしれない。従って、付加的なそ
してより完全な文字切り出しを行うために、装置には修
正用文字切り出し器30が提供されている。
【0075】文字認識装置は参照番号31で示されてい
る。その文字認識装置は公知の技術によるものなので、
その詳細の説明はここでは行わない。一般的に、文字認
識装置31は文字切り出し器30によって切り出された
切り出し文字各々を処理し、辞書16に格納された所定
の文字辞書と切り出し文字各々を比較する。平滑化及び
細線化によって入力画像をその本質的な部分だけに減ら
すので、たとえフォントが異なっていても、同じ文字は
同じに見えるという利点がある。従って、文字辞書16
のサイズが削減でき、装置を単純化することができる。
【0076】文字認識装置31は切り出された文字を処
理し、識別された文字はRAM17内のデコーデッド文
字メモリ32に格納される。デコードされた文字は、必
須なことではないが、ASCII形式によって文書ファ
イルに格納されるのが典型的である。
【0077】デコードされた文字がメモリ32に格納さ
れた後、この文字はさらに続く処理、例えば、ワード或
は文書或は帳票処理に用いられる。従来技術に従うと、
オペレータはキーボード20を用いてメモリ32に格納
されたデコードされた文字を取り出し、図1に示したオ
フィスオートメーション機器のデータ処理機能を用いて
そのデコードされた文字を加工する。その操作によっ
て、CPU10は加工された文字(或は、望むなら加工
されていない文字)を扱って、例えば、モデムによって
遠隔地の装置に対する再伝送のために装置18に出力す
る。もし望むなら、出力装置18はASCII形式から
ファクシミリ互換形式への変換のような、文字形式を変
換するように構成される。
【0078】従って、図1に示す装置は、オペレータに
対してファクシミリ13を経て画像を受信する機能を提
供し、ファクシミリ伝送による画質の低下を補償するよ
うに画像を強調し、その強調画像によって文字認識を実
行したり、その認識文字に対して加工を加えたり、ま
た、他のデータ処理を実行し、例えば、他のファクシミ
リ装置に加工された文字を再伝送する。
【0079】なお本発明は、複数の機器から構成される
システムに適用しても良いし、1つの機器からなる装置
に適用しても良い。また本発明はシステム或は装置にプ
ログラムを供給することによって達成される場合にも適
用できることは言うまでもない。
【0080】
【発明の効果】以上説明したように本発明によれば、例
えば、画像再生或はパターン・文字認識処理などの高度
な処理に先立ち、画像データを平滑化及び細線化するの
で、その平滑化によってノイズによる点を除去する一
方、細線化によって線幅を細くして画像輪郭のぼやけを
補正する。その結果、画像データには本質的な部分のみ
が残され、そのデータからの再生画像はより鮮明なもの
となる。
【0081】特に、これを文字画像に適用した場合には
ノイズによる点が除去され線幅が細くなるので、接触し
た文字からの部分的な文字切り出しが可能となるので、
より正確で精度の高い文字認識ができるようになる。
【0082】さらにノイズ除去によって画像データには
本質的な部分のみが残されるので、類似の文字画像パタ
ーンが多くの異なる入力文字フォントに対して生成され
る。もし、その文字に例えばアンダラインが付された
り、四角(例えば、数字の表など)で囲まれている場
合、本発明に従えば、そのような余計な特徴を除去する
ことが可能となる。
【0083】従って、本発明を文字認識装置に適用した
り文字認識処理に先立つ処理に用いられる場合、文字辞
書のサイズを削減することが可能になるという利点もあ
る。
【図面の簡単な説明】
【図1】本発明の代表的な実施例である装置の構成を示
すブロック図である。
【図2】図1に示す装置によって実行される本発明の画
像処理方法の実施例を示す機能ブロック図である。
【図3】2値画像データから多値画像データを生成する
手順を示す詳細なフローチャートである。
【図4】本発明を応用して用いられる可変マスクフィル
タを示す詳細なフローチャートである。
【図5A】本実施例の処理に従う画像データの変化を示
す図である。
【図5B】本実施例の処理に従う画像データの変化を示
す図である。
【図5C】本実施例の処理に従う画像データの変化を示
す図である。
【図5D】本実施例の処理に従う画像データの変化を示
す図である。
【図5E】本実施例の処理に従う画像データの変化を示
す図である。
【図5F】本実施例の処理に従う画像データの変化を示
す図である。
【図6】本発明の効果を説明するために用いられる画像
データの典型例である。
【符号の説明】
10 CPU 11 データバス 12 スキャナ 13 ファクシミリ 14 電話線 15 プログラムROM 16 文字辞書 17 RAM 18 出力装置 19 プリンタ/ディスプレイ 20 キーボード
フロントページの続き (72)発明者 メザードゥ・レザ・バエズィー アメリカ合衆国 カリフォルニア州 92626,コスタ メサ, プルマン スト リート 3188, アット キヤノン イン フォメーション システムズ インク. (番地なし)

Claims (61)

    【特許請求の範囲】
  1. 【請求項1】 画素データ形式の画像を処理する画像処
    理方法であって、 各画素データについて、周辺画素の画像濃度の変化に依
    存した拡がりをもつ陪フィルタを導出する導出工程と、 フィルタされた画像データを得るために、前記画素デー
    タに前記対応するフィルタをかける適用工程とを有する
    ことを特徴とする画像処理方法。
  2. 【請求項2】 前記フィルタ各々は、おおよそガウス関
    数の形をした特性をもち、前記ガウス関数の拡がりは周
    辺画素の画像濃度に定数を加えたものの変化におおよそ
    逆比例することを特徴とする請求項1に記載の画像処理
    方法。
  3. 【請求項3】 前記フィルタに対するマスクを選択し、
    前記マスクの中央部にフィルタ値を、そして、前記マス
    クの周辺部にゼロ値を詰める値詰め工程をさらに有する
    ことを特徴とする請求項1に記載の画像処理方法。
  4. 【請求項4】 前記フィルタの最大拡がりに基づいて、
    最大マスクサイズを決定する決定工程をさらに有するこ
    とを特徴とする請求項3に記載の画像処理方法。
  5. 【請求項5】 2値画像データから擬似多値画像データ
    を導出する多値画像データ導出工程をさらに有し、前記
    擬似多値画像データは入力画像データとして用いられる
    ことを特徴とする請求項1に記載の画像処理方法。
  6. 【請求項6】 画素データ形式の画像を平滑化、及び、
    細線化する画像処理方法であって、 各画素に対して、拡がりが周辺画素の濃度の変化に依存
    するフィルタを適用し、フィルタされた画像データを得
    るフィルタ適用工程と、 前記フィルタされた画像データの微分データから反転画
    像を導出する導出工程と、 前記反転画像と前記フィルタされた画像データとの積を
    とって、平滑化、細線化された画像データを得る乗算工
    程とを有することを特徴とする画像処理方法。
  7. 【請求項7】 2値画像データから擬似多値画像データ
    を導出する多値画像データ導出工程をさらに有し、前記
    擬似多値画像データが入力画像データとして用いられる
    ことを特徴とする請求項6に記載の画像処理方法。
  8. 【請求項8】 前記フィルタ各々は、おおよそガウス関
    数の形をした特性をもち、前記ガウス関数の拡がりは周
    辺画素の画像濃度に定数を加えたものの変化におおよそ
    逆比例することを特徴とする請求項6に記載の画像処理
    方法。
  9. 【請求項9】 前記フィルタに対するマスクを選択し、
    前記マスクの中央部にフィルタ値を、そして、前記マス
    クの周辺部にゼロ値を詰める値詰め工程をさらに有する
    ことを特徴とする請求項6に記載の画像処理方法。
  10. 【請求項10】 前記フィルタの最大拡がりに基づい
    て、最大マスクサイズを決定する決定工程をさらに有す
    ることを特徴とする請求項9に記載の画像処理方法。
  11. 【請求項11】 前記フィルタされた画像データの第1
    次差分データを計算する計算工程をさらに有し、前記導
    出工程において前記第1次差分データが前記微分データ
    として用いられることを特徴とする請求項6に記載の画
    像処理方法。
  12. 【請求項12】 前記乗算工程において得られた平滑
    化、細線化された画像データに対して閾値処理を施す閾
    値工程をさらに有することを特徴とする請求項6に記載
    の画像処理方法。
  13. 【請求項13】 画素データ形式の画像から文字を認識
    する文字認識方法であって、 前記画素データを平滑化及び細線化する平滑細線化工程
    と、 前記平滑化、細線化されたデータにおいて、隣接する文
    字を切り出す切り出し工程と、 前記切り出された文字と文字辞書との比較に基づいて、
    切り出された文字を認識する認識工程とを有することを
    特徴とする文字認識方法。
  14. 【請求項14】 前記平滑細線化工程は、 前記画素各々に対して、拡がりが周辺画素の濃度の変化
    に依存するフィルタを適用し、フィルタされた画像デー
    タを得るフィルタ適用工程と、 前記フィルタされた画像データの微分データから反転画
    像を導出する導出工程と、 前記反転画像と前記フィルタされた画像データとの積を
    とって、平滑化、細線化された画像データを得る乗算工
    程とを有することを特徴とする請求項13に記載の文字
    認識方法。
  15. 【請求項15】 前記フィルタ各々は、おおよそガウス
    関数の形をした特性をもち、前記ガウス関数の拡がりは
    周辺画素の画像濃度に定数を加えたものの変化におおよ
    そ逆比例することを特徴とする請求項14に記載の文字
    認識方法。
  16. 【請求項16】 前記フィルタに対するマスクを選択
    し、前記マスクの中央部にフィルタ値を、そして、前記
    マスクの周辺部にゼロ値を詰める値詰め工程をさらに有
    することを特徴とする請求項14に記載の文字認識方
    法。
  17. 【請求項17】 前記フィルタの最大拡がりに基づい
    て、最大マスクサイズを決定する決定工程をさらに有す
    ることを特徴とする請求項16に記載の文字認識方法。
  18. 【請求項18】 前記フィルタされた画像データの第1
    次差分データを計算する計算工程をさらに有し、前記導
    出工程において前記第1次差分データが前記微分データ
    として用いられることを特徴とする請求項14に記載の
    文字認識方法。
  19. 【請求項19】 前記乗算工程において得られた平滑
    化、細線化された画像データに対して閾値処理を施す閾
    値工程をさらに有することを特徴とする請求項14に記
    載の文字認識方法。
  20. 【請求項20】 画素データ形式の画像を平滑化、及
    び、細線化する画像処理装置であって、 前記画像画素に対して、各々に拡がりが周辺画素の濃度
    の変化に依存するフィルタを適用し、フィルタされた画
    像データを得るフィルタ適用手段と、 前記フィルタされた画像データの微分データから反転画
    像を導出する導出手段と、 前記反転画像と前記フィルタされた画像データとの積を
    とって、平滑化、細線化された画像データを得る乗算手
    段とを有することを特徴とする画像処理装置。
  21. 【請求項21】 2値画像データを入力する入力手段
    と、 前記2値画像データから擬似多値画像データを導出する
    多値画像データ導出手段とをさらに有し、 前記擬似多値画像データは、前記入力画像データを含む
    ことを特徴とする請求項20に記載の画像処理装置。
  22. 【請求項22】 前記フィルタ各々は、おおよそガウス
    関数の形をした特性をもち、前記ガウス関数の拡がりは
    周辺画素の画像濃度に定数を加えたものの変化におおよ
    そ逆比例することを特徴とする請求項20に記載の画像
    処理装置。
  23. 【請求項23】 前記フィルタ適用手段によって適用さ
    れるマスクを選択する選択手段と、 前記マスクの中央部に入力画像データを、そして、前記
    マスクの周辺部にゼロ値を詰める値詰め手段とをさらに
    有することを特徴とする請求項20に記載の画像処理装
    置。
  24. 【請求項24】 前記フィルタに対するマスクを選択す
    るマスク選択手段と、 前記マスクの中央部にフィルタ値を、そして、前記マス
    クの周辺部にゼロ値を詰める値詰め手段とをさらに有す
    ることを特徴とする請求項20に記載の画像処理方法。
  25. 【請求項25】 前記フィルタされた画像データの第1
    次差分データを計算する計算手段をさらに有し、 前記導出手段は、前記第1次差分データを前記微分デー
    タとして用いることを特徴とする請求項20に記載の画
    像処理装置。
  26. 【請求項26】 前記乗算手段において得られた前記平
    滑化、細線化された画像データに対して閾値処理を施す
    閾値手段をさらに有することを特徴とする請求項20に
    記載の画像処理装置。
  27. 【請求項27】 画素データ形式の画像から文字を認識
    する文字認識装置であって、 画像データを入力する入力手段と、 前記画像データを平滑化及び細線化する平滑細線化手段
    と、 前記平滑化及び細線化されたデータにおいて、隣接する
    文字を切り出す切り出し手段と、 前記切り出された文字と文字辞書との比較に基づいて、
    切り出された文字を認識する認識手段とを有することを
    特徴とする文字認識装置。
  28. 【請求項28】 前記平滑細線化手段は、 前記画素各々に対して、拡がりが周辺画素の濃度の変化
    に依存するフィルタを適用し、フィルタされた画像デー
    タを得るフィルタ手段と、 前記フィルタされた画像データの微分データから反転画
    像を導出する導出手段と、 前記反転画像と前記フィルタされた画像データとの積を
    とって、平滑化、細線化された画像データを得る乗算手
    段とを有することを特徴とする請求項27に記載の文字
    認識装置。
  29. 【請求項29】 前記フィルタ各々は、おおよそガウス
    関数の形をした特性をもち、前記ガウス関数の拡がりは
    周辺画素の画像濃度に定数を加えたものの変化におおよ
    そ逆比例することを特徴とする請求項28に記載の文字
    認識装置。
  30. 【請求項30】 前記フィルタに対するマスクを選択す
    るマスク選択手段と、 前記マスクの中央部にフィルタ値を、そして、前記マス
    クの周辺部にゼロ値を詰める値詰め手段とをさらに有す
    ることを特徴とする請求項28に記載の文字認識装置。
  31. 【請求項31】 前記フィルタの最大拡がりに基づい
    て、最大マスクサイズを決定する決定手段をさらに有す
    ることを特徴とする請求項30に記載の文字認識装置。
  32. 【請求項32】 前記フィルタされた画像データの第1
    次差分データを計算する計算手段をさらに有し、 前記導出手段は、前記第1次差分データを前記微分デー
    タとして用いることを特徴とする請求項28に記載の文
    字認識装置。
  33. 【請求項33】 前記乗算手段において得られた平滑
    化、細線化された画像データに対して閾値処理を施す閾
    値手段をさらに有することを特徴とする請求項28に記
    載の文字認識装置。
  34. 【請求項34】 前記入力手段は2値画像データを画素
    ごとにメモリに格納するメモリ格納手段を含むことを特
    徴とする請求項27に記載の文字認識装置。
  35. 【請求項35】 2値画像データから擬似多値画像デー
    タを導出する多値画像データ導出手段をさらに含み、 前記擬似多値画像データは前記入力画像データを含むこ
    とを特徴とする請求項24に記載の文字認識装置。
  36. 【請求項36】 前記入力手段はスキャナであることを
    特徴とする請求項27に記載の文字認識装置。
  37. 【請求項37】 前記入力手段はファクシミリであるこ
    とを特徴とする請求項27に記載の文字認識装置。
  38. 【請求項38】 前記平滑化及び細線化された画像デー
    タを目視する出力手段をさらに有することを特徴とする
    請求項28に記載の文字認識装置。
  39. 【請求項39】 前記認識手段によって認識された文字
    の特徴を格納する出力装置をさらに有することを特徴と
    する請求項28に記載の文字認識装置。
  40. 【請求項40】 画素からなるオリジナル画像から文字
    を認識する文字認識装置であって、 前記画素画像を入力する入力手段と、 前記画素画像の各画素について、周辺画素の濃度の変化
    に依存したフィルタを導出する第1導出手段と、 前記フィルタ各々を画像の各画素に適用して、フィルタ
    された画像を得るフィルタ手段と、 前記フィルタされた画像データの第1次差分データから
    反転画像を導出する第2導出手段と、 前記反転画像と前記フィルタされた画像データとの積を
    とって、平滑化、細線化された画像データを得る乗算手
    段と、 前記平滑化、及び、細線化された画像データから文字を
    切り出す文字切り出し手段と、 前記切り出された文字各々と文字辞書との比較に基づい
    て、文字を認識する文字認識手段と、 前記認識された文字の特徴を格納する記憶手段とを有す
    ることを特徴とする文字認識装置。
  41. 【請求項41】 前記平滑化、及び、細線化された画像
    データを出力する出力手段をさらに有することを特徴と
    する請求項40に記載の文字認識装置。
  42. 【請求項42】 前記入力手段によって入力された前記
    画素画像は、2値画素画像を含み、さらに、前記2値画
    素画像を擬似多値画素画像に変換する変換手段を含むこ
    とを特徴とする請求項40に記載の文字認識装置。
  43. 【請求項43】 前記記憶手段に格納された前記文字を
    情報処理する情報処理手段と、 前記情報処理された文字を出力するための出力装置とを
    有することを特徴とする請求項40に記載の文字認識装
    置。
  44. 【請求項44】 前記出力装置は前記情報処理された文
    字をファクシミリ互換形式に変換する変換手段を有する
    ことを特徴とする請求項43に記載の文字認識装置。
  45. 【請求項45】 前記第1導出手段と、前記フィルタ手
    段と、前記第2導出手段と、前記乗算手段とを選択的に
    起動できるようにする選択起動手段をさらに有すること
    を特徴とする請求項40に記載の文字認識装置。
  46. 【請求項46】 画素画像から文字を認識する文字認識
    装置であって、 前記画素画像を入力する入力手段と、 (a)前記画素画像の各画素データについて、周辺画素
    の濃度の変化に依存したフィルタを導出する第1導出過
    程と、(b)前記フィルタ各々を前記画像の各画素に適
    用するフィルタ過程と、(c)前記フィルタされた画像
    の第1差分から反転画像を導出する第2導出過程と、
    (d)前記反転画像と前記フィルタされた画像データと
    の積をとって、平滑化、細線化された画像データを得る
    乗算過程との処理ステップを格納する第1記憶手段と、 前記第1記憶手段と協働して、前記第1記憶手段に格納
    された前記処理ステップを実行し、前記画素画像から平
    滑化され、細線化された画像を形成するプロセッサと、 前記プロセッサによって形成された前記平滑化、細線化
    された画像を格納する第2記憶手段と、 前記第2記憶手段に格納された前記平滑化、細線化され
    た画像から文字の特徴を決定する判別手段とを有するこ
    とを特徴とする文字認識装置。
  47. 【請求項47】 前記平滑化、細線化された文字画像を
    出力する出力手段をさらに有することを特徴とする請求
    項46に記載の文字認識装置。
  48. 【請求項48】 前記入力手段によって入力された前記
    画素画像は2値画素画像を含み、 前記第1記憶手段はさらに、前記2値画素画像を擬似多
    値画素画像に変換する過程の処理ステップを格納するこ
    とを特徴とする請求項46に記載の文字認識装置。
  49. 【請求項49】 前記第2記憶手段に格納された前記文
    字を情報処理する情報処理手段と、 前記情報処理された文字を出力する出力装置をさらに有
    することを特徴とする請求項46に記載の文字認識装
    置。
  50. 【請求項50】 前記出力装置は前記情報処理された文
    字をファクシミリ互換形式に変換する変換手段を有する
    ことを特徴とする請求項49に記載の文字認識装置。
  51. 【請求項51】 前記第1導出過程と、前記フィルタ過
    程と、前記第2導出過程と、前記乗算過程とを選択的に
    起動できるようにする選択起動手段をさらに有すること
    を特徴とする請求項46に記載の文字認識装置。
  52. 【請求項52】 統合オフィスオートメーション機器で
    あって、 画素画像を受信する入力手段と、 前記画素画像を平滑化、及び、細線化する平滑細線化手
    段と、 前記画素画像から文字を認識する認識手段と、 前記平滑化、及び、細線化された画素画像を前記認識手
    段に適用し、これによって、前記平滑化、及び、細線化
    された画素画像の文字を認識するようにする適用手段
    と、 前記認識手段によって認識された前記文字の特徴を格納
    する記憶手段と、 前記記憶手段に格納された文字に関して情報処理を実行
    する情報処理手段と、 前記データ処理され、情報処理された文字を出力する出
    力手段とを有することを特徴とする統合オフィスオート
    メーション機器。
  53. 【請求項53】 前記入力手段はファクシミリを含み、
    前記出力手段は前記情報処理された文字をファクシミリ
    互換形式に変換するために用いられることを特徴とする
    請求項52に記載の統合オフィスオートメーション機
    器。
  54. 【請求項54】 前記適用手段は、前記平滑化、及び、
    細線化された画素画像と前記入力手段によって入力され
    た画素画像の1つを選択して、前記認識手段に適用する
    選択手段を含むことを特徴とする請求項52に記載の統
    合オフィスオートメーション機器。
  55. 【請求項55】 前記ファクシミリによって入力された
    前記画素画像は2値画素画像であり、さらに、前記2値
    画素画像を擬似多値画素画像に変換する変換手段を有す
    ることを特徴とする請求項53に記載の統合オフィスオ
    ートメーション機器。
  56. 【請求項56】 画素画像から文字を認識する文字認識
    方法であって、 前記画素画像を受信する受信工程と、 前記画素画像を平滑化、及び、細線化する平滑細線化工
    程と、 前記平滑化、及び、細線化された画素画像から文字を認
    識する認識工程と、 前記認識工程において認識された前記文字の特徴を格納
    する格納工程とを有することを特徴とする文字認識方
    法。
  57. 【請求項57】 前記認識工程において認識され格納さ
    れた文字に関して、情報処理操作を実行する情報処理工
    程と、 前記情報処理された文字を出力する出力工程とをさらに
    有することを特徴とする請求項56に記載の文字認識方
    法。
  58. 【請求項58】 前記出力工程はさらに前記情報処理さ
    れた文字をファクシミリ互換形式に変換する変換工程を
    有することを特徴とする請求項57に記載の文字認識方
    法。
  59. 【請求項59】 前記受信工程は、さらに、前記ファク
    シミリによって受信された前記画素画像を擬似多値画素
    画像に変換する多値画像変換工程を有することを特徴と
    する請求項58に記載の文字認識方法。
  60. 【請求項60】 前記識別工程は、さらに、前記平滑化
    及び細線化された画素画像或は前記受信工程によって受
    信された画素画像のいづれか1つを選択して、前記認識
    工程に適用する選択工程を有することを特徴とする請求
    項56に記載の文字認識方法。
  61. 【請求項61】 前記平滑化、及び、細線化された画素
    画像を出力する出力工程をさらに有することを特徴とす
    る請求項56に記載の文字認識方法。
JP26443892A 1991-10-04 1992-10-02 文字認識方法及びその装置 Expired - Fee Related JP3264999B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US771220 1991-10-04
US07/771,220 US5351314A (en) 1991-10-04 1991-10-04 Method and apparatus for image enhancement using intensity dependent spread filtering

Publications (2)

Publication Number Publication Date
JPH05225388A true JPH05225388A (ja) 1993-09-03
JP3264999B2 JP3264999B2 (ja) 2002-03-11

Family

ID=25091106

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26443892A Expired - Fee Related JP3264999B2 (ja) 1991-10-04 1992-10-02 文字認識方法及びその装置

Country Status (4)

Country Link
US (1) US5351314A (ja)
EP (1) EP0535992B1 (ja)
JP (1) JP3264999B2 (ja)
DE (1) DE69230629T2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002056386A (ja) * 2000-08-07 2002-02-20 Nippon Telegr & Teleph Corp <Ntt> 画像処理方法、及び画像処理方法を実行するプログラムを記録した記録媒体
JP2009065665A (ja) * 2007-09-06 2009-03-26 Thomson Licensing 画像の空間拡散
JP2010191909A (ja) * 2009-02-20 2010-09-02 Mitsubishi Heavy Ind Ltd 文字認識装置及び文字認識方法
JP2016523397A (ja) * 2013-06-03 2016-08-08 アリペイ・ドット・コム・カンパニー・リミテッドAlipay.Com Co., Ltd 情報認識のための方法及びシステム
KR20200063605A (ko) * 2018-11-28 2020-06-05 안희철 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 필체를 통해 생성한 폰트를 이용하는 드로잉 방법, 상기 방법을 실행하기 위해 컴퓨터 판독가능 저장매체에 저장된 컴퓨터 프로그램 및 필체를 통해 생성한 폰트를 이용하는 드로잉 시스템

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4105517C2 (de) * 1991-02-22 1995-11-16 Hell Ag Linotype Verfahren und Vorrichtung zur verbesserten Wiedergabe von Konturen
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US6123261A (en) * 1997-05-05 2000-09-26 Roustaei; Alexander R. Optical scanner and image reader for reading images and decoding optical information including one and two dimensional symbologies at variable depth of field
GB2282514B (en) * 1993-10-04 1997-11-05 Aston Electronic Designs Limit Video signal processors
JP3059615B2 (ja) * 1993-10-27 2000-07-04 キヤノン株式会社 印刷システム及び印刷制御装置及び制御方法
JPH07131641A (ja) * 1993-11-08 1995-05-19 Canon Inc 画像処理装置
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JPH07220091A (ja) * 1994-02-04 1995-08-18 Canon Inc 画像処理装置及び方法
US5563962A (en) * 1994-03-08 1996-10-08 The University Of Connecticut Two dimensional digital hysteresis filter for smoothing digital images
US5802257A (en) * 1994-11-25 1998-09-01 Canon Kabushiki Kaisha Information processing apparatus, method and memory medium that control a bold process in accordance with the setting of a facsimile mode
US5764307A (en) * 1995-07-24 1998-06-09 Motorola, Inc. Method and apparatus for spatially adaptive filtering for video encoding
US6005978A (en) * 1996-02-07 1999-12-21 Cognex Corporation Robust search for image features across image sequences exhibiting non-uniform changes in brightness
US6389162B2 (en) 1996-02-15 2002-05-14 Canon Kabushiki Kaisha Image processing apparatus and method and medium
US5893127A (en) * 1996-11-18 1999-04-06 Canon Information Systems, Inc. Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document
US6512848B2 (en) 1996-11-18 2003-01-28 Canon Kabushiki Kaisha Page analysis system
US5892843A (en) * 1997-01-21 1999-04-06 Matsushita Electric Industrial Co., Ltd. Title, caption and photo extraction from scanned document images
DE19707046A1 (de) 1997-02-21 1998-08-27 Rolf Prof Dr Ing Eckmiller Lernfähiger "Active Vision" Implant Encoder
US6298173B1 (en) 1997-10-03 2001-10-02 Matsushita Electric Corporation Of America Storage management system for document image database
US6457032B1 (en) 1997-11-15 2002-09-24 Cognex Corporation Efficient flexible digital filtering
US6310697B1 (en) 1998-07-07 2001-10-30 Electronics For Imaging, Inc. Text enhancement system
US6501565B1 (en) * 1998-07-07 2002-12-31 Electronics For Imaging, Inc. Method and apparatus for smoothing text outlines
US6327388B1 (en) 1998-08-14 2001-12-04 Matsushita Electric Industrial Co., Ltd. Identification of logos from document images
US6947178B2 (en) * 2001-02-26 2005-09-20 International Business Machines Corporation De-screening halftones using sigma filters
US7203337B2 (en) * 2001-06-21 2007-04-10 Wespot Ab Adjusted filters
US7433084B2 (en) * 2002-07-01 2008-10-07 Xerox Corporation Digital de-screening technique for scanned documents
US8144984B2 (en) * 2006-12-08 2012-03-27 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program for color fringing estimation and compensation
WO2009128798A1 (en) * 2008-04-16 2009-10-22 Nikon Corporation Method for deblurring an image that produces less ringing
JP5223702B2 (ja) * 2008-07-29 2013-06-26 株式会社リコー 画像処理装置、ノイズ低減方法、プログラム、記憶媒体
US9117263B2 (en) * 2012-05-03 2015-08-25 Qualcomm Incorporated Noise removal from images containing text
CN106296578B (zh) * 2015-05-29 2020-04-28 阿里巴巴集团控股有限公司 一种图像处理方法及装置
JP7012642B2 (ja) * 2015-11-09 2022-01-28 ヴァーシテック・リミテッド アーチファクトを意識したビュー合成のための補助データ
CN111709344B (zh) * 2020-06-09 2023-10-17 上海海事大学 一种基于高斯混合模型的epll图像去光照识别处理方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4197583A (en) * 1978-05-03 1980-04-08 Baird Corporation Image display system
DE3347645C1 (de) * 1983-12-30 1985-10-10 Dr.-Ing. Ludwig Pietzsch Gmbh & Co, 7505 Ettlingen Verfahren und Einrichtung zum opto-elektronischen Pruefen eines Flaechenmusters an einem Objekt
JPS60178588A (ja) * 1984-02-24 1985-09-12 Fujitsu Ltd 画像処理装置
US5119444A (en) * 1986-07-22 1992-06-02 Schlumberger Technologies, Inc. System for expedited computation of laplacian and gaussian filters and correlation of their outputs for image processing
US4891750A (en) * 1986-10-29 1990-01-02 Pitney Bowes Inc. Optical character recognition by forming and detecting matrices of geo features
JPS63265371A (ja) * 1986-12-15 1988-11-01 Toshiba Corp 線図形つなぎ装置
US4884225A (en) * 1987-04-03 1989-11-28 University Of Massachusetts Medical Center Filtering in 3-D visual system
JP2675303B2 (ja) * 1987-04-28 1997-11-12 キヤノン株式会社 文字認識方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002056386A (ja) * 2000-08-07 2002-02-20 Nippon Telegr & Teleph Corp <Ntt> 画像処理方法、及び画像処理方法を実行するプログラムを記録した記録媒体
JP2009065665A (ja) * 2007-09-06 2009-03-26 Thomson Licensing 画像の空間拡散
JP2010191909A (ja) * 2009-02-20 2010-09-02 Mitsubishi Heavy Ind Ltd 文字認識装置及び文字認識方法
JP2016523397A (ja) * 2013-06-03 2016-08-08 アリペイ・ドット・コム・カンパニー・リミテッドAlipay.Com Co., Ltd 情報認識のための方法及びシステム
KR20200063605A (ko) * 2018-11-28 2020-06-05 안희철 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 필체를 통해 생성한 폰트를 이용하는 드로잉 방법, 상기 방법을 실행하기 위해 컴퓨터 판독가능 저장매체에 저장된 컴퓨터 프로그램 및 필체를 통해 생성한 폰트를 이용하는 드로잉 시스템

Also Published As

Publication number Publication date
JP3264999B2 (ja) 2002-03-11
EP0535992B1 (en) 2000-02-02
EP0535992A3 (en) 1993-12-01
DE69230629D1 (de) 2000-03-09
US5351314A (en) 1994-09-27
EP0535992A2 (en) 1993-04-07
DE69230629T2 (de) 2000-06-21

Similar Documents

Publication Publication Date Title
JPH05225388A (ja) 画像処理方法及びその装置と、文字認識方法及びその装置と、統合オフィスオートメーション機器
US6075926A (en) Computerized method for improving data resolution
Loce et al. Enhancement and restoration of digital documents: Statistical design of nonlinear algorithms
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
US7599095B2 (en) Wavelet-based image processing path
KR101737338B1 (ko) 주석이 달린 문서 이미지들로부터 클린 문서를 복원하기 위한 시스템 및 방법
US5359423A (en) Method for statistical generation of density preserving templates for print enhancement
JPH11331577A (ja) 連続ト―ン画像出力方法
JP2000216998A (ja) ハーフトーン画像のモデリング及び再構成のための方法及び装置
US5572605A (en) Apparatus and method for inputting, compressing and outputting characters, illustrations, drawings and logomarks
JP2002185800A (ja) 適合画像強調フィルター及び強調画像データの生成方法
US20170249527A1 (en) Image processing apparatus and medium storing program executable by image processing apparatus
US20050030586A1 (en) Adaptive halftone scheme to preserve image smoothness and sharpness by utilizing X-label
US7885486B2 (en) Image processing system, method for processing image and computer readable medium
US5539866A (en) Method and apparatus for accurately rendering half-bitted image pixels
KR101887929B1 (ko) 이미지 처리 장치, 이미지 처리 방법, 컴퓨터 판독가능 기록매체 및 화상형성장치
Zhang et al. Image inverse halftoning and descreening: a review
JP4446332B2 (ja) セグメンテーション・ベースのハーフトーニング
CA2150055C (en) Method of downsampling documents
Konya et al. Adaptive methods for robust document image understanding
KR100416496B1 (ko) 다중 역치값을 이용한 이치화 방법
JPH1031717A (ja) 画像認識方法
JP2004326322A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び画像記録装置
JPH09507942A (ja) 電子走査ピクチャの背景除去
JP2002279346A (ja) 画像処理装置、画像処理方法、記録媒体および文字認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20011207

LAPS Cancellation because of no payment of annual fees