JP2008210387A - 文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム - Google Patents

文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム Download PDF

Info

Publication number
JP2008210387A
JP2008210387A JP2008044927A JP2008044927A JP2008210387A JP 2008210387 A JP2008210387 A JP 2008210387A JP 2008044927 A JP2008044927 A JP 2008044927A JP 2008044927 A JP2008044927 A JP 2008044927A JP 2008210387 A JP2008210387 A JP 2008210387A
Authority
JP
Japan
Prior art keywords
stroke
noise
width
smoothing
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008044927A
Other languages
English (en)
Other versions
JP4852059B2 (ja
Inventor
Shun Son
俊 孫
Yoshinobu Hotta
悦伸 堀田
Katsuto Fujimoto
克仁 藤本
Satoshi Naoi
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2008210387A publication Critical patent/JP2008210387A/ja
Application granted granted Critical
Publication of JP4852059B2 publication Critical patent/JP4852059B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】本発明は文書画像の2値化性能を改善するノイズ除去装置及び方法を提供する。
【解決手段】このノイズ除去装置は、文字の筆画の方向に係わる情報により階調画像のノイズポイントを平滑化させ、平滑化された階調画像を出力する階調画像平滑化手段と、前記階調画像平滑化手段で出力された平滑化後の階調画像を2値化させ、2値化された画像を出力する階調画像2値化手段と、文字の筆画の幅に基づき、前記階調画像2値化手段で出力された2値化後の画像のノイズポイントを除去する2値画像ノイズ除去手段とを含む。
【選択図】 図1

Description

本発明は文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラムに関し、具体的には、文字の筆画モデルによる文書画像平滑化方法及び文字の筆画幅推定による2値画像ノイズ除去方法により、文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラムに関する。
文書画像の2値化とは文書認識の1つの重要な工程である。2値化処理とは、走査又は撮影で得られたデジタル化文書画像の画素ドットを内容と背景という2種類に分けることを意味している。内容は文字や表枠などを含み、通常黒色で示す一方、背景は通常白色で示す。
様々な2値化アルゴリズムの原理及び性能の評価に関する報告としては、非特許文献1がある。また、文書画像の2値化方法についても特許が発表され、例えば、特許文献1がある。
M.Sezgin、B.Sanker著、「Survey over image thresholding techniques and quantitative performance evaluation」、Journal of Electronic Imaging 13(1),2004 米国特許第6,438,265号、A.Heilper, Y.Navon, E.Walach、「Method of binarization in an optical character recognition system」
文書画像の品質は画像を取得する手段の相違や画像圧縮などの原因によって低下することがあり、それは2値化の結果に大いに影響を与えている。2値化効果を向上させるために、多くの異なる2値化アルゴリズムが提案され、それらアルゴリズムはある程度背景ノイズなどによる影響を効果的に抑制できる。しかし、画像劣化の具体的な原因及びその程度はそれぞれ異なるので、現在の2値化アルゴリズムはまだ課題を完全に解決できるものではない。
そこで、本発明は従来技術の課題に着目してなされたものであり、文書画像の2値化効果を改善することにより文字認識の性能を向上させる装置及び方法を提供することを目的とする。
本発明の方法は、従来技術の方法と次のような相違がある。まず、本方法では、2値化処理をするに先立って、入力された階調画像に対して階調等級別に平滑化処理を行うことにより、ノイズを除去して筆画に係わる情報を保留する。なお、本方法では、2値化をした後、2値化した結果により筆画の特徴を解析してから、2値のノイズ除去を行う。
本発明の第1の側面において、
文字の筆画の方向に係わる情報により階調画像のノイズポイントを平滑化させ、平滑化された階調画像を出力する階調画像平滑化手段と、
前記階調画像平滑化手段で出力された平滑化後の階調画像を2値化させ、2値化された画像を出力する階調画像2値化手段と、
文字の筆画の幅に基づき、前記階調画像2値化手段で出力された2値化後の画像のノイズポイントを除去する2値画像ノイズ除去手段と、
を備える文書画像の2値化性能を改善するノイズ除去装置を提供する。
本発明の第1の側面による文書画像の2値化性能を改善するノイズ除去装置において、前記階調画像平滑化手段は、
平滑化される画素ドットを平滑化ポイントとして選択する平滑化ポイント選択手段と、
前記平滑化ポイントが属する筆画の方向を判断する筆画方向判断手段と、
前記平滑化ポイントが属する筆画の方向に隣接する画素ドットの画素値により前記平滑化ポイントを平滑化させる画素ドット平滑化手段とを備える。
本発明の第1の側面による文書画像の2値化性能を改善するノイズ除去装置において、前記2値画像ノイズ除去手段は、
筆画の幅を推定し、前記筆画の幅を閾値と比較する筆画幅推定手段と、
前記筆画の幅が前記閾値より大きい場合に、筆画に2値ノイズ除去処理を行うための循環回数を算出するノイズポイント除去循環回数算出手段と、
前記2値ノイズ除去処理の循環回数により筆画におけるノイズポイントを繰り返し除去する筆画2値ノイズポイント除去手段と、
を備える。
本発明の他の側面において、
文字の筆画の方向に係わる情報により階調画像のノイズポイントを平滑化させ、平滑化された階調画像を出力する階調画像平滑化工程と、
前記平滑化された階調画像を2値化させ、2値化された画像を出力する階調画像2値化工程と、
文字の筆画の幅に基づき2値化された画像のノイズポイントを除去する2値画像ノイズ除去工程とを含む文書画像の2値化性能を改善するノイズ除去方法を提供する。
本発明の他の方面において、
文字の筆画の方向に係わる情報により階調画像のノイズポイントを平滑化させ、平滑化された階調画像を出力する階調画像平滑化工程と、
前記平滑化された階調画像を2値化させ、2値化された画像を出力する階調画像2値化工程と、
文字の筆画の幅に基づき、2値化された画像のノイズポイントを除去する2値画像ノイズ除去工程と、
をコンピュータに実行させるコンピュータプログラムを提供する。
本発明の他の側面において、文書画像の2値化性能を改善するノイズ除去プログラムを記憶したコンピュータ読取り可能な記憶媒体を備えるコンピュータプログラム製品を提供し、このノイズ除去プログラムが処理する時に、
文字の筆画の方向に係わる情報により階調画像のノイズポイントを平滑化させ、平滑化された階調画像を出力する階調画像平滑化工程と、
前記平滑化された階調画像を2値化させ、2値化された画像を出力する階調画像2値化工程と、
文字の筆画の幅に基づき、2値化された画像のノイズポイントを除去する2値画像ノイズ除去工程と、
をコンピュータに実行させる。
本発明によれば、文書画像を2値化するに先立って、文書画像に対して文字の筆画モデルによる文書画像平滑化処理を行うことにより、文書画像の背景におけるノイズポイントを平滑化させて、文書画像を2値化した後に、文書画像に対して文字筆画幅推定による2値画像ノイズ除去処理を行うことで、更に背景におけるノイズポイントを除去することができる。また、本発明の方法を従来のいかなる2値化方法と組み合わせることによって、文書画像の2値化効果を更に改善でき、ひいては文字認識の性能を向上することができる。
以下、図面を参照しながら本発明によるノイズ除去装置及び方法の実施例を詳しく説明する。
まず、図1と図2を参照して、本発明によるノイズ除去装置の全体構成及び処理を概略説明する。図1は、本発明による文書画像の2値化性能を改善する装置を模式的に示すブロック図である。図2は、本発明による文書画像の2値化性能を改善する装置の処理を示すフローチャートである。
図1に示すように、本発明によるノイズポイント除去装置300は、階調画像平滑化手段302と、階調画像2値化手段303と、2値画像ノイズ除去手段304とを備える。
図2に示すように、ノイズポイント除去装置300が処理するにあたって、ノイズポイント除去装置300に階調文書画像が入力されると(ステップS301)、階調画像平滑化手段302はこの階調文書画像を階調等級別に平滑化処理することで(ステップS302)、2値化アルゴリズムに対するノイズの影響を相殺する。次に、階調画像2値化手段303は平滑化処理された階調画像を2値化画像に変換する(ステップS303)。このステップでは従来の各2値化アルゴリズムが適用できる。2値化画像に残留していたノイズについて、2値画像ノイズ除去手段304は更にノイズ除去を行い(ステップS304)、最後にノイズが除去された2値化画像を出力する(ステップS305)。
次に、図3ないし図5を参照して、本発明によるノイズポイント除去装置300の各構成部分の具体的な構成及び処理を詳しく説明する。
図3は、本発明による筆画方向判断方法を示す説明図である。図4は、本発明による階調画像平滑化方法を示すフローチャートである。図5は、本発明による2値画像ノイズ除去方法を示すフローチャートである。
図1に示すように、階調画像平滑化手段302は、平滑化される画素ドットを選択する平滑化ポイント選択手段401と、画素ドットが属する筆画の方向を判断する筆画方向判断手段402と、画素ドットの筆画の方向に係わる情報により画素ドットに平滑化処理を実施する画素ドット平滑化手段403とを備える。
本発明では、全ての画素ドットに対して平滑化処理を実施する必要がない。というのは、本発明の目的はノイズを除去することであるから、ノイズポイントのみを平滑化させればよい。ノイズポイントの位置合わせは現在の画素ドットと隣接する画素ドットとの画素値の関係により決定すればよい。例えば、画素値がその周辺にある8つの画素ドット(図3に示すように)の画素値より大きい又は小さい画素ドットのみに対して平滑化処理をすればよい。
図4に示すように、まず、ステップS401で、平滑化ポイント選択手段401は入力された階調文書画像の画素ドットを処理して、平滑化される画素ドットを選択する。この選択処理では、1つの画素ドットの画素値とその周辺にある画素ドットの画素値との関係を判断することにより、該画素ドットが平滑化される画素ドットであるか否かを決定する。具体的には、1つの画素ドットの画素値を該画素ドットの周辺にある8つの画素ドットの画素値と比較して、該画素ドットの画素値がその周辺にある8つの画素ドットの画素値より大きいか又は小さければ、該画素ドットが平滑化される画素ドットだと判断すると共に、該画素ドットを平滑化ポイントとして選択する。
平滑化ポイントが選択されたら、選択された各平滑化ポイントに平滑化処理を実施する。この平滑化処理は具体的には次の2つのステップに分けられている。
まず、ステップS402で、筆画方向判断手段402は該平滑化ポイントが属する筆画の方向を判断する。図3は、1つの画素ドットが筆画ポイントである時にそれが属する筆画の方向を決定する方法を模式的に示す。筆画モデルにより画素ドットが属する筆画の方向を決定することができる。具体的には、1つの画素ドットの周辺にある4対の画素ドットの画素値と該画素ドットの画素値との類似度を判断することで筆画の方向を決定する。
図3では、可能となる筆画の4つの方向を示しており、そのうちの「0」は現在の画素ドットを表す。仮に現在の画素ドットが第i方向(i=1、2、3、4)に属すれば、現在の画素ドットの画素値と第i方向における2つの画素ドットの画素値とは最も近い。4つの方向における画素ドットの画素値の平均値と現在の画素ドットの画素値との差をそれぞれ決定して、そのうち、差が最も小さい方向を該画素ドットに対応する筆画の方向に特定する。
次に、ステップS403で、画素ドット平滑化手段403は筆画の方向に係わる情報により該画素ドットの画素値に対して平滑化処理を実施する。一般の画像平滑化アルゴリズムと比べると、本発明による画像平滑化アルゴリズムは文字の筆画特徴を活用している。即ち、1文字の筆画は横(水平方向)、縦(垂直方向)、はね(右上から左下へ引く方向)、右払い(左上から右下へ引く方向)という4つの方向しかあり得ない。
仮に文字の筆画における画素ドットの画素値は一定の一致性(類似する色又は階調)を有し、1つの画素ドットがある文字の筆画に属しており、かつ該筆画の方向が既知とすると、該画素ドットの画素値に代えて、この方向における該画素ドットと隣接する複数の画素ドットの平均画素値が用いられる。この平滑化処理の前後では、該画素ドットの画素値はあまり大きく変わらない。
一方、1つの画素ドットが背景に属すれば、いずれの方向に平滑化処理をしても、隣接する画素ドットの画素値同士は一定の一致性を有していないので、該画素ドットの画素値は平滑化処理後に大きく変わる。劣化した場合では、2値化ノイズは一般には孤立した、筆画の画素ドットの色に近い背景ノイズポイントによって発生されるものであるので、上記方法により文書画像を平滑化する場合に、背景の画素ドットが平滑化されて、筆画の画素ドットはあまり大きく変わらない。このような処理により、2値化アルゴリズムの効率を高めるのに寄与でき、また2値化アルゴリズムの効果も改善された。
各平滑化ポイントに平滑化処理を実施した後、ステップS404で、平滑化された階調文書画像を出力する。
以上のように、図4に示した平滑化処理をした後、図2のステップS302で、階調画像2値化手段303は従来の各2値化アルゴリズムにより、平滑化処理された階調文書画像に対して2値化処理を行う。次に、階調画像2値化手段303により出力された2値化画像501は2値画像ノイズ除去手段304に入力される。2値画像ノイズ除去手段304で、2値化画像501に対してノイズ除去処理を行う。
図5に示すように、ステップS501で、階調画像2値化手段303で2値化処理された2値化画像501を入力する。次に、ステップS502で、筆画探索手段502は2値画像に接続要素解析(connected component analysis)を適用することにより全ての筆画を見つける。接続要素解析方法については、次の文献に詳しく記載されている:Gonzalez著、阮秋▲き▼、阮宇智ら訳、「デジタル画像処理(第2版)」、電子工業出版社、2003年3月第1版、第435頁。
次に、筆画探索手段502で探索された各筆画について次の処理を実施する。
筆画幅推定手段503は各筆画の幅を推定する。筆画の幅を推定するときに、図6−1に示すように、筆画中の各画素ドットについて、水平H、垂直V及び2つの45度の方向S1とS2に該筆画を走査しながら、該筆画の該画素ドットでの上記H、V、S1、S2という4つの方向に走査された画素ドットをカウントして、それを該筆画の該画素ドットでの上記H、V、S1、S2という4つの方向における幅とすると共に、それら幅のうちの最小幅を該筆画が該画素ドットにある幅とする。図6−1に示す例では、該筆画の該画素ドットでの幅は水平H方向の幅である。次に、該筆画のあらゆる幅の値が出現した頻度を統計をとって、頻度が最も高い幅を該筆画の幅とする。
筆画の幅が所定の閾値Tより大きければ、処理がステップS505に移行して、該筆画の領域にノイズ除去処理を実施する。該閾値Tは通常の値として3をとる。筆画の幅が所定の閾値Tより小さければ、処理がステップS503に戻し、続いて次の筆画をチェックする(ステップS508)。
ノイズ除去処理において、まずステップS505で、ノイズ除去循環回数算出手段505により循環回数を算出し、各循環では(即ちステップS506を実行するごとに)、筆画2値ノイズポイント除去手段506により除去処理を実施する。
階調画像2値化手段303で2値化処理された2値化画像501において、多くの2値化ノイズはそれぞれ幅が1画素の黒い画素ドットであり、文字の筆画の幅がはるかに1より大きいと推定された場合、それら幅が1画素である黒い画素を除去してもかまわない。
ところで、全ての幅が1画素ドットの黒い画素は常にノイズポイントであるわけではなく、2値化アルゴリズムによって、一つの幅が2画素ドットの筆画は途中のある箇所で幅が1画素ドットしかない可能性があるので、全ての幅が1画素ドットの黒い画素を全部除去すると、筆画の途切れを招くおそれがあることを留意しなければならない。
従って、ノイズポイントの除去は循環モードで行われ、各循環中では、現在の黒い画素ドットの周辺にある黒い画素ドットの個数が2より小さいという条件を満足する黒い画素を全部白い画素に変える。循環の回数は筆画の大きさsizeで決められ、筆画の大きさsizeが大きければ大きいほど、ノイズポイントとなるポイントが多くなり、それだけ除去処理も増える。
以上のように、算出された循環の回数は筆画の大きさsizeに関係しており、筆画の大きさsizeが大きければ大きいほど、循環の回数は多くなり、筆画の大きさsizeが小さければ小さいほど、循環の回数は少なくなる。具体的には、筆画の大きさsizeは筆画の外接矩形の幅と高さのうちの大きい方であってもよく、そのうち、筆画の外接矩形の幅と高さはそれぞれ外接矩形の幅と高さ方向での画素数で定義され、循環の回数は次の式で決定できる。
N=size/r
ここで、Nは循環の回数であり、rは一つの係数であり、その通常の値として10をとる。
ステップS506で、筆画2値ノイズポイント除去手段506は筆画における各画素ドットを判断し、該画素ドットの周辺にある黒点(筆画点)の個数が1個以下であれば、該画素ドットを筆画の幅が1画素ドットである筆画の端点と判定する。該筆画の幅ははるかに1より大きいので、幅が1の筆画の端点はノイズと判定されると共に、該ノイズポイントは除去される(黒点を白点に変える)。
全ての筆画に対して上述した処理を実施した後、即ち、全ての筆画における2値ノイズポイントを除去した後、ステップS507で、ノイズが除去された最終の2値文書画像507を出力する。
次に、図7−1、図7−2、図7−3を参照して本発明の効果を説明する。図7−1、図7−2、図7−3は本発明による方法が適用される前後の効果の比較例を示し、図7−1は本発明による方法が適用されない場合の2値化の結果を、図7−2は本発明による階調画像平滑化方法が適用された場合の2値化の結果を、図7−3は本発明による階調画像平滑化方法及び2値画像ノイズ除去方法が適用された場合の2値化の結果をそれぞれ示す。
図7−1と図7−2は、それぞれ平滑化されない及び平滑化された文書画像の2値化の結果を示しているが、平滑化された文書画像の2値化の効果が大いに改善されたことが明らかである。
図7−2から分かるように、2値化後にもまだ一部のノイズが残留している。それらノイズを更に除去するために、本発明では更に筆画の幅に係わる情報により2値画像にノイズ除去処理を実施する。2値ノイズポイントを除去することにより、2値化の効果は更に向上され、2値ノイズポイントが除去された2値画像は図7−3に示されている。
以上、具体的な実施例に基づいて本発明の原理を詳しく説明したが、本発明の実現は上記実施例に限定されるものではない。
上記実施例では、階調画像平滑化手段302の平滑化ポイント選択手段401により平滑化ポイントを選択する際には、画素値がその周辺にある8つのドットの画素値より大きいまたは小さい画素ドットを平滑化される画素ドットとして選択する、言い換えれば、画素値の最も大きいまたは小さい(最も明るいまたは暗い)画素ドットを平滑化される画素ドットとして選択する。
しかし、別の実施例では、他の方法により平滑化される画素ドットを選択してもよい。例えば、ある一つの画素ドットがその周辺にある画素ドットよりも明るいまたは暗い(或いはある一つの画素ドットの画素値がその周辺にある画素ドットの前または後のN番目である、Nは2から4の整数である)場合、該画素ドットを平滑化される画素ドットとして選択する。
上記実施例では、筆画幅推定手段503は筆画における各画素ドットで水平、垂直、及び右上から左下と左下から右上の2つの45度の方向に沿って筆画を走査することにより、この4つ方向のうち、筆画の画素ドット数が最も少ない方向に走査された画素ドットの数を、該画素ドットにおける筆画の幅として選択し、各幅の値の出現した頻度の統計をとって、出現した頻度の最も高い幅を該筆画の幅として選択する。しかし、別の実施例では、他の方法により筆画の幅を推定してもよい。
例えば、まず、各筆画の骨組を決定し(Gonzalez著、阮秋▲き▼、阮宇智ら訳、「デジタル画像処理(第2版)」、電子工業出版社、2003年3月第1版、第440〜441頁を参照)、次に該筆画と、該骨組の各ポイントを円心とする異なる径の円とを比較する。一つの円が該筆画により完全に覆われれば、筆画の幅は該円の径以上である。
円の径を該円が該筆画により完全に覆われないまで徐々に広くすることにより、該ポイントにおける該筆画の幅は、該筆画により完全に覆われかつ該ポイントを円心とする最も大きい円の径として特定される。そして、各ポイントにおける筆画の幅の値の出現した頻度の統計をとって、出現した頻度の最も高い幅を該筆画の幅とする。
更に、本発明における実施例の各手段はコンピュータプログラム製品として実現してもよく、それらコンピュータプログラム製品に各手段の機能を実行するコンピュータプログラムが記憶されていると理解することができる。それらコンピュータプログラム製品には、コンピュータ読取り可能な記憶媒体(例えば不揮発性記憶媒体)及び、このコンピュータ読取り可能な記憶媒体に記憶されたコンピュータ読取り可能なプログラムのコード(例えば、一連のコンピュータコマンド)を含んでもよい。
更に、図2、図4、図5におけるフローチャートの各ステップ及びステップの組合わせはそれぞれ、特定の機能またはステップを実行する、特別な用途に基づくハードウエアのコンピュータシステム、又は特別な用途のためのハードウエアとコンピュータコマンドとの組み合わせにより実現できることは勿論である。
当業者は、以上の本発明の原理に関する詳しい説明から、本発明の様々の変更及び他の実施例を簡単に思い付くことができる。従って、本発明は開示された具体的な実施例に限らず、添付の特許請求の範囲に入っている本発明の全ての変更及び他の実施例をカバーしているものである。
また、図面は本発明をよりよく理解できるためになされたものであり、かつ明細書に組み込まれて明細書の一部を構成して本発明の実施例を説明するものであり、明細書と共に本発明の原理を解釈するのに用いられている。
(付記1)文書画像の2値化性能を改善するノイズ除去装置であって、
文字の筆画の方向に係わる情報により階調画像のノイズポイントを平滑化させ、平滑化された階調画像を出力する階調画像平滑化手段と、
前記階調画像平滑化手段で出力された平滑化後の階調画像を2値化させ、2値化された画像を出力する階調画像2値化手段と、
文字の筆画の幅に基づき、前記階調画像2値化手段で出力された2値化後の画像のノイズポイントを除去する2値画像ノイズ除去手段と、
を備えたことを特徴とするノイズ除去装置。
(付記2)前記階調画像平滑化手段は、
平滑化される画素ドットを平滑化ポイントとして選択する平滑化ポイント選択手段と、
前記平滑化ポイントが属する筆画の方向を判断する筆画方向判断手段と、
前記平滑化ポイントが属する筆画の方向に隣接する画素ドットの画素値により前記平滑化ポイントを平滑化させる画素ドット平滑化手段と、
を備えたことを特徴とする付記1に記載のノイズ除去装置。
(付記3)前記平滑化ポイント選択手段は、1つの画素ドットの画素値とその周辺にある画素ドットの画素値との関係を判断することにより、該画素ドットが平滑化される画素ドットであるか否かを決定することを特徴とする付記2に記載のノイズ除去装置。
(付記4)前記筆画方向判断手段は、1つの画素ドットの周辺にある4対の画素ドットの画素値と該画素ドットの画素値との類似度を判断することにより、筆画の方向を決定することを特徴とする付記2に記載のノイズ除去装置。
(付記5)前記2値画像ノイズ除去手段は、筆画の幅を推定し、前記筆画の幅を閾値と比較する筆画幅推定手段と、
前記筆画の幅が前記閾値より大きい場合に、筆画に2値ノイズ除去処理を行うための循環回数を算出するノイズポイント除去循環回数算出手段と、
前記2値ノイズ除去処理の循環回数により筆画中のノイズポイントを繰り返し除去する筆画2値ノイズポイント除去手段と、
を備えたことを特徴とする付記1ないし4のいずれか1つに記載のノイズ除去装置。
(付記6)前記筆画幅推定手段は、筆画中の各画素ドットについて、該筆画の水平、垂直、及び右上から左下と左下から右上という2つの45度の方向に沿った幅のうちの最小幅を、該筆画の該画素ドットでの幅として、該筆画のあらゆる幅の値が出現した頻度の統計をとり、頻度が最も高い幅を該筆画の幅とすることを特徴とする付記5に記載のノイズ除去装置。
(付記7)前記筆画幅推定手段は、各筆画の骨組を決定すると共に、該筆画により完全に覆われかつ前記骨組の各ポイントを円心とする最も大きい円の径を、該筆画の該ポイントでの幅に特定して、該筆画のあらゆる幅の値が出現した頻度の統計をとって、出現した頻度が最も高い幅を該筆画の幅とすることを特徴とする付記5に記載のノイズ除去装置。
(付記8)前記ノイズポイント除去循環回数算出手段は、筆画の外接矩形の幅と高さのうちの大きい方である筆画の大きさに基づき循環回数を決定することを特徴とする付記5に記載のノイズ除去装置。
(付記9)前記筆画2値ノイズポイント除去手段は、画素ドットが、幅が1の筆画の端点であるか否かを判断することにより、該画素ドットがノイズポイントであるか否かを決定することを特徴とする付記5に記載のノイズ除去装置。
(付記10)文書画像の2値化性能を改善するノイズ除去方法であって、
文字の筆画の方向に係わる情報により階調画像のノイズポイントを平滑化させ、平滑化された階調画像を出力する階調画像平滑化工程と、
前記平滑化された階調画像を2値化させ、2値化された画像を出力する階調画像2値化工程と、
文字の筆画の幅に基づき、2値化された画像のノイズポイントを除去する2値画像ノイズ除去工程と、
を含むことを特徴とするノイズ除去方法。
(付記11)前記階調画像平滑化工程は、
平滑化される画素ドットを平滑化ポイントとして選択する平滑化ポイント選択工程と、
前記平滑化ポイントが属する筆画の方向を判断する筆画方向判断工程と、
前記平滑化ポイントが属する筆画の方向に隣接する画素ドットの画素値により前記平滑化ポイントを平滑化させる画素ドット平滑化工程と、
を含むことを特徴とする付記10に記載のノイズ除去方法。
(付記12)前記平滑化ポイント選択工程において、1つの画素ドットの画素値とその周辺にある画素ドットの画素値との関係を判断することにより、該画素ドットが平滑化される画素ドットであるか否かを決定することを特徴とする付記11に記載のノイズ除去方法。
(付記13)前記筆画方向判断工程において、1つの画素ドットの周辺にある4対の画素ドットの画素値と該画素ドットの画素値との類似度を判断することにより、筆画の方向を決定することを特徴とする付記11に記載のノイズ除去方法。
(付記14)前記2値画像ノイズ除去工程は、
筆画の幅を推定し、前記筆画の幅を閾値と比較する筆画幅推定工程と、
前記筆画の幅が前記閾値より大きい場合に、筆画に2値ノイズ除去処理を行うための循環回数を算出するノイズポイント除去循環回数算出工程と、
前記2値ノイズ除去処理の循環回数により筆画におけるノイズポイントを繰り返し除去する筆画2値ノイズポイント除去工程と、
を含むことを特徴とする付記10ないし13のいずれか1つに記載のノイズ除去方法。
(付記15)前記筆画幅推定工程において、筆画中の各画素ドットについて、該筆画の水平、垂直、及び右上から左下へと左下から右上へという2つの45度の方向に沿った幅のうちの最小幅を、該筆画の該画素ドットでの幅として、該筆画のあらゆる幅の値が出現した頻度の統計をとって、出現した頻度が最も高い幅を該筆画の幅とすることを特徴とする付記14に記載のノイズ除去方法。
(付記16)前記筆画幅推定工程において、各筆画の骨組を決定すると共に、該筆画により完全に覆われかつ前記骨組の各ポイントを円心とする最も大きい円の径を、該筆画の該ポイントでの幅に特定して、該筆画のあらゆる幅の値が出現した頻度の統計をとって、出現した頻度が最も高い幅を該筆画の幅とすることを特徴とする付記14に記載のノイズ除去方法。
(付記17)前記ノイズポイント除去循環回数算出工程において、筆画の外接矩形の幅と高さのうちの大きい方である筆画の大きさに基づき循環回数を決定することを特徴とする付記14に記載のノイズ除去方法。
(付記18)前記筆画2値ノイズポイント除去工程において、画素ドットが、幅が1の筆画の端点であるか否かを判断することにより、該画素ドットがノイズポイントであるか否かを決定することを特徴とする付記14に記載のノイズ除去方法。
(付記19)文書画像の2値化性能を改善するノイズ除去プログラムであって、該ノイズ除去プログラムが処理する時に、
文字の筆画の方向に係わる情報により階調画像のノイズポイントを平滑化させ、平滑化された階調画像を出力する階調画像平滑化工程と、
前記平滑化された階調画像を2値化させ、2値化された画像を出力する階調画像2値化工程と、
文字の筆画の幅に基づき、2値化された画像のノイズポイントを除去する2値画像ノイズ除去工程と、
をコンピュータに実行させることを特徴とするノイズ除去プログラム。
以上のように、本発明に係るノイズ除去装置およびノイズ除去プログラムは、文書画像の2値化性能を改善することが必要なノイズ除去装置およびノイズ除去プログラムに有用である。
本発明による文書画像の2値化性能を改善する装置を模式的に示すブロック図である。 本発明による文書画像の2値化性能を改善する装置の処理を示すフローチャートである。 本発明による筆画方向判断方法を示す模式図である。 本発明による階調画像平滑化方法を示すフローチャートである。 本発明による2値画像ノイズ除去方法を示すフローチャートである。 本発明による筆画幅推定方法を示す模式図(a)である。 本発明による筆画幅推定方法を示す模式図(b)である。 本発明による方法が適用されない場合の2値化の結果を示す図である。 本発明による階調画像平滑化方法が適用された場合の2値化の結果を示す図である。 本発明による階調画像平滑化方法及び2値画像ノイズ除去方法が適用された場合の2値化の結果を示す図である。
符号の説明
300 ノイズポイント除去装置
310 文書画像
302 階調画像平滑化手段
303 階調画像2値化手段
304 2値化画像ノイズ除去手段
401 平滑化ポイント選択手段
402 筆画方向判断手段
403 画素ドット平滑化手段
501 2値化画像
502 筆画探索手段
503 筆画幅推定手段
506 筆画ノイズポイント除去手段
507 2値化文書画像

Claims (10)

  1. 文書画像の2値化性能を改善するノイズ除去装置であって、
    文字の筆画の方向に係わる情報により階調画像のノイズポイントを平滑化させ、平滑化された階調画像を出力する階調画像平滑化手段と、
    前記階調画像平滑化手段で出力された平滑化後の階調画像を2値化させ、2値化された画像を出力する階調画像2値化手段と、
    文字の筆画の幅に基づき、前記階調画像2値化手段で出力された2値化後の画像のノイズポイントを除去する2値画像ノイズ除去手段と、
    を備えたことを特徴とするノイズ除去装置。
  2. 前記階調画像平滑化手段は、
    平滑化される画素ドットを平滑化ポイントとして選択する平滑化ポイント選択手段と、
    前記平滑化ポイントが属する筆画の方向を判断する筆画方向判断手段と、
    前記平滑化ポイントが属する筆画の方向に隣接する画素ドットの画素値により前記平滑化ポイントを平滑化させる画素ドット平滑化手段と、
    を備えたことを特徴とする請求項1に記載のノイズ除去装置。
  3. 前記平滑化ポイント選択手段は、1つの画素ドットの画素値とその周辺にある画素ドットの画素値との関係を判断することにより、該画素ドットが平滑化される画素ドットであるか否かを決定することを特徴とする請求項2に記載のノイズ除去装置。
  4. 前記筆画方向判断手段は、1つの画素ドットの周辺にある4対の画素ドットの画素値と該画素ドットの画素値との類似度を判断することにより、筆画の方向を決定することを特徴とする請求項2に記載のノイズ除去装置。
  5. 前記2値画像ノイズ除去手段は、筆画の幅を推定し、前記筆画の幅を閾値と比較する筆画幅推定手段と、
    前記筆画の幅が前記閾値より大きい場合に、筆画に2値ノイズ除去処理を行うための循環回数を算出するノイズポイント除去循環回数算出手段と、
    前記2値ノイズ除去処理の循環回数により筆画中のノイズポイントを繰り返し除去する筆画2値ノイズポイント除去手段と、
    を備えたことを特徴とする請求項1ないし4のいずれか1つに記載のノイズ除去装置。
  6. 前記筆画幅推定手段は、筆画中の各画素ドットについて、該筆画の水平、垂直、及び右上から左下と左下から右上という2つの45度の方向に沿った幅のうちの最小幅を、該筆画の該画素ドットでの幅として、該筆画のあらゆる幅の値が出現した頻度の統計をとり、頻度が最も高い幅を該筆画の幅とすることを特徴とする請求項5に記載のノイズ除去装置。
  7. 前記筆画幅推定手段は、各筆画の骨組を決定すると共に、該筆画により完全に覆われかつ前記骨組の各ポイントを円心とする最も大きい円の径を、該筆画の該ポイントでの幅に特定して、該筆画のあらゆる幅の値が出現した頻度の統計をとって、出現した頻度が最も高い幅を該筆画の幅とすることを特徴とする請求項5に記載のノイズ除去装置。
  8. 前記ノイズポイント除去循環回数算出手段は、筆画の外接矩形の幅と高さのうちの大きい方である筆画の大きさに基づき循環回数を決定することを特徴とする請求項5に記載のノイズ除去装置。
  9. 前記筆画2値ノイズポイント除去手段は、画素ドットが、幅が1の筆画の端点であるか否かを判断することにより、該画素ドットがノイズポイントであるか否かを決定することを特徴とする請求項5に記載のノイズ除去装置。
  10. 文書画像の2値化性能を改善するノイズ除去プログラムであって、該ノイズ除去プログラムが処理する時に、
    文字の筆画の方向に係わる情報により階調画像のノイズポイントを平滑化させ、平滑化された階調画像を出力する階調画像平滑化工程と、
    前記平滑化された階調画像を2値化させ、2値化された画像を出力する階調画像2値化工程と、
    文字の筆画の幅に基づき、2値化された画像のノイズポイントを除去する2値画像ノイズ除去工程と、
    をコンピュータに実行させることを特徴とするノイズ除去プログラム。
JP2008044927A 2007-02-26 2008-02-26 文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム Expired - Fee Related JP4852059B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200710078757.2 2007-02-26
CN2007100787572A CN101256630B (zh) 2007-02-26 2007-02-26 用于改善文档图像二值化性能的去噪声装置和方法

Publications (2)

Publication Number Publication Date
JP2008210387A true JP2008210387A (ja) 2008-09-11
JP4852059B2 JP4852059B2 (ja) 2012-01-11

Family

ID=39786586

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008044927A Expired - Fee Related JP4852059B2 (ja) 2007-02-26 2008-02-26 文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム

Country Status (2)

Country Link
JP (1) JP4852059B2 (ja)
CN (1) CN101256630B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105976341A (zh) * 2016-06-17 2016-09-28 天津工业大学 图像自适应中值滤波方法
WO2017028742A1 (zh) * 2015-08-17 2017-02-23 比亚迪股份有限公司 图像去噪系统及图像去噪方法
CN109033982A (zh) * 2018-06-28 2018-12-18 佛山市顺德区中山大学研究院 一种快速的指纹连续分布方向图平滑方法及装置
CN116958986A (zh) * 2023-05-11 2023-10-27 东莞市铁石文档科技有限公司 一种用于档案管理的数据化转换系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5423697B2 (ja) * 2011-02-09 2014-02-19 株式会社ニコン 画像処理装置、撮像装置、画像処理プログラム、及び画像処理方法
CN103377472B (zh) * 2012-04-13 2016-12-14 富士通株式会社 用于去除附着噪声的方法和系统
CN105718926A (zh) * 2014-12-03 2016-06-29 夏普株式会社 一种文本检测的方法和装置
CN106295630B (zh) * 2016-07-21 2019-10-15 北京小米移动软件有限公司 字符识别方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04268869A (ja) * 1991-02-22 1992-09-24 Ricoh Co Ltd 画像処理装置
JPH10187886A (ja) * 1996-12-26 1998-07-21 Toshiba Corp 文字認識装置および文字認識方法
JP2000152000A (ja) * 1998-11-09 2000-05-30 Canon Inc 画像読取装置、読取画像判定方法及び記憶媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6757449B1 (en) * 1999-11-17 2004-06-29 Xerox Corporation Methods and systems for processing anti-aliased images
JP4391704B2 (ja) * 2001-01-11 2009-12-24 富士通株式会社 多値画像から二値画像を生成する画像処理装置および方法
CN1333574C (zh) * 2004-09-29 2007-08-22 致伸科技股份有限公司 一种数字图像中提取文本区域的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04268869A (ja) * 1991-02-22 1992-09-24 Ricoh Co Ltd 画像処理装置
JPH10187886A (ja) * 1996-12-26 1998-07-21 Toshiba Corp 文字認識装置および文字認識方法
JP2000152000A (ja) * 1998-11-09 2000-05-30 Canon Inc 画像読取装置、読取画像判定方法及び記憶媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017028742A1 (zh) * 2015-08-17 2017-02-23 比亚迪股份有限公司 图像去噪系统及图像去噪方法
CN105976341A (zh) * 2016-06-17 2016-09-28 天津工业大学 图像自适应中值滤波方法
CN105976341B (zh) * 2016-06-17 2018-10-09 天津工业大学 图像自适应中值滤波方法
CN109033982A (zh) * 2018-06-28 2018-12-18 佛山市顺德区中山大学研究院 一种快速的指纹连续分布方向图平滑方法及装置
CN116958986A (zh) * 2023-05-11 2023-10-27 东莞市铁石文档科技有限公司 一种用于档案管理的数据化转换系统
CN116958986B (zh) * 2023-05-11 2024-05-14 东莞市铁石文档科技有限公司 一种用于档案管理的数据化转换系统

Also Published As

Publication number Publication date
CN101256630A (zh) 2008-09-03
CN101256630B (zh) 2010-06-30
JP4852059B2 (ja) 2012-01-11

Similar Documents

Publication Publication Date Title
JP4852059B2 (ja) 文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム
KR101795823B1 (ko) 광학 문자 인식되는 텍스트 영상의 텍스트 개선 기법
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
CN106203251B (zh) 文档图像二值化方法
US9495343B2 (en) Horizontal and vertical line detection and removal for document images
EP1910994B1 (en) Binarization of an image
JP2003132358A (ja) 画像処理方法、装置およびシステム
US9275030B1 (en) Horizontal and vertical line detection and removal for document images
US20040223662A1 (en) Apparatus and method for processing images, recording medium, and program
US8620080B2 (en) Methods and systems for locating text in a digital image
JP5900208B2 (ja) 画像処理装置及び画像処理方法
Kumar et al. Power-law transformation for enhanced recognition of born-digital word images
JP2010218420A (ja) 文字認識装置、画像読取装置、およびプログラム
US7848589B2 (en) Method and apparatus for applying edge enhancement based on image characteristics
JP2008225764A (ja) 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム
Saini Document image binarization techniques, developments and related issues: a review
CN111445402B (zh) 一种图像去噪方法及装置
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
Boiangiu et al. Handwritten documents text line segmentation based on information energy
Boiangiu et al. Methods of bitonal image conversion for modern and classic documents
CN114693543A (zh) 图像降噪方法及装置、图像处理芯片、图像采集设备
JP5453215B2 (ja) 画像処理装置、画像形成装置、および画像処理方法
JP4049296B2 (ja) カラー画像情報処理方法、該方法の実行に用いるプログラム、及びカラー画像情報処理装置
CN100366046C (zh) 影像文字增强的方法
JP6095050B2 (ja) テクスチャ検出装置、テクスチャ検出方法、テクスチャ検出プログラム及び画像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111021

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees