JP4094789B2 - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP4094789B2
JP4094789B2 JP33549599A JP33549599A JP4094789B2 JP 4094789 B2 JP4094789 B2 JP 4094789B2 JP 33549599 A JP33549599 A JP 33549599A JP 33549599 A JP33549599 A JP 33549599A JP 4094789 B2 JP4094789 B2 JP 4094789B2
Authority
JP
Japan
Prior art keywords
background
pixel
target pixel
image
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP33549599A
Other languages
English (en)
Other versions
JP2001155146A (ja
Inventor
克仁 藤本
敦子 小原
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP33549599A priority Critical patent/JP4094789B2/ja
Priority to US09/669,663 priority patent/US7167281B1/en
Priority to KR1020000058723A priority patent/KR100698426B1/ko
Publication of JP2001155146A publication Critical patent/JP2001155146A/ja
Application granted granted Critical
Publication of JP4094789B2 publication Critical patent/JP4094789B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【0001】
【発明の属する技術分野】
本発明は、多値画像処理技術に関する。
【0002】
【従来の技術】
近年、非接触型画像入力装置(Over Head Reader:OHR)を用いた帳票認識技術が金融OCR(Optical Character Reader)商談獲得の鍵となってきている。
非接触型画像入力装置(OHR)とは、ラインあるいはエリアCCDを撮像素子として備える、図26に示すようなスタンド型の画像入力装置である。従来のイメージスキャナなどの接触型画像入力装置と比較して、OHRを用いることによって、ユーザが画像入力を行いながら帳票への記入が行える、帳票の表を見たまま画像入力が行える、といった作業の快適さを享受できる。
【0003】
一方、OHRにて取得した画像(以降OHR画像と呼ぶ)はスキャナにて取得した画像(以降スキャナ画像と呼ぶ)と比較して、濃淡むら、影、画像の歪みなどの画像の劣化が見られる。
【0004】
図27にスキャナ画像の例、図28にOHR画像の例を示す。図28のOHR画像は、机、壁、人間などの影を含んでおらず、OHRで取得できる画像としては比較的品質の良い画像であるが、図27に比べて、濃淡むらの度合いが強く、文字線がよりぼけてしまっている。また、OHRを用いる場合、机、壁、人間などの影が画像に含まれてしまう可能性があり、図29に示すような影ありのOHR画像を取り扱う場合も発生する。図29に示すOHR画像は、影の影響でグラデーションがかかったように、画像の右から左に向けて暗くなっている。OHRを用いるためには、このような画像の劣化を克服する基盤技術の開発が重要な課題となる。
【0005】
OHR画像に対して高精度な二値化方式を構築するためには、影、濃淡むらに対して安定した文字輪郭を得る必要があり、一定閾値二値化では不十分で、Niblackの局所的二値化(文献1:IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.17, No.12, p.1191-1202, 1995. 参照)などを導入する必要がある。
【0006】
Niblack の局所的二値化とは、各画素の閾値T=E+Kσ(E:対象画素の近傍領域の画素濃度の平均、σ:対象画素の近傍領域の画素濃度の標準偏差、K:所定の定数)として、画素毎に二値化を実行する方式である。画素の近傍領域として、対象画素を中心とするN×N(Nは定数)の矩形領域を用いる。
【0007】
【発明が解決しようとする課題】
しかしながら、Niblack の二値化などの従来方式をそのまま適用すると、背景及び太い線の内部において、画素近傍の全ての画素が一様な濃度であるため、ごま塩状ノイズが発生してしまう。
【0008】
図30に示すOHR画像にNiblack の局所的二値化(N=7、K=−0.1)を施した二値画像を図31に示す。図31のように、従来の二値化方式ではごま塩状ノイズが発生する。このようなごま塩状ノイズを除去する必要がある。
【0009】
Niblack の局所的二値化を採用した場合に発生するごま塩状ノイズを除去する方法は、先の文献1にも記されているが、その方法は複雑で、処理が重く、計算コストが高いという問題がある。
【0010】
本発明の課題は、従来の二値化方式の問題点であるごま塩状ノイズをできるだけ低い計算コストで除去できるようにすることである。
【0011】
【課題を解決するための手段】
上述した課題を解決するために、本発明では、対象とする画素の近傍領域から得られる情報を元に、各対象画素が背景画素であるか否かを判別する背景判別手段を導入し、Niblack 等の局所的二値化と組み合わせて用いるようにした。
【0012】
本発明の一態様によれば、背景判別手段と局所的二値化手段を備え、多値画像を入力とし、画素ごとに背景判別手段が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段が局所的二値化を行い、背景であるかまたは文字、罫線などを構成するストロークであるかを判別して、二値画像を出力するように構成する。
背景判別手段は、対象画素の近傍領域の標準偏差をσ、対象画素の近傍領域の濃度差をΔgとした場合に、所定の定数rminをもって、r=σ/Δg<rminを背景判別条件として、対象画素が背景画素であるか否かを判別する。あるいは、対象画素の近傍領域の標準偏差をσ、対象画素の近傍領域の濃度差をΔgとした場合に、所定の定数σmin、所定の定数rmin、所定の定数Δgminをもって、背景判別条件式σ<σmin、背景判別条件式r=σ/Δg<rmin、背景判別条件式Δg<Δgmin、の組み合わせを用いて、対象画素が背景画素であるか否かを判別する。
【0013】
また、本発明の一態様によれば、背景判別手段と局所的二値化手段と線素制約手段を備える。多値画像を入力とし、画素ごとに背景判別手段が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段が局所的二値化を行い、背景かストロークかを判別して二値画像を得て、得た二値画像に対して、線素制約手段が対象画素を含む形状の固定された線素マスク中の黒画素の割合が一定以上の場合のみ、その黒画素を黒画素として残す、あるいは線素マスク中の全画素を黒画素に変更する。
【0014】
また、本発明の一態様によれば、背景判別手段と局所的二値化手段と線素制約手段とストローク分離手段を備える。多値画像を入力とし、画素ごとに背景判別手段が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段が局所的二値化を行い、背景かストロークかを判別して二値画像を得て、得た二値画像に対して、線素制約手段が対象画素を含む形状の固定された線素マスク中の黒画素の割合が一定以上の場合のみ、その黒画素を黒画素として残す、あるいは線素マスク中の全画素を黒画素に変更し、ストローク分離手段が黒画素連結成分に対応する濃淡画像中の部分パターンに二値化を適用し、濃度の異なるストロークを分離する。
【0015】
上記の構成のいずれにおいても、局所的二値化を施す前に、背景判別手段が大まかに対象画素が背景であるか否かを判別するため、低い計算コストでごま塩状ノイズの発生を抑制することができる。
【0016】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照しながら説明する。
図1は、本発明の第1実施例における画像処理装置の構成図である。背景判別手段101と局所的二値化手段102を備える。多値画像を入力とし、画素ごとに背景判別手段101が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段102が局所的二値化を行い、背景であるかストロークであるかを判別して、二値画像を出力する。
【0017】
図2は、本発明の第2実施例における画像処理装置の構成図である。標準偏差による背景判別手段201と局所的二値化手段202を備える。多値画像を入力とし、画素ごとに標準偏差による背景判別手段201が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段202が局所的二値化を行い、背景かストロークかを判別して二値画像を出力する。
【0018】
標準偏差による背景判別手段201は、対象画素の近傍領域内にある画素の濃度の標準偏差σの値を用いて、対象画素が背景画素であるか否かを判別する。すなわち、σ<σmin(あらかじめ決められた定数)の場合、対象画素の近傍の濃度が一様であると考えられ、この条件を満たすとき背景画素であると判断する。尚、対象画素の近傍領域とは、対象画素を含む連結領域である画素の近傍のことで、図3に一例を示す。図3では、対象画素301を中心とするN×Nの矩形領域(図3ではN=7)を画素の近傍領域302としている。近傍領域の形状は矩形に限らず、円形、ひし形など適当な形状でよい。また、対象画素301は近傍領域の中心に位置しなくてもかまわない。近傍領域302内の画素濃度の標準偏差が、対象画素301の標準偏差σとして割り当てられる。
【0019】
そして、標準偏差による背景判別手段201において背景でないと判断された画素についてのみ、局所的二値化手段202においてNiblack の局所的二値化を実行する。Niblack の二値化は、各画素の二値化閾値Tとして、対象画素の近傍領域の画素濃度の平均Eと標準偏差σを用いて、T=E+Kσで求められる量を用いる二値化方式である。
【0020】
図30に示すOHR画像を、Niblack の局所的二値化によって処理した結果を図31に、本発明第2実施例における画像処理装置によって処理した結果を図4に示す。図31と図4を比較すると、標準偏差による背景判別を行ってからNiblack の局所的二値化を行った本発明第2の実施例の処理結果では、ごま塩状ノイズをほぼ除去できたことが分かる。尚、図4の結果を得るための処理では、近傍領域として対象画素を中心とする7×7の矩形領域を用い、σmin=10、K=−0.1とした。
【0021】
図5は、本発明の第3実施例における画像処理装置の構成図である。平均濃度差による背景判別手段501と局所的二値化手段502を備える。多値画像を入力とし、画素ごとに平均濃度差による背景判別手段501が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段502が局所的二値化を行い、背景かストロークかを判別して二値画像を出力する。
【0022】
平均濃度差による背景判別手段501は、対象画素の近傍領域内の平均濃度差Δgを用いて、対象画素が背景画素であるか否かを判別する。
ここで、平均濃度差Δgは、Δg=近傍領域内の白画素の平均濃度−近傍領域内の黒画素の平均濃度、で定義される量である。なお、式中の「近傍領域内の白画素」、「近傍領域内の黒画素」とは、仮の二値化閾値T’によって、仮に決定されるものである。
【0023】
平均濃度差Δgを、図6を用いて説明する。まず、対象画素mの近傍領域601において、閾値T’によって画素a〜βが白画素に、画素A〜Uが黒画素に、仮に決定される。そして、それぞれ白画素a〜βの平均濃度▲1▼、黒画素A〜Uの平均濃度▲2▼を求め、その差(平均濃度▲1▼−平均濃度▲2▼)から平均濃度差Δgが求められる。求められたΔgは対象画素mの平均濃度差Δgとして割り当てられる。
【0024】
近傍領域内に背景領域とストローク領域が両方含まれている場合、平均濃度差Δgは大きくなり、背景領域のみまたはストローク領域のみの場合、平均濃度差Δgは小さくなる。したがって、平均濃度差による背景判別手段501において平均濃度差Δg<Δgmin(あらかじめ決められた定数)の場合、対象画素が背景画素であると判断する。そして、局所的二値化手段502で、平均濃度差による背景判別手段501において背景でないと判断された画素についてのみNiblack の局所的二値化を実行する。
【0025】
図29に示すOHR画像を、本発明の第2実施例における画像処理装置(標準偏差による背景判別手段を備える)によって処理した結果を図7に、本発明の第3実施例における画像処理装置(平均濃度差による背景判別手段を備える)によって処理した結果を図8に示す。尚、図7、8の結果を得るための処理では、近傍領域として対象画素を中心とする7×7の矩形領域を用い、σmin=10、K=−0.1、Δgmin=8とした。
【0026】
図29は影のあるOHR画像のため、影の部分では背景領域であっても黒画素と判断される可能性があり、ストロークと背景の濃度差が小さくなる。そのため標準偏差による背景判別手段を備えた画像処理装置では、図7に示すように、ストロークが十分に抽出できず、かすれるが、平均濃度差による背景判別手段を備えた画像処理装置では、図8に示すように、ストロークをかすれなしで抽出することができ、またノイズが少ない良好な二値化結果を得ることができる。
【0027】
尚、本発明第3の実施例における平均濃度差による背景判別手段501は、平均濃度差Δg<Δgmin(あらかじめ決められた定数)の場合に対象画素が背景画素であると判断するが、近傍領域内がストローク領域のみに該当してしまった場合にも平均濃度差Δgは小さくなるため、本来ストロークと認識されるべき画素が背景画素であると判断されてしまう場合もある。例えば、原画像である図29の「静岡10」の文字は黒文字であるが、本発明第3の実施例における処理結果である図8では「静岡10」の文字は白抜きになってしまっている。これを防ぐために、本発明第3の実施例における平均濃度差による背景判別手段501において、先に説明したように対象画素が背景画素であるか否かを判断した後に、更に、対象画素の濃度をもとに、対象画素が黒画素か白画素かの判定を行う処理を追加する。この処理によりストロークが白抜きになってしまうことを防ぐことができる。
【0028】
図9は、本発明の第4実施例における画像処理装置の構成図である。rによる背景判別手段901と局所的二値化手段902を備える。多値画像を入力とし、各画素ごとにrによる背景判別手段901が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段902が局所的二値化を行い、背景かストロークかを判別して二値画像を出力する。
【0029】
rによる背景判別手段901におけるrは、対象画素近傍領域内にある画素濃度の標準偏差をσ、対象画素の均分領域内の濃度差をΔgとすると、r=σ/Δgで求められる。rによる背景判別手段901は、求められたrを用いて対象画素が背景画素であるか否かを判別する。
【0030】
ここで、図10、図11を用いてrについて説明する。図10はある多値画像の一例で、対象画素1001、近傍領域1002、近傍領域の黒領域1003、近傍領域の白領域1004、ストローク1005、背景1006を示している。
【0031】
近傍領域の黒領域1003の平均濃度をg1、近傍領域の白領域1004の平均濃度をg2とする。すると標準偏差σについて、σ=r│g1−g2│=rΔgが成り立つ。すなわちr=σ/Δgとなる。また、近傍領域内の黒画素比率t(0≦t≦1)とすると、(1)式のようになり、rと黒画素比率tは図11に示すような関係になる。
【0032】
【数1】
Figure 0004094789
【0033】
よって、rが小さな値の場合、黒画素比率tが小さな値を取りうる。黒画素比率tが小さい場合、すなわち黒領域が狭いまたはほとんどないということだから、その対象画素を背景であると判断することができる。従って、r<rmin(あらかじめ決められた定数)の場合、対象画素を背景であると判断する。尚、rは二次関数なのでrとtは一対一には決定しない。従って、r<rminを満たしても対象画素が背景画素でない可能性もあるが、これは本発明3の実施例の平均濃度差による背景判別手段501において、ストロークが白抜きになってしまうのを防ぐための処理と同様の処理を行うことで対処することができる。
【0034】
局所的二値化手段902は、rによる背景判別手段901において背景画素ではないと判断された画素についてのみ、Niblack の局所的二値化を実行する。
図12は、本発明の第5実施例における画像処理装置の構成図である。背景判別手段1201と、局所的二値化手段1202と線素制約手段(その1)1203を備える。ストロークは画素が連結した線素から構成されるため、線素制約手段(その1)1203で線素に満たないノイズを排除し、背景判別の精度をより向上することができる点が本実施例の特徴である。
【0035】
図12の画像処理装置は、多値画像を入力とし、画素ごとに背景判別手段1201が背景画素であるか否かを判別し、背景でなかった場合にのみ、局所的二値化手段1202が局所的二値化を行い、背景かストロークかを判別して二値画像を得て、得た二値画像に対して、線素制約手段1203が、対象画像を含んだ形状の固定された線素マスク中の画素が全て黒画素の場合、線素マスクの全画素を黒画素とし、そうでない場合は線素マスクの全画素を白画素に変更する。
【0036】
ここで線素制約手段(その1)1203で用いる線素マスクを対象画素を中心とした、横/縦1×3あるいは横/縦3×1の矩形マスクとする。一般にストロークは3ドット以上あるため、1×3あるいは3×1のマスクを使用することで、ストロークの太さには満たないようなノイズを除去することができる。このことから、1ドットずつ交互に黒画素と白画素が並んだ市松模様の上に描かれたストロークを抽出することが可能となる。1ドットずつ交互に黒画素と白画素が並んだ市松模様は、人間の目からは灰色の面塗り領域と認識されていて、帳票を入力画像とする画像処理装置に求められる技術である。
【0037】
図13は、灰色の面塗り領域と認識される市松模様上に「00230」という文字が描かれた帳票をOHRで取得したOHR画像である。図13に示すOHR画像に局所的二値化を施した結果を図14に、図13に示すOHR画像を本発明第5の実施例における画像処理装置によって処理した結果を図15に示す。図14では、背景領域にごま塩状ノイズが存在するが、図15ではごま塩状ノイズはほとんど存在せず、ストロークがきれいに抽出されている。
【0038】
図16は、本発明の第6実施例における画像処理装置の構成図である。背景判別手段1601と、局所的二値化手段1602と線素制約手段(その2)1603を備える。前記第5の実施例(図12)と本実施例の構成(図16)はほぼ同様であるが、線素制約手段(その2)における処理の詳細が異なる。
【0039】
図16の画像処理装置は、多値画像を入力とし、画素ごとに背景判別手段1601が背景画素であるか否かを判別し、背景でなかった場合にのみ、局所的二値化手段1602が局所的二値化を行い、背景かストロークかを判別して二値画像を得て、得た二値画像に対して、線素制約手段1603が、対象画素を含んだ形状の固定された線素マスク中の黒画素の割合が一定以上の場合、その黒画素を黒画素として残す、あるいは線素マスクの全画素を黒画素に変更するようにし、線素マスク中の黒画素の割合が一定未満の場合、線素マスクの全画素を白画素に変更する。
【0040】
ここで線素制約手段(その2)1603で用いる線素マスクとして、対象画素を中心とする横/縦13×1、横/縦1×13、横/縦5×3、横/縦3×5の4種の矩形マスク及び、斜め5×3、斜め3×5の2種の斜めマスク、の計6種類のマスクを使用する。図17に、斜め5×3マスク1701を示す。線素制約手段(その2)1603では、線素マスク中11画素が黒画素の場合は線素マスクの全画素を黒画素とし、そうでない場合は線素マスクの全画素を白画素にする。この処理により、ストロークの薄い部分からもストロークを良好に抽出できるようになる。
【0041】
尚、図16の画像処理装置は、背景判別手段1601で背景判別をし、局所的二値化を行って得た二値画像のごま塩状ノイズを線素制約手段1603で除去するような構成をしているが、背景判別手段1601による背景判別を行わずに、局所的二値化のみを行って得た二値画像のごま塩状ノイズを線素制約手段1603で除去するように構成してもよい。
【0042】
図18は影ありOHR画像の例である。同図の右下の罫線は薄くなってしまっている。図18に示す画像に、本発明の第3実施例の処理(平均濃度差による背景判別を行い、局所的二値化する)を施して得られる二値画像を図19に示す。同図右下の罫線を構成するストロークはかすれてしまっている。また、図18に示す画像に、背景判別を行わずにNiblack の局所的二値化処理だけ行った場合の二値画像を図20に示す。同図の背景領域にはごま塩状ノイズが発生しているが、一方で注目すべきなのは、罫線を構成するストロークがかすれずに抽出されていることである。更に、図18に示す画像に本発明の第6実施例の処理を施して得られた二値画像を図21に示す。同図はノイズも含んでいるが、罫線を構成するストロークはかすれずに抽出されている。後段の処理で、罫線の長さの制約から、一定の長さに満たない線を除去するなどの処理を行うことで、良好な罫線抽出を実現できる可能性がある。
【0043】
図22は、本発明第7実施例における画像処理装置の構成図である。背景判別手段2201と、局所的二値化手段2202と線素制約手段2203とストローク分離手段2204を備える。本実施例はストローク分離手段2204において、濃度の異なる二つのストロークが接触している場合に分離することを特徴とする。本実施例を用いると、罫線・文字接触の存在する濃淡画像から高精度に文字抽出をすることができる。
【0044】
多値画像を入力とし、画素ごとに背景判別手段2201が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段2202が局所的二値化を行い、背景かストロークかを判別して二値画像を得て、得た二値画像に対して、線素制約手段2203が対象画素を含んだ形状の固定された線素マスク中の黒画素の割合が一定以上の場合のみ、その黒画素を黒画素として残す、あるいは線素マスクの全画素を黒画素に変更する。そして、ストローク分離手段2204は、線素制約手段により得た二値画像の黒画素連結成分を求め、各連結成分に対応する入力濃淡画像中の部分パターンに大津の二値化(文献2:電子情報通信学会論文誌'80/4 Vol.J63-D No.4, p.349-356, 1980.参照)を適用し、クラス間分散一定値以上の場合、あるいは、分散比率(=クラス内分散/クラス間分散)が一定値未満の場合に二つのストロークに分離する。
【0045】
図23にストローク分離手段2204の処理の概念図を示す。線素制約手段2203によって得られた部分パターン2301に対して、大津の二値化を施す。部分パターン2301は、濃度の異なる二つのストローク(文字ストローク2303、罫線ストローク2302)から構成されるため、クラス間分散はある程度大きな値となる。そこで、求めたクラス間分散が所定の値より大きな場合、部分パターン2301を二つのストロークに分離する。不図示であるが、仮に部分パターンが濃度差の小さなストロークで構成される場合は、ストローク分離手段2204では、同一ストロークであると判断され、ストローク分離は行われない。
【0046】
尚、ストローク分離手段2204において、クラス間分散の代わりに分散比率を用いる場合は、分散比率が所定の値より小さな場合、部分パターン2301を二つのストロークに分離するようにする。
【0047】
ところで、上述した画像処理装置は、図24に示すような情報処理装置(コンピュータ)を用いて構成することができる。図24の情報処理装置は、CPU(中央処理装置)2401、メモリ2402、入力装置2403、出力装置2404、外部記憶装置2405、媒体駆動装置2406、およびネットワーク接続装置2407を備え、それらはバス2408により互いに接続されている。
【0048】
メモリ2402は、例えばROM(read only memory)、RAM(random access memory)等を含み、処理に用いられるプログラムとデータを格納する。CPU2401は、メモリ2402を利用してプログラムを実行することにより、必要な処理を行う。つまり、本発明の各実施例で述べた背景判別手段、局所的二値化手段、線素制約手段、ストローク分離手段はメモリ2402に格納されたプログラムで実現される。
【0049】
帳票等の画像データは、OHR等の入力装置2403を介して情報処理装置に取り込まれる。また、出力装置2404は例えばディスプレイ、プリンタ等であり、処理結果の出力等に用いられる。
【0050】
外部記憶装置2405は、例えば磁気ディスク装置、光ディスク装置、光磁気ディスク装置などである。情報処理装置はこの外部記憶装置2405に、上述のプログラムとデータを保存しておき、必要に応じて、それらをメモリ2402にロードして使用することができる。
【0051】
媒体駆動装置2406は、可搬型記録媒体2409としては、メモリカード、フロッピーディスク、CD−ROM(compact disk read only memory)、光ディスク、光磁気ディスク等、任意のコンピュータ読み取り可能な記録媒体が用いられる。この可搬記録媒体2409に上述のプログラムとデータを格納しておき、必要に応じてそれらをメモリ2402にロードして使用することができる。
【0052】
ネットワーク接続装置2407は、LAN(local area network)等の任意のネットワーク(回線)を介して外部の装置と通信し、通信に伴うデータ変換を行う。情報処理装置は、必要に応じて、ネットワーク接続装置2407を介して上述のプログラムとデータを外部の装置から受け取り、それらをメモリ2402にロードして使用することができる。なお、図24は情報処理装置単体で示してあるが、複数のコンピュータからなる処理装置やネットワークを介した複数の処理装置でも実現が可能である。
【0053】
また、図25は、本発明に係わる情報処理装置で実行されるソフトウェアプログラム等の提供方法を説明する図である。プログラム等は例えば以下の3つの方法の中の任意の方法により提供される。
【0054】
(a)コンピュータ等の情報処理装置2501にインストールされて提供される。この場合、プログラム等は例えば出荷前にプレインストールされる。
(b)可搬型記録媒体2502に格納されて提供される。この場合、可搬型記憶媒体2502に格納されているプログラム等は、コンピュータ等の情報処理装置2501の外部記憶装置2405にインストールされる。
【0055】
(c)ネットワーク2503上のサーバから提供される。この場合、基本的には、コンピュータなどの情報処理装置2501がサーバ2504に格納されているプログラム等をダウンロードすることによって、そのプログラム等を取得する。
【0056】
【発明の効果】
以上、詳細に説明したように、本発明によれば、OHR等の入力装置から取得された帳票等の画像データを処理する場合に、従来技術で発生する背景領域のごま塩状ノイズを除去でき、高精度な二値化を実現することができる。
【0057】
本発明の一態様によれば、背景判別手段と局所的二値化手段を備え、多値画像を入力とし、画素ごとに背景判別手段が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段が局所的二値化を行い、背景かまたは文字、罫線などを構成するストロークであるかを判別して、二値画像を出力するように構成する。このような構成をとることにより、背景判別手段が大まかに対象画素が背景であるか否かを判別するため、ごま塩状ノイズの発生を抑制する効果がある。
【0058】
また、本発明の一態様によれば、背景判別手段と局所的二値化手段と線素制約手段を備える。多値画像を入力とし、画素ごとに背景判別手段が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段が局所的二値化を行い、背景かストロークかを判別して二値画像を得て、得た二値画像に対して、線素制約手段が対象画素を含む形状の固定された線素マスク中の黒画素の割合が一定以上の場合のみ、その黒画素を黒画素として残す、あるいは線素マスクの全画素を黒画素に変更するように構成する。このような構成をとることにより、線素制約手段が線素に満たないノイズを除去し、背景判別の精度をより向上することができる。
【0059】
また、本発明の一態様によれば、背景判別手段と局所的二値化手段と線素制約手段とストローク分離手段を備える。多値画像を入力とし、画素ごとに背景判別手段が背景画素であるか否かを判別し、背景でなかった場合にのみ局所的二値化手段が局所的二値化を行い、背景かストロークかを判別して二値画像を得て、得た二値画像に対して、線素制約手段が対象画素を含む形状の固定された線素マスク中の黒画素の割合が一定以上の場合のみ、その黒画素を黒画素として残す、あるいは線素マスクの全画素を黒画素に変更し、ストローク分離手段が黒画素連結成分に対応する濃淡画像中の部分パターンに二値化を適用し、濃度の異なるストロークを分離するように構成する。このような構成をとることにより、ストローク分離手段が、罫線・文字などの複数のストローク接触の存在する濃淡画像から高精度に文字抽出をすることができる。
【図面の簡単な説明】
【図1】本発明第1実施例に係わる画像処理装置の構成を示す図である。
【図2】本発明第2実施例に係わる画像処理装置の構成を示す図である。
【図3】対象画素の近傍領域の例を示す図である。
【図4】図30に示すOHR画像の例に本発明第2の実施例の処理を施して得られる二値画像を示す図である。
【図5】本発明第3実施例に係わる画像処理装置の構成を示す図である。
【図6】平均濃度差の説明に用いる図である。
【図7】図29に示すOHR画像の例に本発明第2の実施例の処理を施して得られる二値画像を示す図である。
【図8】図29に示すOHR画像の例に本発明第3の実施例の処理を施して得られる二値画像を示す図である。
【図9】本発明第4実施例に係わる画像処理装置の構成を示す図である。
【図10】本発明第4実施例で用いるrの説明に用いる図である。
【図11】本発明第4実施例で用いるrと黒画素比率tの関係を示す図である。
【図12】本発明第5実施例に係わる画像処理装置の構成を示す図である。
【図13】OHR画像の例を示す図である。
【図14】図13に示すOHR画像の例に、局所的二値化を施して得られる二値画像を示す図である。
【図15】図13に示すOHR画像の例に本発明第5の実施例の処理を施して得られる二値画像を示す図である。
【図16】本発明第6実施例に係わる画像処理装置の構成を示す図である。
【図17】斜めマスクの例を示す図である。
【図18】OHR画像の例を示す図である。
【図19】図18に示すOHR画像の例に本発明第3の実施例の処理を施して得られる二値画像を示す図である。
【図20】図18に示すOHR画像の例にNiblack局所的二値化を施して得られる二値画像を示す図である。
【図21】図18に示すOHR画像の例に本発明第6の実施例の処理を施して得られる二値画像を示す図である。
【図22】本発明第7実施例に係わる画像処理装置の構成を示す図である。
【図23】ストローク分離手段の処理の概要を説明する図である。
【図24】本発明に係わる画像処理装置を構成するために用いる情報処理装置を示す図である。
【図25】本発明に係わるソフトウェアプログラム等の提供方法を説明する図である。
【図26】非接触型画像入力装置(OHR)を示す図である。
【図27】スキャナ画像の例を示す図である。
【図28】影なしOHR画像の例を示す図である。
【図29】影ありOHR画像の例を示す図である。
【図30】OHR画像の例を示す図である。
【図31】図30に示すOHR画像の例にNiblackの局所的二値化を施して得られる二値画像を示す図である。
【符号の説明】
101 背景判別手段
102 局所的二値化手段
201 標準偏差による背景判別手段
202 局所的二値化手段
301 対象画素
302 対象画素の近傍領域
501 平均濃度差による背景判別手段
502 局所的二値化手段
601 対象画素mの近傍領域
901 rによる背景判別手段
902 局所的二値化手段
1001 対象画素
1002 対象画素1001の近傍領域
1003 近傍領域1002の黒領域
1004 近傍領域1002の白領域
1005 ストローク
1006 背景
1201 背景判別手段
1202 局所的二値化手段
1203 線素制約手段(その1)
1601 背景判別手段
1602 局所的二値化手段
1603 線素制約手段(その2)
1701 斜めマスク
2201 背景判別手段
2202 局所的二値化手段
2203 線素制約手段
2204 ストローク分離手段
2301 部分パターン
2302 罫線ストローク
2303 文字ストローク
2401 CPU
2402 メモリ
2403 入力装置
2404 出力装置
2405 外部記憶装置
2406 媒体駆動装置
2407 ネットワーク接続装置
2408 バス
2409 可搬型記録媒体
2501 情報処理装置
2502 可搬型記録媒体
2503 ネットワーク
2504 サーバ

Claims (6)

  1. 多値画像を入力とし、対象画素ごとに背景画素であるか否かを判別する背景判別手段と、
    前記背景判別手段によって背景でないと判別された場合に、局所的二値化を行い、背景かストロークかを判別して二値画像を出力する局所的二値化手段を備え
    前記背景判別手段は、前記対象画素の近傍領域の標準偏差をσ、前記対象画素の近傍領域の濃度差をΔgとした場合に、所定の定数rminをもって、r=σ/Δg<rminを背景判別条件として、前記対象画素が背景画素であるか否かを判別することを特徴とする画像処理装置。
  2. 多値画像を入力とし、対象画素ごとに背景画素であるか否かを判別する背景判別手段と、
    前記背景判別手段によって背景でないと判別された場合に、局所的二値化を行い、背景かストロークかを判別して二値画像を出力する局所的二値化手段を備え、
    前記背景判別手段は、前記対象画素の近傍領域の標準偏差をσ、前記対象画素の近傍領域の濃度差をΔgとした場合に、所定の定数σmin、所定の定数rmin、所定の定数Δgminをもって、背景判別条件式σ<σmin、背景判別条件式r=σ/Δg<rmin、背景判別条件式Δg<Δgmin、の組み合わせを用いて前記対象画素が背景画素であるか否かを判別することを特徴とする画像処理装置。
  3. 多値画像を入力とし、対象画素の近傍領域の標準偏差をσ、前記対象画素の近傍領域の濃度差をΔgとした場合に、所定の定数rminをもって、r=σ/Δg<rminを背景判別条件として、前記対象画素ごとに背景画素であるか否かを判別し、
    前記対象画素が背景でないと判別された場合に、局所的二値化を行い、背景かストロークかを判別して二値画像を出力することを特徴とする画像処理方法。
  4. 多値画像を入力とし、対象画素の近傍領域の標準偏差をσ、前記対象画素の近傍領域の濃度差をΔgとした場合に、所定の定数σmin、所定の定数rmin、所定の定数Δgminをもって、背景判別条件式σ<σmin、背景判別条件式r=σ/Δg<rmin、背景判別条件式Δg<Δgmin、の組み合わせを用いて、前記対象画素ごとに背景画素であるか否かを判別し、
    前記対象画素が背景でないと判別された場合に、局所的二値化を行い、背景かストロークかを判別して二値画像を出力することを特徴とする画像処理方法。
  5. コンピュータのためのプログラムを記録した記録媒体であって、
    多値画像を入力とし、対象画素の近傍領域の標準偏差をσ、前記対象画素の近傍領域の濃度差をΔgとした場合に、所定の定数rminをもって、r=σ/Δg<rminを背景判別条件として、前記対象画素ごとに背景画素であるか否かを判別し、
    前記対象画素が背景でないと判別された場合に、局所的二値化を行い、背景かストロークかを判別して二値画像を出力する、
    という処理を前記コンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  6. コンピュータのためのプログラムを記録した記録媒体であって、
    多値画像を入力とし、対象画素の近傍領域の標準偏差をσ、前記対象画素の近傍領域の濃度差をΔgとした場合に、所定の定数σmin、所定の定数rmin、所定の定数Δgminをもって、背景判別条件式σ<σmin、背景判別条件式r=σ/Δg<rmin、背景判別条件式Δg<Δgmin、の組み合わせを用いて、前記対象画素ごとに背景画素であるか否かを判別し、
    前記対象画素が背景でないと判別された場合に、局所的二値化を行い、背景かストロークかを判別して二値画像を出力する、
    という処理を前記コンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP33549599A 1999-11-26 1999-11-26 画像処理装置及び画像処理方法 Expired - Fee Related JP4094789B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP33549599A JP4094789B2 (ja) 1999-11-26 1999-11-26 画像処理装置及び画像処理方法
US09/669,663 US7167281B1 (en) 1999-11-26 2000-09-26 Image processing apparatus and method for binarizing a multilevel image
KR1020000058723A KR100698426B1 (ko) 1999-11-26 2000-10-06 화상 처리 장치 및 화상 처리 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33549599A JP4094789B2 (ja) 1999-11-26 1999-11-26 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2001155146A JP2001155146A (ja) 2001-06-08
JP4094789B2 true JP4094789B2 (ja) 2008-06-04

Family

ID=18289223

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33549599A Expired - Fee Related JP4094789B2 (ja) 1999-11-26 1999-11-26 画像処理装置及び画像処理方法

Country Status (3)

Country Link
US (1) US7167281B1 (ja)
JP (1) JP4094789B2 (ja)
KR (1) KR100698426B1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI245557B (en) * 2003-09-11 2005-12-11 Matsushita Electric Ind Co Ltd Image compensation apparatus and method for the same
KR100750112B1 (ko) 2003-11-03 2007-08-21 삼성전자주식회사 입체물 스캔 장치 및 방법
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
JP5251100B2 (ja) * 2007-12-07 2013-07-31 セイコーエプソン株式会社 画像処理プログラム及び画像処理装置
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
JP2011013007A (ja) * 2009-06-30 2011-01-20 Kobe Steel Ltd 磁粉探傷装置
US8406554B1 (en) * 2009-12-02 2013-03-26 Jadavpur University Image binarization based on grey membership parameters of pixels
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
JP5870745B2 (ja) * 2012-02-21 2016-03-01 富士通株式会社 画像処理装置、二値化閾値算出方法及びコンピュータプログラム
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
WO2014160426A1 (en) 2013-03-13 2014-10-02 Kofax, Inc. Classifying objects in digital images captured using mobile devices
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
DE202014011407U1 (de) 2013-05-03 2020-04-20 Kofax, Inc. Systeme zum Erkennen und Klassifizieren von Objekten in durch Mobilgeräte aufgenommenen Videos
CN104298982B (zh) * 2013-07-16 2019-03-08 深圳市腾讯计算机系统有限公司 一种文字识别方法及装置
JP2016538783A (ja) 2013-11-15 2016-12-08 コファックス, インコーポレイテッド モバイル映像データを用いて長尺文書の合成画像を生成するためのシステムおよび方法
US9460357B2 (en) * 2014-01-08 2016-10-04 Qualcomm Incorporated Processing text images with shadows
CN103871034B (zh) * 2014-03-22 2017-03-22 四川大学 一种自适应的图像椒盐噪声滤除方法
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10467465B2 (en) 2015-07-20 2019-11-05 Kofax, Inc. Range and/or polarity-based thresholding for improved data extraction
US10242285B2 (en) * 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
JP2017068349A (ja) * 2015-09-28 2017-04-06 株式会社Screenホールディングス 画像処理方法および制御プログラム
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
CN110596746B (zh) * 2019-10-17 2024-03-01 中国测试技术研究院辐射研究所 使用剂量当量仪自动测试/校准/检定装置的方法
CN112163252A (zh) * 2020-08-31 2021-01-01 重庆宝图科技发展有限公司 一种不动产草图落地的方法和系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6126149A (ja) 1984-07-17 1986-02-05 Nec Corp 文書画像フアイル登録検索装置
US4903316A (en) * 1986-05-16 1990-02-20 Fuji Electric Co., Ltd. Binarizing apparatus
JPS63220375A (ja) * 1987-03-09 1988-09-13 Toray Ind Inc 画像2値化処理方法
US5583659A (en) * 1994-11-10 1996-12-10 Eastman Kodak Company Multi-windowing technique for thresholding an image using local image properties
JP3552419B2 (ja) * 1996-09-25 2004-08-11 松下電工株式会社 物体の認識方法
KR100467565B1 (ko) * 1997-07-24 2005-04-06 삼성전자주식회사 화상 시스템의 국부 이치화 방법.
JP3114668B2 (ja) * 1997-10-03 2000-12-04 日本電気株式会社 物体検出・背景除去方法、装置およびプログラムを記録した記録媒体
JPH11265453A (ja) 1998-03-17 1999-09-28 Toshiba Corp 画像処理方法および画像処理装置および記録媒体
US6577762B1 (en) * 1999-10-26 2003-06-10 Xerox Corporation Background surface thresholding

Also Published As

Publication number Publication date
KR20010050887A (ko) 2001-06-25
KR100698426B1 (ko) 2007-03-26
US7167281B1 (en) 2007-01-23
JP2001155146A (ja) 2001-06-08

Similar Documents

Publication Publication Date Title
JP4094789B2 (ja) 画像処理装置及び画像処理方法
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3768052B2 (ja) カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体
JP5566811B2 (ja) プリントアンドスキャン文書の画像評価のためのボケ除去および監視適応的スレッショルディング
JP3078844B2 (ja) 文書中の前景情報を背景情報から分離する方法
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US7110607B2 (en) Image processing apparatus
EP2270746B1 (en) Method for detecting alterations in printed document using image comparison analyses
JP2007504719A (ja) 組み込みアプリケーションに適した、画像における赤目の検出と補正を行うシステム及び方法
JP2003132358A (ja) 画像処理方法、装置およびシステム
Yang et al. Adaptive thresholding algorithm and its hardware implementation
KR101224936B1 (ko) 화상 처리 장치, 화상 형성 장치, 및 컴퓨터 판독 가능한 매체
JP2002199206A (ja) メッセージ埋込並びに抽出方法、装置および媒体
JP4049560B2 (ja) 網点除去方法及びシステム
JP3604910B2 (ja) 画像縮小装置及び画像縮小プログラムを記録した記録媒体
JP3830350B2 (ja) カラー画像処理方法、カラー画像処理装置、プログラム、及び記録媒体
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
EP1006476A2 (en) Method of enhancing characters in an original binary image of a document
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
KR100416496B1 (ko) 다중 역치값을 이용한 이치화 방법
US11778122B2 (en) Apparatus, method, and storage medium for removing shading dots
JP4324532B2 (ja) 画像処理装置および記憶媒体
JP4738645B2 (ja) 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
JP3989647B2 (ja) 画像処理方法,装置および記録媒体
KR100288706B1 (ko) 고립점 노이즈를 제거한 국부 이치화 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080306

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120314

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140314

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees