JP2004227355A - Scanner system, sheet for setting threshold, and binary image forming method - Google Patents

Scanner system, sheet for setting threshold, and binary image forming method Download PDF

Info

Publication number
JP2004227355A
JP2004227355A JP2003015474A JP2003015474A JP2004227355A JP 2004227355 A JP2004227355 A JP 2004227355A JP 2003015474 A JP2003015474 A JP 2003015474A JP 2003015474 A JP2003015474 A JP 2003015474A JP 2004227355 A JP2004227355 A JP 2004227355A
Authority
JP
Japan
Prior art keywords
image
color
binary image
threshold
binary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003015474A
Other languages
Japanese (ja)
Other versions
JP4155035B2 (en
Inventor
Kiyoshi Ishihara
清志 石原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2003015474A priority Critical patent/JP4155035B2/en
Publication of JP2004227355A publication Critical patent/JP2004227355A/en
Application granted granted Critical
Publication of JP4155035B2 publication Critical patent/JP4155035B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To effectively form a binary image for OCR processing. <P>SOLUTION: A scanner system (101) of this invention comprises an image acquiring device (10) that acquires an image picture representing a document from a document and a binary image forming device (20) that forms a binary image corresponding to the image picture acquired by the image acquiring device. The binary image forming device comprises a threshold setting part (22) that detects a luminance distribution of a standard color from a standard imaged picture to which the standard color indicating a specified luminance to acquire a binary image is given, and sets as a threshold a luminance value with the highest intensity from the detected luminance distribution, and a binarization processing part (25) that carries out binarization processing, using the threshold to the imaged picture acquired by the image acquiring device and forms a binary image corresponding to the imaged picture. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、書面から得られたイメージ画像から該画像に表される文字および記号等を判別するための二値画像を形成するスキャナシステムに関する。
【0002】
【従来の技術】
従来、帳票のような書類の書面を表すイメージ画像から記入文字を判別するOCR(Optical Character Reader)処理を行うにあたっては、記入文字が記載された画像部分と、ドロップアウトカラーで記載された枠線のように二値画像の形成に不用な画像部分との識別のために、当該イメージ画像の輝度に基づいて二値画像が形成される。ドロップアウトカラーは、一般的に、記入文字の理想的な輝度分布よりも高い輝度分布を示すように設定されている。このような二値画像の形成に関する技術は、例えば、後述する特許文献1に提案されている。
【0003】
前記文献の技術では、非接触スキャナで取得したイメージ画像を二値化する手法が提案されており、二値化閾値を設定する際、運用時に取り扱う帳票と同様の帳票であって判別すべき文字が記入されていない未記入帳票が用いられる。そして、この未記入帳票のイメージ画像における所定領域毎に輝度分布が検知され、各輝度分布のうちの最小の輝度値が、当該領域の二値化閾値として設定される。
【0004】
【特許文献1】
特開2002−344739公報
【0005】
【発明が解決しようとする課題】
しかしながら、前記技術では、未記入帳票として、運用に対応した帳票が用いられることから、運用時に取り扱う帳票のレイアウトあるいはドロップアウトカラーが異なる毎に、新たに閾値を設定する必要がある。そのため、コストや手間が掛かるという問題があった。
【0006】
また、記入文字の濃淡が部分的に薄い場合、当該部分の輝度値は他の文字部分のそれよりも高くなる。しかしながら、前記技術の二値化閾値は、ドロップアウトカラーのパターンのように、記入文字の理想的な輝度分布よりも高い輝度を示すパターンを排除すべく設定されることから、二値化処理では前記したような輝度の高い部分がドロップアウトカラーのパターンと共に排除され易く、その結果、二値画像の文字パターンに擦れや欠落を生じさせる虞がある。
【0007】
本発明は、前記した課題に鑑みてなされたものであり、二値化処理を効率化することができ、また、二値画像における文字パターンをより適正に表示するための閾値を設定することができるスキャナシステムを提供することを目的とする。
【0008】
【課題を解決するための手段】
〈構成1〉
本発明に係るスキャナシステムは、書面から該書面を表すイメージ画像を取得する画像取得装置と、該画像取得装置により取得したイメージ画像に対応する二値画像を形成する二値画像形成装置とを含むスキャナシステムであって、前記二値画像形成装置は、二値画像を得るための所定の輝度を示す基準色が付与された基準イメージ画像から当該基準色の輝度分布を検知し、該検知した輝度分布から強度が最大となる輝度値を閾値として設定する閾値設定部と、前記画像取得装置により取得されたイメージ画像に対し前記閾値を用いて二値化処理を施し、当該イメージ画像に対応する二値画像を形成する二値化処理部とを備える。
【0009】
前記基準イメージ画像は、予め区分された複数の領域のそれぞれに前記基準色が付与された画像とすることができる。その場合、前記閾値設定部は、前記基準イメージ画像の各前記領域についての前記閾値を設定し、前記二値化処理部は、前記領域毎に、対応する前記閾値に基づき前記二値化処理を施すことが望ましい。
【0010】
本発明に係るスキャナシステムは、さらに、前記基準色の輝度分布よりも高い輝度分布を示し且つ前記二値画像の形成に不用とされるドロップアウト色が前記基準色と共に付与された基準イメージ画像から当該ドロップアウト色の輝度分布を検知し、該検知した輝度分布と前記閾値との比較により前記ドロップアウト色の排除の可否を判定するドロップアウト判定部を備えることができる。
【0011】
前記基準イメージ画像は、予め区分された複数の領域のそれぞれに前記基準色および前記ドロップアウト色が付与された画像とすることができる。その場合、前記閾値設定部は、前記基準イメージ画像の各前記領域についての前記閾値を設定し、前記ドロップアウト判定部は、前記領域毎に、対応する前記閾値に基づき前記ドロップアウト色に関する前記判定を行うことが望ましい。
【0012】
本発明に係るスキャナシステムの前記画像取得装置として、前記書面に接触することなく前記イメージ画像を光学的に取得する非接触スキャナ装置を適用することができる。
【0013】
〈構成2〉
本発明に係る閾値設定用シートは、書面を表すイメージ画像に対応する二値画像を得るための所定の輝度を示す基準色が付与されている。
【0014】
〈構成3〉
本発明に係る二値画像形成方法は、書面から該書面を表すイメージ画像を取得し、該取得したイメージ画像に対応する二値画像を形成する方法であって、二値画像を得るための所定の輝度を示す基準色が付与された基準イメージ画像から当該基準色の輝度分布を検知し、該検知した輝度分布から強度が最大となる輝度値を閾値として設定し、書面のイメージ画像に対し前記閾値を用いて二値化処理を施し、当該イメージ画像に対応する二値画像を形成する方法である。
【0015】
【発明の実施の形態】
本発明の実施の形態を具体例を用いて説明する。
〈具体例1〉
図1は、本発明に係るスキャナシステムの具体例1の構成を示すブロック図である。
具体例1のスキャナシステム101は、図1に示すように、帳票のような書類の書面から当該書面のイメージ画像を取得する画像取得装置となる非接触スキャナ装置10と、該非接触スキャナ装置により取得したイメージ画像に対応する二値画像を形成する二値画像形成装置20とを備える。二値画像形成装置20としては、汎用のパーソナルコンピュータを用いることができる。
スキャナシステム101には、この他に、二値画像形成装置20を操作するオペレータに向けて画面を表示するCRTディスプレイのような表示装置30と、二値画像形成装置20への入力操作のためのキーボードのような入力装置40とが設けられている。
【0016】
図2に、スキャナシステム101における非接触スキャナ装置10の構成例を示す。非接触スキャナ装置10には、イメージ画像を取得すべき書類を配置するマット部11と、該マット部上の書類に接触することなく書面を光学的に読み取る画像取得部12とが設けられている。
【0017】
非接触スキャナ装置10で取り扱う書類には、OCR処理の際に不要となる枠線や罫線などが、記入される文字の輝度分布よりも高い輝度分布を示す所定のドロップアウトカラーで記載されている。非接触スキャナ装置10は、画像取得部12で書面を読み取った後、当該非接触スキャナ装置の図示しないフィルタ部により前記イメージ画像にフィルタ処理を施し、ドロップアウトカラーの大半を排除する。
【0018】
二値画像形成装置20は、図1に示すように、非接触スキャナ装置10で取得したイメージ画像を格納する画像メモリ21と、該画像メモリに格納される後述する閾値設定用シートのイメージ画像に基づいて二値化閾値を設定する二値化閾値設定部22と、前記二値化閾値の設定の際に用いられるレイアウト情報を予め保持するレイアウトメモリ23と、二値化閾値設定部22で設定した二値化閾値を記憶する二値化閾値メモリ24と、記入文字の判別を行うべき書類に対し二値化閾値メモリ24の二値化閾値を用いて二値化処理を施し二値画像を形成する二値化処理部25と、二値画像形成装置20の各構成部分の動作を制御する制御部26とを備える。
【0019】
二値化閾値設定部22は、二値画像の形成に先立つ調整処理において二値化閾値を設定する。その設定の際には、図3(a)に示す基準イメージ画像に対応した閾値設定用シートが用いられる。閾値設定用シートには、二値画像に文字擦れを生じさせない臨界的な輝度値を示す色である基準色が付与されている。この基準色の輝度は、前記した条件を満たす値であれば、実験あるいは経験等から得られた値を用いることができる。例えば、基準色として、蛍光灯照明下において256階調の150付近をピークとした約100〜200の輝度分布を持つ色を採用することができる。また、基準色の色彩は、記入文字に関し指定された色彩に対応させたものであれば、無彩色または有彩色のいずれでも用いることができる。
【0020】
本具体例の閾値設定用シートには、図3(a)に示すように、予め設定した5箇所に無彩色の基準色が付与されている。図示の例では、帳票の上方および下方のそれぞれに2箇所ずつ、および、帳票の中央付近の1箇所に基準色が塗布されている。この配置は、非接触スキャナ装置10の読み取り時に、帳票の各箇所で照明による影響が異なることを考慮して設定された一例であり、図示の例に限らず、配置を適宜設定することができる。
【0021】
図3(b)は、レイアウトメモリ23に予め格納されているレイアウト情報を表す。このレイアウト情報は、閾値設定用シートにおいて基準色が塗布されている各箇所のいずれの部分の輝度分布を検知するかを規定する。
また、図3(c)に、図3(a)に示す基準イメージ画像と、図3(b)のレイアウト情報とを対応させたイメージ画像を示す。
【0022】
本具体例では、二値化閾値設定部22により、図3(c)に示す境界線で区分された各範囲毎に二値化閾値が設定される。具体的には、図4に示すように、レイアウトメモリ23のレイアウト情報のうちの「領域1:(xs1、ys1)−(xe1、ye1)」のような領域毎に基準色の輝度分布が検知され、検知された輝度分布のうちで強度が最大となる輝度値が、同図に示す「閾値1」のような二値化閾値として各領域毎に二値化閾値メモリ24に格納される。
【0023】
二値化処理部25は、運用時に、記入済み帳票のイメージ画像に対して前記した各領域毎に二値化処理を行う。この二値化処理では、例えば、図4に示すヒストグラムにおいて、二値化閾値である150よりも低い輝度値を示すパターンは、OCR処理を施すべき文字のパターンであると判断し、それよりも高い輝度値を示すパターンは、二値化処理において排除すべき枠線のようなパターンであると判断する。
【0024】
具体例1のスキャナシステム101の動作を、図5に示す調整処理のフローチャート、および、図6に示す運用時のフローチャートに沿って説明する。
図5のフローチャートに沿った調整処理では、非接触スキャナ装置10が閾値設定用シートから書面を読み取ると、二値画像形成装置20は、そのイメージ画像である基準イメージ画像を画像メモリ21に格納する(ステップS1)。なお、画像メモリ21に格納される基準イメージ画像は、非接触スキャナ装置10による従来よく知られたシャッタ制御により、白のピークが正規化されている。
【0025】
二値化閾値設定部22は、基準イメージ画像について、レイアウトメモリ23のレイアウト情報から得られる前記したような各領域毎に、図4に示すような基準色のヒストグラムを生成する。そして、当該ヒストグラムにおけるピークに対応する輝度値を二値化閾値として各領域毎に二値化閾値メモリ24へ格納する(ステップS2)。これを以って、運用前の調整処理が終了する。
【0026】
図6に沿ったスキャナシステム101の運用時には、記入済み帳票、すなわちOCR処理を施すべき帳票の書面を非接触スキャナ装置10が読み取ると、二値画像形成装置20は、そのイメージ画像を画像メモリ21へ格納する(ステップS3)。このイメージ画像も、前記した基準イメージ画像と同様に、白のピークが正規化されている。
【0027】
二値化処理部25は、画像メモリ21に格納された前記イメージ画像について、図3(c)で示すように区分された各範囲毎に、それぞれに対応する二値化閾値を用いて二値化する。さらに、各範囲毎に二値化された画像を統合することにより二値画像を形成し、これを画像メモリ21へ格納する(ステップS4)。その後、画像メモリ21に格納された二値画像は、図示しないOCR処理部により文字の判別が行われる。
【0028】
具体例1のスキャナシステム101によれば、閾値設定用シートを用いて各種帳票に対して共用の二値化閾値を設定することから、帳票フォームが変更される毎に閾値を設定する必要がなく、OCR処理のための二値画像を効率的に形成することができる。また、二値化閾値が文字の基準色に基づき設定されることから、当該二値化閾値が記入文字の輝度分布内に存在し難くなり、その結果、文字の擦れや欠落を防止することができる。
【0029】
〈具体例2〉
図7は、本発明に係るスキャナシステムの具体例2の構成を示すブロック図である。
具体例2のスキャナシステム102は、前記した具体例1のスキャナシステム101と同様の構成に、さらに、二値化閾値設定部22で設定した二値化閾値によりドロップアウトカラーの排除が可能か否かを判定するドロップアウト可否判定部27を備える。
【0030】
具体例2の閾値設定用シートには、図8(a)に示すように、各箇所に配置された文字の基準色に隣接して、ドロップアウトカラーの限界色が付与されている。ドロップアウトカラーの限界色は、その輝度強度のピークにあたる輝度値が、二値化閾値よりも高い値を示す色であると共に、当該二値化閾値により除去可能な輝度分布を示す色である。この限界色の輝度分布は、前記した条件を満たす値であれば、実験あるいは経験等から得られたものを用いることができる。例えば、当該限界色として、蛍光灯照明下において256階調の210付近をピークとした約160〜255の輝度分布を持つ色を採用することができる。また、前記限界色は、有彩色に限らず、これと同一の輝度を示す無彩色を用いることができる。
【0031】
具体例2のレイアウトメモリ23のレイアウト情報は、図8(b)に示すように、基準色の輝度を検知すべき領域に加えて、図8(a)に示すドロップアウトカラーの輝度を検知すべき領域を規定する。
図8(c)に、図8(a)に示す基準イメージ画像と、図8(b)のレイアウト情報とを対応させたイメージ画像を示す。
【0032】
ドロップアウト可否判定部27は、運用に先立つ調整処理において、前記した基準イメージ画像から各領域毎にドロップアウトカラーの輝度分布を検知し、当該ドロップアウトカラーが二値化閾値により除去可能か否かを判定する。例えば、図9に示すように、(A)の値をピークとした輝度分布を持つドロップアウトカラーが検知された場合は、文字の基準色から得られた二値化閾値で当該ドロップアウトカラーを適正に排除できると判定される。また、例えば(B)の値をピークとしたドロップアウトカラーが検知された場合は、その輝度分布内に二値化閾値が存在することから、当該ドロップアウトカラーを適正に排除することはできないと判定される。
【0033】
具体例2のスキャナシステム102の調整処理における動作を、図10に示すフローチャートに沿って説明する。
非接触スキャナ装置10が閾値設定用シートの書面を読み取ってから、二値化閾値を設定するステップS10からS11までの手順は、前記した具体例1のスキャナシステム101におけるステップS1からS2までの手順と同様であるので、説明を省略する。
【0034】
二値化閾値が設定された後、ドロップアウト可否判定部27は、図8(c)に沿って説明したイメージ画像について、各領域毎に前記したドロップアウトカラーの排除に関する判定を行う(ステップS12)。この判定において、ドロップアウトカラーが適正に排除できないと判定された場合、例えば、非接触スキャナ装置10の設置環境に問題があり、照明に起因するノイズが発生しているとのメッセージを表示装置30に表示することができる。
【0035】
また、前記判定において、ドロップアウトカラーが適正に排除可能であるとされた場合、非接触スキャナ装置10の設置環境を変更することなく、前記具体例1で説明した運用手順と同様にスキャナシステム102を運用することができる。
【0036】
具体例2のスキャナシステム102によれば、具体例1のスキャナシステム101と同様の効果を得ることができ、さらに、ドロップアウトカラーの排除の可否に関する判定を行うことから、運用に先立って、非接触スキャナ装置10の設置環境の良否を確認することができる。これにより、運用時には、より適正にドロップアウトカラーを排除することが可能となり、高精度な2値画像を形成することができる。
【0037】
前記した各具体例では、閾値設定用シートに単色の基準色が付与された例を示したが、基準色としては、この他に、複数のPCS(Print Contrast Scale)値を有する色を採用することができる。その場合、例えば線形補完処理により、間接的に文字擦れを生じさせないような輝度を算出することができる。
【0038】
また、前記した各具体例では、非接触スキャナ装置を用いたスキャナシステムの例を示したが、本発明は、接触式のスキャナ装置により書面を読み取るスキャナシステムにも適用することができる。
前記した各具体例では、閾値設定用シートが予め複数の領域に区分されたが、このように区分されることなく基準色が1箇所に付与された閾値設定用シートを用いることができる。
【0039】
【発明の効果】
本発明に係るスキャナシステムによれば、閾値設定用シートを用いて、各種帳票に対し二値化のための共用の閾値を設定することから、書類の各フォーム毎に閾値を設定する必要がなく、OCR処理のための二値画像の形成を効率的に行うことができる。しかも、二値化のための閾値が基準色に基づき設定されることから、当該閾値が記入文字の輝度分布内に存在し難くなり、その結果、文字の擦れや欠落を防止することができる。
【図面の簡単な説明】
【図1】本発明に係るスキャナシステムの具体例1の構成を示すブロック図である。
【図2】非接触スキャナ装置の構成を示す説明図である。
【図3】具体例1の閾値設定用シートを説明するための説明図である。
【図4】二値化閾値の設定を説明するための説明図である。
【図5】具体例1のスキャナシステムの調整処理の手順を示すフローチャートである。
【図6】具体例1のスキャナシステムの運用時の手順を示すフローチャートである。
【図7】本発明に係るスキャナシステムの具体例2の構成を示すブロック図である。
【図8】具体例2の閾値設定用シートを説明するための説明図である。
【図9】ドロップアウトカラーの排除に関する可否判定を説明するための説明図である
【図10】具体例2のスキャナシステムの調整処理の手順を示すフローチャートである。
【符号の説明】
101、102 スキャナシステム
10 非接触スキャナ装置
11 マット部
12 画像取得部
20 二値画像形成装置
21 画像メモリ
22 二値化閾値設定部
23 レイアウトメモリ
24 二値化閾値メモリ
25 二値化処理部
26 制御部
27 ドロップアウト可否判定部
30 表示装置
40 入力装置
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a scanner system that forms a binary image for determining characters, symbols, and the like represented in an image image obtained from a document.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, in performing an OCR (Optical Character Reader) process of determining an entry character from an image image representing a document such as a form, an image portion in which the entry character is described and a frame line described in a dropout color In order to identify an image portion that is not necessary for forming a binary image as described above, a binary image is formed based on the luminance of the image image. In general, the dropout color is set so as to show a higher luminance distribution than the ideal luminance distribution of the entered character. A technique relating to the formation of such a binary image has been proposed in, for example, Japanese Patent Application Laid-Open No. H11-216, which will be described later.
[0003]
In the technology of the literature, a method of binarizing an image image obtained by a non-contact scanner has been proposed.When setting a binarization threshold, a character to be discriminated is a form similar to a form handled during operation. An unfilled form with no is used. Then, a luminance distribution is detected for each predetermined region in the image image of the blank form, and the minimum luminance value of each luminance distribution is set as a binarization threshold value of the region.
[0004]
[Patent Document 1]
JP-A-2002-34739
[Problems to be solved by the invention]
However, in the above-described technology, since a form corresponding to operation is used as an unfilled form, it is necessary to set a new threshold value each time the layout or dropout color of the form handled during operation is different. Therefore, there is a problem that cost and labor are required.
[0006]
Further, when the density of the entered character is partially light, the luminance value of the portion is higher than that of the other character portions. However, since the binarization threshold of the above technique is set to exclude a pattern showing a luminance higher than the ideal luminance distribution of the entered characters, such as a pattern of a dropout color, the binarization processing is not performed. The high-luminance portion described above is easily removed together with the dropout color pattern, and as a result, the character pattern of the binary image may be rubbed or missing.
[0007]
The present invention has been made in view of the above-described problem, and can improve the efficiency of the binarization process.Also, it is possible to set a threshold value for more appropriately displaying a character pattern in a binary image. It is an object of the present invention to provide a scanner system capable of performing the above.
[0008]
[Means for Solving the Problems]
<Configuration 1>
A scanner system according to the present invention includes an image acquisition device that acquires an image representing a document from a document, and a binary image forming device that forms a binary image corresponding to the image acquired by the image acquisition device. A scanner system, wherein the binary image forming apparatus detects a luminance distribution of the reference color from a reference image image to which a reference color indicating a predetermined luminance for obtaining a binary image is given, and detects the detected luminance. A threshold value setting unit that sets, as a threshold, a luminance value at which the intensity is maximum from the distribution, and performs a binarization process on the image image acquired by the image acquisition device using the threshold value; A binarization processing section for forming a value image.
[0009]
The reference image image may be an image in which the reference color is assigned to each of a plurality of regions that have been divided in advance. In that case, the threshold value setting unit sets the threshold value for each of the regions of the reference image image, and the binarization processing unit performs the binarization process based on the corresponding threshold value for each region. It is desirable to apply.
[0010]
The scanner system according to the present invention further includes a luminance distribution higher than the luminance distribution of the reference color, and a drop-out color that is not required for forming the binary image, from the reference image image given together with the reference color. A dropout determination unit that detects the luminance distribution of the dropout color and compares the detected luminance distribution with the threshold to determine whether or not the dropout color can be excluded can be provided.
[0011]
The reference image image may be an image in which the reference color and the dropout color are assigned to each of a plurality of pre-divided regions. In that case, the threshold value setting unit sets the threshold value for each of the regions of the reference image image, and the dropout determination unit determines, for each region, the determination regarding the dropout color based on the corresponding threshold value. It is desirable to carry out.
[0012]
As the image acquisition device of the scanner system according to the present invention, a non-contact scanner device that optically acquires the image image without contacting the document can be applied.
[0013]
<Configuration 2>
The threshold setting sheet according to the present invention is provided with a reference color indicating a predetermined luminance for obtaining a binary image corresponding to an image representing a document.
[0014]
<Configuration 3>
A binary image forming method according to the present invention is a method of obtaining an image image representing a document from a document and forming a binary image corresponding to the obtained image image. The luminance distribution of the reference color is detected from the reference image image to which the reference color indicating the luminance is given, and a luminance value having the maximum intensity from the detected luminance distribution is set as a threshold, and the threshold is set for the image image of the document. This is a method of performing a binarization process using a threshold to form a binary image corresponding to the image image.
[0015]
BEST MODE FOR CARRYING OUT THE INVENTION
An embodiment of the present invention will be described using a specific example.
<Specific example 1>
FIG. 1 is a block diagram showing a configuration of a specific example 1 of the scanner system according to the present invention.
As illustrated in FIG. 1, a scanner system 101 according to a specific example 1 includes a non-contact scanner device 10 serving as an image acquisition device that acquires an image image of a document from a document such as a form, and an image acquired by the non-contact scanner device. And a binary image forming apparatus 20 for forming a binary image corresponding to the converted image image. As the binary image forming apparatus 20, a general-purpose personal computer can be used.
The scanner system 101 further includes a display device 30 such as a CRT display that displays a screen for an operator who operates the binary image forming apparatus 20, and an input operation to the binary image forming apparatus 20. An input device 40 such as a keyboard is provided.
[0016]
FIG. 2 shows a configuration example of the non-contact scanner device 10 in the scanner system 101. The non-contact scanner device 10 is provided with a mat unit 11 for arranging a document from which an image image is to be obtained, and an image obtaining unit 12 for optically reading a document without contacting the document on the mat unit. .
[0017]
In a document handled by the non-contact scanner device 10, a frame line, a ruled line, and the like that are unnecessary in the OCR process are described in a predetermined dropout color indicating a luminance distribution higher than a luminance distribution of a character to be written. . After reading the document by the image acquisition unit 12, the non-contact scanner device 10 performs a filtering process on the image image by a filter unit (not shown) of the non-contact scanner device, and removes most of the dropout colors.
[0018]
As shown in FIG. 1, the binary image forming apparatus 20 includes an image memory 21 for storing an image acquired by the non-contact scanner 10 and an image for a threshold setting sheet (described later) stored in the image memory. A binarization threshold setting unit 22 that sets a binarization threshold based on the binarization threshold; a layout memory 23 that previously holds layout information used when setting the binarization threshold; and a binarization threshold setting unit 22 A binarization threshold value memory 24 that stores the binarization threshold value that has been obtained, and a binarization process using a binarization threshold value of the binarization threshold value memory 24 for a document for which an entry character is to be determined. The image processing apparatus includes a binarization processing unit 25 to be formed, and a control unit 26 that controls the operation of each component of the binary image forming apparatus 20.
[0019]
The binarization threshold setting unit 22 sets a binarization threshold in adjustment processing prior to formation of a binary image. In the setting, a threshold setting sheet corresponding to the reference image shown in FIG. 3A is used. The threshold setting sheet is provided with a reference color that is a color that indicates a critical luminance value that does not cause character rubbing in the binary image. As the luminance of the reference color, a value obtained from an experiment or experience can be used as long as the value satisfies the above-described condition. For example, as a reference color, a color having a luminance distribution of about 100 to 200 with a peak near 150 of 256 gradations under fluorescent lamp illumination can be adopted. Further, as the color of the reference color, any achromatic color or chromatic color can be used as long as the color corresponds to the color specified for the entered character.
[0020]
As shown in FIG. 3A, an achromatic reference color is assigned to five preset positions on the threshold setting sheet of this specific example. In the illustrated example, the reference color is applied to each of two places above and below the form, and one place near the center of the form. This arrangement is an example set when the non-contact scanner device 10 reads the document, taking into account that the influence of illumination is different at each location of the form. The arrangement is not limited to the illustrated example, and the arrangement can be appropriately set. .
[0021]
FIG. 3B shows layout information stored in the layout memory 23 in advance. The layout information defines which part of the threshold setting sheet is to be detected for the luminance distribution of each part where the reference color is applied.
FIG. 3C shows an image image in which the reference image image shown in FIG. 3A is associated with the layout information shown in FIG. 3B.
[0022]
In this specific example, the binarization threshold setting unit 22 sets a binarization threshold for each range divided by the boundary shown in FIG. Specifically, as shown in FIG. 4, the luminance distribution of the reference color is detected for each region such as “region 1: (xs1, ys1)-(xe1, ye1)” in the layout information of the layout memory 23. Then, the luminance value having the maximum intensity in the detected luminance distribution is stored in the binarization threshold memory 24 for each region as a binarization threshold such as “Threshold 1” shown in FIG.
[0023]
During operation, the binarization processing unit 25 performs binarization processing on the image of the completed form for each of the above-described regions. In the binarization processing, for example, in the histogram shown in FIG. 4, a pattern indicating a luminance value lower than 150, which is the binarization threshold, is determined to be a pattern of a character to be subjected to the OCR processing. It is determined that the pattern indicating a high luminance value is a pattern like a frame to be excluded in the binarization processing.
[0024]
The operation of the scanner system 101 of the first specific example will be described with reference to the flowchart of the adjustment process shown in FIG. 5 and the flowchart at the time of operation shown in FIG.
In the adjustment processing according to the flowchart of FIG. 5, when the non-contact scanner device 10 reads a document from the threshold setting sheet, the binary image forming device 20 stores the reference image, which is the image, in the image memory 21. (Step S1). The white peak of the reference image stored in the image memory 21 is normalized by the well-known shutter control by the non-contact scanner device 10.
[0025]
The binarization threshold setting unit 22 generates a reference color histogram as shown in FIG. 4 for each of the above-described regions obtained from the layout information of the layout memory 23 for the reference image image. Then, the luminance value corresponding to the peak in the histogram is stored in the binarization threshold memory 24 for each region as a binarization threshold (step S2). With this, the pre-operation adjustment processing ends.
[0026]
In the operation of the scanner system 101 shown in FIG. 6, when the non-contact scanner device 10 reads a completed form, that is, a form to be subjected to OCR processing, the binary image forming apparatus 20 stores the image in the image memory 21. (Step S3). In this image image as well, the white peak is normalized as in the case of the above-described reference image image.
[0027]
The binarization processing unit 25 uses the binarization threshold value corresponding to each of the image images stored in the image memory 21 for each range divided as shown in FIG. Become Furthermore, a binary image is formed by integrating the binarized images for each range, and this is stored in the image memory 21 (step S4). Thereafter, the binary image stored in the image memory 21 is subjected to character determination by an OCR processing unit (not shown).
[0028]
According to the scanner system 101 of the specific example 1, since the shared binarization threshold is set for various forms using the threshold setting sheet, it is not necessary to set the threshold every time the form is changed. , And a binary image for the OCR process can be efficiently formed. Further, since the binarization threshold is set based on the reference color of the character, the binarization threshold hardly exists in the luminance distribution of the entered character, and as a result, it is possible to prevent the character from being rubbed or missing. it can.
[0029]
<Specific example 2>
FIG. 7 is a block diagram showing a configuration of a specific example 2 of the scanner system according to the present invention.
The scanner system 102 of the specific example 2 has the same configuration as that of the scanner system 101 of the specific example 1 described above, and further includes whether or not dropout colors can be eliminated by the binarization threshold set by the binarization threshold setting unit 22. A drop-out availability determination unit 27 that determines whether the drop-out is possible.
[0030]
As shown in FIG. 8A, the threshold setting sheet of the specific example 2 is provided with a limit color of a dropout color adjacent to a reference color of a character arranged at each position. The limit color of the dropout color is a color in which the luminance value corresponding to the peak of the luminance intensity indicates a value higher than the binarization threshold and a color indicating a luminance distribution that can be removed by the binarization threshold. As the luminance distribution of the limit color, a value obtained from an experiment or experience can be used as long as the value satisfies the above-described condition. For example, as the limit color, a color having a luminance distribution of about 160 to 255 having a peak near 210 of 256 gradations under fluorescent lamp illumination can be adopted. Further, the limit color is not limited to a chromatic color, and an achromatic color having the same luminance as the chromatic color can be used.
[0031]
As shown in FIG. 8B, the layout information of the layout memory 23 of the specific example 2 detects the luminance of the dropout color shown in FIG. Area to be defined.
FIG. 8C shows an image image in which the reference image image shown in FIG. 8A is associated with the layout information shown in FIG.
[0032]
In the adjustment processing prior to the operation, the dropout availability determination unit 27 detects the luminance distribution of the dropout color for each region from the reference image image, and determines whether the dropout color can be removed by the binarization threshold. Is determined. For example, as shown in FIG. 9, when a dropout color having a luminance distribution having a peak at the value of (A) is detected, the dropout color is determined by a binarization threshold obtained from the reference color of the character. It is determined that it can be properly excluded. Further, for example, when a dropout color having a peak at the value of (B) is detected, it is determined that the dropout color cannot be properly excluded because a binarization threshold exists in the luminance distribution. Is determined.
[0033]
The operation in the adjustment process of the scanner system 102 of the specific example 2 will be described with reference to the flowchart shown in FIG.
The procedure from steps S10 to S11 for setting the binarization threshold after the non-contact scanner device 10 reads the document on the threshold setting sheet is the procedure from steps S1 to S2 in the scanner system 101 of the specific example 1 described above. Therefore, the description is omitted.
[0034]
After the binarization threshold is set, the dropout availability determination unit 27 makes a determination on the exclusion of the above-described dropout color for each region of the image described with reference to FIG. 8C (step S12). ). In this determination, when it is determined that the dropout color cannot be properly removed, for example, a message indicating that there is a problem in the installation environment of the non-contact scanner device 10 and noise due to illumination is occurring is displayed on the display device 30. Can be displayed.
[0035]
If it is determined in the determination that the dropout color can be properly eliminated, the scanner system 102 can be used in the same manner as the operation procedure described in the first embodiment without changing the installation environment of the non-contact scanner device 10. Can be operated.
[0036]
According to the scanner system 102 of the specific example 2, the same effect as that of the scanner system 101 of the specific example 1 can be obtained. Further, since the determination as to whether or not the dropout color can be excluded is performed, the non- It is possible to confirm whether the installation environment of the contact scanner device 10 is good or not. As a result, during operation, it is possible to more appropriately eliminate the dropout color, and it is possible to form a highly accurate binary image.
[0037]
In each of the specific examples described above, an example is shown in which a single reference color is given to the threshold setting sheet, but a color having a plurality of PCS (Print Contrast Scale) values is also used as the reference color. be able to. In that case, for example, by a linear interpolation process, it is possible to calculate a luminance that does not cause indirect character rubbing.
[0038]
Further, in each of the specific examples described above, the example of the scanner system using the non-contact scanner device has been described. However, the present invention can be applied to a scanner system that reads a document using a contact-type scanner device.
In each of the specific examples described above, the threshold setting sheet is divided into a plurality of regions in advance. However, a threshold setting sheet in which the reference color is assigned to one place without being divided in this way can be used.
[0039]
【The invention's effect】
ADVANTAGE OF THE INVENTION According to the scanner system which concerns on this invention, since the threshold value of the common sheet | seat for a binarization is set to various forms using the sheet | seat for a threshold value setting, it is not necessary to set a threshold value for every form of a document. , A binary image for the OCR process can be efficiently formed. Moreover, since the threshold value for binarization is set based on the reference color, the threshold value is unlikely to exist in the luminance distribution of the entered character, and as a result, it is possible to prevent the character from being rubbed or missing.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a specific example 1 of a scanner system according to the present invention.
FIG. 2 is an explanatory diagram illustrating a configuration of a non-contact scanner device.
FIG. 3 is an explanatory diagram illustrating a threshold setting sheet according to a specific example 1.
FIG. 4 is an explanatory diagram for explaining setting of a binarization threshold.
FIG. 5 is a flowchart illustrating a procedure of an adjustment process of the scanner system according to the first embodiment.
FIG. 6 is a flowchart illustrating a procedure when the scanner system according to the first embodiment is operated.
FIG. 7 is a block diagram showing a configuration of a specific example 2 of the scanner system according to the present invention.
FIG. 8 is an explanatory diagram illustrating a threshold setting sheet according to a second specific example.
FIG. 9 is an explanatory diagram for explaining availability determination regarding removal of a dropout color. FIG. 10 is a flowchart illustrating a procedure of an adjustment process of the scanner system according to the second embodiment.
[Explanation of symbols]
101, 102 Scanner system 10 Non-contact scanner device 11 Mat unit 12 Image acquisition unit 20 Binary image forming device 21 Image memory 22 Binarization threshold setting unit 23 Layout memory 24 Binarization threshold memory 25 Binarization processing unit 26 Control Unit 27 Dropout availability determination unit 30 Display device 40 Input device

Claims (7)

書面から該書面を表すイメージ画像を取得する画像取得装置と、該画像取得装置により取得したイメージ画像に対応する二値画像を形成する二値画像形成装置とを含むスキャナシステムであって、
前記二値画像形成装置は、
二値画像を得るための所定の輝度を示す基準色が付与された基準イメージ画像から当該基準色の輝度分布を検知し、該検知した輝度分布から強度が最大となる輝度値を閾値として設定する閾値設定部と、
前記画像取得装置により取得されたイメージ画像に対し前記閾値を用いて二値化処理を施し、当該イメージ画像に対応する二値画像を形成する二値化処理部とを備えることを特徴とするスキャナシステム。
An image acquisition device that acquires an image image representing the document from a document, and a scanner system including a binary image forming device that forms a binary image corresponding to the image image acquired by the image acquisition device,
The binary image forming apparatus includes:
A luminance distribution of the reference color is detected from a reference image image to which a reference color indicating a predetermined luminance for obtaining a binary image is added, and a luminance value having the maximum intensity from the detected luminance distribution is set as a threshold value. A threshold setting unit;
A scanner that performs a binarization process on the image image acquired by the image acquisition device using the threshold value and forms a binary image corresponding to the image image. system.
前記基準イメージ画像は、予め区分された複数の領域のそれぞれに前記基準色が付与され、
前記閾値設定部は、前記基準イメージ画像の各前記領域についての前記閾値を設定し、
前記二値化処理部は、前記領域毎に、対応する前記閾値に基づき前記二値化処理を施す請求項1記載のスキャナシステム。
In the reference image image, the reference color is given to each of a plurality of regions that have been divided in advance,
The threshold value setting unit sets the threshold value for each of the regions of the reference image image,
The scanner system according to claim 1, wherein the binarization processing unit performs the binarization processing for each of the regions based on the corresponding threshold value.
さらに、前記基準色の輝度分布よりも高い輝度分布を示し且つ前記二値画像の形成に不用とされるドロップアウト色が前記基準色と共に付与された基準イメージ画像から当該ドロップアウト色の輝度分布を検知し、該検知した輝度分布と前記閾値との比較により前記ドロップアウト色の排除の可否を判定するドロップアウト判定部を備える請求項1記載のスキャナシステム。Furthermore, the luminance distribution of the drop-out color is obtained from a reference image image that shows a luminance distribution higher than the luminance distribution of the reference color and is used together with the reference color, and a drop-out color that is not used for forming the binary image is provided. 2. The scanner system according to claim 1, further comprising: a dropout determination unit that detects and compares the detected luminance distribution with the threshold to determine whether or not the dropout color is excluded. 前記基準イメージ画像は、予め区分された複数の領域のそれぞれに前記基準色および前記ドロップアウト色が付与され、
前記閾値設定部は、前記基準イメージ画像の各前記領域についての前記閾値を設定し、
前記ドロップアウト判定部は、前記領域毎に、対応する前記閾値に基づき前記ドロップアウト色に関する前記判定を行う請求項3記載のスキャナシステム。
In the reference image image, the reference color and the dropout color are given to each of a plurality of regions that are previously divided,
The threshold value setting unit sets the threshold value for each of the regions of the reference image image,
The scanner system according to claim 3, wherein the dropout determination unit performs the determination regarding the dropout color based on the corresponding threshold value for each of the areas.
前記画像取得装置は、前記書面に接触することなく前記イメージ画像を光学的に取得する非接触スキャナ装置である請求項1記載のスキャナシステム。The scanner system according to claim 1, wherein the image acquisition device is a non-contact scanner device that optically acquires the image image without touching the document. 書面を表すイメージ画像に対応する二値画像を得るための所定の輝度を示す基準色が付与されていることを特徴とする閾値設定用シート。A threshold setting sheet, which is provided with a reference color indicating a predetermined luminance for obtaining a binary image corresponding to an image image representing a document. 書面から該書面を表すイメージ画像を取得し、該取得したイメージ画像に対応する二値画像を形成する二値画像形成方法であって、
二値画像を得るための所定の輝度を示す基準色が付与された基準イメージ画像から当該基準色の輝度分布を検知し、該検知した輝度分布から強度が最大となる輝度値を閾値として設定し、書面のイメージ画像に対し前記閾値を用いて二値化処理を施し、当該イメージ画像に対応する二値画像を形成することを特徴とする二値画像形成方法。
A binary image forming method for obtaining an image image representing the document from a document and forming a binary image corresponding to the obtained image image,
A luminance distribution of the reference color is detected from a reference image image to which a reference color indicating a predetermined luminance for obtaining a binary image is added, and a luminance value having the maximum intensity from the detected luminance distribution is set as a threshold. And performing a binarization process on the written image image using the threshold value to form a binary image corresponding to the image image.
JP2003015474A 2003-01-24 2003-01-24 Scanner system, threshold setting sheet, and binary image forming method Expired - Fee Related JP4155035B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003015474A JP4155035B2 (en) 2003-01-24 2003-01-24 Scanner system, threshold setting sheet, and binary image forming method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003015474A JP4155035B2 (en) 2003-01-24 2003-01-24 Scanner system, threshold setting sheet, and binary image forming method

Publications (2)

Publication Number Publication Date
JP2004227355A true JP2004227355A (en) 2004-08-12
JP4155035B2 JP4155035B2 (en) 2008-09-24

Family

ID=32903213

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003015474A Expired - Fee Related JP4155035B2 (en) 2003-01-24 2003-01-24 Scanner system, threshold setting sheet, and binary image forming method

Country Status (1)

Country Link
JP (1) JP4155035B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830857A (en) * 2018-05-29 2018-11-16 南昌工程学院 A kind of adaptive Chinese character rubbings image binaryzation partitioning algorithm

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830857A (en) * 2018-05-29 2018-11-16 南昌工程学院 A kind of adaptive Chinese character rubbings image binaryzation partitioning algorithm
CN108830857B (en) * 2018-05-29 2021-04-23 南昌工程学院 Self-adaptive Chinese character copy label image binarization segmentation method

Also Published As

Publication number Publication date
JP4155035B2 (en) 2008-09-24

Similar Documents

Publication Publication Date Title
US8184923B2 (en) Image analysis method, image analysis program, pixel evaluation system having the image analysis method, and pixel evaluation system having the image analysis program
US7072526B2 (en) Image processing apparatus, image processing method and recording medium
EP1051025A1 (en) Image processing device and image processing method
JP4977103B2 (en) Print document authentication method, computer program product, and data processing system
JPH09329527A (en) Image processing method, and apparatus therefor
JPH0957201A (en) Specific color region extracting system and specific color region removing system
US8477988B2 (en) Image processing apparatus, image forming apparatus and computer readable medium
JP2004239733A (en) Defect detection method and apparatus of screen
JP2004212311A (en) Method and apparatus for detecting unevenness defect
JP4155035B2 (en) Scanner system, threshold setting sheet, and binary image forming method
WO2003010622A3 (en) Automatic separation of subject pixels using segmentation based on multiple planes of measurement data
JP2010225047A (en) Noise component removing device, and medium with noise component removing program recorded thereon
KR20060047531A (en) Image processing apparatus and method
JP3584507B2 (en) Pattern unevenness inspection equipment
JP3941403B2 (en) Image density unevenness detection method and inspection apparatus
JP2005342936A (en) Color tone controlling method
JP4084257B2 (en) Printed circuit board inspection equipment
JP2004276476A (en) Printed matter inspecting device, printed matter inspecting method, printed matter inspecting processing program and recording medium having program thereon
KR20080041056A (en) Image forming apparatus and image forming method
JP2001143076A (en) Image processor
JP2004048130A (en) Image processing method, image processing apparatus, and image processing program
JP2004015232A (en) Method for acquisition processing of document image and apparatus therefor, and program
JP2004177215A (en) Apparatus, method and processing program for inspecting printed matter, and recording medium in which the program is recorded
JP2000293629A (en) Image processing method, image processor and recording medium
JP2001174228A (en) Marking reader

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060316

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080617

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080630

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4155035

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120718

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130718

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees