JP2009140244A - 画像処理プログラム及び画像処理装置 - Google Patents

画像処理プログラム及び画像処理装置 Download PDF

Info

Publication number
JP2009140244A
JP2009140244A JP2007316117A JP2007316117A JP2009140244A JP 2009140244 A JP2009140244 A JP 2009140244A JP 2007316117 A JP2007316117 A JP 2007316117A JP 2007316117 A JP2007316117 A JP 2007316117A JP 2009140244 A JP2009140244 A JP 2009140244A
Authority
JP
Japan
Prior art keywords
value
threshold
gradation value
binarization
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007316117A
Other languages
English (en)
Other versions
JP4867903B2 (ja
Inventor
Yasuyuki Harada
泰行 原田
Taira Obara
平 小原
Keiji Hirose
啓次 広瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2007316117A priority Critical patent/JP4867903B2/ja
Publication of JP2009140244A publication Critical patent/JP2009140244A/ja
Application granted granted Critical
Publication of JP4867903B2 publication Critical patent/JP4867903B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】ディジタル画像を二値化するための画像処理プログラムであって、二値化のために不要な下地や背景を適切に除去することのできる画像処理プログラム等を提供する。
【解決手段】画像データを二値のデータとする二値化処理をコンピュータに実行させる画像処理プログラムにおいて、前記画像データは、各画素が、白色で最高値となり黒色で最低値となる階調値を有するデータであり、前記階調値の所定値から、階調値の高い順番に画素を所定個数ずつグルーピングし、グループ内における最高階調値と最低階調値の差が所定値よりも大きくなる各グループにおいて、同じ階調値を有している画素の個数が最も少ない当該階調値を閾値候補として検出する、処理を前記コンピュータに実行させ、前記検出された閾値候補の中から、前記二値化処理のための閾値が選択される。
【選択図】図2

Description

本発明は、入力されたディジタル画像を二値化するための画像処理プログラム等に関し、特に、二値化のために不要な下地や背景を適切に除去することのできる画像処理プログラム等に関する。
従来、各画素が多値の濃度階調値を有する画像データを二値化することが行なわれている。当該処理では、所定の閾値が設定されて、当該閾値より大きい濃度階調値を有する画素は白画素に、当該閾値より小さい濃度階調値を有する画素は黒画素に変換される。かかる画像の二値化処理は、画像をOCRで読み取る際に、帳票などを判別する際に、また、データ量を小さくして保存する際などに用いられる。
下記特許文献1には、帳票の濃度画像を安定して二値化するための装置が記載され、対象画像の濃度ヒストグラムにおいて所定の濃度値付近に位置する複数の極小値を検出し、この検出された極小値の中から最小値となる極小値の濃度値を二値化しきい値として選択する、ことが示されている。
特開2002−150276号公報
上述した画像の二値化処理では、対象画像において二値化後に黒色として残したい文字などが色の付いた背景の上に記載されている場合などがあり、文字等を明確に残すためには背景を的確に除去する(白画素とする)ことが必要となる。
上記特許文献1に記載の方法では、この背景除去のみを目的としていないので、二値化後に黒色として残しておきたい部分についても背景として除去されてしまう可能性がある。
そこで、本発明の目的は、入力されたディジタル画像を二値化するための画像処理プログラムであって、二値化のために不要な下地や背景を適切に除去することのできる画像処理プログラム、等を提供することである。
上記の目的を達成するために、本発明の一つの側面は、多値の画像データを二値のデータとする二値化処理をコンピュータに実行させる画像処理プログラムにおいて、前記画像データは、各画素が、白色で最高値となり黒色で最低値となる階調値を有するデータであり、前記階調値の所定値から、前記階調値の高い順番に前記画素を所定個数ずつグルーピングし、グループ内における最高階調値と最低階調値の差が所定値よりも大きくなる各グループにおいて、同じ階調値を有している前記画素の個数が最も少ない当該階調値を閾値候補として検出する、処理を前記コンピュータに実行させ、前記検出された閾値候補の中から、前記二値化処理のための閾値が選択される、ことである。
更に、上記の発明において、一つの態様は、前記選択された閾値は、当該閾値以上の前記階調値を有する画素を白色とする処理に用いられる、ことを特徴とする。
更に、上記の発明において、好ましい態様は、前記検出された閾値候補の中から、最も階調値の高い閾値候補が前記閾値として選択される、ことを特徴とする。
更にまた、上記の発明において、好ましい態様は、前記検出された閾値候補の中で最も階調値の高い閾値候補の階調値が予め定められた所定値以上である場合には、前記階調値の低い画素の個数に応じて、2番目に階調値の高い前記閾値候補が前記閾値として選択される、ことを特徴とする。
更に、上記の発明において、好ましい態様は、前記階調値が予め定められた最低値よりも小さい前記閾値候補は前記閾値として選択されない、ことを特徴とする。
上記の目的を達成するために、本発明の別の側面は、多値の画像データを二値のデータとする二値化処理を実行する画像処理装置において、前記画像データは、各画素が、白色で最高値となり黒色で最低値となる階調値を有するデータであり、前記階調値の所定値から、前記階調値の高い順番に前記画素を所定個数ずつグルーピングし、グループ内における最高階調値と最低階調値の差が所定値よりも大きくなる各グループにおいて、同じ階調値を有している前記画素の個数が最も少ない当該階調値を閾値候補として検出し、前記検出された閾値候補の中から、前記二値化処理のための閾値が選択される、ことである。
本発明の更なる目的及び、特徴は、以下に説明する発明の実施の形態から明らかになる。
以下、図面を参照して本発明の実施の形態例を説明する。しかしながら、かかる実施の形態例が、本発明の技術的範囲を限定するものではない。なお、図において、同一又は類似のものには同一の参照番号又は参照記号を付して説明する。
図1は、本発明を適用した画像処理装置の実施の形態例に係る機能構成図である。図1に示す二値化装置2が本発明を適用した画像処理装置であり、二値化対象画像の輝度(濃度)ヒストグラムにおいて、所定割合の度数を規定する輝度幅が所定幅以上になる部分から二値化のための閾値候補を検出して、当該候補の中から最も輝度の高い閾値候補または2番目に輝度の高い閾値候補を閾値として選択し、当該閾値よりも値の大きい画素については白画素とする処理を実行して、二値化における下地、背景除去の処理を適切に行なおうとするものである。
図1に示す本実施の形態例に係るシステムは、二値化対象画像の原稿を読み取る、いわゆるスキャナである画像読み取り装置1と、そのホスト装置であるホストコンピュータ等に備えられる上記二値化装置2とから構成される。
画像読み取り装置1は、ユーザ操作などに従って上記原稿の画像を光学的な方法により読み取り、読み取った画像をディジタル画像として出力する。このディジタル画像は、各画素が各色の濃度階調値を有する画像データとなっており、カラー画像として読み取った場合には、例えば、各画素がRGB各色の濃度階調値(例えば、0〜255の256階調)で表現される。また、グレースケールで読み取った場合には、1次元の濃度階調値(例えば、0〜255の256階調)で表現される。画像読み取り装置1では、このような画像データを二値化装置2に供給する。
次に、二値化装置2は、上述の通り、前記画像読み取り装置1のホストコンピュータ内に構築される。当該ホストコンピュータは、いわゆるパーソナルコンピュータなどで構成することができ、図示していないが、CPU、ROM、RAM、ハードディスク、他装置とのインターフェースなどを備える。
図1に示すとおり、二値化装置2は、機能的には、ヒストグラム作成部21、閾値候補検出部22、閾値択一部23、及び二値化処理部24を有し、前記画像読み取り装置1から供給される画像データに対して、ユーザ指示等に基づき、二値化処理を実行し、その結果の出力画像を出力する。これら各部21〜24は、上記ホストコンピュータのROMに格納される各種プログラム、当該プログラムに従って処理を実行する上記CPU、及び上記RAM等で構成される。なお、当該プログラムが本発明を適用した画像処理プログラムに相当し、例えば、上記画像読み取り装置1のドライバプログラムとして備えられる。また、当該プログラムは、CDなどの記憶媒体に格納されているものをホストコンピュータにインストールする、あるいは、所定のサイトからインターネットなどを介してホストコンピュータにダウンロードする、ことによってホストコンピュータに備えることができる。
ヒストグラム作成部21は、上記画像読み取り装置1から供給され、上記RAMに格納される画像データについて、上記プログラムに従ったCPUの処理で、輝度値のヒストグラムを作成する部分である。具体的な処理については後述する。
閾値候補検出部22は、上記作成されたヒストグラムを用いて、上記プログラムに従ったCPUの処理により、閾値候補を検出し、当該検出した候補値を記憶する部分である。
また、閾値択一部23は、上記プログラムに従ったCPUの処理により、上記検出された閾値候補の中から一つの閾値を選択する部分である。上記閾値候補検出部22及び当該閾値択一部23による処理に特徴があり、その具体的な内容については後述する。
二値化処理部24は、上記プログラムに従ったCPUの処理により、前記閾値択一部23により選択された閾値を利用して、二値化対象画像から、黒画素として残す必要のない下地や背景の部分を除去する処理を実行し、その後、除去されなかった部分について、適宜、二値化の処理を実行して、二値化された対象画像を出力する部分である。
以上説明したような構成を有する本実施の形態例に係る二値化装置2では、以下に示すような内容で各処理が実行される。
まず、ヒストグラム作成部21が、画像読み取り装置1から受け取ってRAM等に格納している画像データにつき、輝度値Yについてのヒストグラムを作成する。当該画像データがRGB色空間で表現されたデータである場合には、すなわち、前述したように各画素がRGBの各濃度階調値を有するデータである場合には、下記(1)式に従って、各画素の輝度値Yを求め、対象画像全体について、輝度値Y毎の画素数(度数)を求める。
Y=a×R+b×G+c×B (1)
但し、a、b、cは、3つの合計が1となる値であればよい係数であって、例えば、a=1/3、b=1/3、c=1/3とすることができる。また、R、G、Bは、各画素が有する上記各色の濃度階調値であり、例えば、それぞれ、0〜255のいずれかの値をとる。
また、前記画像データが、グレースケールで表現されたグレーデータである場合には、各画素の有する濃度階調値を、白側が大きい値となるようにして、そのまま輝度値Yとすることができる。この場合にも、同様に、輝度値Y毎の画素数(度数)を求めてヒストグラムを作成する。
図2は、生成されるヒストグラムを例示した図である。図2では、輝度が0〜255の256階調で表現されており、輝度が0(黒色)に近い側(黒色側)と輝度が255(白色)に近い側(白色側)にそれぞれヒストグラムの山が現れる例となっている。
このようにして作成されたヒストグラム(のデータ)は、RAM等に記憶される。
次に、閾値候補検出部22による処理が実行される。ここでは、前述の通り、作成した輝度ヒストグラムにおいて、所定割合の度数を規定する輝度幅が所定幅以上になる部分から閾値候補を検出する処理を実行するが、具体的には、以下のような手順で処理が行われる。
まず、予め定められた白色側の輝度値Zから、上記作成されたヒストグラムの度数(画素数)を、輝度値が低くなる方向へ順番に積算していき、その積算値が、当該ヒストグラムの輝度値が0〜Zに入る全画素数に対して、予め定められた割合N%になった時点で、そこまでのヒストグラムの輝度幅を求める。すなわち、輝度値Zを始点としてその時点までに積算された画素を1グループとし、そのグループの最大輝度値(この場合にはZ)と最小輝度値との差である輝度幅を求める。
図2に示す例では、ヒストグラムの右側に設定されているZの位置から上記積算が開始され、上記N%となった時点で輝度幅yが求められる。輝度幅yのグループにおいてその右端の輝度値Zが上記最大輝度値であり、左端の輝度値が上記最小輝度値である。
その後、上記積算が終了した画素の次の画素、すなわち、ヒストグラムで輝度値が低くなる方向へ次の画素、を始点として、上記と同様の積算(グルーピング)及び輝度幅の算出を行う。図2に示す例では、当該処理の結果、yが求められる。
その後も同様の処理をヒストグラムの最後まで繰り返し実行し、その結果、各輝度幅を有する複数のグループ(ヒストグラムの範囲)が形成される。図2に示す例では、輝度幅Y、Y、・・・を有する各範囲が順次形成されていくことになる。
次に、上記形成された各範囲の輝度幅を予め定めた固定値Aと比較し、輝度幅が固定値Aよりも広くなっている範囲を選出する。そして、その選出された各範囲について、その範囲内の最小頻度(度数)の輝度値を求め、この輝度値を閾値候補として検出する。すなわち、各範囲でヒストグラムの高さが一番低い位置の輝度値を閾値候補とする。ここでは、上記固定値Aよりも広い輝度幅をY(輝度の高いほうから順番にn=1,2,3・・・とする)、上記検出された閾値候補をt(輝度の高いほうから順番にn=1,2,3・・・とする)とする。なお、輝度値0を含む上記範囲について閾値候補を検出しない。
図2に示す例では、矢印で示される固定幅Aと各輝度幅が比較され、Aより広い幅としてYとYが選出され、それらに対応する範囲から、それぞれ、閾値候補1としてtと閾値候補2としてtとが検出される。
このように閾値候補が検出されるが、上述の処理により、ヒストグラムにおいて輝度幅が狭い範囲、すなわち、度数が高い山となっている範囲、からは閾値候補が検出されず、輝度幅が広い範囲、すなわち、度数が低く谷や山の裾野となっている範囲、から閾値候補が検出さることになる。従って、画像を二つのグループに分けて表現するための二値化において、その閾値をヒストグラムの谷や山の裾野付近で選択することが相応しいことから、上述の処理により二値化処理において有効な閾値候補を検出することができ、また、画像の下地部分や背景部分を除去する(白画素とする)処理においても、これらの部分はヒストグラム上で山を形成するので、当該処理に対しても有効な閾値候補が検出されるといえる。
また、前述した処理の起点となる輝度値Zは、その値よりも輝度が高い部分の処理を行わないために設定されるものである。この輝度値Zが設定されず、最高輝度値(255)から上述の処理を行うと、殆ど下地の画像であるなど、輝度値の高い部分に殆どの画素が集中している画像の場合に、上述した画素数N%の区間が当該輝度値の高い部分に集中して複数形成され、それ以降、黒色側が殆ど形成されないという状態となって、上述した閾値候補を適切に検出できないことになってしまう。そこで、この輝度値Zが予め設定され、適切なN%の区間が形成されるようにしている。
このようにして検出した閾値候補tは、RAM等に記憶されて次工程で使用される。なお、上述した輝度値Z、固定幅A、画素数割合N%は、それぞれ、各種原稿を用いた実験等により予め相応しい値が求められて設定される。
次に、閾値択一部23による処理が実行される。当該処理では、前記検出された閾値候補の中から実際に処理に用いる閾値を選択する処理を行うが、ここでは、二値化後に不要な、対象画像の下地部分や文字などの背景部分を除去する処理のための閾値を選択する。以下、そのための選択方法について説明する。
図3は、典型的なヒストグラム形状を例示した図である。各種原稿の画像データについて前記輝度ヒストグラムを作成すると、その形状は、概ね図3に示されるような4つのパターンに分けることができる。上記閾値の選択では、これら各パターンにおいて、上記目的に対して適切な閾値が選択されるようにする必要がある。
まず、図3の(a)に示すパターンは、二値化後に黒色として残す必要のある文字等の部分と原稿の下地部分とからなる原稿の場合である。すなわち、上記文字等に所定の色を有する背景がない場合である。このパターンでは、前述した閾値候補の検出処理において、図に示すように、下地からなる山の裾野に位置する閾値候補tと、谷(極小値)に位置するtが検出されることが予想される。
ここで、図中のA1で示す点線の範囲は、下地等の二値化後に不要な画素が存在すると考えられる範囲を示し、A2で示す破線の範囲は、文字等の二値化後に必要な画素が存在すると考えられる範囲を示している。従って、このパターンにおいて、上述した下地や背景を除去する目的の閾値としてtを選択すると、二値化後に必要な部分も除去してしまう危険性があり、当該パターンでは、tを選択するのが相応しい。
次に、図3の(b)に示すパターンは、二値化後に残す必要のある文字等に対して比較的濃い色の背景がある原稿の場合である。このパターンでは、前述した閾値候補の検出処理において、図に示すように、原稿の下地からなる山と上記背景からなる山の間の谷(極小値)に位置するtと、背景からなる山の裾野に位置するtが検出されることが予想される。
ここで、図中のA1及びA2は、図3の(a)と同様の範囲を示しており、従って、このパターンにおいて、上述した下地や背景を除去する目的の閾値としてtを選択すると、二値化後に必要な部分も除去してしまう危険性があり、当該パターンでも、tを選択するのが相応しい。
次に、図3の(c)に示すパターンは、二値化後に残す必要のある文字等に対して比較的薄い色の背景がある原稿の場合である。このパターンでは、前述した閾値候補の検出処理において、図に示すように、原稿の下地からなる山と上記背景からなる山の間の谷(極小値)に位置するtと、背景からなる山の裾野に位置するtが検出されることが予想される。
ここで、図中のA1及びA2は、図3の(a)と同様の範囲を示している。このパターンでは、A2の範囲に対して背景の山(tとtの間の山)の輝度が十分に高くなっており、この背景を除去しても残す必要のある部分を除去してしまう危険性が殆どないので、すなわち、上述した下地や背景を除去する目的の閾値としてtを選択しても二値化後に必要な部分を除去してしまう危険性が少ないので、当該パターンでは、下地と共に背景も除去できるtを選択するのが相応しい。
次に、図3の(d)に示すパターンは、二値化後に残す必要のある文字等に対して背景があり、黒い部分が少ない原稿の場合である。このパターンでは、前述した閾値候補の検出処理において、図に示すように、原稿の下地からなる山と上記背景からなる山の間の谷(極小値)に位置するtと、背景からなる山の裾野に位置するtが検出されることが予想される。
ここで、図中のA1及びA2は、図3の(a)と同様の範囲を示している。このパターンでは、黒側の画素数が少なく全体的に白っぽい画像であるため、文字等の必要な範囲A2の輝度と背景(tとtの間の山)の輝度にあまり差がなく、上述した下地や背景を除去する目的の閾値としてtを選択すると、二値化後に必要な部分も除去してしまう危険性があり、当該パターンでは、あえて背景は除去せずに下地のみを除去するようにtを選択するのが相応しい。
以上説明した各パターンに対する相応しい閾値が適確に選択されるように、閾値択一部23では、以下の条件で前記閾値候補から閾値を選択する。
まず、基本的にはtを閾値として選択するようにし、図3の(c)、(d)に示した場合のように、tが高い輝度値である場合には、すなわち、tが下地と背景の山の間の谷に位置すると考えられる場合には、tを選択できるか否かを判断する。当該判断では、黒側の状態を参照して原稿全体が白っぽい画像であるか否かを判定し、白っぽい画像であると判定した場合にはtを選択できないと判断してtを選択し、白っぽい画像でないと判定した場合にはtを選択できると判断してtを選択する。
なお、文字等の残す必要のある情報は概ね輝度の低い方に存在していることから、閾値が低くなりすぎて必要な情報を除去してしまうことを回避するために、一般的な条件として閾値の下限値(Tmin)を上記選択条件に加えて設けることが必要である。また、極めて白紙に近い原稿の場合など例外的なヒストグラム形状になって、上述した処理が有効に機能しない場合を考慮した条件も必要となる。
以上説明した条件で閾値が選択されるよう、閾値択一部23では、以下のような処理手順で選択処理を行う。図4は、閾値の選択処理の手順を例示したフローチャートである。
まず、閾値択一部23は、前工程で、すなわち、前述した閾値候補検出部22の処理で閾値候補tが検出されているか否かをチェックする(ステップS1)。その結果、閾値候補tが検出されていない場合には(ステップS1のNo)、前述した輝度値Zの値が、(予め定められた閾値Tの下限値Tmin+5)以下であるか否かをチェックし(ステップS2)、そうでなければ(ステップS2のNo)、輝度値Zを所定値(例えば、5)下げて(ステップS3)、再度、閾値候補検出部22における候補検出の処理を実行させる(ステップS4)。一方、輝度値Zの値が(閾値Tの下限値Tmin+5)以下である場合には(ステップS2のYes)、閾値Tを下限値Tminとする(ステップS10)。
一方、ステップS1において、閾値候補tが検出されている場合には(ステップS1のYes)、最も輝度値の高い閾値候補tが予め定めたTmaxよりも小さいか否かをチェックする(ステップS5)。このTmaxは、閾値候補tが高すぎるか否かを判定する定数であり、前述したt選択の判断を行うか否かを判定するために用いられる。当該チェックの結果、tがTmaxよりも小さい場合には(ステップS5のYes)、tが前記Tmin以上であるか否かをチェックする(ステップS6)。
その結果、tがTmin以上である場合には(ステップS6のYes)、閾値Tをtとする(ステップS7)。すなわち、閾値候補tの中から、下地除去用の閾値としてtを選択する。一方、tがTmin以上でない場合には(ステップS6のNo)、閾値TをTminとする(ステップS10)。すなわち、下地除去用の閾値をTminとする。
また、ステップS5において、tがTmaxよりも小さくない場合には(ステップS5のNo)、前述した、tを閾値として選択できるか否かの判断を行う。具体的には、まず、全体が白っぽい画像であるか否かを判定すべく、画像の黒成分の量を示すYminを前記ヒストグラムから求め、この値が予め定められた判定値Yよりも大きいか否かをチェックする(ステップS8)。
図5は、画像の黒成分の量を示すYmin等を説明するための図である。Yminは、図5に示すように、前記作成したヒストグラムにおいて、輝度0側から順番に画素を積算していき、その積算値の全画素数に対する割合が予め定めた一定値に達した時点の輝度値であり、この値が高ければ高いほど白っぽい画像であると判断する。また、上記判定値Yは、画像の白っぽさを判定するための値であり、例えば、図5に示すような位置の値であり、Yminがこの値よりも大きければ画像が白っぽいと判定する。なお、前述した定数Tmax、Tminは、例えば、図5に示すような位置の値である。
ステップS8のチェックにおいて、YminがYよりも大きければ(ステップS8のYes)、閾値Tをtとする(ステップS7)。すなわち、画像が白っぽいと判定し、tを閾値として選択するのは危険であるとして、下地除去用の閾値としてtを選択する。一方、YminがYよりも大きくなければ(ステップS8のNo)、2番目に輝度値の高い閾値候補tが前記下限値Tmin以下であるか否かをチェックする(ステップS9)。
が下限値Tmin以下である場合には(ステップS9のYes)、閾値TをTminとする(ステップS10)。すなわち、下地除去用の閾値をTminとする。一方、tが下限値Tmin以下でない場合には(ステップS9のNo)、閾値Tをtとする(ステップS11)。すなわち、閾値候補tの中から、下地除去用の閾値としてtを選択する。
以上のように使用する閾値Tとしていずれかの値が選択されると、最後に、選択された閾値Tが前述したYminよりも大きい値となっているか否かをチェックする(ステップS12)。ここで、一般的なヒストグラム形状の原稿の場合には、閾値TがYminよりも大きい値となるので(ステップS12のYes)、そのまま、当該閾値の選択処理を終了する。
一方、閾値TがYminよりも大きい値とならない場合には(ステップS12のNo)、例外的なヒストグラム形状の原稿であると判断し、例外処理を実行する(ステップS13)。具体的には、例えば、その時点で設定されている、前述した各種定数の値では、適切な閾値が選択されない旨のエラーメッセージを、ホストコンピュータの表示装置に表示させるなどの処理を実行する。その場合、ユーザによって各種定数の値を変更できるインターフェースを用意するようにしても良い。また、各種定数の値を自動的に変更させて、再度、閾値候補の検出から処理をやり直すようにしてもよい。
なお、上述した各定数、Tmin、Tmax、Y、Yminを求める画素数割合は、それぞれ、各種原稿を用いた実験等により予め相応しい値が求められて設定される。
以上のようにして、閾値が選択されると、当該閾値が二値化処理部24に渡されて、対象とする画像データの輝度値が当該閾値以上の画素については、二値化後に不要な下地や背景であるとみなし、除去する処理を行う。具体的には、当該画素を白画素とする。より具体的には、当該画素の輝度値を最高値の255にしてその後の二値化処理にかけてもよいし、この時点で当該画素の値を、二値化後の白を表す値、例えば、「0」に変換しても良い。
一方、輝度値が当該閾値以上でない画素の範囲については、二値化後に黒画素として残すべき文字等の画像が含まれており、また、さらに不要な画像も含まれている可能性があるので、この時点では全てを黒画素又は白画素とする処理は実行せず、二値化後に残すべき部分が黒画素となり、その他の更に不要な部分が白画素となるような、さらなる二値化処理を実行する。具体的な処理内容は、対象画像に応じて適宜決定される。
このようにして二値化処理部24での二値化が終了すると、対象原稿についての二値画像が生成され、当該二値化装置2から出力される。その後、出力画像は、ホストコンピュータのRAM、ハードディスク等に記憶され、適宜、目的とする用途に使用される。
なお、上述の説明では、閾値候補tの全てを検出後にその中から採用する閾値Tを選出したが、上述の場合に様に、下地、背景除去の目的で閾値を決定する場合には、まず、閾値候補tのみを求めて、その値がTmax以上である場合に閾値候補tを求めるようにしても良い。そうすることにより、処理時間を短縮することが可能である。
以上説明したように、本実施の形態例に係る二値化装置2では、二値化対象画像の輝度(濃度)ヒストグラムにおいて、所定割合の度数を規定する輝度幅が所定幅以上になる部分から当該部分の最小頻度の輝度値を閾値候補として検出するので、ヒストグラムにおける谷部や山の裾野部を閾値候補として検出でき、二値化に有効な閾値を自動的に決定することが可能となる。
また、当該閾値候補を、二値化処理の下地除去処理のための閾値に用いることにより、ヒストグラムにおいて山を形成する、二値化後に不要な下地部分や背景部分を、適切に白画素化することが可能となる。
また、下地除去処理において、基本的に最も輝度値の高い閾値候補を閾値として採用し、画像の輝度ヒストグラムが輝度の高い側に偏っていないなど所定条件を満たしている場合に、さらに輝度値の低い閾値候補を閾値として採用するので、二値化後に必要な画像部分を除去してしまう危険を冒すことなく有効な下地除去を実行することができる。
また、下地除去処理において、予め適切な最低閾値Tminを設けてこれ以下の閾値を設定しないようにすることにより、二値化後に必要な部分を除去してしまう危険性を回避している。
また、画像全体の二値化処理を実行する前に、上記下地除去処理を実行して、選択した閾値以上の画素については白画素化し、それ以外の部分については、通常、処理時間を要する更なる二値化処理を実行するようにしたので、高品質な二値化の処理を高速で行なうことが可能となる。
なお、上述の実施の形態例では、閾値候補検出部22で検出した複数の候補の中から、閾値択一部23が下地除去処理の目的に適した条件で閾値を選択したが、閾値候補検出部22で検出される閾値候補は、前述の通り、ヒストグラムにおける谷部や山の裾野部に位置するものであり、下地除去処理の目的だけでなく、二値化処理において他の目的にも使用可能である。従って、閾値択一部23において他の使用目的に応じた条件を設定して閾値を選択し処理を実行するようにすることも可能である。
また、上記実施の形態例では、画像読み取り装置1と二値化装置2を含むホストコンピュータからなるシステム構成としたが、本発明に係る画像処理プログラム及び画像処理装置は、当該システム構成に限定されることなく適用することができる。
本発明の保護範囲は、上記の実施の形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶものである。
本発明を適用した画像処理装置の実施の形態例に係る機能構成図である。 生成されるヒストグラムを例示した図である。 典型的なヒストグラム形状を例示した図である。 閾値の選択処理の手順を例示したフローチャートである。 画像の黒成分の量を示すYmin等を説明するための図である。
符号の説明
1 画像読み取り装置、 2 二値化装置、 21 ヒストグラム作成部、 22 閾値候補検出部、 23 閾値択一部、 24 二値化処理部

Claims (6)

  1. 多値の画像データを二値のデータとする二値化処理をコンピュータに実行させる画像処理プログラムであって、
    前記画像データは、各画素が、白色で最高値となり黒色で最低値となる階調値を有するデータであり、
    前記階調値の所定値から、前記階調値の高い順番に前記画素を所定個数ずつグルーピングし、グループ内における最高階調値と最低階調値の差が所定値よりも大きくなる各グループにおいて、同じ階調値を有している前記画素の個数が最も少ない当該階調値を閾値候補として検出する、処理を前記コンピュータに実行させ、
    前記検出された閾値候補の中から、前記二値化処理のための閾値が選択される
    ことを特徴とする画像処理プログラム。
  2. 請求項1において、
    前記選択された閾値は、当該閾値以上の前記階調値を有する画素を白色とする処理に用いられる
    ことを特徴とする画像処理プログラム。
  3. 請求項2において、
    前記検出された閾値候補の中から、最も階調値の高い閾値候補が前記閾値として選択される
    ことを特徴とする画像処理プログラム。
  4. 請求項2において、
    前記検出された閾値候補の中で最も階調値の高い閾値候補の階調値が予め定められた所定値以上である場合には、前記階調値の低い画素の個数に応じて、2番目に階調値の高い前記閾値候補が前記閾値として選択される
    ことを特徴とする画像処理プログラム。
  5. 請求項2乃至請求項4のいずれかにおいて、
    前記階調値が予め定められた最低値よりも小さい前記閾値候補は前記閾値として選択されない
    ことを特徴とする画像処理プログラム。
  6. 多値の画像データを二値のデータとする二値化処理を実行する画像処理装置であって、
    前記画像データは、各画素が、白色で最高値となり黒色で最低値となる階調値を有するデータであり、
    前記階調値の所定値から、前記階調値の高い順番に前記画素を所定個数ずつグルーピングし、グループ内における最高階調値と最低階調値の差が所定値よりも大きくなる各グループにおいて、同じ階調値を有している前記画素の個数が最も少ない当該階調値を閾値候補として検出し、
    前記検出された閾値候補の中から、前記二値化処理のための閾値が選択される
    ことを特徴とする画像処理装置。
JP2007316117A 2007-12-06 2007-12-06 画像処理プログラム及び画像処理装置 Active JP4867903B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007316117A JP4867903B2 (ja) 2007-12-06 2007-12-06 画像処理プログラム及び画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007316117A JP4867903B2 (ja) 2007-12-06 2007-12-06 画像処理プログラム及び画像処理装置

Publications (2)

Publication Number Publication Date
JP2009140244A true JP2009140244A (ja) 2009-06-25
JP4867903B2 JP4867903B2 (ja) 2012-02-01

Family

ID=40870786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007316117A Active JP4867903B2 (ja) 2007-12-06 2007-12-06 画像処理プログラム及び画像処理装置

Country Status (1)

Country Link
JP (1) JP4867903B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141790A (ja) * 2007-12-07 2009-06-25 Seiko Epson Corp 画像処理プログラム及び画像処理装置
JP2011066669A (ja) * 2009-09-17 2011-03-31 Hitachi Ltd 文書検証システム、文書検証方法、文書検証プログラム及び記録媒体
US8314972B2 (en) 2009-06-29 2012-11-20 Seiko Epson Corporation Image processing program, image processing apparatus, and image processing method for suppressing see-through photo-optical appearance
US10104269B2 (en) 2016-03-18 2018-10-16 Brother Kogyo Kabushiki Kaisha Image processing apparatus configured for binarizing image data and methods for binarizing image data

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6162979A (ja) * 1984-09-05 1986-03-31 Hitachi Ltd 画像入力方式
JP2002150276A (ja) * 2000-11-08 2002-05-24 Glory Ltd 二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002319021A (ja) * 2001-04-19 2002-10-31 Murata Mfg Co Ltd 二値化処理方法、外観検査方法および外観検査装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6162979A (ja) * 1984-09-05 1986-03-31 Hitachi Ltd 画像入力方式
JP2002150276A (ja) * 2000-11-08 2002-05-24 Glory Ltd 二値化装置、二値化方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002319021A (ja) * 2001-04-19 2002-10-31 Murata Mfg Co Ltd 二値化処理方法、外観検査方法および外観検査装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009141790A (ja) * 2007-12-07 2009-06-25 Seiko Epson Corp 画像処理プログラム及び画像処理装置
US8314972B2 (en) 2009-06-29 2012-11-20 Seiko Epson Corporation Image processing program, image processing apparatus, and image processing method for suppressing see-through photo-optical appearance
JP2011066669A (ja) * 2009-09-17 2011-03-31 Hitachi Ltd 文書検証システム、文書検証方法、文書検証プログラム及び記録媒体
US10104269B2 (en) 2016-03-18 2018-10-16 Brother Kogyo Kabushiki Kaisha Image processing apparatus configured for binarizing image data and methods for binarizing image data

Also Published As

Publication number Publication date
JP4867903B2 (ja) 2012-02-01

Similar Documents

Publication Publication Date Title
JP4960897B2 (ja) 画像処理装置、画像処理方法、プログラム、記憶媒体
CN110189349B (zh) 图像处理方法及装置
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
JP4979956B2 (ja) 電子透かし埋め込み装置および電子透かし埋め込み方法
KR20120132314A (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
JP5337563B2 (ja) 帳票認識方法および装置
JP6021665B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
US11935314B2 (en) Apparatus for generating a binary image into a white pixel, storage medium, and method
JP4867903B2 (ja) 画像処理プログラム及び画像処理装置
KR20120132315A (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
JP4853560B2 (ja) 画像処理方法、画像処理装置およびコンピュータプログラム
JP4502001B2 (ja) 画像処理装置および画像処理方法
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
JP5929282B2 (ja) 画像処理装置及び画像処理プログラム
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
US9277074B2 (en) Image processing apparatus, method, and medium determining whether image data of a page to be processed is blank and contains a foreground object and transmitting the foreground object obtained by removing a background object
JP2010225047A (ja) ノイズ成分除去装置、ノイズ成分除去プログラムを記録した媒体
JP2008282280A (ja) 2次元コード読取装置及びその方法
JP2011170882A (ja) 2次元コード読取装置及びその方法
JP2012222581A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP5251100B2 (ja) 画像処理プログラム及び画像処理装置
JP6317413B1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP6111796B2 (ja) 画像処理装置およびコンピュータプログラム
JP2001143076A (ja) 画像処理装置
JP6372409B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101015

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111031

R150 Certificate of patent or registration of utility model

Ref document number: 4867903

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350