JP4977189B2 - 画像処理装置および画像処理方法 - Google Patents

画像処理装置および画像処理方法 Download PDF

Info

Publication number
JP4977189B2
JP4977189B2 JP2009248226A JP2009248226A JP4977189B2 JP 4977189 B2 JP4977189 B2 JP 4977189B2 JP 2009248226 A JP2009248226 A JP 2009248226A JP 2009248226 A JP2009248226 A JP 2009248226A JP 4977189 B2 JP4977189 B2 JP 4977189B2
Authority
JP
Japan
Prior art keywords
color
vector
image
unit
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009248226A
Other languages
English (en)
Other versions
JP2011097291A (ja
Inventor
智久 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2009248226A priority Critical patent/JP4977189B2/ja
Publication of JP2011097291A publication Critical patent/JP2011097291A/ja
Application granted granted Critical
Publication of JP4977189B2 publication Critical patent/JP4977189B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、例えばスキャナなどによって光学的に読み取られた帳票の画像から帳票の背景、帳票に印刷された文字や図形などの色を表現する画像処理装置および画像処理方法に関する。
例えばスキャナやカメラなどの撮像手段で撮像された画像は、多くの場合、赤、緑、青の三刺激値の組合せで色を表現するRGB表色系で表現されている。
しかしながら、RGB表色系ではいずれの成分も色の心理的な特徴を表しているとは言えないため、色相、彩度、明度の三成分で色を表現するHSV表色系や、色相、輝度、彩度の三成分で色を表現するHLS表色系などが通用している。
色の判別に関する従来の技術としては、例えば特定領域内のカラー画像の画素を色空間上に写像して得られた色空間上の点分布を検出し色の種類を特定する技術が開示されている(例えば特許文献1参照)。
特開平7−44709号公報
しかしながら、手書きされた帳票などの印刷物の紙面上における印刷や記入に用いられたインクの色表現を行う場合、HSV表色系やHLS表色系など既存の表色系では、筆圧や線幅の違い等に起因するインク濃度の変化に伴って彩度と明度、または輝度と彩度のいずれもが変化してしまい、インクの種類を特徴づけることができないという問題があった。
このため、HSV表色系では、例えば赤色のインクによる記入文字と茶色のインクによって印刷された罫線の画素を区別するのは困難である。これは、既存の表色系がインクによる色の変化の特徴ではなく紙面の色とインクの種類と濃度の組合せを特徴づけており、必ずしもインク単体を特徴づけているとは言えないからである。
本発明はこのような課題を解決するためになされたもので、帳票への印刷や記入に用いられたインクによる色の変化を特徴づける成分を分離した形で色の表現を行うことを目的とする。
上記の課題を解決するために、本発明の画像処理装置は、帳票のカラー画像が記憶された記憶部と、前記記憶部から読み出した前記カラー画像から背景色ベクトルを算出する背景色算出部と、前記背景色ベクトルを、指定された画素値を要素とする入力ベクトルまたは前記カラー画像の各画素の画素値を要素とする入力ベクトルから差し引くことで差分色ベクトルを求める差分色ベクトル算出部と、N次元(Nは2以上の整数)の色空間の原点から前記差分色ベクトルの方向に伸ばした線が、前記色空間の任意の位置に配置したN−1次元の色空間と交わる交点の座標を要素とする色ベクトルを導出する色導出部とを具備することを特徴とする。
本発明の画像処理方法は、帳票のカラー画像を記憶部に記憶するステップと、背景色算出部が、前記記憶部から読み出した前記カラー画像から背景色ベクトルを算出するステップと、指定された画素値を要素とする入力ベクトルまたは前記カラー画像の各画素の画素値を要素とする入力ベクトルから差分色ベクトル算出部が前記背景色ベクトルを差し引くことで差分色ベクトルを求めるステップと、N次元(Nは2以上の整数)の色空間の原点から前記差分色ベクトルの方向に伸ばした線が、前記色空間の任意の位置に配置したN−1次元の色空間と交わる交点の座標から前記色ベクトルの色を導出するステップとを具備することを特徴とする。
本発明によれば、帳票への印刷や記入に用いられたインクによる色の変化を特徴づける成分を分離した形で色の表現を行うことができる。
本発明の画像処理装置の第1実施形態の構成を示す図である。 帳票画像の一例を示す図である。 背景色検出部の動作を示すフローチャートである。 帳票画像の画素の色の赤色成分(R成分)G[1]のヒストグラムと中央値を示した模式図である。 帳票画像の各画素の座標および色成分から、各画素の色ベクトルを求めるまでの各数値例を示す図である。 色空間に配置されたN−1次元の色空間(色平面)と変位ベクトル、交点の関係を示す図である。 図4のN−1次元の色空間(色平面)を別の視点(面に垂直な方向)から眺めた様子を示す図である。 色ベクトルの算出動作を示すフローチャートである。 図5の色ベクトルの分布を示す図である。 色空間に配置する面を曲面とした例を示す図である。 画像処理装置の第2実施形態の構成を示す図である。 N−1次元の色空間(色平面)と交点、極座標系および色ベクトルなどの関係を示す図である。 生成される変換画像の例を示す図である。 変換前(元)の帳票画像の例を示す図である。 生成される変換画像の例を示す図である。 画像処理装置の第3実施形態の構成を示す図である。 代表色列挙部による階層的クラスタリング動作を示すフローチャートである。 代表色の抽出結果を示す図である。 画像処理装置の第4実施形態の構成を示すブロック図である。 帳票画像の一例を示す図である。 図20の帳票画像に対して二値化処理を行った二値画像(変換画像)を示す図である。 画像処理装置の第5実施形態の構成を示すブロック図である。 図20に示した帳票画像に対してマスク処理を行ったマスク済み画像(変換画像)を示す図である。 画像処理装置の第6実施形態の構成を示すブロック図である。 図20に示した帳票画像に対して変換処理を行った変換画像を示す図である。
以下、図面を参照して、本発明の実施の形態の画像処理装置を詳細に説明する。
(第1実施形態)
図1は画像処理装置の第1実施形態の構成を示すブロック図である。
図1に示すように、この第1実施形態の画像処理装置は、スキャナ1などの帳票画像読取部と、キーボード2などの入力部とを接続したコンピュータ3と、このコンピュータ3から出力される情報を表示する表示装置4とを有している。
スキャナ1は、モノクロ以外の色つきの帳票を読み取りカラー画像(以下「帳票画像」と称す)をコンピュータ3に入力する。キーボード2は、ユーザにより操作されて任意の画素値をコンピュータ3に入力する。入力部としてはキーボード2以外に、任意の画素値が設定された設定ファイルやメモリ領域、レジスタなどであってもよい。
コンピュータ3は、記憶部30、背景色ベクトル算出部としての背景色検出部31、差分色ベクトル算出部としての変位計算部32、色導出部として色ベクトル算出部33、受付部34などを有している。
受付部34は、キーボード2により任意に指定された画素値(R,G,B)を要素とする入力ベクトルを受け付ける。また、受付部34は、スキャナ1から入力された帳票のカラー画像(以下「帳票画像」と称す)を受け付け、記憶部30に記憶する。
記憶部30はメモリまたはハードディスク装置などによって実現される。記憶部30には、光学的に読み取られた帳票画像が記憶される。記憶部30は画像を構成する各画素の色を示す複数の色成分が記憶された画像記憶部として機能する。
記憶部30には、第2の色空間の座標と色の番号や名前の対応表である座標−色対応テーブルが予め記憶されている。座標−色対応テーブルには、例えば、N次元、例えば3次元などの色空間(RGB座標)上の任意の位置、例えば3つの頂点R(1,0,0)、G(0,1,0)、B(0,0,1)を結んで形成される3角形の2次元平面(これを「色平面」という)上の座標をインデックスとして色の番号が記憶されている。なおこのテーブルは3次元の色空間についても同様に構成でき、この場合、3つの座標の組をインデックスとする。
背景色検出部31は、記憶部30の帳票画像を読み出し、読み出した帳票画像の各画素の色成分(例えば赤色成分、緑色成分、青色成分などの3色など)の各々についてヒストグラムを計算し、計算したヒストグラムからその中央値を算出し、算出した中央値を当該色成分の背景領域における推定値とすることで、背景領域の色成分を含んだ背景色ベクトルを算出する。
すなわち、背景色検出部31は、帳票画像の背景領域から背景色を表す複数(N個)の色成分を用いたベクトルで表現される背景色ベクトルG(R成分,G成分,B成分の3個の色成分を含む)を算出する。
変位計算部32は、記憶部30から読み出した帳票画像の各画素の複数(N個)の色成分を用いた入力ベクトル(画素値R,G,B)、またはキーボード2から受付部34を通じて与えられた任意の画素値の組からなるN次元の入力ベクトルから、背景色ベクトル(背景における画素値R,G,B)を差し引くことで、変位ベクトル(各座標の差分の値:差分色ベクトル)を計算する。
換言すると、変位計算部32は、背景色算出部31により算出された背景色ベクトルを、受付部34により受け付けられた入力ベクトルまたは記憶部30から読み出した帳票画像の各画素から得られる入力ベクトルから差し引くことで、帳票画像の背景の背景色ベクトルと、指定された画素値を要素とする入力ベクトルまたは帳票画像の各画素の画素値を要素とする入力ベクトルとの差分を示す差分色ベクトルを求める。
つまり、変位計算部32は、記憶部30から読み出した帳票画像の各画素の複数(N個)の色成分を用いた入力ベクトル(画素値R,G,B)、またはキーボード2から受付部34を通じて与えられた任意の画素値を要素とする入力ベクトルの、背景色ベクトル(背景画素値R,G,B)に対する変位ベクトルを計算する。
色データ算出部33は、N次元(Nは2以上の整数)の色空間の原点から差分色ベクトルの方向に伸ばした線と、色空間中で任意の位置に配置した色空間よりも一つ少ない次元の空間(例えば平面など)との交点の座標を計算により求め、色ベクトルとして表示装置4へ出力する。この色空間よりも一つ少ない次元の空間をN−1次元の色空間と呼ぶ。N−1次元の色空間としては、N−1次元の空間、平面、曲面などを含め、N−1次元の多様体である限り前述の例に限らずどのようなものでもよい。
色データ算出部33は、求められた色平面上の交点の座標(R,G,Bの値)を、記憶部30の座標−色対応テーブルのデータと照合して、その位置(交点座標)の色を特定(識別)し、色データとして表示装置4へ出力する。交点の座標はN次元の色空間中の予め任意に定めた空間上で定める。以降ではこの予め任意に定めた空間を第2の色空間と呼ぶ。
なお、交点の座標をそのまま使うのではなく、交点の座標の中のいくつかの値を用いたり、組合せたりして色(色ベクトル)を導出してもよい。
この場合、色ベクトル算出部33は、色空間の原点から差分色ベクトルの方向に伸ばした線と色空間中で任意に定めた色平面との交点の座標の複数の座標成分のうち、予め任意に定められたM個の成分の組合せを含む色(色ベクトル)を導出する。
換言すると、色ベクトル算出部33は、原点から差分色ベクトルの方向に伸ばした線が、色空間の任意の位置に配置した色平面と交わる交点の座標から色を表す色ベクトルを導出する。
また、色ベクトル算出部33は、求められた色ベクトル、つまり色平面上の交点座標(R,G,Bの値)をインデックスとして記憶部30の座標−色対応テーブルを参照してデータを照合することで、色ベクトルに対応する色の番号や名前を導出する。つまりその位置の色を特定し、色データとして表示装置4へ出力する。
このような画像処理装置は、実質的にコンピュータ3に画像処理ソフトウェアを組み込むことによって主要部を構成できるため、以下ではコンピュータによる例で説明する。
但し、画像処理装置は、各部を専用ハードウェアや、その集合体、または分散処理用のコンピュータネットワークとしても構成することもでき、上述した各要素を備える構成ならば、ここで挙げた構成に関わらずどのようなもので実装しても良い。
本実施形態において、帳票画像はRGB表色系で表現されているものとする。したがって、本実施形態においては、次元数を示す値Nは3であり、帳票画像の画素の第1の色成分は赤色成分(R成分)、第2の色成分は緑色成分(G成分)、第3の色成分は青色成分(B成分)であるものとする。3次元空間中で色成分を図示する場合、例えばR軸が横方向、G軸が縦方向、B軸が奥行き方向を示すものとする。
但し、帳票画像の表現形式は、RGB表色系に限定されるものではなく、例えばXYZ表色系、CMY表色系などで表してもよく、ここで挙げた表色系以外のどのような表色系を用いてもよい。
以下、この第1実施形態の画像処理装置の動作を説明する。この画像処理装置の場合、帳票画像は、例えば申込書などであり、その一部として、図2に示すように、ベージュ色の背景51に黒色の罫線52や「認印」などのプレプリント文字55が印刷されており、捺印欄53に赤色の印鑑54が押印されたカラー画像であるものとする。
この帳票がスキャナ1により読み取られると、帳票画像がスキャナ1からコンピュータ3へ出力されて、コンピュータ3内で受付部34により指定された記憶部30に記憶される。
記憶部30に帳票画像が記憶されるときには、帳票画像として、画像の端部(例えば左下角など)を原点とし画像を構成する各画素の位置座標と各画素の色を示す複数の色成分(赤色成分R,緑色成分G,青色成分Bの値)を含むデータが記憶される。
続いて、背景色検出部31は、記憶部30に記憶された帳票画像を読み出して、帳票画像から背景領域の色(背景色)を検出する。
ここで、図3のフローチャートを参照して背景色検出部31による背景色の検出動作を詳細に説明する。なお説明では帳票画像の色成分の値の上限をImaxとする。
背景色検出部31は、図3に示すように、まず、帳票画像の横幅wと帳票画像の高さhをかけ算することで帳票画像を構成する画素数aを算出する(ステップS101)。
次に、背景色検出部31は、画素数aを1/2倍することで閾値bを算出する(ステップS102)。
背景色検出部31は、変数iに1を設定し(ステップS103)、変数iを1〜Nまで変えながら以下の処理を繰り返す(ステップS104〜ステップS112)。
(a)帳票画像の画素の色の第i成分のヒストグラムHiを算出する。
(b)算出したヒストグラムHiから以下の手順で第i成分の中央値G[i]を算出する。
但し、hmaxをヒストグラムの階級数、Hi[h]をヒストグラムの第h番目の階級の頻度とする。
(ア)s=0とし、G[i]=hmaxとする(ステップS104)。
(イ)変数hに1を設定し(ステップS105)、変数hを1からhmaxまで変えながら以下の処理を繰り返す(ステップS106〜ステップS109)。
[1]s=s+Hi[h]とする(ステップS107)。
[2]s>=bならば(ステップS108の真)、繰り返し処理を終了し、ステップS110へ処理を進める。
(ウ)G[i]=hとする(ステップS110)。
(c)(赤色成分R,緑色成分G,青色成分Bの値を含む)背景色ベクトルGの第i成分にG[i]を代入する。
この例の帳票画像や文書画像においては、紙面の大部分が背景領域であるため、このように帳票画像の画素の色の第i成分の中央値を計算することで、背景色の第i成分を求めることができる。
図4は帳票画像の画素の色の第1成分である赤色成分Rのヒストグラムと中央値を示す模式図である。図5に帳票画像の画素毎の画素値の例と、背景色検出部31で算出される背景色ベクトル(背景画素値)(G[1]、G[2]、G[3])の例を示す。
続いて、変位計算部32は、キー入力された任意の画素値Xから、背景色検出部31で算出された背景色ベクトルGを差し引くことで、与えられた任意の画素値Xの、背景色ベクトルGに対する変位ベクトルFを計算する。
画素値Xは、N次元のベクトルとして表現される。この例は3次元であるため、画素値Xは、R軸の座標、G軸の座標、B軸の座標という3つの値で与えられる。
変位ベクトルFは変数i=1..Nについて、変位ベクトルFの第i成分F[i]を、背景色ベクトルGの第i成分G[i]と任意の画素値Xの第i成分X[i]とから、式F[i]=G[i]−X[i]で算出する。
画素値Xを各画素の画素値とした場合に、変位計算部32で計算された変位ベクトル(F[1],F[2],F[3])の例を図5に示す。
色ベクトル算出部33は、図6に示すように、3次元の色空間の原点0(0,0,0)から差分色ベクトルの方向に伸ばした線と、色空間中で任意に定めた色平面との交点の座標を求め、その交点の座標の中から、予め任意に定められたM個の成分K[1]、…、K[M]の組合せを含むベクトルで表される色ベクトルKを算出する。
交点の座標は3次元の色空間中の予め任意に定めた空間上で定める。この予め任意に定めた空間を第2の色空間と呼ぶ。
この例では、N−1次元の色空間の例として、F=(1、0、0)の点、F=(0、1、0)の点、F=(0、0、1)の点の3点を通る2次元平面を用いる。また、この例では、第2の色空間は、N−1次元色空間と同一の空間とする。従って、M=2であり、第2の色空間上での座標成分は2個の実数値K[1]、K[2]で表される。
K[1]とK[2]は色平面上での座標を表し、色平面上の座標系としては、F[1]=F[2]=F[3]となる点でK[1]=0、K[2]=0で、F=(1、0、0)の点においてK[1]=Kmax/2、K[2]=0となる正規直交座標系を用いる。
図7に変位ベクトル、交点、2次元平面上の座標系の関係を示す。図7は図6に示した色平面を別の視点から眺めた様子を示す図となっており、3次元の色空間の原点を通る紙面に垂直な軸上でF[1]=F[2]=F[3]となっている。
ここで、図8のフローチャートを参照して色ベクトル算出部33による色ベクトルKの算出動作を説明する。但しK[j]は色ベクトルKの第j成分、Fthは予め定めた任意の正定数、sqrt(x)は引数xの平方根を表す。
まず、色ベクトル算出部33は、Fsum=F[1]+F[2]+F[3]とする(ステップS201)。
続いて、色ベクトル算出部33は、FsumとFthを比較し(ステップS202)、Fsum<=Fthならば(ステップS202の真)、K[1]=0、K[2]=0とする(ステップS203)。
また、Fsum>Fthならば(ステップS202の偽)、K[1]=(F[3]−(F[1]+F[2])/2)×Kmax/Fsum
K[2]=(F[1]−F[2])×Kmax×sqrt(3)/(Fsum×2)
とする(ステップS204)。
ステップS202の判定処理において、Fsum<=Fthの場合と、Fsum>Fthの場合とで処理を変えているのは、Fsum=0の場合の0除算を防止するためである。
任意の画素値Xを各画素の画素値とした場合に変位計算部で計算される色ベクトル(K[1],K[2])の値を図5に示す。また図9に図5に示した色ベクトルの分布を示す。
図9(図5)では、黒インクと背景が原点に分布し、青インクが点(−123.6,13.2)近傍に分布し、赤インクが点(61.9,−107.2)近傍に分布している。
なお、上記K[1]、K[2]の他に、インクの濃度を表すK[3]を求めるステップを以下のように追加してもよい。K[3]=F[1]+F[2]+F[3]
また、第2の色空間はN−1次元多様体を含むN=3の3次元の色空間とし、この色空間上での座標をK[1]、K[2]、K[3]としてもよい。この場合、3次元の色空間は、例えばK[1]=F[1]、K[2]=F[2]、K[3]=F[3]となる色空間として定めればよい。
また、図10に示すように、N次元空間に設けるN−1次元の色空間を、曲面としてもよい。この場合はK[1]とK[2]を球体における曲面上の緯度と経度とする。つまり曲面は色空間の原点から等距離にある面の一部である。この他、色空間としては、以上で述べたものに限らず、N次元の色空間に設ける次元数がN−1以下の色空間ならば、湾曲面など、どのような形態のものを用いてもよい。換言するならば、色空間としてはN−1次元の多様体である限りいかなるものを用いてもよい。
また、入力される帳票画像の色成分としては、3つの色成分に限ることなく、例えば赤色成分Rと緑色成分Gの画像など、2つの色成分の画像を用いてもよく、N>3のマルチスペクトル画像を用いてもよい。従って、色空間は、平面や曲面に限らず、1次元の直線や曲線にも3次元以上の空間(多様体)にもなり得る。
このようにこの第1実施形態の画像処理装置によれば、帳票画像から背景色を検出し、キー入力された色ベクトルまたは帳票画像の画素の色成分を用いた色ベクトルから引き算して得られた変位ベクトルを3次元の色空間のから差分色ベクトルの方向に伸ばした線が色空間に配置した2次元の色平面と交差した交点の座標を求め、その座標からキー入力された色ベクトルまたは帳票画像の画素の色成分を用いた色ベクトルの色を導出するので、帳票への印刷や記入に用いられたインクによる色の変化を特徴づける成分を分離した形で色を表現することができる。
(第2実施形態)
次に、図11乃至図16を参照して第2実施形態について説明する。
図11は画像処理装置の第2実施形態の構成を示すブロック図である。なおこの第2実施形態において第1実施形態と同一の構成には同一の符号を付しその説明は省略する。
図11に示すように、この第2実施形態の画像処理装置は、受付部34および記憶部30の他、記憶部30から読み出した帳票画像から背景色の複数(N個)の色成分を用いた背景色ベクトルを算出する背景色検出部31と、記憶部30から読み出した帳票画像の各画素の色成分を用いた画素毎の色ベクトルと背景色ベクトルとの差を算出し、各画素の画素値を要素とする入力ベクトルの、背景色ベクトルに対する変位ベクトル(差分色ベクトル)を計算する変位計算部32と、計算した変位ベクトルを色空間のから差分色ベクトルの方向に伸ばした線と色空間中で任意に定めた2次元平面との交点の座標を算出する色ベクトル算出部33と、色ベクトル算出部33により算出された交点の座標を用いて変換画像を生成する画像生成部35とを有している。
変位計算部32は、帳票画像の各画素について画素の画素値の背景画素値に対する変位ベクトルFを計算する。変位計算部32は、与えられた任意の画素値ではなく、当該画素の複数の色成分の値からなるベクトルをベクトルXとする点を除いては第1実施形態の変位計算部32の機能と同等である。
変位計算部32は、3次元の色空間のから差分色ベクトルの方向に伸ばした線と色空間内で任意に定めた2次元平面との交点の座標を算出し、その交点の座標の中から、予め任意に定められたM個の成分K[1]、…、K[M]の組合せを含む色ベクトルを計算する。
画像生成部35は、各画素について計算した色ベクトルの要素を画素値とした変換画像を生成する。
この第2実施形態では、図12に示すように、第1実施形態と同様に、F=(1、0、0)の点、F=(0、1、0)の点、F=(0、0、1)の点の3点を通る2次元平面を用いる。
2次元平面上の座標系としては、平面上でF[1]=F[2]=F[3]となる点を原点とし、F=(1、0、0)の点において角度0となる極座標系を用いる。第2の色空間は平面として定義される。
そして、M=1とし、K[1]を交点の極座標系原点からの距離とする。図12では、図7と同様に、原点を通る紙面に垂直な軸上でF[1]=F[2]=F[3]となっている。
このように色ベクトルの要素を画素値とすることで、インクの色に特徴的な画素値で塗り分けられた画像を生成できる。この画像を「変換画像」という。
図13乃至図15に本実施形態の画像生成部35で生成される変換画像を示す。
図2に示した帳票画像には、黒色インクで印刷された罫線52やプレプリント文字55と赤色の印影54の押印がみられるが、図13では、罫線52やプレプリント文字55などの黒色の画素が除外され、ベージュ色の背景51に、赤色の印影54のみがみられる変換画像を生成できる。
これはF[1]=F[2]=F[3]となる極座標系原点からの距離(ここではK[1」)が、F[1]、F[2]、F[3]のばらつき、すなわち色の鮮やかさの程度を示しているため、黒インクではほぼ0に留まり、より色の鮮やかな赤インクでは距離が0でない値となるからである。
例えば色の鮮やかさに関する座標成分をK[1]とすることで、K[1]の画像では、色がついていない黒色や灰色の画素が消え、色のついた例えば赤色や青色などの画素を際立たせる効果がある。
例えば図14に示すように、黒色の罫線と青色ボールペンで、例えば“¥1000”などと手書き(記入)されている帳票の場合、図15に示すように、青色ボールペンで記入された“¥1000”のみが見られる変換画像を生成することができる。
これはF[1]=F[2]=F[3]となる極座標系原点からの距離(ここではK[1」)が、F[1]、F[2]、F[3]のばらつき、すなわち色の鮮やかさの程度を示しているため、黒インクではほぼ0に留まり、より色の鮮やかな青インクでは距離が0でない値となるからである。
また、M=2としてK[1]を交点の極座標系原点からの距離、K[2]を極座標の角度成分とすることで、インクの色の鮮やかさに加えてインクの色相の違いの数値的な表現を算出することができる。
(第3実施形態)
次に、図16乃至図18を参照して第3実施形態について説明する。図16は画像処理装置の第3実施形態の構成を示すブロック図である。なおこの第3実施形態において第1実施形態と同一の構成には同一の符号を付しその説明は省略する。
この第3実施形態の画像処理装置は、受付部34および記憶部30の他、記憶部30から読み出した帳票画像から背景色の複数(N個)の色成分を含む背景色ベクトルを算出する背景色検出部31と、記憶部30から読み出した帳票画像の各画素の色成分を要素とする入力ベクトルの、背景色ベクトルに対する変位ベクトル(差分色ベクトル)を計算する変位計算部32と、3次元の色空間の原点から変位ベクトルの方向に伸ばした線が、色空間中で任意に定めた2次元平面と交わる交点の座標を算出し、その交点の座標成分のうち予め任意に定められたM個の成分の組合せを含む色ベクトルを算出する色ベクトル算出部33と、色ベクトル算出部33で画素毎に求められた色ベクトルを代表する代表色を0個以上列挙する代表色列挙部36とを有している。
背景色検出部31と変位計算部32は第2実施形態における同名の構成要素と同一でありその説明は省略する。また色ベクトル算出部33は第1実施形態における同名の構成要素と同一でありその説明は省略する。
代表色列挙部36は、色ベクトル算出部33により画素毎に求められた複数個の色ベクトルを代表する代表色をΛ≧0個列挙する。
具体的には、代表色列挙部36は、階層的クラスタリングにより複数個の色ベクトル(a個)をΛ個のクラスタ(集合)にクラスタリングした後、各クラスタに属する色ベクトルの平均を算出することで代表色を列挙する。
また、代表色列挙部36は、各代表色について、代表色で代表される色ベクトルの分布の拡がりを表すL個の拡がりパラメータを算出する。
ここで、図17のフローチャートを参照して代表色列挙部36による階層的クラスタリングについて説明する。図17は階層的クラスタリング動作を示すフローチャートである。
なお、クラスタおよび対応する代表色の番号をλ、第λ番目のクラスタをC[λ]、第λ番目の代表色をμ[λ]、第λ番目のクラスタに属する色ベクトルの共分散行列をΣ[λ]、帳票画像上での画素の座標を(x、y)、λ=x+w×yとする。
この場合、代表色列挙部36は、Λにaをセットし(図17のステップS301)、λ=1...Λについて、C[λ]を第λ番目の画素について算出した色ベクトル1つのみを含むクラスタに初期化する(ステップS302)。
そして、代表色列挙部36は、ステップS303〜S308の処理を繰り返す。
λ=1、...、Λについて、C[λ]に属する色ベクトルの平均ベクトルを算出し、μ[λ]に代入する(ステップS303)。
λ=1、...、Λについて、C[λ]に属する色ベクトルの共分散行列を算出し、Σ[λ]に代入する(ステップS304)。
次に、λ=1とし(ステップS305)、λ=1、...、Λについて、ステップS306〜S308の処理を繰り返す。
代表色列挙部36は、ξ=λ+1、...、Λについて、μ[λ]とμ[ξ]のユークリッドD(λ、μ)を算出し、ユークリッド距離D(λ、μ)が最小となるξをξoptに代入する(ステップS307)。
代表色列挙部36は、D(λ、μ)と予め定めた任意の閾値Dthとを比較し(ステップS308)、D(λ、μ)が予め定めた任意の閾値Dth以下ならば(ステップS308の真)、C[λ]とC[μ]を統合してクラスの番号λを振りなおした後(ステップS309)、ステップS303の処理に戻る。
また、D(λ、μ)が予め定めた任意の閾値Dthを超えている場合(ステップS308の偽)、代表色列挙部36は、λ=λ+1として(ステップS310)、ステップS306の処理へ戻る。
λが1を超えた場合(ステップS306の真)、代表色列挙部36は、λ=1、...、Λについて、クラスタC[λ]に属する色ベクトルの個数と、予め定めた任意の閾値nとを比較し(ステップS311)、クラスタC[λ]に属する色ベクトルの個数が、予め定めた任意の閾値n以下ならば(ステップS311の真)、当該クラスタを削除する(ステップS312)。
さらに、代表色列挙部36は、λ=1、...、Λについて、C[λ]に属する色ベクトルの平均ベクトルを算出し、μ[λ]に代入する(ステップS313)。以上の処理により、Λ≧0個の代表色が算出される。
代表色列挙部36は、代表色で代表される色ベクトルの分布の拡がりを表すL個の拡がりパラメータとして、共分散行列Σ[λ]を算出する。共分散行列Σ[λ]は、M次元の色ベクトルの分布の拡がりを表し、M次の実対象行列となるため、M×(M+1)/2個の実数で表される。よって、本実施形態においては拡がりパラメータとしてM×(M+1)/2個の実数を算出する。従って、K=M×(M+1)/2である。
なお、上記動作例では、代表色で代表される色ベクトルの分布の拡がりを表すL個の拡がりパラメータを、ステップS304で算出することとしたが、このステップは省略してもよい。
図18は代表色の抽出結果を示す図である。同図に示すように、この例では、青色の罫線の様式に黒色で記入し、赤色の印鑑を押した帳票のスキャン画像を処理した結果を示しており、黒色インクに対応する第1クラスタ61、赤色インクに対応する第2クラスタ62、青色インクに対応する第3クラスタ63とこれらのクラスタに対応する代表色64、65、66が検出されている。
(第4実施形態)
次に、図19乃至図21を参照して第4実施形態について説明する。図19は画像処理装置の第4実施形態の構成を示すブロック図である。なおこの第4実施形態において第3実施形態と同一の構成には同一の符号を付しその説明は省略する。
この第4実施形態の画像処理装置は、受付部34および記憶部30の他、記憶部30から読み出した帳票画像から背景色の複数(N個)の色成分を含む背景画素値を算出する背景色検出部31と、記憶部30から読み出した帳票画像の各画素の色成分を要素とする入力ベクトルの、背景色ベクトルに対する変位を計算する変位計算部32と、3次元の色空間の原点から変位ベクトルの方向に伸ばした線が、色空間中で任意に定めた2次元平面(N−1次元の色空間)と交わる交点の座標を算出し、その交点の座標成分のうち予め任意に定められたM個の成分の組合せを含む色ベクトルを生成する色ベクトル算出部33と、この色ベクトル算出部33で画素毎に求めた色ベクトルを代表する代表色を0個以上列挙する代表色列挙部36と、代表色から1つ以上の選択色を選択する代表色選択部37と、画素毎に色ベクトル算出部33により計算された色ベクトルが代表色選択部37により選択された選択色のいずれかと類似しているか否かを判定する類似性判定部38と、この類似性判定部38で類似しているものと判定された画素と類似していないものと判定された画素とを塗り分けた二値画像を生成する二値画像生成部39とを有している。
背景色検出部31、変位計算部32、色ベクトル算出部33および代表色列挙部36は第3実施形態と同じ機能を有している。
代表色選択部37は、帳票画像の各画素の代表色から1個以上の選択色を選択する。具体的には、代表色選択部37は、代表色のうちの、予め任意に定めたM次元のベクトルYとのユークリッド距離が予め定めた任意の正定数r以上のもの全てを選択色として選択する。
このように選択色を代表色から選択することにより、例えば特定色で印刷されたプレプリント文字や罫線以外の記入や印字等に対応する代表色を選択することができる。
類似性判定部38は、色ベクトルKと各選択色とのユークリッド距離を算出し、いずれかの選択色について算出したユークリッド距離が予め定めた任意の定数r2以下ならば類似していると判定し、全ての選択色についてユークリッド距離がr2を超えている場合は類似していないと判定する。
類似性判定部38は、画素毎に色ベクトル算出部33で計算された色ベクトルKが代表色選択部37で選択された選択色のいずれかと類似しているか否かを判定する。
すなわち、類似性判定部38は、色ベクトル算出部33により計算された各画素の色と、代表色選択部37により選択された選択色との類似/非類似を判定する。
二値画像生成部39は、類似性判定部38により類似しているものと判定された画素と類似していないものと判定された画素とを塗り分けた二値画像を生成する。
この例では、二値画像を白画素が「0」、黒画素が「1」で表現されるビットマップ画像とし、類似性判定部38で類似しているものと判定された画素については二値画像上での画素値を「1」、類似していないものと判定された画素については二値画像上での画素値を「0」とする。
図20にこの実施形態の画像処理装置により処理前の帳票画像の一例を示し、図21に生成された変換画像の一例を示す。図20の帳票画像上には、緑色インクで印刷された罫線52や同色のプレプリント文字(金額など)55と黒色ボールペンにより記入された“¥1000”という手書き文字56、赤色の印影54が見られる。
この例では、ベクトルYが緑色のインクを表すように定められており、緑色の該当画素は白色、黒色と赤色の該当画素が黒画素に付色、つまり白色と黒色で塗り分けられるため、図21の変換画像上には、手書き文字56と赤色の印影54のみが黒色で表現される。なお背景色はデフォルトで白色として付色される。
(第5実施形態)
次に、図22、図23を参照して第5実施形態について説明する。図22は画像処理装置の第5実施形態の構成を示すブロック図である。なおこの第5実施形態において第4実施形態と同一の構成には同一の符号を付しその説明は省略する。
この第5実施形態の画像処理装置は、受付部34および記憶部30の他、記憶部30から読み出した帳票画像から背景色の複数(N個)の色成分を用いた背景色ベクトルを算出する背景色検出部31と、記憶部30から読み出した画像の各画素の色成分を要素とする入力ベクトルの、背景画素値に対する変位ベクトルを計算する変位計算部32と、3次元の色空間の原点から変位ベクトルの方向に延ばした線が、色空間中で任意に定めた2次元平面(N−1次元空間)と交わる交点の座標を算出し、その交点の座標成分のうち予め任意に定められたM個の成分の組合せを含む色ベクトルを生成する色ベクトル算出部33と、この色ベクトル算出部33により画素毎に求められた色ベクトルを代表する代表色を0個以上列挙する代表色列挙部36と、代表色から1個以上の選択色を選択する代表色選択部37と、画素毎に色ベクトル算出部33により計算された色ベクトルが代表色選択部37により選択された選択色のいずれかと類似しているか否かを判定する類似性判定部38と、この類似性判定部により類似しているものと判定された画素の画素値を帳票画像の当該画素の画素値そのままとし、類似していないものと判定された画素の色成分の値(画素値)を背景色ベクトルの成分で置き換えたマスク済み画像を生成する画像マスク部40とを有している。
この第5実施形態の背景色検出部31、変位計算部32、色ベクトル算出部33および代表色列挙部36などは、第3実施形態における同名の構成要素と同一でありその説明は省略する。また代表色選択部37と類似性判定部38は第4実施形態における同名の構成要素と同一でありその説明は省略する。
画像マスク部40は、類似性判定部38により類似しているものと判定された画素の画素値を帳票画像の当該画素の画素値とし、類似していないものと判定された画素の画素値を背景色ベクトルの成分としたマスク済み画像を生成する。
このようにこの第5実施形態によれば、帳票画像において類似性判定部38で類似していないものと判定された画素を背景色で塗りつぶしたマスク済み画像を生成する画像マスク部40を設けることで、不要な色(例えば元の帳票画像のプレプリントされた罫線52など)を消し込んだマスク済み画像を生成することで、帳票画像上の罫線を消したり、印形だけを抽出したりすることができる。
図20に示した帳票画像の各画素に対して処理を行ったマスク済み画像(変換画像)を図23に示す。
図20の帳票画像上には、緑色インクで印刷された罫線52やプレプリント文字55と黒色ボールペンによる記入、赤色の印影54が見られるが、この例では、ベクトルYが緑のインクを表すように定められており、図23の変換画像上には、黒色ボールペンにより記入された“¥1000”という手書き文字56、赤色の印影54のみが付色される。
(第6実施形態)
次に、図24、図25を参照して第6実施形態について説明する。図24は画像処理装置の第6実施形態の構成を示すブロック図である。なおこの第6実施形態において、第5実施形態と同じ構成について同じ符号を付しその説明は省略する。
すなわち、この第6実施形態の画像処理装置は、図24に示すように、第5実施形態の画像マスク部40に替えて、変換画像生成部41を設けたものである。
変換画像生成部41は、類似性判定部38により類似しているものと判定された画素について、色ベクトル算出部33により算出された色ベクトルを予め定めた任意の関数に入力することで画素値を算出する。また変換画像生成部41は、類似性判定部38により、類似していないとものと判定された画素の画素値を、予め定めた任意の画素値に置換した変換画像を生成する。
具体的には、変換画像生成部41は、類似性判定部38で類似しているものと判定された画素について色ベクトルKから予め定めた任意の関数Γ(K)でスカラーあるいはベクトルで表される画素値γ=Γ(K)を算出する一方、類似していないものと判定された画素の画素値を、予め定めた任意の画素値(のベクトル)γ0に置換した変換画像を生成する。
この第6実施形態では、色ベクトルKとして、第1実施形態と同様に2次元の正規直交座標系を用いる。そして、関数Γ(K)を下記(式1)で定義する。
Γ(K)=(K・K0)/||K0|| …(式1)
但し、K0は予め定めたM次元の任意のベクトル、||X||はベクトルXのノルム、
||α・β||はαとβの内積を表す。
このように関数Γ(K)を定義することにより、関数Γ(K)はベクトルK0で定まる色とより類似したインクによる印字または記入上の画素で大きくなる。
図20に示した処理前の帳票画像に対して、変換処理を施して生成した変換画像の一例を図25に示す。
図20の帳票画像上には、緑色インクで印刷された罫線52やプレプリント文字55と黒色ボールペンにより記入された“¥1000”という手書き文字56、赤色の印影54が見られるが、この変換例では、ベクトルK0が赤色のインクを表すように定められており、図25に示すように、赤色以外の色は消滅し、変換画像には赤色の印影54のみが見られる。
このようにこの第6実施形態によれば、類似性判定部38で類似しているものと判定された画素について色ベクトルKから予め定めた任意の関数Γ(K)でスカラーあるいはベクトルで表される画素値γ=Γ(K)を算出する一方、類似していないものと判定された画素の画素値を予め定めた任意の画素値(のベクトル)γ0とした変換画像を生成することで、例えば赤色の印影54のみを残した画像を生成でき、予め保管されている印影と照合するためのデータとして利用することができる。
なお、本願発明は、上記実施形態のみに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形してもよい。例えば各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現してもよい。
また上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。
電子媒体としては、例えばCD−ROM等の記録媒体やフラッシュメモリ、リムーバブルメディア:Removable media等が含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
1…スキャナ、2…キーボード、3…コンピュータ、4…表示装置、30…記憶部、31…背景色検出部、32…変位計算部、33…色ベクトル算出部、34…受付部、35…画像生成部、36…代表色列挙部、37…代表色選択部、38…類似性判定部、39…二値画像生成部、40…画像マスク部、41…変換画像生成部。

Claims (10)

  1. 帳票のカラー画像が記憶された記憶部と、
    前記記憶部から読み出した前記カラー画像から背景色ベクトルを算出する背景色算出部と、
    前記背景色ベクトルを、指定された画素値を要素とする入力ベクトルまたは前記カラー画像の各画素の画素値を要素とする入力ベクトルから差し引くことで差分色ベクトルを求める差分色ベクトル算出部と、
    N次元(Nは2以上の整数)の色空間の原点から前記差分色ベクトルの方向に伸ばした線が、前記色空間の任意の位置に配置したN−1次元の色空間と交わる交点の座標を要素とする色ベクトルを導出する色導出部と
    を具備することを特徴とする画像処理装置。
  2. 前記色算出部により求められた前記色ベクトルの色を代表する代表色を列挙する代表色列挙部を具備することを特徴とする請求項1記載の画像処理装置。
  3. 前記代表色列挙部は、
    前記列挙された代表色毎に、代表色で代表される色ベクトルの分布の拡がりを表す拡がりパラメータを算出することを特徴とした請求項2記載の画像処理装置。
  4. 前記代表色列挙部により列挙された前記代表色から選択色を選択する代表色選択部と、
    前記色導出部により計算された各画素の色と、前記代表色選択部により選択された選択色との類似/非類似を判定する類似性判定部と、
    前記類似性判定部により色が類似している画素と非類似の画素とを塗り分けた二値画像を生成する二値画像生成部と
    を具備することを特徴とした請求項2または請求項3記載の画像処理装置。
  5. 前記類似性判定部により色が類似していると判定された画素の色ベクトルを、前記カラー画像の当該画素の画素値そのままとし、色が類似していないと判定された画素の画素値を前記背景色ベクトルの成分で置き換えたマスク済み画像を生成する画像マスク部を具備することを特徴とした請求項2乃至4いずれか1記載の画像処理装置。
  6. 前記類似性判定部により色が類似していると判定された画素の画素値を、前記画素の画素値を予め定めた任意の関数に入力して算出した画素値とし、色が類似していないと判定された画素の色ベクトルを、予め定めた任意の画素値とした変換画像を生成する変換画像生成部を具備することを特徴とした請求項2乃至4いずれか1記載の画像処理装置。
  7. 予め色空間の座標と色とを対応させたテーブルを有し、
    前記色導出部は、
    算出した前記座標を基に前記テーブルから前記色ベクトルに対応する色の番号や名前を導出することを特徴とする請求項1記載の画像処理装置。
  8. 前記色導出部は、
    前記交点の座標を示す複数の座標成分から予め任意に定められたいくつかの成分を組合せることで前記色ベクトルを導出することを特徴とする請求項1記載の画像処理装置。
  9. 前記色導出部は、
    前記帳票のカラー画像のヒストグラムの中央値を背景色の画素値として算出することを特徴とする請求項1記載の画像処理装置。
  10. 帳票のカラー画像を記憶部に記憶するステップと、
    背景色算出部が、前記記憶部から読み出したカラー画像から背景色ベクトルを算出するステップと、
    指定された画素値を要素とする入力ベクトルまたは前記カラー画像の各画素の画素値を要素とする入力ベクトルから差分色ベクトル算出部が前記背景色ベクトルを差し引くことで差分色ベクトルを求めるステップと、
    N次元(Nは2以上の整数)の色空間の原点から前記差分色ベクトルの方向に伸ばした線が、前記色空間の任意の位置に配置したN−1次元の色空間と交わる交点の座標から前記色ベクトルの色を導出するステップと
    を具備することを特徴とする画像処理方法。
JP2009248226A 2009-10-28 2009-10-28 画像処理装置および画像処理方法 Active JP4977189B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009248226A JP4977189B2 (ja) 2009-10-28 2009-10-28 画像処理装置および画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009248226A JP4977189B2 (ja) 2009-10-28 2009-10-28 画像処理装置および画像処理方法

Publications (2)

Publication Number Publication Date
JP2011097291A JP2011097291A (ja) 2011-05-12
JP4977189B2 true JP4977189B2 (ja) 2012-07-18

Family

ID=44113751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009248226A Active JP4977189B2 (ja) 2009-10-28 2009-10-28 画像処理装置および画像処理方法

Country Status (1)

Country Link
JP (1) JP4977189B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07110965A (ja) * 1993-10-13 1995-04-25 Nikon Corp 光ディスクの製造方法
JP3501907B2 (ja) * 1996-09-27 2004-03-02 グローリー工業株式会社 色識別装置

Also Published As

Publication number Publication date
JP2011097291A (ja) 2011-05-12

Similar Documents

Publication Publication Date Title
JP4374331B2 (ja) 画像生成装置、プログラム及び記録媒体
JP4443576B2 (ja) パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
US10477063B2 (en) Character detection and binarization
CN102693425A (zh) 图像处理设备和图像处理方法
US8582879B2 (en) Image processing device and image processing method that convert color image into monochrome image
KR101000421B1 (ko) 드롭 아웃 컬러 처리방법 및 그 장치
JP2002142128A (ja) 画像処理装置及び記録媒体
CN115812221A (zh) 图像生成及着色方法及装置
JP6387026B2 (ja) 書籍探索装置、方法及びプログラム
CN101677351A (zh) 图像处理装置、图像形成装置和图像处理方法
US20090244570A1 (en) Face image-output control device, method of controlling output of face image, program for controlling output of face image, and printing device
JP4977189B2 (ja) 画像処理装置および画像処理方法
JP4453979B2 (ja) 画像再生装置、画像再生方法、プログラム及び記録媒体
JP2006135664A (ja) 画像処理装置及びプログラム
US8320027B2 (en) Image processing apparatus, data processing method executed by image processing apparatus, and computer-readable storage medium storing program for causing computer to execute data processing method
US9191536B2 (en) Processing apparatus
JP2013106173A (ja) 画像処理装置
JP6387028B2 (ja) 探索書籍表示装置、方法及びプログラム
US7995869B2 (en) Information processing apparatus, information processing method, and information storing medium
Marcu et al. Three-dimensional histogram visualization in different color spaces and applications
CN110674336A (zh) 一种识别、检索影像文件的系统
JP2008042346A (ja) 画像処理方法、画像処理装置
US9411543B2 (en) Image processing apparatus
KR102461350B1 (ko) 디지털기를 이용한 판화식 인쇄 방법 및 이를 수행하는 인쇄 시스템
JP4952507B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120321

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120413

R150 Certificate of patent or registration of utility model

Ref document number: 4977189

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150420

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350