JP5505187B2 - 画像処理装置およびプログラム - Google Patents

画像処理装置およびプログラム Download PDF

Info

Publication number
JP5505187B2
JP5505187B2 JP2010180491A JP2010180491A JP5505187B2 JP 5505187 B2 JP5505187 B2 JP 5505187B2 JP 2010180491 A JP2010180491 A JP 2010180491A JP 2010180491 A JP2010180491 A JP 2010180491A JP 5505187 B2 JP5505187 B2 JP 5505187B2
Authority
JP
Japan
Prior art keywords
broken line
string
strings
extracted
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010180491A
Other languages
English (en)
Other versions
JP2012038261A (ja
Inventor
伸一 矢田
正和 福永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2010180491A priority Critical patent/JP5505187B2/ja
Publication of JP2012038261A publication Critical patent/JP2012038261A/ja
Application granted granted Critical
Publication of JP5505187B2 publication Critical patent/JP5505187B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像処理装置およびプログラムに関する。
特許文献1には、網点からなる網掛けがなされた領域が帳票に含まれる場合、この領域と他の領域との境界線を帳票の罫線として抽出する技術が開示されている。網点とは、或る間隔で配置された或る大きさの点画像の集合である。特許文献2には、表の罫線が途切れている為にこれが罫線として認識されなかった場合であっても、その位置が他の罫線に続く位置であり、かつその途切れの長さが閾値よりも小さい場合には、これを罫線として認識する技術が開示されている。特許文献3には、画像データから判別された罫線の近傍の黒画素密度が所定値以上であればこの罫線を無効化罫線とし、無効化罫線の数が所定値以上の場合には、これらをつぶれ画像であると判別する技術が開示されている。
特開2007−34972号公報 特開平6−150056号公報 特開2008−117418号公報
本発明の目的は、破線と網点領域とを含む画像から破線を抽出する処理の精度を向上させる事にある。
上述した課題を解決するため、本発明の請求項1に係る画像処理装置は、異なる2つの色の画素で表される画像から、互いに隣り合う同色の画素からなりその形状に関して予め定められた条件を満たす画素群を、それぞれ、破線を構成する要素の候補として抽出する要素抽出部と、候補として抽出された前記要素群から、複数の要素が直線状に並べられた要素列を抽出する要素列抽出部と、抽出された前記要素列のうち、隣接する要素列間の距離が閾値以下である複数の要素列同士をグループ化するグループ化部と、グループ化された複数の前記要素列のそれぞれについて、当該要素列の特徴量を算出する特徴量算出部と、1つのグループに含まれる複数の前記要素列のうち、当該グループに含まれる他の要素列との前記特徴量の相関度が閾値よりも低い要素列を、破線として抽出する破線抽出部とを備えることを特徴とする
本発明の請求項2に係る画像処理装置は、請求項1に記載の画像処理装置において、前記特徴量算出部は、各々の前記要素列同士の位置関係に関する前記特徴量を算出することを特徴とする。
本発明の請求項3に係る画像処理装置は、請求項2に記載の画像処理装置において、前記位置関係は、前記要素列間の距離または間隔であることを特徴とする。
本発明の請求項4に係る画像処理装置は、請求項1に記載の画像処理装置において、前記特徴量算出部は、各々の前記要素列の属性に関する前記特徴量を算出することを特徴とする。
本発明の請求項5に係る画像処理装置は、請求項4に記載の画像処理装置において、前記属性は、前記要素列の長さ、当該要素列に含まれる要素の数、当該要素列に含まれる要素の大きさ、または当該要素列に含まれる要素間の距離のうち少なくともいずれか一つであることを特徴とする。
本発明の請求項6に係るプログラムは、コンピュータを、異なる2つの色の画素で表される画像から、互いに隣り合う同色の画素からなりその形状に関して予め定められた条件を満たす画素群を、それぞれ、破線を構成する要素の候補として抽出する要素抽出手段と、候補として抽出された前記要素群から、複数の要素が直線状に並べられた要素列を抽出する要素列抽出手段と、抽出された前記要素列のうち、隣接する要素列間の距離が閾値以下である複数の要素列同士をグループ化するグループ化手段と、グループ化された複数の前記要素列のそれぞれについて、当該要素列の特徴量を算出する特徴量算出手段と、1つのグループに含まれる複数の前記要素列のうち、当該グループに含まれる他の要素列との前記特徴量の相関度が閾値よりも低い要素列を、破線として抽出する破線抽出手段として機能させるためのプログラムである。
請求項1記載の画像処理装置によれば、他の複数の要素列との特徴量の相関度が閾値よりも低い要素列を破線として抽出する、という構成を有しない場合に比べて、破線と網点領域とを含む画像から破線を抽出する処理の精度を向上させることができる。
請求項2記載の画像処理装置によれば、各々の要素列同士の位置関係に関する特徴量を算出する、という構成を有しない場合に比べて、破線と網点領域とを含む画像から破線を抽出する処理の精度をより向上させることができる。
請求項3記載の画像処理装置によれば、位置関係が、距離または間隔である、という構成を有しない場合に比べて、破線と網点領域とを含む画像から破線を抽出する処理の精度をより向上させることができる。
請求項4記載の画像処理装置によれば、各々の要素列の属性に関する特徴量を算出する、という構成を有しない場合に比べて、破線と網点領域とを含む画像から破線を抽出する処理の精度をより向上させることができる。
請求項5記載の画像処理装置によれば、属性が、当該要素列の長さ、当該要素列に含まれる要素の数、当該要素列に含まれる要素の大きさ、および当該要素列に含まれる要素間の距離の少なくともいずれか一つである、という構成を有しない場合に比べて、破線と網点領域とを含む画像から破線を抽出する処理の精度をより向上させることができる。
請求項6記載のプログラムによれば、他の複数の要素列との特徴量の相関度が閾値よりも低い要素列を破線として抽出する、という構成を有しない場合に比べて、破線と網点領域とを含む画像から破線を抽出する処理の精度を向上させることができる。
画像処理システムのハードウェア構成を示す。 画像処理装置の機能的構成を示す。 画像処理装置100による処理の手順を示す。 二値画像の一例を示す。 抽出された要素の一例を示す。 要素が抽出された状態の二値画像400の一例を示す。 抽出された要素列の一例を示す。 グループ化処理の一例を示す。 抽出された破線の一例を示す。
本発明の実施形態にかかる画像処理システム10のハードウェア構成を説明する。図1は、画像処理システム10のハードウェア構成を示す。図1に示すように、画像処理システム10は、画像処理装置100とスキャナ110を含む。
スキャナ110は、用紙等の記録媒体に光を照射し、反射光強度を測定する事により、記録媒体上に形成されている画像(以下、「原画像」と示す)を読み取って、この画像を示す画像データ(以下、「原画像データ」と示す)を生成する光学読取装置である。画像処理装置100は、スキャナ110が生成した原画像データに対して破線抽出処理を行う事により、その原画像データが示す画像から破線を抽出する装置である。ここでいう「破線」とは、一定の間隔で切れ目が入れられた線であり、後述するような複数の要素が規則的に並べられたものである。例えば、「破線」としては、点線、一点鎖線、二点鎖線などが挙げられる。
CPU101は、ROM102に記憶されているコンピュータプログラム(以下、単にプログラムという)を読み出して実行する事により画像処理装置100の各部を制御する。例えば、CPU101は、図2で説明する各機能部として機能する。ROM102は半導体素子等で構成された読み出し専用の不揮発性記憶装置である。このROM102には、種々のプログラムやBIOS(Basic Input/Output System)が記憶されている。RAM103はCPU101がプログラムを実行する際のワークエリアとして利用される。VRAM(Video RAM)104は、画像データを記憶するRAMである。入力部105は、スキャナやコンピュータなどの外部入力装置とのインターフェースであり、CPU101の制御の下、画像データを受け付ける。ここでは、入力部105は、スキャナ110から入力される原画像データを受け付ける。
図2は、画像処理装置100の機能的構成を示す。以下に説明する、画像処理装置100が備える各機能部は、画像処理装置100のCPU101がプログラムを実行する事により実現される。画像処理装置100は、画像データ取得部202と、二値画像生成部204と、要素抽出部205と、要素列抽出部206と、グループ化部208と、特徴量算出部210と、破線抽出部212とを備える。
画像データ取得部202は、原画像データを取得する。具体的には、画像データ取得部202は、スキャナ110が生成した原画像データを、入力部105およびバス19を介してスキャナ110から取得する。そして、画像データ取得部202は、取得した画像データを、VRAM104に記憶させておく。
二値画像生成部204は、画像データ取得部202が取得した原画像データに基づいて、原画像の二値画像を生成する。「二値画像」とは、異なる2つの色の画素で表される画像である。この実施形態では、二値画像生成部204は、白色の画素(以下、「白画素」という)と黒色の画素(以下、「黒画素」という)との2種類の画素からなる二値画像を生成する。具体的には、二値画像生成部204は、原画像を構成する各画素について、その階調値が閾値以上である画素は白画素に、閾値未満である画素は黒画素にそれぞれ置換して二値画像を生成する。この処理は、予め定められた閾値を用いる単純二値化処理でも良いし、画像の解析結果に応じて閾値を決定する浮動二値化処理でも良い。二値画像生成部204によって生成された二値画像を示す二値画像データはVRAM104に記憶される。なお、現画像データがカラー画像の場合、二値画像生成部204は、原画像データに対して、グレースケール処理を施してから、上記のとおり二値画像を生成する。
要素抽出部205は、二値画像生成部204が生成した二値画像から、一方の画素色の複数の画素が予め定められた形状に配列された画素群を、破線を構成する要素の候補となる要素(以下、単に「要素」と示す)として抽出する。つまり、要素抽出部205は、いわゆるラベリングを行って得た連結要素のうち、形状に関して予め定められた条件を満たすものを要素として抽出する。ラベリングとは、同色つまり同一の階調値の画素であって互いに隣り合うものに同一の符号を割り当ててグルーピングする事であり、この結果得られた連結要素とは、同色つまり同一の階調値で互いに隣り合う位置に配置された画素群の事である。この実施形態では、「一方の画素色」は、黒である。また、この実施形態では、「予め定められた形状」は、矩形状である。すなわち、要素抽出部205は、黒色かつ矩形状の画素群を要素として抽出する。ここで、要素抽出部205は、画素群がなす矩形の辺の長さが、予め定められた長さよりも長い場合、この画素群を要素として抽出しない。これにより、要素抽出部205は、実線など、破線の構成要素とはなり得ない長さの画素群を要素として抽出せず、これを排除する。
要素列抽出部206は、要素抽出部205が抽出した複数の要素群の中から、複数の要素が直線状に並べられた要素列を抽出する。例えば、要素列抽出部206は、ある要素(以下、「基準要素」という)に着目し、この基準要素のある画素(例えば中心の画素)から、横方向(画像の各位置をXYの直交座標系で表す場合のY軸の正負方向)に二値画像上を走査する。そして、この走査線上に他の要素が発見されれば、この他の要素と基準要素とで横方向の「要素列」をなしていると判断する。同様に、走査線上に複数の他の要素が発見されれば、これら複数の他の要素と基準要素とで横方向の「要素列」をなしていると判断する。この時、ある要素から、同一の直線上において予め定められた距離以内に他の要素が見つからない場合、要素列抽出部206は、この要素を要素列の終端とする。
要素列抽出部206は、ある要素を基準要素とした要素列の抽出が終了すると、基準要素を、要素列をなしていると判断されていない他の要素に移動させて、移動後の要素を基準要素として、上記と同様に、要素列の抽出処理を行う。要素列抽出部206は、この処理を繰り返す事で、要素抽出部205が抽出した複数の要素群の中から、横方向に並ぶ要素列を全て抽出する。さらに、要素列抽出部206は、上記した横方向の要素列の抽出処理と同様の方法により、要素抽出部205が抽出した複数の要素群の中から、縦方向(画像の各位置をXYの直交座標系で表す場合のX軸の正負方向)に並ぶ要素列を全て抽出する。
グループ化部208は、要素列抽出部206によって抽出された要素列のうち、近接する複数の要素列同士をグループ化する。ここでいう「近接する」とは、要素列との要素列との間隔が予め定められた基準値(つまり閾値)よりも近い事を意味する。例えば、グループ化部208は、互いに平行する関係にある要素列同士については、これらの間隔が予め定められた基準値よりもよりも小さい場合、これらの要素列同士が互いに「近接する」と判断する。例えば、グループ化部208は、互いに直交する関係にある要素列同士については、一方の要素列の端部(他方の要素列に近い方の端部)と、他方の要素列(の一方の要素列に最も近い部分)との距離が予め定められた基準値よりもよりも短い場合、これらの要素列同士が互いに「近接する」と判断する。なお、グループ化部208は、互いに直交する関係にある要素列同士であって、実際に交わっている要素列同士については、これらの要素列同士を無条件で互いに「近接する」と判断する。
特徴量算出部210は、グループ化部208によってグループ化された複数の要素列のそれぞれについて、当該要素列の特徴量を算出する。例えば、特徴量算出部210は、グループ化された複数の要素列のそれぞれについて、他の要素列との位置関係に関する特徴量を算出する。ここでいう「位置関係」とは、距離または間隔である。具体例を挙げると、一の要素列と、隣接する他の要素列とが平行する関係にある場合、特徴量算出部210は、この一の要素列と他の要素列との間隔を、一の要素列の特徴量として算出する。また、一の要素列と、隣接する他の要素列とが直交する関係にある場合、特徴量算出部210は、この一の要素列の端部(他の要素列に近い方の端部)と他の要素列(一の要素列の端部から一番近い部分)との距離を、一の要素列の特徴量として算出する。なお、上記「位置関係」は、距離および間隔に限定するものではない。一般的に網掛け領域というのは、複数の要素列が一定の位置関係(特に間隔または距離)を有して規則的に並べられているものである。この為、このような位置関係を特徴量として抽出し、これに基づいて破線を抽出するという事は、各々の要素列が網掛け領域を構成するものなのか、それ以外のものなのか(すなわち、破線を構成するものなのか)を判断するのに有効である。
また、特徴量算出部210は、グループ化された複数の要素列のそれぞれについて、当該要素列の属性に関する特徴量を算出する。ここでいう「属性」とは、上述した位置関係のように他の要素列との相互の関係に基づくものでなく、当該要素列そのものの特徴となるような事項、例えば当該要素列の長さ、当該要素列に含まれる要素の数、当該要素列に含まれる要素の大きさ、および当該要素列に含まれる要素間の距離の少なくともいずれか一つであるが、これに限定するものではない。特徴量算出部210が算出する特徴量は、上記した複数種類の特徴量のうち、いずれか一種類であってもよく、いずれか複数種類であっても良い。一般的に網掛け領域というのは、同一の属性(例えば、要素列の長さ、要素列に含まれる要素の数、要素列に含まれる要素の大きさ、要素列に含まれる要素間の距離)を有する複数の要素列が規則的に並べられているものである。この為、このような属性を特徴量として抽出し、これに基づいて破線を抽出するという事は、各々の要素列が網掛け領域を構成するものなのか、それ以外のものなのか(すなわち、破線を構成するものなのか)を判断するのに有効である。
破線抽出部212は、グループ化部208によってグループ化された複数の要素列のうち、当該グループに含まれる他の複数の要素列との特徴量の相関度が予め定められた基準値よりも低い要素列を、原画像に含まれた破線として特定する。例えば、ある要素列の特徴量を基準値として設定しておき、この基準値に対する特徴量の差が予め定められた閾値よりも大きい要素列については、他の要素列との特徴量の相関度が低い要素列として、原画像に含まれた破線として特定する。
例えば、特徴量算出部210が算出した特徴量が、「他の要素列との距離または間隔」であれば、破線抽出部212は、他の要素列同士の距離または間隔と、当該要素列と他の要素列との距離または間隔との相違が、予め定められた値以上、大きいまたは小さい要素列を、他の要素列との相関度が低い要素列とし、これを破線として抽出する。
また、特徴量算出部210が算出した特徴量が、「要素列の長さ」であれば、破線抽出部212は、他の複数の要素列よりも予め定められた値以上、長さが長いまたは短い要素列を、他の要素列との相関度が低い要素列とし、これを破線として抽出する。
また、特徴量算出部210が算出した特徴量が、「要素列に含まれる要素の数」であれば、破線抽出部212は、他の複数の要素列よりも予め定められた値以上、要素の数が多いまたは少ない要素列を、他の要素列との相関度が低い要素列とし、これを破線として抽出する。
また、特徴量算出部210が算出した特徴量が、「要素列に含まれる要素の大きさ」であれば、破線抽出部212は、他の複数の要素列よりも予め定められた値以上、要素の大きさが大きいまたは小さい要素列を、他の要素列との相関度が低い要素列とし、これを破線として抽出する。
また、特徴量算出部210が算出した特徴量が、「要素列に含まれる要素間の距離」であれば、破線抽出部212は、他の複数の要素列よりも予め定められた値以上、要素間の距離が大きいまたは小さい要素列を、他の要素列との相関度が低い要素列とし、これを破線として抽出する。
図3は、画像処理装置100による処理の手順を示す。まず、画像データ取得部202が、原画像データを取得する(ステップS302)。つぎに、二値画像生成部204が、ステップS302で画像データ取得部202が取得した原画像データに基づいて、原画像の二値画像を生成する(ステップS304)。
ここで、二値画像の一例を説明する。図4は、二値画像の一例を示す。図4において、二値画像400は、二値画像生成部204が生成した二値画像である。二値画像400には、表領域410、網点領域420、および網点領域430が含まれている。表領域410は、表が示されている領域である。網点領域420および網点領域430は、網点によって網掛けがなされている領域である。このうち、網点領域420は、表領域410内の領域である。また、二値画像400には、破線440が含まれている。破線440は、表領域410および網点領域420に重なっている。
図3の説明に戻り、つぎに、要素抽出部205が、ステップS304で二値画像生成部204によって生成された二値画像から要素を抽出する(ステップS306)。ここで、抽出された要素の一例を示す。図5は、抽出された要素の一例を示す。図5に示す各要素510は、図4に示した網点領域420から抽出された要素の一部を示すものである。このうち、図面に向かって左から1列目、2列目、3列目、5列目、および6列目の縦方向に延びる列に含まれる各要素510は、網点領域420に示されている網点から抽出された要素である。一方、4列目の要素列に含まれる要素510は、網点領域420に重なっている破線440から抽出された要素である。図5に示すとおり、各要素は矩形状をなしている。これは、既に説明したとおり、本実施形態では、要素抽出部205が矩形状の要素を抽出するようになっているからである。
図6は、要素が抽出された状態の二値画像400の一例を示す。二値画像400から要素が抽出されるという事は、すなわち、二値画像400から要素以外のオブジェクトが除去されるという事である。例えば、図4に示す二値画像400においては、矩形状の要素以外のオブジェクトとして、実線からなる表領域410の枠線412が示されている。その後、要素抽出部205による要素抽出処理がおこなわれた事により、この枠線412が除去された為、図6に示す二値画像400においては、この枠線412が示されていない。
図3の説明に戻り、つぎに、要素列抽出部206が、ステップS308で要素抽出部205が抽出した複数の要素群の中から、複数の要素が直線状に並べられた要素列を抽出する(ステップS308)。ここで、抽出された要素列の一例を示す。図7は、抽出された要素列の一例を示す。図7は、図5に示した複数の要素群から抽出された要素列を示すものである。図7において、抽出された要素列は二点鎖線で結ばれた状態で示されている。例えば、図7に示す例では、横方向の要素列として、要素列710A、要素列710B、要素列710C、要素列710D、要素列710E、要素列710F、および要素列710Gが抽出された事が示されている。また、図7に示す例では、縦方向の要素列として、要素列720A、要素列720B、要素列720C、要素列720D、要素列720E、および要素列720Fが抽出された事が示されている。
既に説明したとおり、要素列抽出部206は、要素間の間隔が予め定められている距離よりも大きい場合、これら要素同士を同じ要素列とはしない。例えば、図7において、要素510(1,2)、要素510(2,2)、要素510(3,2)、要素510(5,2)、要素510(6,2)は、いずれも横方向に同一列に並んでいる。このうち、要素510(1,2)、要素510(2,2)、および要素510(3,2)は、隣接する要素同士の間隔が、予め定められている距離よりも小さい為に、同じ要素列710Bに含まれている。一方、要素510(5,2)は、要素510(3,2)とでは、互いの間隔が予め定められている距離よりも大きいが、要素510(6,2)とでは、互いの間隔が予め定められている距離よりも小さい。この為、要素510(5,2)は、要素列710Bには含まれず、要素510(6,2)とともに、要素列710Eをなしている。
図3の説明に戻り、つぎに、グループ化部208が、ステップS308で要素列抽出部206によって抽出された要素列のうち、近接する複数の要素列同士をグループ化する(ステップS310)。ここで、グループ化処理の一例を説明する。図8は、グループ化処理の一例を示す。図8では、説明をわかりやすくする為、二値画像400上において、各要素の表示を除し、1つの要素列全体を斜線でハッチングされた棒状の図形で示している。既に説明したとおり、グループ化部208は、近接する複数の要素列同士をグループ化する。例えば、図8に示す例では、表領域410内に含まれる複数の要素列が、いずれも近接する複数の要素列同士であると判断されている。よって、これら表領域410内に含まれる複数の要素列は、グループ化部208により、同じグループとしてグループ化されている。また、図8に示す例では、網点領域430内に含まれる複数の要素列が、いずれも近接する複数の要素列同士であると判断されている。よって、これら網点領域430内に含まれる複数の要素列が、グループ化部208により、同じグループとしてグループ化されている。なお、網点領域430内に含まれる要素列は、いずれも、表領域410内に含まれるいずれの要素列とも近接していないと判断されている。この為、これら網点領域430内に含まれる複数の要素列は、いずれも、表領域410内に含まれる要素列とは、同じグループとしてはグループ化されていない。
図3の説明に戻り、つぎに、特徴量算出部210が、ステップS310でグループ化部208によってグループ化された複数の要素列のそれぞれについて、当該要素列に含まれる複数の要素の分布に関する特徴量を算出する(ステップS312)。
そして、破線抽出部212が、ステップS310でグループ化部208によってグループ化された複数の要素列のうち、当該グループに含まれる他の複数の要素列との特徴量(ステップS312で算出された特徴量)の相関度が予め定められた基準値(つまり閾値)よりも低い要素列を、原画像に含まれた破線として抽出する(ステップS314)。図9は、抽出された破線の一例を示す。図9に示す二値画像400は、破線440が抽出された状態の二値画像400を示す。
図4に示したとおり、二値画像400には、破線440だけでなく、網点領域420および網点領域430には網点が示されており、表領域には枠線412が示されていたが、上記した画像処理装置100による破線抽出処理がおこなわれた事により、これらが除去され、破線440だけが抽出されている。この例では、図7に示した要素列720Dのように、破線440に含まれる要素の大きさが、他の要素列と異なっているから、すなわち「要素列に含まれる要素の大きさ」という特徴量の相関度が他の要素列よりも低いから、この破線440が抽出されたのである。一般的に網掛け領域というのは、「要素列に含まれる要素の大きさ」が同一である複数の要素列が規則的に並べられているものであるから、この破線440のように「要素列に含まれる要素の大きさ」という特徴量の相関度が低い要素列というのは、網点ではなく破線として抽出されるべきであり、画像処理装置100はこれを実現できるのである。
以上説明したとおり、本実施形態の画像処理装置100は、他の要素列との特徴量の相関度が低い要素列を破線として抽出する事とした。一般的に網掛け領域というのは、複数の網点(要素)からなる複数の要素列が規則的に並べられているものであるから、これらの要素列との特徴量の相関度が低い要素列というのは、破線である可能性が高い。特に、本実施形態の画像処理装置100は、他の要素列との位置関係に関する特徴量の相関度が低い要素列を破線として抽出する事とした。一般的に網掛け領域というのは、複数の要素列が一定の位置関係(特に間隔または距離)を有して規則的に並べられているものであるから、このような位置関係に関する特徴量の相関度が低い要素列というのは、破線である可能性が高い。さらに、本実施形態の画像処理装置100は、要素列の属性に関する特徴量の相関度が低い要素列を破線として抽出する事とした。一般的に網掛け領域というのは、同一の属性(例えば、要素列の長さ、要素列に含まれる要素の数、要素列に含まれる要素の大きさ、要素列に含まれる要素間の距離)を有する複数の要素列が規則的に並べられているものであるから、このような属性に関する特徴量の相関度が低い要素列というのは、破線である可能性が高い。したがって、本実施形態によれば、上記のような特徴量の相関度に注目しない場合と比べて、網掛けがなされた領域を含む画像から高い精度で破線が抽出される。
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例を組み合わせても良い。
(変形例1)
実施形態では、画像データ取得部202が原画像データを取得して、二値画像生成部204がこの原画像データから二値画像を生成する事とした。これに限らず、例えば既に二値画像が生成されている場合、画像データ取得部202がこの二値画像を取得するようにしても良い。この場合、画像処理装置100は、原画像データから二値画像を生成する処理を省略する。
(変形例2)
実施形態では、要素列抽出部206は、縦方向の要素列および横方向の要素列をそれぞれ抽出する事としたが、これに限らず、縦方向または横方向のいずれか一方を抽出するようにしても良い。例えば、ユーザが指定する等によって抽出対象の破線が横方向に延伸するものである事がわかっている場合、要素列抽出部206は、縦方向の要素列を抽出せずに、横方向の要素列を抽出するようにしても良い。また、抽出対象の破線が縦方向に延伸するものである事がわかっている場合、要素列抽出部206は、横方向の要素列を抽出せずに、縦方向の要素列を抽出するようにしても良い。この場合、画像処理装置100は、抽出する要素列数を抑えるので、要素列を抽出する処理にかかる処理量、および抽出された各々の要素列に対する処理にかかる処理量を軽減する。
(変形例3)
実施形態では、二値画像において、白色の画素からなる下地に対し、破線、網点、枠線等の各種オブジェクトが黒色の画素によって示されているものとした。この為、要素抽出部205は、黒色の画素群を要素として抽出する事とした。反対に、二値画像において、黒色の画素からなる下地に対し、破線、網点、枠線等の各種オブジェクトが白色の画素によって示されているものであっても良い。この場合、要素抽出部205は、白色の画素群を要素として抽出するようにしても良い。これにより、例えば図4に示した画像400の各画素の色が反転されたような二値画像に対しても、画像処理装置100は、この二値画像から破線を抽出する。
(変形例4)
実施形態では、二値画像が白色の画素と黒色の画素とからなるものである事を説明したが、これに限らず、二値画像は、白色および黒色以外の色の画素からなるものであっても良い。この場合、要素抽出部205は、二値画像を構成する画素の色に応じて、白色および黒色以外の色の画素群を、要素として抽出しても良い。これにより、例えば図4に示した画像400の各画素の色が変更されたような二値画像であっても、画像処理装置100は、この二値画像から破線を抽出する。
(変形例5)
実施形態では、要素抽出部205は、矩形状の画素群を要素として抽出する事としたが、矩形状以外の形状の画素群を要素として抽出しても良い。つまり、要素抽出部205は、互いに隣り合う同色の画素からなる画素群であって、その形状が予め定められた条件を満たす画素群を要素として抽出すれば良い。例えば、円形状の画素群を要素として抽出しても良い。この場合、画像処理装置100は、二値画像から、円形状の要素からなる破線を抽出する。
(変形例6)
実施形態では、特徴量算出部210は、グループ化部208によってグループ化された複数の要素列のそれぞれについて、当該要素列と他の要素列との位置関係に関する特徴量と、当該要素列の属性に関する特徴量との双方を算出する事としたが、少なくともいずれか一方を算出すれば良い。当該要素列と他の要素列との位置関係に関する特徴量を算出する場合において、当該要素列に隣接する他の要素列が複数存在する場合、特徴量算出部210は、この複数の他の要素列のそれぞれとの位置関係を特徴量として算出しても良い。これに留まらず、特徴量算出部210は、当該要素列に隣接しない他の要素列との位置関係を特徴量として算出しても良い。よって、当該要素列以外の全ての他の要素列との位置関係を特徴量として算出しても良い。
(変形例7)
実施形態では、原画像に含まれた破線を特定する方法の一例として、破線抽出部212は、ある要素列の特徴量を基準値として設定しておき、この基準値に対する特徴量の差が予め定められた閾値よりも大きい要素列については、他の要素列との特徴量の相関度が低い要素列として、原画像に含まれた破線として特定する事とした。これに限らず、例えば破線抽出部212は、複数の要素列の特徴量の平均値を算出し、この平均値に対する特徴量の差が予め定められた閾値よりも大きい要素列については、他の要素列との特徴量の相関度が低い要素列として、原画像に含まれた破線として特定するようにしても良い。他の例として、破線抽出部212は、複数の要素列の特徴量のそれぞれの偏差値を算出し、標準偏差に対する偏差値の差が予め定められた閾値よりも大きい要素列については、他の要素列との特徴量の相関度が低い要素列として、原画像に含まれた破線として特定するようにしても良い。
(変形例8)
特徴量算出部210は、各々の要素列に対して複数種類の特徴量を算出する事がある。この場合、破線抽出部212は、算出された複数種類の特徴量に基づいて、破線を抽出しても良い。複数種類の特徴量に基づく破線の抽出方法は様々であって良いが、例えば、破線抽出部212は、各々の要素列について、算出された複数種類の特徴量のそれぞれに関する相関度を求めたうえで、少なくともいずれか一種類の特徴量に関する相関度が予め定められた基準値よりも低い要素列を、原画像に含まれた破線として特定するようにしても良い。また、複数種類の特徴量に関する複数の相関度を正規化したうえで、これらの合計値、平均値、標準偏差値等の指標値を算出し、算出された指標値が予め定められた基準値よりも低い要素列を、原画像に含まれた破線として特定するようにしても良い。
10…画像処理システム、100…画像処理装置、101…CPU、102…ROM、103…RAM、104…VRAM、105…入力部、110…スキャナ、202…画像データ取得部、204…二値画像生成部、205…要素抽出部、206…要素列抽出部、208…グループ化部、210…特徴量算出部、212…破線抽出部

Claims (6)

  1. 異なる2つの色の画素で表される画像から、互いに隣り合う同色の画素からなりその形状に関して予め定められた条件を満たす画素群を、それぞれ、破線を構成する要素の候補として抽出する要素抽出部と、
    候補として抽出された前記要素群から、複数の要素が直線状に並べられた要素列を抽出する要素列抽出部と、
    抽出された前記要素列のうち、隣接する要素列間の距離が閾値以下である複数の要素列同士をグループ化するグループ化部と、
    グループ化された複数の前記要素列のそれぞれについて、当該要素列の特徴量を算出する特徴量算出部と、
    1つのグループに含まれる複数の前記要素列のうち、当該グループに含まれる他の要素列との前記特徴量の相関度が閾値よりも低い要素列を、破線として抽出する破線抽出部と
    を備えることを特徴とする画像処理装置。
  2. 前記特徴量算出部は、
    各々の前記要素列同士の位置関係に関する前記特徴量を算出する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記位置関係は、
    前記要素列間の距離または間隔である
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記特徴量算出部は、
    各々の前記要素列の属性に関する前記特徴量を算出する
    ことを特徴とする請求項1に記載の画像処理装置。
  5. 前記属性は、
    前記要素列の長さ、当該要素列に含まれる要素の数、当該要素列に含まれる要素の大きさ、または当該要素列に含まれる要素間の距離のうち少なくともいずれか一つである
    ことを特徴とする請求項4に記載の画像処理装置。
  6. コンピュータを、
    異なる2つの色の画素で表される画像から、互いに隣り合う同色の画素からなりその形状に関して予め定められた条件を満たす画素群を、それぞれ、破線を構成する要素の候補として抽出する要素抽出手段と、
    候補として抽出された前記要素群から、複数の要素が直線状に並べられた要素列を抽出する要素列抽出手段と、
    抽出された前記要素列のうち、隣接する要素列間の距離が閾値以下である複数の要素列同士をグループ化するグループ化手段と、
    グループ化された複数の前記要素列のそれぞれについて、当該要素列の特徴量を算出する特徴量算出手段と、
    1つのグループに含まれる複数の前記要素列のうち、当該グループに含まれる他の要素列との前記特徴量の相関度が閾値よりも低い要素列を、破線として抽出する破線抽出手段と
    して機能させるためのプログラム。
JP2010180491A 2010-08-11 2010-08-11 画像処理装置およびプログラム Active JP5505187B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010180491A JP5505187B2 (ja) 2010-08-11 2010-08-11 画像処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010180491A JP5505187B2 (ja) 2010-08-11 2010-08-11 画像処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2012038261A JP2012038261A (ja) 2012-02-23
JP5505187B2 true JP5505187B2 (ja) 2014-05-28

Family

ID=45850156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010180491A Active JP5505187B2 (ja) 2010-08-11 2010-08-11 画像処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5505187B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4738645B2 (ja) * 2001-06-15 2011-08-03 株式会社リコー 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
JP2003223612A (ja) * 2002-01-31 2003-08-08 Ricoh Co Ltd 画像処理方法および装置
JP2007034972A (ja) * 2005-07-29 2007-02-08 Toshiba Corp 罫線検出装置、罫線検出方法およびプログラム

Also Published As

Publication number Publication date
JP2012038261A (ja) 2012-02-23

Similar Documents

Publication Publication Date Title
EP0621554B1 (en) Method and apparatus for automatic determination of text line, word and character cell spatial features
CN102870399B (zh) 在ocr过程中将词语位图分割为单个字符或字形
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
JP2009266232A (ja) キーワード識別方法及装置
US20150347886A1 (en) High capacity 2d color barcode and method for decoding the same
JP4791295B2 (ja) 罫線抽出プログラム、罫線抽出装置、罫線抽出方法
US8534565B2 (en) Two-dimensional optical identification device with same gray level for quick decoding and decoding method therefor
CN108717544B (zh) 一种基于智能图像分析的报纸样稿文字自动检测方法
EP2782065A1 (en) Image-processing device removing encircling lines for identifying sub-regions of image
US10424066B2 (en) Image analyzing apparatus that corrects isolated pixels in target image data
JP4532331B2 (ja) 情報埋め込み装置、情報抽出装置、情報埋め込み方法、情報抽出方法、情報埋め込みプログラム、及び情報抽出プログラム
JP5505187B2 (ja) 画像処理装置およびプログラム
JP6546385B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4208520B2 (ja) 画像処理装置および画像処理方法、プログラムおよび記憶媒体
JP2009080727A (ja) 翻訳装置及びプログラム
JP5109548B2 (ja) 画像処理装置及びプログラム
JP2010219848A (ja) 文書画像処理装置および文書画像処理方法
JP5375577B2 (ja) 字形要素判定装置及び字形要素判定方法
JP4346620B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5648340B2 (ja) 画像処理装置およびプログラム
JP2013065164A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5298830B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
US20240355114A1 (en) Area correction device, area correction method, and program
JP4718370B2 (ja) パターンマッチング装置、パターンマッチング方法およびプログラム
JP2009093595A (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130724

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140303

R150 Certificate of patent or registration of utility model

Ref document number: 5505187

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350