JP2004096435A - 画像解析装置、画像解析方法、および画像解析プログラム - Google Patents

画像解析装置、画像解析方法、および画像解析プログラム Download PDF

Info

Publication number
JP2004096435A
JP2004096435A JP2002254939A JP2002254939A JP2004096435A JP 2004096435 A JP2004096435 A JP 2004096435A JP 2002254939 A JP2002254939 A JP 2002254939A JP 2002254939 A JP2002254939 A JP 2002254939A JP 2004096435 A JP2004096435 A JP 2004096435A
Authority
JP
Japan
Prior art keywords
document
image
document edge
edge
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002254939A
Other languages
English (en)
Inventor
Daisaku Horie
保理江 大作
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP2002254939A priority Critical patent/JP2004096435A/ja
Publication of JP2004096435A publication Critical patent/JP2004096435A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Facsimile Scanning Arrangements (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Image Input (AREA)

Abstract

【課題】入力画像から高精度で原稿領域を抽出することのできる画像解析装置を提供する。
【解決手段】入力画像について原稿端概検出処理を行なって原稿端を概検出し、検出結果の確実性が高いと思われる原稿端を特定する(S20)。次に、概検出された原稿端情報を用いて、この原稿端の画像の中心寄りの画素値の分布と、外寄りの画素値の分布とから、下地の色候補と背景の色候補とをそれぞれ選択する(S30)。次に、画像の中心寄りに下地色候補と、画像の外寄りに背景色候補とを有する画素を検出し、検出された画素を原稿端画素として選択する(S40)。最後に、選択された画像端画素を直線で置換することで(S50)、入力画像より最終的な原稿端とする。
【選択図】    図2

Description

【0001】
【発明の属する技術分野】
この発明は画像解析装置、画像解析方法、および画像解析プログラムに関し、特に、入力画像から高精度で原稿領域を抽出することのできる画像解析装置、画像解析方法、および画像解析プログラムに関する。
【0002】
【従来の技術】
フラッドベッド(平台型)スキャナや、シートフィーダ(原稿自動供給型)スキャナや、MFP(Multi Function Peripherals)や、デジタルカメラ等の、様々な画像入力装置から、画像処理装置に対して文書画像が入力される。
【0003】
このような文書画像の入力は、モニタ出力や、印刷紙出力や、OCR(Optical Character Recognition;光学的文字認識)や、ファイリング等を目的とする場合が考えられる。
【0004】
これらの場合、画像処理装置においては次のような画像処理を行なうことが多い。すなわち、モニタ出力を目的とする場合には、画像処理装置においては露出補正等を行なう。また、印刷紙出力を目的とする場合には、下地飛ばし処理や、黒文字強調や、領域別補正処理等を行なう。また、OCRを目的とする場合には、文字領域抽出や2値化処理等を行なう。また、ファイリングを目的とする場合には、領域別圧縮処理等を行なう。
【0005】
なお、ここで下地とは、原稿の紙色、あるいは原稿内の(特に文字領域に)広域に存在する単色領域を示し、以下においても同様に用いる。
【0006】
これらの処理においては、下地が白色であることを前提として、画像の画素値ヒストグラム等の階調分布情報から検出した下地画素値が用いられることが多い。
【0007】
ここで、画像処理装置に、図17に示す文書画像が入力された場合について考える。デジタルカメラによる撮影等では、図17に示されるように、背景に、他の文書、机の模様、筆記用具、指の写込み等、撮影対象ではない余分な部分が入力画像内に入ることがある。なお、ここで背景とは、原稿の外の領域を示し、以下においても同様に用いる。
【0008】
このような文書画像が入力された場合の、画素値のヒストグラムあるいはエッジの射影ヒストグラムの形状の具体例を、図18〜図20に示す。図18〜図20を参照して、図18〜図20の(b)に示す画素値のヒストグラムや、図18〜図20の(c)に示すエッジの射影ヒストグラムの形状は、図18〜図20の(a)に示す入力画像の、被写体原稿内容の白以外の下地領域や写真領域のサイズ、背景領域の写込み等によって変化する。
【0009】
すなわち、図18(a)に示すような白地に黒文字の領域が原稿内容の大半である文書画像が入力された場合には、図18(b)に示す画素値のヒストグラムや、図18(c)に示す射影ヒストグラムのピーク位置を調べるだけで下地領域を検出することが可能である。
【0010】
しかし、図19(a)に示すような白以外の単体領域や、写真領域の割合が比較的大きい文書画像が入力された場合や、図20(a)に示すような撮影対象となる文書以外の写込みが多い文書画像が入力された場合には、図19(b)、図20(b)に示す画素値のヒストグラムや、図20(c)に示す射影ヒストグラムのピーク位置の検出が困難になったり、ピーク位置が原稿端を示さない場合が生じたり、等の理由により、原稿端の検出が困難、あるいは不可能になる場合がある。
【0011】
したがって、入力された文書画像において処理対象を原稿領域内に特定するために、前述のような文書画像処理に先だって原稿領域抽出処理が行なわれることが好ましい。また、原稿領域抽出処理は、前述の文書画像処理以外に、図21に示すような原稿の回転補正や、図22に示すような見開き原稿を読取ることで生じる歪みの補正等を行なうためにも必要な処理となる。
【0012】
従来より、様々な原稿領域抽出方法が提案され使用されている。
例えば、特許文献1を参照すると、紙色である白画素を検出することで原稿領域を特定して原稿の傾きを補正する画像処理方法について開示されている。
【0013】
また、特許文献2を参照すると、複数の角度に対する射影ヒストグラムを調べることでエッジの分布を測定し、最もピーク度合いが大きい位置を原稿端とし、そのときの角度を原稿の傾き角度とする画像読取装置について開示されている。
【0014】
また、特許文献3を参照すると、粗いハフ変換を行なうことである程度の目安をつけた後に、精密なハフ変換を行なうことで原稿の歪み角度を検出する画像処理方法について開示されている。
【0015】
このような原稿領域抽出方法としては、下地の色に関する情報を用いて原稿領域を抽出する方法と、エッジ検出結果を用いて原稿領域を抽出する方法とに大分される。
【0016】
【特許文献1】
特開平10−191026号公報
【0017】
【特許文献2】
特開平11−252351号公報
【0018】
【特許文献3】
特開平8−063548号公報
【0019】
【発明が解決しようとする課題】
しかしながら、上述の原稿領域抽出方法は、前者の方法の場合には、下地色に関する何らかの情報が予め必要となり、様々な下地色の任意の原稿に対応することや、写真領域割合の大きい原稿等に対応することが困難であるという問題があった。
【0020】
また、後者の方法の場合には、図17に示す入力画像のように、余分な物体の写込みがあったり、原稿内容が複雑でエッジが多い原稿が被写体であったり、照明むら等によってエッジの検出精度にばらつきがある場合に誤検出が多くなるという問題もあった。
【0021】
具体的には、特許文献1において開示されている画像処理方法は、複写機による白色の下地の文書を読取ることを前提としているため、背景に模様や他の物体が写込んだ場合や、下地の色が白色でない場合に対応することができないという問題があった。
【0022】
また、特許文献2において開示されている画像読取装置も、背景に模様や他の物体が写込んだ場合や、見開き原稿のように原稿端が複雑な歪みを有する場合には対応することができないという問題があった。
【0023】
また、特許文献3において開示されている画像処理方法は、背景の模様や原稿以外の物体の写込み、原稿内容等に起因する余分なエッジが多い場合には判別を誤りやすいという問題があった。また、見開き原稿のように原稿端が複雑な歪みを有する場合には対応することができないという問題があった。
【0024】
本発明はこれらの問題に鑑みてなされたものであって、最適な原稿端検出を行なうことで、下地と背景とのそれぞれの色を推定し、高精度で原稿領域の抽出を行なうことのできる画像解析装置、画像解析方法、および画像解析プログラムを提供することを目的とする。
【0025】
【課題を解決するための手段】
上記目的を達成するために、本発明のある局面に従うと、画像解析装置は、入力画像に含まれる原稿端の、少なくとも一部を検出する第1の原稿端検出手段と、検出された原稿端の部分に基づいて、入力画像に含まれる背景、または入力画像に含まれる原稿の下地に関する色情報を取得する色情報取得手段と、取得した色情報を用いて、検出した原稿端の部分以外の他の部分の原稿端を検出する第2の原稿端検出手段とを備える。
【0026】
また、上述の第1の原稿端検出手段は、入力画像に含まれるラインについて原稿端らしさを判定する判定手段を備え、原稿端らしさが高いと判定されたラインを原稿端として検出することが望ましい。
【0027】
本発明の他の局面に従うと、画像解析方法は、入力画像に含まれる原稿端の、少なくとも一部を検出する第1の原稿端検出ステップと、検出された原稿端の部分に基づいて、入力画像に含まれる背景、または入力画像に含まれる原稿の下地に関する色情報を取得する色情報取得ステップと、取得した色情報を用いて、検出した原稿端の部分以外の他の部分の原稿端を検出する第2の原稿端検出ステップとを備える。
【0028】
本発明のさらに他の局面に従うと、画像解析プログラムは、画像解析方法をコンピュータに実行させるプログラムであって、入力画像に含まれる原稿端の、少なくとも一部を検出する第1の原稿端検出ステップと、検出された原稿端の部分に基づいて、入力画像に含まれる背景、または入力画像に含まれる原稿の下地に関する色情報を取得する色情報取得ステップと、取得した色情報を用いて、検出した原稿端の部分以外の他の部分の原稿端を検出する第2の原稿端検出ステップとを実行させる。
【0029】
【発明の実施の形態】
以下に、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰返さない。
【0030】
図1は、本実施の形態における画像解析装置10の構成の具体例を示す図である。図1を参照して、画像解析装置10は、画像解析装置10全体の制御を行なうCPU(Central Processing Unit)101と、ROM(Read Only Memory)103と、HD(Hard Disc)104と、RAM(Random Access Memory)102と、I/O(Input/Output;入出力部)105とを備え、CPU101が、オペレーションシステム、アプリケーション等のプログラムや、画像ファイル等のデータを格納するHD104あるいはROM103から格納されたプログラムを読出し、RAM102上に展開して実行することによって、以下に述べるような画像解析を実現する。
【0031】
また、画像解析装置10は、I/O105において、MNT(モニタ)20や、画像取込み用のカラーデジタルスチルカメラであるDSC(Digital Still Camera)30や、処理済みの画像を出力するカラープリンタであるPR40との交信を行なう。
【0032】
なお、このような画像解析装置10は、一般的なパーソナルコンピュータ等で構築されるものであって、上述の構成に限定されるものではない。
【0033】
本実施の形態において、画像解析装置10は、CPU101が、HD104あるいはROM103に格納されたプログラムを読出し、RAM102上に展開して実行することによって、図2に示される原稿検出処理を実行する。
【0034】
図2を参照して、始めに、画像解析装置10は、I/O105においてDSC30やスキャナ等から入力した画像に対して、前処理を実行する(S10)。ここでの入力画像を、具体的に、DSC30から入力した、上述の図17に示される文書画像であるものとして以下の説明を行なう。
【0035】
図17に示される入力文書画像の具体例では、被写体対象である文書以外に、左原稿端付近には筆記用具と原稿を押さえている指とが写込んでおり、上原稿端付近には付箋が写込んでおり、右原稿端付近には筆記用具が写込んでいる。さらに背景には机の模様が写込んでいる。
【0036】
このように、図17に示される入力文書画像は、被写体対象である文書以外の様々な写込みを含む。さらに、その原稿内容は、写真領域や見出し等が存在するため複雑である。そのため、単純に画素値やエッジの射影等のヒストグラムを用いるだけでは下地の色を特定することが難しく、原稿領域の抽出が困難である。
【0037】
そこで、次に、原稿端概検出処理を行なって原稿端を概検出し、検出結果の確実性が高いと思われる原稿端を特定する(S20)。
【0038】
次に、ステップS20で概検出された原稿端情報を用いて、この原稿端の画像の中心寄りの画素値の分布と、外寄りの画素値の分布とから、下地の色候補と背景の色候補とをそれぞれ選択する(S30)。
【0039】
次に、画像の中心寄りに下地色候補と、画像の外寄りに背景色候補とを有する画素を検出し、検出された画素を原稿端画素として選択する(S40)。
【0040】
最後に、ステップS40で選択された画像端画素を直線で置換することで(S50)、最終的な原稿端を検出し、原稿検出処理を終了する。
【0041】
なお、上述の説明においては、図17に示されるような被写体となる原稿が矩形形状であるものとしているが、図22に示すような、見開き原稿の場合であっても、上述のステップS50における変換を、直線ではなく曲線による変換に一部変更することで同様に対応することができる。
【0042】
次に、上述の原稿検出処理における各処理について詳細な説明を行なう。
まず始めに、ステップS10における前処理について、図3を用いて説明を行なう。この前処理は、ノイズの除去、入力時のAE(Auto Exposure:自動露出)のずれの影響の除去、高速化、使用メモリ量の削減等を目的として行なわれる。
【0043】
そこで、図3を参照して、前処理の一例として、始めにステップS101で階調を正規化する修正を行なう。
【0044】
ここでは、入力した文書画像の色情報であるRGB値から、次式に基づいて各画素ごとにY画像内の最大値Ymaxと最小値Yminとを算出する。
【0045】
Y=0.3R+0.6G+0.1B
そして、算出された最大値Ymaxと最小値Yminとを用いて、次式に基づいて画素値の正規化を行なう。
【0046】
Rnew=255×(Rold−Ymin)/(Ymax−Ymin)
Gnew=255×(Gold−Ymin)/(Ymax−Ymin)
Bnew=255×(Bold−Ymin)/(Ymax−Ymin)
ただし、上述の正規化において、RGB値が0未満である場合には0となるように、256以上である場合には255となるように補正することが必要である。
【0047】
次に、ステップS103で、間引きやBL(Bi−Linear)法による処理を行ない、縦横1/2や、縦横1/4等に画像を縮小変換する。
【0048】
最後に、ステップS105で、平滑化処理、メディアンやモルフォロジ等のフィルタ演算等を行ない、ノイズを除去する。
【0049】
以上でステップS10における前処理を終了し、図2に示すメインルーチンに処理を戻す。
【0050】
なお、上述の説明は様々な前処理のうちの一例を挙げたものであって、この処理に限定されるものではない。そこで、入力された文書画像の品質や画像解析装置10の性能等に応じて、必要な処理を選択することもできる。
【0051】
次に、ステップS20における原稿端概検出処理について、図4を用いて説明を行なう。
【0052】
本実施の形態においては、比較的単調な原稿端を検出できる原稿端概検出方法を用いることを特徴とする。すなわち、原稿や、撮影状況に対する制約が小さい場合に対応するためには、原稿内容や撮影状況に関する情報をできるだけ必要としない原稿端概検出方法を行なうことが好ましい。
【0053】
そこで1つの具体例として、ハフ(Hough)変換を利用した原稿端概検出処理について説明する。なお、ハフ変換自体は、直線や固定形状の曲線を検出するために広く用いられている公知の技術であって、「画像解析ハンドブック」(東京大学出版会出版)の第592ページ等に記載あるため、ここでは詳細な説明は行なわない。
【0054】
さらに、ハフ変換では、直線以外に例えば円等の検出も行なうことができる。しかし、本実施に形態においては単調な原稿端を検出できる方法を用いるため、直線検出用のハフ変換のみについて説明する。すなわち、一般的には全ての方向に対する直線に対応できるようr−θ極座標系を用いたハフ変換が用いられることが多い。しかし、本実施に形態においては、上下の原稿端では水平方向(x軸に平行な方向)のみ、左右の原稿端では垂直方向(Y軸に平行な方向)のみに、方向に制約を加えて直線検出を行なえばよい。そのため、本実施に形態においては、x−y座標系を用いた原始的なハフ変換を用いても十分に原稿端の検出を行なうことができる。
【0055】
図4を参照して、始めに、ステップS201で、前処理後の画像からエッジを抽出してエッジ画像を作成する。
【0056】
上下の原稿端を概検出する場合にはX軸方向(水平方向)の原稿端を検出すればよく、左右の原稿端を概検出する場合にはY軸方向(垂直方向)の原稿端を検出すればよい。そのため、水平方向のエッジ度(水平エッジ度Eh)を用いて上下の原稿端を検出し、垂直方向のエッジ度(垂直エッジ度Ev)を用いて左右の原稿端を検出すればよい。水平エッジ度Ehおよび垂直エッジ度Evは、エッジ画像が図5に示すような各画素A〜H,Pを含む画像であって、画素Pを注目する画素とする場合、各々の画素値をa〜h,pとすると、次式で表わされる。
【0057】
Eh=max(|2p−a−h|,|2p−b−g|,|2p−c−f|)
−min(|2p−a−h|,|2p−d−e|,|2p−c−f|)
Ev=max(|2p−a−h|,|2p−d−e|,|2p−c−f|)
−min(|2p−a−h|,|2p−b−g|,|2p−c−f|)
ただし、max(A,B,C)は、A,B,Cのうちの最大値を示し、min(A,B,C)は、A,B,Cのうちの最小値を示す。
【0058】
次に、ステップS203において、ハフ変換投票処理を行なう。ここでは、上側の原稿端を検出する場合について説明する。言うまでもなく、下側の原稿端を検出する場合にも同様の処理である。また、左右の原稿端を検出する場合には、X軸とY軸とを入替えるだけで同様の処理である。
【0059】
ステップS203では、まず、算出されたエッジ度が、予め設定されている固定しきい値Th_eについて、Eh>Th_eであるエッジ画素のみに対してハフ変換を行なう。具体的には、対象となるエッジ画素(X,Y)において、ある程度限定した組合わせ(a,b)を選択し、選択されたあらゆる組合わせに対して、次式の計算を行なう。
【0060】
E=|Y−(aX+b)|
ここで、(a,b)は、原稿の上端を表わす直線をy=ax+bで表わした場合の傾きaと、Y切片bとの組合わせである。
【0061】
そして、所定の固定しきい値Th_dについて、E<Th_dを満たす組合わせ(a,b)に対して、ポイントを加算(投票)する。
【0062】
上述の組合わせ(a,b)に対する「ある程度の限定」とは、原稿端を表わす直線の傾きと位置とに対する推定に基づく限定である。このような推定に基づく限定について、図6を用いて説明する。
【0063】
すなわち、図6を参照して、「原稿端の傾きは高々aである」と推定した場合には、傾きaを−a<a<aと限定することになる。さらに、原稿の上端を表わす直線とY軸との交点のY座標(Y切片)が、bからbの間であると限定する場合には、Y切片bをb<b<bと限定することになる。より具体的には、「原稿端は高々30度程度しか傾いていないはずである」という推定を行なった場合には、図6においてa=tan30°に相当し、傾きaを
−tan30°<a<tan30°
と限定することになる。
【0064】
また、傾きaとY切片bとのサンプリングピッチについても限定を加えることで、処理速度を高めると同時にノイズの影響を低減することができる。
【0065】
ポイントの加算数は、エッジ度の高い画素(X,Y)での算出値ほど多くのポイントが加算されるようにしてもよいし、一律に1ポイントが加算されるようにしてもよい。このようなポイントの加算数は、入力文書画像の画質に応じて調整されることが好ましい。
【0066】
エッジ度が固定しきい値Th_e以上である全てのエッジ画素(X,Y)に対して対してポイントの加算を行なうと、各エッジ画素について、傾きaとY切片bとから構成される図6の右図に示されるa−b平面上にポイントを表わす。
【0067】
次に、ステップS205において、a−b平面上にて(a,b)のピークを検出する。ステップS205で検出される最大ポイントをもつ(a,b)の組合わせで表現される直線y=ax+bが、求める原稿の上端を表わす直線となる。
【0068】
そして、ステップS207で、原稿端検出についての良否を判定する。ここでは、ステップS205で最大ポイントをもつ(a,b)の組合わせとして選択された組合わせ(a,b)の有するポイント数Pabが、原稿の上端についての概検出の信頼度となる。すなわち、所定の固定しきい値Th_hを用い、Pab>Th_hならば当該原稿端概検出の信頼度が高い(あるいは正常に検出できた)とし、そうでないならば信頼度が低い(あるいは、検出できなかった)とすることができる。
【0069】
以上でステップS20における原稿端概検出処理を終了し、図2に示すメインルーチンに処理を戻す。
【0070】
なお、上述のように原稿端概検出処理においてハフ変換を用いることは特に有効ではあるが、ハフ変換に限定するものではなく、他の既存の原稿端検出方法を用いても構わない。この場合には、検出過程で何らかの検出信頼度が算出できる検出手段を利用する、検出結果の直線上に含まれるエッジ画素割合を調べるなどして信頼度を検出後に判定する、等を行なって、後述の色候補選択処理に使用するための原稿端を特定することが好ましい。
【0071】
次に、ステップS30における色候補選択処理について、図7を用いて説明を行なう。
【0072】
始めに、ステップS301において、上述の概検出の信頼度が高かった原稿端の候補に対して、入力された文書画像の中心寄りと外寄りとに、各々色候補を選択するための範囲を設定する。図8に示す具体例では、上述の原稿端概検出処理で、下側の原稿端と右側の原稿端との概検出信頼度が高かった場合を示しており、ステップS301では、この原稿端の候補である直線から図に示されたような範囲を各々色候補を選択するための範囲に設定する。この範囲の大きさは、例えば原稿端方向の幅50画素、細い方の幅5画素、などと固定されていてもよいし、画像サイズ等の情報を用いて可変であってもよい。
【0073】
次に、ステップS303あるいはステップS307において、設定された全ての中心寄りの範囲あるいは全ての外寄り範囲に対して、RGB値の分布についてヒストグラムを作成する。
【0074】
そして、ステップS305あるいはステップS309において、各範囲のRGB値のヒストグラムからピーク値を求め、中心寄りの範囲についてはこれを下地色と推定して採用し、外寄り範囲についてはこれを背景色と推定して採用する。
【0075】
以上でステップS30における色候補選択処理を終了し、図2に示すメインルーチンに処理を戻す。
【0076】
なお、上述のRGB値のヒストグラムを用いて色候補を選択する方法の他に、クラスタリング等を利用して背景と下地とそれぞれに対して複数の色を算出し、これらを用いてもよいが、説明の簡便上、採用色は背景と下地とで各々1つである場合以外の説明についてはここでは行なわない。
【0077】
次に、ステップS40における原稿端画素選択処理について、図9を用いて説明を行なう。
【0078】
始めに、ステップS401において、上述の概検出の信頼度が低かった原稿端の候補に対して、原稿端として選択する対象となる画素を検出するための原稿端検出用の範囲を設定する。上述の具体例では下側の原稿端と右側の原稿端との概検出信頼度が高かったため、図10に示すように、画像の上半分と左半分にのみ原稿端検出用の範囲を絞ってもよい。ここでは、左側の原稿端となる画素を選択する場合の処理について述べるが、言うまでもなく右側や下側の原稿端についても同様である。
【0079】
次に、ステップS403およびステップ405において、設定した範囲内の各画素について、自身の右側(画像の中心側)に下地色が存在するという第1の条件と、自身の左側(画像の外側)に背景色が存在するという第2の条件とを満たすか否かを判定する。この第1の条件と第2の条件とを共に満たす場合には(S403でYES)、注目する画素についてflag1=1とし(S407)、第1の条件と第2の条件とを全て満たさない場合には(S403でNO)、注目する画素についてflag1=0とする(S409)。
【0080】
具体的には、各画素に対して、原稿の中央寄りに位置する対象画素の色と下地色との色距離を所定の固定しきい値Th_ciと比較することで、下地色であるか否かの判定を行なう。同様に、原稿の外寄りに位置する対象画素の色と背景色との色距離を所定の固定しきい値Th_coと比較することで、背景色であるか否かの判定を行なう。
【0081】
このように、所定の固定しきい値Th_ci,Th_coを利用することで、下地色であるか否かあるいは背景色であるか否かの判定で、ある程度の判定の幅を許容することができる。
【0082】
色距離は、例えば比較対象となる2組のRGB値に対してRGBの各値の差の絶対値和(|ΔR|+|ΔG|+|ΔB|)を用いて算出してもよいし、その他の方法で算出してもよい。
【0083】
さらに、ステップS411において、設定した範囲内の各画素について、上述の第1の条件と第2の条件とのいずれかを満たすか否かを判定する。この第1の条件と第2の条件とのいずれか一方でも満たす場合には(S411でYES)、注目する画素についてflag2=1とし(S413)、第1の条件と第2の条件とを全て満たさない場合には(S411でNO)、注目する画素についてflag2=0とする(S415)。
【0084】
そして、ステップS417において、ステップS405およびステップS411における判定結果(S407,S409,S413,S415)に基づいて、注目画素の選択重要度Lvを算出する。ここでの選択重要度Lvは、以下の式によって算出される。
【0085】
Lv=flag1+flag2+(flag1×flag2)
なお、選択重要度Lvは上述の式によるものに限定されず、注目画素からみて画像の中心寄りにある近隣画素がより下地らしい場合、また、画像の端寄りにある近隣画素がより背景らしい場合、等に重要度が高くなるように設定できるものなら他のものであってもよい。
【0086】
以上の処理をステップS419およびステップS403で、設定された範囲内の全ての画素について実行し、選択重要度Lvの高い画素を原稿端として選択する。
【0087】
ここで、図11に示す具体例を参照して、左側の原稿端の画素を選択するために、原稿端検出用の範囲としてエッジ画像の左側の範囲が設定されている。そして、その範囲に含まれる各画素について、上述の第1の条件および第2の条件を満たすか否かが判断され、選択重要度Lvに応じて原稿端候補として選択する。
【0088】
なお、上述のように、選択重要度Lvを算出して2条件のどちらか一方のみを満たす場合と、どちらも満たす場合とで原稿端画素の選択重要度Lvに差をつける選択方法に限定するものではない。すなわち、2条件の両方を満たす場合にのみ原稿端画素と判定してもよいし、どちらかの条件のみを満たす場合でも原稿端画素と判定してもよい。
【0089】
このようにして下地色と背景色とに基づいて原稿端画素であると選択された画素から、図12に具体例を示すような原稿端画像を作成することができる。
【0090】
また、ここで検出の対象としていた左側の原稿端は、垂直方向である可能性が高いため、ステップS421において垂直方向であると判断すると、ステップS425で水平方向度合いの高いエッジを除去して、図13に具体例を示すように、左側原稿端として確実性の高いエッジのみを抽出することができる。
【0091】
なお、下側の原稿端等、水平方向である可能性が高い原稿端を検出の対象としていた場合にも、同様に、ステップS423で垂直度合いの高いエッジを除去することで、確実性の高いエッジのみを抽出することができる。
【0092】
このようにして抽出されたエッジは、単純に入力画像から検出されたエッジ画像を示す図14と比較すると、より原稿端として確からしいエッジのみが残り、不要なエッジはかなり除去されているため、原稿端の誤抽出を軽減することができる。
【0093】
以上でステップS40における原稿端画素選択処理を終了し、図2に示すメインルーチンに処理を戻す。
【0094】
なお、上述の処理において、最後に実行したエッジの縮退は、モルフォロジー演算等、他の方法を用いて実行することもできる。
【0095】
また、原稿端画素の選択対象を、予め2次微分等を用いて選択しておいたエッジ画素のみに限定することもできる。このようにすることで、原稿端検出の制御を高めることができ、また、処理時間を短縮することもできる。
【0096】
次に、ステップS50における原稿端置換処理について、図15を用いて説明を行なう。ここでは、図13に示される原稿端画像の各画素に対して再度ハフ変換を行なうことで直線検出を行なう、座標位置の補間(検出された原稿端画素の間を単純に直線で結ぶ)等を行なうことで原稿端の隙間を埋める等の処理によって、最終的な直線の原稿端を検出することができる。
【0097】
その方法については限定されるものではないが、ここではその一例として、射影ヒストグラムを用いた処理について挙げる。
【0098】
始めに、ステップS501において、回転角度θと、基準値であるmaxPositionと、maxValueと、maxAngleとを初期化する。ここでは、回転角度θをθ1からθ2まで変化させて直線である原稿端を決定するものとする。
【0099】
次に、ステップS503において、直線に置換する対象である原稿端として選択された画素からなるエッジ画像を、回転角度θだけ回転させる。
【0100】
次に、ステップS505において、回転された原稿端画素を用いて射影ヒストグラムを作成する。ここでは、直線に置換する対象である原稿端が左側の原稿端や右側の原稿端といった垂直方向の原稿端である場合には垂直方向の射影ヒストグラムを作成し、上側の原稿端や下側の原稿端といった水平方向の原稿端である場合には水平方向の射影ヒストグラムを作成する。
【0101】
なお、ステップS505でヒストグラムを作成する際には、上述の原稿端画素選択処理において算出された画素単位の選択重要度Lvの値を用いることもできる。また、選択重要度Lv=2である画素のみを用いて射影ヒストグラムを作成してもよい。
【0102】
次に、ステップS507で作成された射影ヒストグラムから、回転角度θだけ回転した場合の射影ヒストグラムのピーク位置maxPositionθと、その度数maxValueθとを求める。そして、射影ヒストグラムのピーク位置maxPositionθでの度数maxValueθが基準値maxValueよりも大きい場合には(S509でYes)、ステップS511において、回転角度θだけ回転した場合の射影ヒストグラムのピーク位置maxPositionθと、その度数maxValueθと、その回転角度θとを、新たな基準値に設定する。
【0103】
回転角度θがθ2に達したときの基準値maxValue,maxPositionは、射影ヒストグラムのピーク位置maxPositionθでの度数maxValueθが最大であるときの値となっている。そこで、ステップS517においては、ピーク位置での度数が最大となる回転角度θで回転させた場合のエッジ画像が原稿端であると決定し、その角度θにおける直線と原稿端とを置換する。
【0104】
以上でステップS50における原稿端置換処理を終了し、図2に示すメインルーチンに処理を戻す。
【0105】
このように、本実施の形態における画像解析装置10は、まず、直線性が高く、下地あるいは背景の画素値が均一であり、余分な物体の写込みが少ない比較的短調な原稿端の検出に適している原稿端概検出処理を行なうことを特徴としている。そして、その概検出結果に基づいて、下地と背景とのそれぞれの色を推定し、概検出結果の信頼性の低い、あるいは概検出処理では検出されなかった原稿端を、指定色を利用して再度検出することを特徴とする。このような、原稿端概検出処理と、その結果に基づいた再検出処理とを行なうことによって、原稿領域抽出の精度を向上させることができる。
【0106】
すなわち、本実施の形態の画像解析装置10において上述の原稿検出処理を実行することで、入力された原稿画像に余計な物体が写込んでいる場合であっても確実に原稿領域を抽出することが可能となる。また、様々な原稿の種類や照明条件や撮影角度等にも高い対応性を備えた原稿検出を行なうことができる。
【0107】
なお、上述の説明においては、被写体となる原稿の下地輝度値や形状に関する情報を事前に取得することなく原稿端を検出する原稿端概検出を行なっているが、被写体についての色や形状等に関する情報が既知である場合には、これらの情報を用いて原稿端概検出を行なうことも有効である。このことで、原稿領域抽出性能をさらに高めることができる。
【0108】
また、上述の説明においては、図17に示すような見開き原稿歪みのない原稿を入力画像の具体例として述べたが、図22に示すような見開き原稿を読取ることで生じる歪みの補正等を行なう場合には、図16に示すように、原稿端概検出によって歪みのない原稿端を先に検出し、この検出結果を用いて歪みのある原稿端を検出するようにすればよい。なお、見開き原稿歪みを含む歪みのある複雑な形状の原稿端の検出方法については、特開平10−336428号公報等において開示されている検出方法等を用いることができる。
【0109】
さらに、上述の画像解析装置10が行なう原稿検出方法を、プログラムとして提供することもできる。このようなプログラムは、コンピュータに付属するフレキシブルディスク、CD−ROM(Compact Disc−ROM)、ROM、RAMおよびメモリカードなどのコンピュータ読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
【0110】
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。
【0111】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【図面の簡単な説明】
【図1】本実施の形態における画像解析装置10の構成の具体例を示す図である。
【図2】画像解析装置10における原稿検出処理を示すフローチャートである。
【図3】ステップS10における前処理の具体例を示すフローチャートである。
【図4】ステップS20における原稿端概検出処理を示すフローチャートである。
【図5】画素A〜H,Pを含むエッジ画像の具体例を示す図である。
【図6】原稿の上端を表わす直線y=ax+bの傾きaの範囲とY切片bの範囲とを示す図、およびa−b平面とを示す図である。
【図7】ステップS30における色候補選択処理を示すフローチャートである。
【図8】原稿端概検出処理で、下側の原稿端と右側の原稿端との概検出信頼度が高かった場合の入力文書画像の具体例を示す図である。
【図9】ステップS40における原稿端画素選択処理を示すフローチャートである。
【図10】原稿端検出用の範囲を限定した状態の具体例を示す図である。
【図11】左側の原稿端の画素を選択する場合の原稿端画素選択処理の具体例を示す図である。
【図12】原稿端画素選択処理で選択された画素より作成された原稿端画像の具体例を示す図である。
【図13】左側原稿端として確実性の高いエッジのみから作成された原稿端画像の具体例を示す図である。
【図14】単純に入力画像から検出されたエッジ画像の具体例を示す図である。
【図15】ステップS50における原稿端置換処理の具体例を示すフローチャートである。
【図16】入力画像が見開き原稿歪みを含む歪みのある原稿である場合の原稿端検出方法の概略を示す図である。
【図17】入力文書画像である文書画像の具体例を示す図である。
【図18】白地に黒文字の領域が原稿内容の大半である文書画像が入力された場合の画素値のヒストグラムおよびエッジの射影ヒストグラムの形状の具体例を示す図である。
【図19】白以外の単体領域や、写真領域の割合が比較的大きい文書画像が入力された場合の画素値のヒストグラムの形状の具体例を示す図である。
【図20】撮影対象となる文書以外の写込みが多い文書画像が入力された場合の画素値のヒストグラムおよびエッジの射影ヒストグラムの形状の具体例を示す図である。
【図21】原稿の回転補正を示す図である。
【図22】見開き原稿を読取ることで生じる歪みの補正を示す図である。
【符号の説明】
10 画像解析装置、20 MNT(モニタ)、30 DSC(デジタルスチルカメラ)、40 PR(プリンタ)、101 CPU、102 RAM、103 ROM、104 HD、105 I/O。

Claims (4)

  1. 入力画像に含まれる原稿端の、少なくとも一部を検出する第1の原稿端検出手段と、
    前記検出された原稿端の部分に基づいて、前記入力画像に含まれる背景、または前記入力画像に含まれる原稿の下地に関する色情報を取得する色情報取得手段と、
    前記取得した色情報を用いて、前記検出した原稿端の部分以外の他の部分の原稿端を検出する第2の原稿端検出手段とを備える、画像解析装置。
  2. 前記第1の原稿端検出手段は、前記入力画像に含まれるラインについて原稿端らしさを判定する判定手段を備え、
    前記原稿端らしさが高いと判定されたラインを原稿端として検出する、請求項1に記載の画像解析装置。
  3. 入力画像に含まれる原稿端の、少なくとも一部を検出する第1の原稿端検出ステップと、
    前記検出された原稿端の部分に基づいて、前記入力画像に含まれる背景、または前記入力画像に含まれる原稿の下地に関する色情報を取得する色情報取得ステップと、
    前記取得した色情報を用いて、前記検出した原稿端の部分以外の他の部分の原稿端を検出する第2の原稿端検出ステップとを備える、画像解析方法。
  4. 画像解析方法をコンピュータに実行させるプログラムであって、
    入力画像に含まれる原稿端の、少なくとも一部を検出する第1の原稿端検出ステップと、
    前記検出された原稿端の部分に基づいて、前記入力画像に含まれる背景、または前記入力画像に含まれる原稿の下地に関する色情報を取得する色情報取得ステップと、
    前記取得した色情報を用いて、前記検出した原稿端の部分以外の他の部分の原稿端を検出する第2の原稿端検出ステップとを実行させる、画像解析プログラム。
JP2002254939A 2002-08-30 2002-08-30 画像解析装置、画像解析方法、および画像解析プログラム Withdrawn JP2004096435A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002254939A JP2004096435A (ja) 2002-08-30 2002-08-30 画像解析装置、画像解析方法、および画像解析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002254939A JP2004096435A (ja) 2002-08-30 2002-08-30 画像解析装置、画像解析方法、および画像解析プログラム

Publications (1)

Publication Number Publication Date
JP2004096435A true JP2004096435A (ja) 2004-03-25

Family

ID=32060597

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002254939A Withdrawn JP2004096435A (ja) 2002-08-30 2002-08-30 画像解析装置、画像解析方法、および画像解析プログラム

Country Status (1)

Country Link
JP (1) JP2004096435A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006163821A (ja) * 2004-12-07 2006-06-22 Casio Comput Co Ltd 撮影装置、画像処理装置、画像処理方法及びプログラム
JP2008271332A (ja) * 2007-04-23 2008-11-06 Pfu Ltd 画像読取装置
JP2009152901A (ja) * 2007-12-20 2009-07-09 Konica Minolta Business Technologies Inc 画像処理装置および画像処理方法
US8102575B2 (en) 2006-07-28 2012-01-24 Canon Kabushiki Kaisha Image processing apparatus and method
JP2013117970A (ja) * 2006-05-17 2013-06-13 Qualcomm Inc ライン又はテキスト・ベース画像処理ツール
US8606018B2 (en) 2008-06-17 2013-12-10 Canon Kabushiki Kaisha Image processing method and image processing apparatus
CN104184918A (zh) * 2013-05-27 2014-12-03 富士通株式会社 图像处理装置和方法以及上置式图像扫描装置
CN104284053A (zh) * 2013-07-08 2015-01-14 富士施乐株式会社 倾斜角度校正装置、图像读取装置、图像形成装置及程序

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006163821A (ja) * 2004-12-07 2006-06-22 Casio Comput Co Ltd 撮影装置、画像処理装置、画像処理方法及びプログラム
JP4600019B2 (ja) * 2004-12-07 2010-12-15 カシオ計算機株式会社 撮影装置、画像処理方法及びプログラム
JP2013117970A (ja) * 2006-05-17 2013-06-13 Qualcomm Inc ライン又はテキスト・ベース画像処理ツール
US8102575B2 (en) 2006-07-28 2012-01-24 Canon Kabushiki Kaisha Image processing apparatus and method
JP2008271332A (ja) * 2007-04-23 2008-11-06 Pfu Ltd 画像読取装置
US8285043B2 (en) 2007-12-20 2012-10-09 Konica Minolta Business Technologies, Inc. Image processing apparatus and image processing method
JP4502001B2 (ja) * 2007-12-20 2010-07-14 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法
JP2009152901A (ja) * 2007-12-20 2009-07-09 Konica Minolta Business Technologies Inc 画像処理装置および画像処理方法
US8606018B2 (en) 2008-06-17 2013-12-10 Canon Kabushiki Kaisha Image processing method and image processing apparatus
CN104184918A (zh) * 2013-05-27 2014-12-03 富士通株式会社 图像处理装置和方法以及上置式图像扫描装置
CN104184918B (zh) * 2013-05-27 2017-07-07 富士通株式会社 图像处理装置和方法以及上置式图像扫描装置
CN104284053A (zh) * 2013-07-08 2015-01-14 富士施乐株式会社 倾斜角度校正装置、图像读取装置、图像形成装置及程序
JP2015015687A (ja) * 2013-07-08 2015-01-22 富士ゼロックス株式会社 傾斜角度補正装置、画像読取装置、画像形成装置およびプログラム

Similar Documents

Publication Publication Date Title
US7724950B2 (en) Image processing apparatus, image processing method, computer program, and storage medium
JP6216871B2 (ja) 文書バウンダリ検知方法
JP3768052B2 (ja) カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体
US8457403B2 (en) Method of detecting and correcting digital images of books in the book spine area
WO2007127085A1 (en) Generating a bitonal image from a scanned colour image
JPH08185095A (ja) 偽造防止用紙幣パターン検知器および検知方法
KR101597739B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
JP2000082144A (ja) 文書上の所定のマ―カ―の存在及び向きを検出する方法、及びノイズの影響を受けないシステム
CN114283156B (zh) 一种用于去除文档图像颜色及手写笔迹的方法及装置
CN111259891B (zh) 一种自然场景下身份证识别方法、装置、设备和介质
US8306335B2 (en) Method of analyzing digital document images
EP2184712A2 (en) Noise reduction for digital images
JP2004096435A (ja) 画像解析装置、画像解析方法、および画像解析プログラム
JP2004336282A (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
US7961941B2 (en) Color form dropout using dynamic geometric solid thresholding
WO2021195873A1 (zh) 识别sfr测试卡图像中感兴趣区域的方法及装置、介质
JP3820751B2 (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
CN111445402A (zh) 一种图像去噪方法及装置
EP2156373A2 (en) Applying a segmentation engine to different mappings of a digital image
CN113033562A (zh) 一种图像处理方法、装置、设备及存储介质
JP4646130B2 (ja) 画像処理装置、画像処理方法、プログラム及びプログラムを格納した記憶媒体
JP2006107034A (ja) 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム
JP5397468B2 (ja) パタンノイズ除去装置、パタンノイズ除去方法、パタンノイズ除去プログラム
CN110991451B (zh) 扫描图像的卡片区域图像的校正方法及装置
Konya et al. Adaptive methods for robust document image understanding

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050613

A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20051101