JP2010224987A - 画像処理装置、画像処理方法、プログラム、および記録媒体 - Google Patents

画像処理装置、画像処理方法、プログラム、および記録媒体 Download PDF

Info

Publication number
JP2010224987A
JP2010224987A JP2009072928A JP2009072928A JP2010224987A JP 2010224987 A JP2010224987 A JP 2010224987A JP 2009072928 A JP2009072928 A JP 2009072928A JP 2009072928 A JP2009072928 A JP 2009072928A JP 2010224987 A JP2010224987 A JP 2010224987A
Authority
JP
Japan
Prior art keywords
image
inclination
value
calculated
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009072928A
Other languages
English (en)
Inventor
Chikayuki Koyama
至幸 小山
Mitsuhiro Toya
充宏 斗谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2009072928A priority Critical patent/JP2010224987A/ja
Priority to US12/729,483 priority patent/US20100246972A1/en
Publication of JP2010224987A publication Critical patent/JP2010224987A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

【課題】 画像に写真が含まれ、あるいは文字の背景が無地でない場合においても、長い処理時間を必要とせず、画像の傾きを検知することができる画像処理装置、画像処理方法、プログラム、および記録媒体を提供する。
【解決手段】 縮小エッジ画像生成部3は、画像を表す画像情報を入力する入力装置6によって入力される画像情報が示す画像をブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいて1/Nエッジ画像を作成する。傾き検出部4は、縮小エッジ画像生成部3によって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、ライン走査が行われるライン毎に画素の輝度に基づく評価値を算出し、算出したライン毎の評価値に基づいて統計値を算出し、算出した統計値から画像の傾きを推定する。
【選択図】 図1

Description

本発明は、入力装置が入力する画像情報が表す画像の傾きを検知する画像処理装置、画像処理方法、プログラム、および記録媒体に関する。
昨今、カメラ付き携帯電話の普及率が高まり、カメラを使った色々なアプリケーションが提案されている。たとえば、カメラで名刺を撮影し、OCR (Optical Character
Reading)を用いて、カメラで撮影した名刺の画像の文字認識を行い、認識した結果を携帯電話の電話帳に登録するアプリケーションプログラムが搭載された携帯電話が周知である。また、雑誌などに掲載されたお店情報の画像を撮影し、撮影した画像に対してOCR処理を行って情報を抽出するアプリケーションプログラムが搭載された携帯電話が商品化されている。撮影した雑誌の画像は、文字情報の他に写真を含み、また、文字の背景が無地ではなくカラフルなカラー画像である場合が多い。
カメラ付き携帯電話で画像を撮影する場合には携帯電話を把持した状態で撮影するので、スキャナで画像を読み込む場合に比べて、撮影方向の自由度が高くカメラ位置が安定しない。そのため、カメラ付き携帯電話で撮影する場合には、被写体が傾いた状態で撮影される場合がある。しかしながら、通常のOCRは傾いた画像を正しく認識することができない。画像の傾きを気にせずに撮影し、撮影した画像から文字認識をすることができるようにするためには、予め画像の傾きを検知し、検知した傾きに基づいて画像を回転補正しておく必要がある。
他の従来技術として、たとえば、特許文献1には、文書画像の傾きを検知する手段として、入力された画像を2値画像に変換し、所定の角度毎のラインに沿ったピクセル列の白ランレングスもしくは黒ランレングスを算出し、分散が最大になる角度を画像の傾きとする技術が開示されている。
また、他の従来技術として、たとえば、特許文献2には、所定の角度毎に、段階的に読み出した各ライン列の黒画素の和が最大になるライン列の角度を画像の傾きとする技術が開示されている。
特許第2701346号公報 特開平6−20093号公報
特許文献1または特許文献2が開示する技術によれば、文字だけの文書画像の傾きは検知することができるが、写真を含んだ画像の傾きを検知することはできない。入力された画像が2値画像に変換されると、文字列の方向に特徴が表れる文字部分とは異なり、写真部分の特徴は、特定の方向に表れない。写真を含んだ画像においては、適切な白ランレングス、黒ランレングス、あるいは黒画素の和を算出することが困難である。
写真を含んでいない場合であっても、文字の背景が無地でない場合には、画像の傾きを検知することは困難である。たとえば、文字の背景に、なだらかなグラデーションが存在する画像が入力された場合には、2値画像の文字列が不鮮明になり、適切な白ランレングスや黒ランレングス、あるいは黒画素の和を算出することが困難である。このように、従来の技術では画像に写真が含まれる場合、あるいは文字の背景が無地でない場合には、傾きを検知することが難しい。
さらに、入力された画像のサイズが大きくなると、白ランレングス、黒ランレングス、あるいは黒画素の和を算出する際に読み出す画素が大きくなるので処理量が大きくなる。
画像から写真を除去する処理を別途行って、写真を除去した画像を2値画像に変換すれば、特許文献1または特許文献2の技術を用いて画像の傾きを検知することもできる。しかし、画像から写真を除去する処理を別途行う必要があるので、システムが複雑になり、処理時間が長くなる。
本発明の目的は、入力装置が入力する画像情報が表す画像に写真が含まれ、あるいは文字の背景が無地でない場合においても、長い処理時間を必要とせず、画像の傾きを検知することができる画像処理装置、画像処理方法、プログラム、および記録媒体を提供することである。
本発明は、画像を表す画像情報を入力する入力手段によって入力される画像情報が示す画像をブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいて1/Nエッジ画像を作成するエッジ画像生成手段と、
前記エッジ画像生成手段によって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、前記ライン走査が行われるライン毎に画素の輝度に基づく評価値を算出し、算出したライン毎の評価値に基づいて統計値を算出し、算出した統計値から画像の傾きを推定する傾き検知手段とを含むことを特徴とする画像処理装置である。
また本発明は、前記評価値には、黒画素数が用いられることを特徴とする。
また本発明は、前記評価値には、白ランレングスの最大値が用いられることを特徴とする。
また本発明は、前記統計値は、隣接するラインのそれぞれの評価値の差分の分散である分散値が用いられ、統計値が最大となる角度を画像の傾きと推定することを特徴とする。
また本発明は、前記ライン走査は、画像の水平方向および垂直方向を基準として行われることを特徴とする。
また本発明は、画像の傾きを検知する画像処理装置で処理される画像の傾きを推定する推定方法であって、
画像を表す画像情報を入力する入力ステップと、
前記入力ステップによって入力される画像情報が示す画像をブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいて1/Nエッジ画像を作成するエッジ画像生成ステップと、
前記エッジ画像生成ステップによって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、前記ライン走査が行われるライン毎に画素の輝度に基づく評価値を算出し、算出したライン毎の評価値に基づいて統計値を算出し、算出した統計値から画像の傾きを推定する傾き検知ステップとを含むことを特徴とする画像処理方法である。
また本発明は、画像の傾きを検知する画像処理装置で処理される画像の傾きを推定するコンピュータプログラムであって
コンピュータに、
画像を表す画像情報を入力する入力ステップと、
前記入力ステップによって入力される画像情報が示す画像をブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいた1/Nエッジ画像を作成するエッジ画像生成ステップと、
前記エッジ画像生成ステップによって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、前記ライン走査が行われるライン毎に画素の輝度に基づく評価値を算出し、算出したライン毎の評価値に基づいて統計値を算出し、算出した統計値から画像の傾きを推定する傾き検知ステップとを実行させるためのプログラムである。
また本発明は、前記プログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明によれば、画像を表す画像情報を入力する入力手段によって入力される画像情報が示す画像をブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいて1/Nエッジ画像を作成するエッジ画像生成手段と、エッジ画像生成手段によって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、ライン走査が行われるライン毎に画素の輝度に基づいてエッジを表す評価値を算出し、算出したライン毎の評価値から各ライン間のエッジの数の差分を表す統計値を算出し、算出した統計値から画像の傾きを推定する傾き検知手段とを含むので、エッジが発生しやすい文字列は評価値が高くなり、エッジが発生しにくい写真部分は評価値が低くなる。画像に写真が含まれ、あるいは文字の背景が無地でない場合においても、画像の傾きを検知することができる。さらに、1/Nエッジ画像に対してライン走査を行うので画素の読み出し量が1/N2になり、処理時間を短縮することができる。
本発明の第1実施形態である画像処理装置1のブロック図である。 画像処理装置1の判定処理を示すフローチャートである。 縮小エッジ画像生成処理を示すフローチャートである。 入力装置6が入力する画像情報が示す画像の1例である画像7である。 画像7を2値画像に変換した画像8である。 画像7を縮小エッジ画像に変換した画像9である。 統計値を求める処理を示すフローチャートである。 画像10においてライン走査角度Dでの水平方向のライン走査を説明する図である。 画像7を、反時計回りに9度回転させて−9度傾けた画像11である。 入力装置6が入力する画像情報が示画像の他の例である画像12である。 画像12を2値画像に変換した画像13である。 画像12を縮小エッジ画像に変換した画像14である。 推定傾斜角度に基づいて傾斜角度を補正した画像15である。
図1は、本発明の第1実施形態である画像処理装置1のブロック図である。画像処理装置1は、制御部2と、エッジ画像生成手段である縮小エッジ画像生成部3と、傾き検知手段である傾き検出部4と、傾きテーブル5とを備え、入力手段である入力装置6が接続される。入力装置6は、画像を表す画像情報を入力する装置である。本発明に係る画像処理方法は、画像処理装置1によって処理される。
入力装置6は、たとえば携帯電話、デジタルカメラ、コピー機またはイメージスキャナのCCD(Charge Coupled Device)、あるいはCMOS(Complementary Metal Oxide
Semiconductor)イメージセンサなどである。入力装置6は、CCDイメージセンサ、CMOSイメージセンサなどで読み込まれた画像が蓄積されるシリコンメモリまたは磁気メモリから読み出してくる装置であってもよい。入力装置6は、さらに、有線あるいは無線で接続される他のコンピュータまたは記憶システムにある画像情報を受信する手段であってもよい。入力装置6は、画像処理装置1の外部に設けられ、画像処理装置1とは別個の構成としているが、これに限定されるものではなく画像処理装置1に組み込まれた構成としてもよい。
制御部2は、画像処理装置1の全体を制御する。縮小エッジ画像生成部3は、画像を表す画像情報を入力する入力手段によって入力される画像情報が示す画像を画素数がN×Nのブロックに分割し、分割した各ブロック内の画素の輝度を平均した平均輝度値を順次算出し、注目ブロックの平均輝度値と注目ブロックの直前に算出されたブロックの平均輝度値との差に基づいた1/Nエッジ画像を作成する。
傾き検出部4は、縮小エッジ画像生成部3によって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、ライン走査が行われるライン毎に画素の輝度に基づく評価値を算出し、算出したライン毎の評価値に基づいて統計値を算出し、算出した統計値から画像の傾きを推定する。傾き検出部4は、1/Nエッジ画像に対してライン走査を行うので画素の読み出し量が1/N2になり、長い処理時間を必要としない。傾きテーブル5は、ライン走査を行う際に用いられる。
1/Nエッジ画像は、黒画素と白画素とから成る。注目ブロックの平均輝度値と、注目ブロックの直前に算出されたブロックの平均輝度値との差分が閾値以上であれば黒画素がセットされる。評価値は、たとえば、黒画素の総数である黒画素数を用いて算出される。評価値は、最大の白ランレングスを用いて算出することもできる。白ランレングスとは、連続する白画素の数値であり、最大の白ランレングスとは、連続する白画素の数値が最大の白ランレングスである。
図2は、画像処理装置1の判定処理を示すフローチャートである。ステップS11で、入力装置6は、画像情報を画像処理装置1に入力する。入力装置6は、たとえば図5に示す画像8の画像情報を入力する。ステップS12で、縮小エッジ画像生成部3は、ステップS11で入力された画像情報が示す画像から縮小エッジ画像を生成する。この処理については、別途詳細に説明する。ステップS13で、傾き検出部4は、画像の傾きを検出する画像検知を開始するときの画像の傾き角度を、変数である傾き検知開始角度Diにセットする。たとえば傾き検知開始角度Di=−45度である。ステップS14で、傾き検出部4は、縮小エッジ画像生成部3がステップS12で生成した縮小エッジ画像に対して、傾き検知開始角度Diで、水平方向の統計値を算出する。水平方向の統計値を算出することによって、横書きの文字列の傾きを検知することができる。この処理については、別途詳細に説明する。
ステップS15で、傾き検出部4は、縮小エッジ画像生成部3が、ステップS12で生成した縮小エッジ画像に対して、傾き検知開始角度Diで、垂直方向の統計値を算出する。ステップS15の処理は、画像の水平方向で行われるステップS12の処理を画像の垂直方向で行うものである。垂直方向の統計値を算出することによって、縦書きの文字列の傾きを検知することができる。ステップS16では、傾き検出部4は、傾き検知開始角度Diに、傾き検知単位角度を加え、傾き検知単位角度を加えた角度を傾き検知角度Dとする。傾き検知単位角度は、傾き検知が行われる角度の間隔を表す。
ステップS17で、傾き検出部4は、傾き検知角度Dが、予め定められ傾き検知を終了させる角度である傾き検知終了角度De以下であるか否かを判定する。傾き検知角度Dが傾き検知終了角度De以下の場合には、ステップS14に戻り、傾き検知角度Dが傾き検知終了角度Deより大きい場合には、ステップS18に進む。ステップS18で、傾き検出部4は、ステップS14およびステップS15で算出された統計値のうちの最大の値を持つ傾き検知角度Dを画像の傾斜角度と推定する。
傾き検知開始角度Diは、たとえば−45度とされ、画像の傾きを検知する角度は−45度〜+45度の範囲とされる。傾き検知単位角度は1度とされるが、これに限定されるものではなく、たとえば、スキャナなどを用いる場合には画像の傾斜角度が限定されるので、画像の傾きを検知する角度を−20度〜+20度の範囲とし、傾き検知単位角度を2度とすることもできる。
傾き検知終了角度Deは+45度であるので、ステップS17で、傾き検知角度Dが+45度を超えていればステップS18に進む。傾き検知角度Dが+45度を超えていなければ、ステップS14に進む。−10度とは、画像が水平方向から反時計回りに10度傾いていることを示し、+10度とは、画像が水平方向から時計回りに10度傾いていることを示す。
なお、一般的なOCR(Optical Character Reading)処理では、内部に90度単位で画像の東西南北のどちらが上かを判定する天地方向判定処理を行っている。したがって、本実施形態において、画像の傾きを検知する角度範囲を−45度から+45度とすることと、天地方向判定処理とを組み合わせることによって、いかなる方向に画像が傾いていてもOCR処理が可能になる。
図3は、縮小エッジ画像生成処理を示すフローチャートである。図2に示すステップS11で、入力装置6が画像情報を画像処理装置1に入力したとき、ステップS21に移る。
ステップS21で、縮小エッジ画像生成部3は、入力された画像情報が示す画像から順次ブロックを取り出す処理を行う。本実施例ではN=8として、画素数8x8のブロックが取り出される。なお、Nの値はN=8に限定されることはなく他の値でもよい。取り出されるブロックも画素数8x8などの正方形のものに限定されるものではなく、たとえば画素数8×4の長方形のものでもよい。
ステップS22で、縮小エッジ画像生成部3は、ステップS21で取り出したN×Nのブロックの平均輝度値を求める処理をする。入力された画像情報が示す画像がRGB(Red
Green Blue)24ビットで表される場合には、輝度値YはY=0.3×R+0.59×G+0.11×Bで計算され、Y=0〜255の値になる。また入力画像がYCbCrで表される場合はYの値が輝度値である。平均輝度値は、対象のブロックに含まれるN×N画素の輝度値の平均値を取ることによって算出することができる。本実施形態において、平均輝度値は、8×8=64画素の輝度値の平均値を取ることによって算出される。
ステップS23で、縮小エッジ画像生成部3は、ステップS22で求めた注目ブロックの平均輝度値と、注目ブロックの直前に算出されたブロックの平均輝度値との差分を算出する。また、縮小エッジ画像生成部3は、算出された差分が閾値α以上であるか否かを判定する。
本実施形態においてはα=20とするが、これに限定されるものではない。算出された差分がα以上であればステップS24に進む。ステップS24で、縮小エッジ画像生成部3は、注目ブロックと注目ブロックの直前に算出されたブロックとの間にエッジがあったとして黒画素をセットする。算出された差分がα未満であれば、ステップS25に進む。ステップS25で、縮小エッジ画像生成部3は、注目ブロックと注目ブロックの直前に算出されたブロックとの間にエッジがなかったとして白画素をセットする。
縮小エッジ画像生成部3は、ステップS24またはステップS25で、黒画素または白画素をセットした後に、ステップS26に進む。ステップS26で、縮小エッジ画像生成部3は、画像のすべてのブロックを取り出したか否かを判定する。縮小エッジ画像生成部3は、画像にブロックが残っていない場合には処理を終了し、画像にブロックが残っている場合には、ステップS21に戻り画像からブロックを取り出す処理を続ける。
本実施形態において、縮小エッジ画像生成部3は、各ブロックの平均輝度値を求め、注目ブロックの平均輝度値と、注目ブロックの直前に算出されたブロックの平均輝度値との差分を算出し、算出した差分に基づいて1/Nエッジ画像を生成するが、これに限定されるものではない。注目ブロック内の画素について、輝度値が所定の値(たとえば50)以下あるいは所定の値(たとえば200)以上である画素の数をカウントし、カウントした数の総数を算出する。注目ブロックについて算出した総数と、注目ブロックに隣接するブロックについてカウントした数の総数との差分が、所定の値以上であれば黒画素をセットし所定の値以下であれば白画素をセットして、1/Nエッジ画像を生成するものでもよい。
図4は、入力装置6が入力する画像情報が示す画像の1例である画像7である。文字の背景は、なだらかなグラデーションとされ、文字列の上部には写真が存在する。
図5は、画像7を2値画像に変換した画像8である。文字列が不鮮明になり、2値画像から適切な白ランレングスや黒ランレングス、あるいは黒画素の和を算出することができない。
図6は、図4に示す画像の縮小エッジ画像を示す図である。エッジは文字列に多く存在し、文字列と文字列の行間にはエッジが現れない。写真部分において、エッジは文字部分とは異なり特定の方向に現れにくい。
図7は、統計値を求める処理を示すフローチャートである。傾き検出部4は、図2に示すステップS12で生成した縮小エッジ画像に対してライン走査を行う。ステップS31で、傾き検出部4は、ライン走査を行う際の制御カウンタLを初期化し変数Lに「1」をセットする。ステップS32で、傾き検出部4は、角度DでラインLを走査し評価値を算出する。評価値は、黒画素数が用いられる。
ステップS33で、傾き検出部4は、変数Lの値に「1」を加算する。ステップS34で、傾き検出部4は、ライン走査が終わったか否か判定する。水平方向のライン走査の場合に、ラインLが縮小エッジ画像の下端まで達していれば、傾き検出部4は、ラインLを走査して処理を終了する。ラインLが縮小エッジ画像の下端まで達していなければ、傾き検出部4は、ステップS32に戻り変数Lの値に「1」が加算されたラインを走査して処理を続ける。
ステップS35で、傾き検出部4は、ライン毎に注目ラインの評価値と注目ラインの直前に算出されたラインの評価値との差分を求め、差分の絶対値を要素とした分散値を算出する。文字列においては、写真部分に比べて分散値が大きくなる。傾き検知角度Dが0度との分散値の比率が一定以上でない場合には、回転角度は不明としても良い。
ステップS36で、傾き検出部4は、ステップS35で求めた分散値を補正し、補正した分散値を統計値とする。傾き検出部4は、縮小エッジ画像が正方形でない場合には、縮小エッジ画像の水平方向の幅と垂直方向の高さとの違いに基づいて補正される。
水平方向のライン走査については、
統計値=分散値÷縮小エッジ画像の幅×100000
とされ、垂直方向のライン走査については、
統計値=分散値÷縮小エッジ画像の高さ×100000
とされる。
エッジが発生しやすい文字列はエッジを表す黒画素の数が多いので評価値が高くなり、エッジが発生しにくい写真部分では、エッジを表す黒画素の数が少ないので評価値は低くなる。画像に写真が含まれ、あるいは文字の背景が無地でない場合においても、画像の傾きを検知することができる。
図8は、画像10においてライン走査角度Dでの水平方向のライン走査を説明する図である。ライン走査は、ラインL=1で開始される。ラインL=mは、m番目の走査ラインを示す。n番目の走査ラインであるラインL=nでは、ラインL=nがライン走査の途中で画像の下端まで達している。傾き検出部4は、引き続き画像の上端からライン走査を再開し画像の右端までライン走査を行う。傾き検出部4は、ラインL=nを走査して処理を終了する。
表1は、傾きテーブル5を示す。傾き検出部4がライン走査を行う際には、傾きテーブル5が用いられる。
傾き検出部4は、傾きテーブル5を用いることによってtanの計算を行う必要がなくなるので、傾き検出処理の高速化を図ることができる。傾きテーブル5は、図8に示す角度Dにおける位置xでの走査位置yを表にしたものである。例えば角度8度において、位置x=20での走査位置yの位置は3であることがわかる。
表2は、傾き検知角度毎の最大統計値を示す図である。図4に示す画像情報が示す画像は、図2に示すステップS12で、縮小エッジ画像に変換される。傾き検出部4は、ステップS13〜ステップS17の処理によって統計値を出力する。
表2によれば、傾き検知角度毎の水平方向の最大統計値は「192」である。最大統計値「192」の傾き検知角度Dは9度であり、傾き検知角度Dである9度が画像の傾斜角度と推定される。
図9は、画像7を、反時計回りに9度回転させて−9度傾けた画像11である。図9に示す画像の文字列は水平方向に並び、推定傾斜角度9度が実際の傾斜角度と一致していることがわかる。なお、図7に示すステップS32の処理において、ライン走査の評価値として黒画素を用いたが、最大の白ランレングスをライン走査の評価値として用いても良い。
図10は、入力装置6が入力する画像情報が示す画像の他の1例である画像12である。画像は、写真と文字とを含む。図11は、画像12を2値画像に変換した画像13である。図10に示す画像12は、縮小エッジ画像を作成するために2値画像に変換される。図12は、画像12を縮小エッジ画像に変換した画像14である。画像の文字部分で、エッジは、文字列に多く存在し、文字列と文字列との行間にはエッジが現れない。写真部分において、エッジは、文字部分のように特定の方向に多く現れるものではない。図13は、推定傾斜角度に基づいて傾斜角度を補正した画像15である。図13に示す画像の文字列は水平方向に並び、推定傾斜角度が実際の傾斜角度と一致していることがわかる。
表3は、黒画素数の分散を評価値として傾きの検知率を評価した結果を示す。雑誌などから、写真を含み傾きのない文書画像439枚が取り出される。取り出した文書画像を、予め−40度〜−10度の範囲および10度〜40度の範囲においては10度単位で回転させ、−10度〜10度の範囲においては5度単位で回転させる。回転させた総数4829枚の画像を評価画像として、評価画像の予め定められた傾きが正しく検知されるか否かを評価したものである。
総数4829枚の評価画像のうち、99.7%の評価画像について傾きが正しく検知されており、高い精度で画像の傾きを検知することができる本実施例の有効性の高さを示している。
表4は、表3で用いられた画像と同じ画像に対して、ライン走査の際の評価値を最大の白ランレングスとして評価したものである。
総数4829枚の評価画像のうち、97.0%の評価画像について傾きが正しく検知された。この結果から、黒画素数を用いた場合と同様、高い精度で画像の傾きを検知することができ、本実施例の有効性の高さを示すものである。
このように、本発明によれば、画像に写真などが含まれる文書画像であっても、縮小エッジ画像のエッジの偏りの分散値に基づいた統計値を利用することによって、画像の傾きを検知することができる。
画像処理装置1は、たとえばコンピュータによって構成される。画像処理装置1を構成するコンピュータは、入力装置、出力装置、記憶装置および中央処理装置(Central
Processing Unit:以下「CPU」という)を含んで構成される。
入力手段である入力装置は、たとえばキーボードおよびマウスなどによって構成され、情報を入力する。表示手段である出力装置は、たとえば液晶ディスプレイなどの表示装置あるいはプリンタなどの印刷装置によって構成され、情報を出力する。記憶装置は、たとえば半導体メモリおよびハードディスク装置などによって構成され、画像処理装置1を制御するためのプログラムおよび画像処理装置1を制御するために必要なデータを記憶する。
CPUは、記憶装置に記憶されるプログラムを実行することによって、入力装置および出力装置を制御し、縮小エッジ画像生成部3、傾き検出部4、傾きテーブルなどの機能を実現する。画像処理装置1を構成するコンピュータは、一般的に用いられるものであり、詳細な説明は省略する。
上述した実施の形態では、プログラムは、コンピュータの記憶装置たとえば半導体メモリあるいはハードディスク装置などの記憶装置に記憶されているが、これらの記憶装置に限定されるものではなく、コンピュータで読取り可能な記録媒体に記録されていてもよい。記録媒体は、たとえば図示しない外部記憶装置としてプログラム読取装置を設け、そこに記録媒体を挿入することによって読取り可能な記録媒体であってもよいし、あるいは他の装置の記憶装置であってもよい。
いずれの記録媒体であっても、記憶されているプログラムがコンピュータからアクセスされて実行される構成であればよい。あるいはいずれの記録媒体であっても、プログラムが読み出され、読み出されたプログラムが、記憶装置のプログラム記憶エリアに記憶されて、そのプログラムが実行される構成であってもよい。さらに通信ネットワークを介して他の装置からダウンロードされてプログラム記憶エリアに記憶させてもよい。ダウンロード用のプログラムは、予めコンピュータの記憶装置に記憶しておくか、あるいは別な記録媒体からプログラム記憶エリアにインストールしておく。
本体と分離可能に構成される記録媒体は、たとえば磁気テープ/カセットテープなどのテープ系の記録媒体、フレキシブルディスク/ハードディスクなどの磁気ディスクもしくはCD−ROM(Compact Disk Read Only Memory)/MO(Magneto Optical disk)/MD(Mini Disc)/DVD(Digital Versatile Disk)などの光ディスクのディスク系の記録媒体、IC(Integrated Circuit)カード(メモリカードを含む)/光カードなどのカード系の記録媒体、またはマスクROM/EPROM(Erasable Programmable Read Only Memory)/EEPROM(Electrically Erasable Programmable Read Only
Memory)/フラッシュROMなどの半導体メモリを含む固定的にプログラムを担持する記録媒体であってもよい。したがって、本発明は、コンピュータに画像修理方法の各ステップを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体として提供することができる。
このように、画像を表す画像情報を入力する入力装置6によって入力される画像情報が示す画像をブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいて1/Nエッジ画像を作成する縮小エッジ画像生成部3と、縮小エッジ画像生成部3によって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、ライン走査が行われるライン毎に画素の輝度に基づいてエッジを表す評価値を算出し、算出したライン毎の評価値から各ライン間のエッジの数の差分を表す統計値を算出し、算出した統計値から画像の傾きを推定する傾き検出部4とを含むので、エッジが発生しやすい文字列は評価値が高くなり、エッジが発生しにくい写真部分は評価値が低くなる。画像に写真が含まれ、あるいは文字の背景が無地でない場合においても、画像の傾きを検知することができる。さらに、1/Nエッジ画像に対してライン走査を行うので画素の読み出し量が1/N2になり、処理時間を短縮することができる。
さらに、評価値には、黒画素数が用いられるので、高い精度で画像の傾きを検知することができる。
さらに、評価値には、白ランレングスの最大値が用いられるので、高い精度で画像の傾きを検知することができる。
さらに、統計値は、隣接するラインのそれぞれの評価値の差分の分散である分散値が用いられ、統計値が最大となる角度を画像の傾きと推定するので、エッジが発生しやすい文字列は評価値が高くなり、エッジが発生しにくい写真部分は評価値が低くなり、画像に写真が含まれ、あるいは文字の背景が無地でない場合においても、画像の傾きを検知することができる。
さらに、ライン走査は、画像の水平方向および垂直方向を基準として行われるので、水平方向および垂直方向の統計値を算出することによって、横書きおよび縦書きの文字列の傾きを検知することができる。
さらに、画像を表す画像情報を入力する入力ステップS11と、入力ステップS11によって入力される画像情報が示す画像をブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいて1/Nエッジ画像を作成するエッジ画像生成ステップS12と、エッジ画像生成ステップS12によって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、ライン走査が行われるライン毎に画素の輝度に基づいてエッジを表す評価値を算出し、算出したライン毎の評価値から各ライン間のエッジの数の差分を表す統計値を算出し、算出した統計値から画像の傾きを推定する傾き検知ステップS18とを含むので、エッジが発生しやすい文字列は評価値が高くなり、エッジが発生しにくい写真部分は評価値が低くなるので、画像に写真が含まれ、あるいは文字の背景が無地でない場合においても、画像の傾きを検知することができ、1/Nエッジ画像に対してライン走査を行うので画素の読み出し量が1/Nになり、長い処理時間を必要としない画像処理方法を提供することができる。
さらに、画像を表す画像情報を入力する入力ステップS11と、入力ステップS11によって入力される画像情報が示す画像を画素数がブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいて1/Nエッジ画像を作成するエッジ画像生成ステップS12と、エッジ画像生成ステップS12によって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、ライン走査が行われるライン毎に画素の輝度に基づいてエッジを表す評価値を算出し、算出したライン毎の評価値から各ライン間のエッジの数の差分を表す統計値を算出し、算出した統計値から画像の傾きを推定する傾き検知ステップS18とを含むので、エッジが発生しやすい文字列は評価値が高くなり、エッジが発生しにくい写真部分は評価値が低くなるので、画像に写真が含まれ、あるいは文字の背景が無地でない場合においても、画像の傾きを検知することができ、1/Nエッジ画像に対してライン走査を行うので画素の読み出し量が1/Nになり、長い処理時間を必要としないプログラムを提供することができる。
さらに、前記プログラムを記録したコンピュータ読み取り可能な記録媒体を提供することができる。
1 画像処理装置
2 制御部
3 縮小エッジ画像生成部
4 傾き検出部
5 傾きテーブル
6 入力装置
7,8,9,10,11,12,13,14,15 画像

Claims (8)

  1. 画像を表す画像情報を入力する入力手段によって入力される画像情報が示す画像をブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいて1/Nエッジ画像を作成するエッジ画像生成手段と、
    前記エッジ画像生成手段によって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、前記ライン走査が行われるライン毎に画素の輝度に基づいてエッジを表す評価値を算出し、算出したライン毎の評価値から各ライン間のエッジの数の差分を表す統計値を算出し、算出した統計値から画像の傾きを推定する傾き検知手段とを含むことを特徴とする画像処理装置。
  2. 前記評価値には、黒画素数が用いられることを特徴とする請求項1に記載の画像処理装置。
  3. 前記評価値には、白ランレングスの最大値が用いられることを特徴とする請求項1に記載の画像処理装置。
  4. 前記統計値は、隣接するラインのそれぞれの評価値の差分の分散である分散値が用いられ、統計値が最大となる角度を画像の傾きと推定することを特徴とする請求項1〜3のいずれか1つに記載の画像処理装置。
  5. 前記ライン走査は、画像の水平方向および垂直方向を基準として行われることを特徴とする請求項1〜4のいずれか1つに記載の画像処理装置。
  6. 画像の傾きを検知する画像処理装置で処理される画像の傾きを推定する推定方法であって、
    画像を表す画像情報を入力する入力ステップと、
    前記入力ステップによって入力される画像情報が示す画像をブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいて1/Nエッジ画像を作成するエッジ画像生成ステップと、
    前記エッジ画像生成ステップによって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、前記ライン走査が行われるライン毎に画素の輝度に基づいてエッジを表す評価値を算出し、算出したライン毎の評価値から各ライン間のエッジの数の差分を表す統計値を算出し、算出した統計値から画像の傾きを推定する傾き検知ステップとを含むことを特徴とする画像処理方法。
  7. 画像の傾きを検知する画像処理装置で処理される画像の傾きを推定するコンピュータプログラムであって
    コンピュータに、
    画像を表す画像情報を入力する入力ステップと、
    前記入力ステップによって入力される画像情報が示す画像をブロックに分割し、分割された各ブロック内の画素の輝度値を算出し、注目ブロックの輝度値と注目ブロックに隣接するブロックの輝度値との差に基づいて1/Nエッジ画像を作成するエッジ画像生成ステップと、
    前記エッジ画像生成ステップによって生成される1/Nエッジ画像に対して、予め定める角度毎にライン走査を行い、前記ライン走査が行われるライン毎に画素の輝度に基づいてエッジを表す評価値を算出し、算出したライン毎の評価値から各ライン間のエッジの数の差分を表す統計値を算出し、算出した統計値から画像の傾きを推定する傾き検知ステップとを実行させるためのプログラム。
  8. 請求項7に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2009072928A 2009-03-24 2009-03-24 画像処理装置、画像処理方法、プログラム、および記録媒体 Pending JP2010224987A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009072928A JP2010224987A (ja) 2009-03-24 2009-03-24 画像処理装置、画像処理方法、プログラム、および記録媒体
US12/729,483 US20100246972A1 (en) 2009-03-24 2010-03-23 Image processing apparatus, image processing method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009072928A JP2010224987A (ja) 2009-03-24 2009-03-24 画像処理装置、画像処理方法、プログラム、および記録媒体

Publications (1)

Publication Number Publication Date
JP2010224987A true JP2010224987A (ja) 2010-10-07

Family

ID=42784336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009072928A Pending JP2010224987A (ja) 2009-03-24 2009-03-24 画像処理装置、画像処理方法、プログラム、および記録媒体

Country Status (2)

Country Link
US (1) US20100246972A1 (ja)
JP (1) JP2010224987A (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9298979B2 (en) * 2008-01-18 2016-03-29 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US10685223B2 (en) 2008-01-18 2020-06-16 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US10102583B2 (en) 2008-01-18 2018-10-16 Mitek Systems, Inc. System and methods for obtaining insurance offers using mobile image capture
KR101336736B1 (ko) * 2008-08-22 2013-12-04 정태우 영상에 포함된 객체를 식별하는 방법
JP2011055284A (ja) * 2009-09-02 2011-03-17 Seiko Epson Corp 画像処理装置、画像処理方法、および、プログラム
JP5487813B2 (ja) * 2009-09-02 2014-05-14 セイコーエプソン株式会社 画像処理装置、画像処理方法、および、プログラム
CN104063875B (zh) * 2014-07-10 2017-07-28 深圳市华星光电技术有限公司 增强视频图像光滑度及清晰度的超分辨率重构方法
JP2017151493A (ja) * 2016-02-22 2017-08-31 富士ゼロックス株式会社 画像処理装置、画像読み取り装置及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256081A (ja) * 1988-08-22 1990-02-26 Fuji Xerox Co Ltd 文書傾き補正装置
JP2004128643A (ja) * 2002-09-30 2004-04-22 Matsushita Electric Ind Co Ltd 画像の傾き補正方法
JP2006127159A (ja) * 2004-10-28 2006-05-18 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム及び記憶媒体
JP2007201948A (ja) * 2006-01-27 2007-08-09 Casio Comput Co Ltd 撮像装置、画像処理方法及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9711022D0 (en) * 1997-05-28 1997-07-23 Rank Xerox Ltd Text/image selection from document images
US6922487B2 (en) * 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
JP4840066B2 (ja) * 2006-10-11 2011-12-21 セイコーエプソン株式会社 回転角度検出装置、および回転角度検出装置の制御方法
WO2009008174A1 (ja) * 2007-07-12 2009-01-15 Panasonic Corporation 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体、および、画像処理プロセッサ

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256081A (ja) * 1988-08-22 1990-02-26 Fuji Xerox Co Ltd 文書傾き補正装置
JP2004128643A (ja) * 2002-09-30 2004-04-22 Matsushita Electric Ind Co Ltd 画像の傾き補正方法
JP2006127159A (ja) * 2004-10-28 2006-05-18 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム及び記憶媒体
JP2007201948A (ja) * 2006-01-27 2007-08-09 Casio Comput Co Ltd 撮像装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
US20100246972A1 (en) 2010-09-30

Similar Documents

Publication Publication Date Title
JP2010224987A (ja) 画像処理装置、画像処理方法、プログラム、および記録媒体
JP5951367B2 (ja) 撮像装置、撮像画像処理システム、プログラムおよび記録媒体
US10115178B2 (en) Image processing apparatus, image capturing apparatus, image processing method, and storage medium
JP5547243B2 (ja) 画像処理装置、プログラムおよび記録媒体
JP4772889B2 (ja) 携帯端末装置、撮像画像処理システム、プログラムおよび記録媒体
KR20070098511A (ko) 화상처리장치, 화상처리방법 및 촬상장치
JP6172935B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2004023158A (ja) 画像撮像装置
JP6021665B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP2019040617A (ja) 画像処理装置および画像処理方法
KR102311367B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 프로그램
KR100867049B1 (ko) 화상 보정 장치 및 화상 보정 방법
US8334919B2 (en) Apparatus and method for digital photographing to correct subject area distortion caused by a lens
JP2005006255A (ja) 画像撮像装置
JP2009089220A (ja) 撮像装置
US20130076940A1 (en) Photographing apparatus and method of detecting distortion thereof
JP5564961B2 (ja) 撮像装置
KR20080021468A (ko) 촬상장치 및 이에 적용되는 촬상방법
US20160275345A1 (en) Camera systems with enhanced document capture
JP2001136438A (ja) 画像処理装置および画像処理方法ならびに画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2000276581A (ja) 画像処理装置および画像処理方法ならびに画像処理プログラムを記録した記録媒体
JP4043499B2 (ja) 画像補正装置及び画像補正方法
JP2010273218A (ja) 画像出力装置、撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP2015055988A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2005295313A (ja) コード読取装置、電子機器、パラメータの調整方法及びパラメータ調整プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111129