JP6494166B2 - 画像処理装置、画像処理方法およびプログラム - Google Patents

画像処理装置、画像処理方法およびプログラム Download PDF

Info

Publication number
JP6494166B2
JP6494166B2 JP2014049311A JP2014049311A JP6494166B2 JP 6494166 B2 JP6494166 B2 JP 6494166B2 JP 2014049311 A JP2014049311 A JP 2014049311A JP 2014049311 A JP2014049311 A JP 2014049311A JP 6494166 B2 JP6494166 B2 JP 6494166B2
Authority
JP
Japan
Prior art keywords
objects
document
candidate
image processing
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014049311A
Other languages
English (en)
Other versions
JP2015173418A (ja
Inventor
水城 早川
水城 早川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014049311A priority Critical patent/JP6494166B2/ja
Priority to US14/633,537 priority patent/US9471842B2/en
Publication of JP2015173418A publication Critical patent/JP2015173418A/ja
Application granted granted Critical
Publication of JP6494166B2 publication Critical patent/JP6494166B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、原稿が読み取られることで得られた読取画像において当該原稿に対応する原稿領域の候補を決定する画像処理装置、画像処理方法およびプログラムに関する。
従来、画像読取装置に置載された原稿に対応する原稿領域を検出する方法として、読み取った原稿を二値化し、ラベリングや射影により分割して切り出す方法が行われていた。特許文献1には、読取画像において原稿のエッジを検出することで、上記原稿領域を検出することが記載されている。
特開2010−035162号公報
しかしながら、従来の原稿切り出し方法では、原稿と原稿を押さえる圧着シートとのコントラスト差を検出するので、一定のコントラスト差が得られなければ原稿領域を特定できない場合がある。例えば、レシート用紙などの薄く白い紙に印刷された原稿では、原稿と圧着シートとの境界が不明確なことがあるので原稿領域を特定できない場合がある。
本発明の目的は、このような従来の問題点を解決することにある。上記の点に鑑み、本発明は、読取画像において原稿に対応する原稿領域の候補を適切に決定する画像処理装置、画像処理方法およびプログラムを提供することを目的とする。
上記課題を解決するため、本発明に係る画像処理装置は、複数の原稿を読取装置が読み取ることで得られた、当該複数の原稿のそれぞれに対応する原稿領域を含む読取画像を取得する取得手段と、前記取得手段により取得された読取画像のうちの、輝度値で表された場合に所定の輝度値より小さい輝度値となる画素群に基づいて、当該読取画像において複数のオブジェクトを特定する特定手段と、前記特定手段により特定された複数のオブジェクトに含まれる複数の第1オブジェクトにおいて、各オブジェクト間の傾きの差分が第1の所定範囲となり、且つ、前記複数のオブジェクトに含まれる複数の第2オブジェクトにおいて、各オブジェクト間の傾きの差分が前記第1の所定範囲となり、且つ、前記複数の第1オブジェクトと前記複数の第2オブジェクトの間の傾きの差分が前記第1の所定範囲外となり、且つ、前記複数の第1オブジェクトにおいて、各オブジェクト間の距離が第2の所定範囲となり、且つ、前記複数の第2オブジェクトにおいて、各オブジェクト間の距離が前記第2の所定範囲となり、且つ、前記複数の第1オブジェクトと前記複数の第2オブジェクトの間の距離が前記第2の所定範囲外となることを条件として、前記複数の第1オブジェクトを含む第1の原稿領域の候補および前記複数の第2オブジェクトを含む第2の原稿領域の候補を決定する決定手段とを備えることを特徴とする。
本発明によると、読取画像において原稿に対応する原稿領域の候補を適切に決定することができる。
システム構成を示す図である。 ホストPCの概略構成を示す図である。 画像読取の処理の手順を示すフローチャートである。 S308の処理の手順を示すフローチャートである。 ラベルの統合化を説明するための図である。 ラベルの角度の決定を説明するための図である。
以下、添付図面を参照して本発明の好適な実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。なお、同一の構成要素には同一の参照番号を付して、説明を省略する。
図1は、本実施形態におけるシステム構成を示す図である。本システムは、画像読取装置100とホストPC150とを含む。画像読取装置100は、原稿台に置かれた原稿用紙である原稿101を光学的に読み取って画像データを生成する。光源ランプ111は、光源点灯回路110からの信号により、不図示の原稿台上の原稿101に対して読取用の光を照射する。照射された光は原稿101で反射し、その反射光は、結像レンズ102を介して、固体撮像素子103上に結像される。固体撮像素子103は、CCDセンサ等のラインイメージセンサ(ラインセンサ)である。以下、固体撮像素子103をCCD103ともいう。画像読取装置100の原稿台上には、原稿の読取領域を覆うようにカバー(蓋部)が設けられており、そのカバーは、読取領域と対面となる位置に白色領域が設けられている。光源からの光は、原稿101、および原稿101の背景となる白色領域に反射し、ラインイメージセンサにより受光される。
また、画像読取装置100の原稿台上の読取領域の上方に、原稿給紙装置が搭載されていても良い。その場合には、ラインイメージセンサが搭載されたキャリッジを所定の読取位置に固定的に位置させ、その上方を複数枚の原稿を通過させつつ原稿画像を読み取ることができる。キャリッジの固定位置に対応する読取位置の上方には、白色基準を得るための白色基準板若しくは白色ローラがラインイメージセンサのライン方向に設けられている。
増幅器104は、CCD103から出力された読取画像に対応するアナログ信号を増幅して後段に出力する。A/D変換器105は、増幅器104から出力されたアナログ信号をデジタル信号に変換する。画像処理回路106は、A/D変換器105から出力されたデジタル信号の画像データに対して各種画像処理を行う。画像処理回路106は、例えば、オフセット補正、シェーディング補正、デジタルゲイン調整、カラーバランス調整、カラーマスキング変換、主走査方向及び副走査方向の解像度変換を行う。また、後述する、基準となる輝度値に対する二値化処理や、ラベリング処理、ラベル統合処理、切出処理等も画像処理回路106で行われる。
バッファメモリ107は、例えばRAMであり、画像処理回路106の画像処理後の画像データを一時的に記憶する。圧縮回路120は、バッファメモリ107に記憶された画像データを圧縮する。バッファメモリ121も、例えばRAMであり、圧縮回路120の圧縮後の画像データを一時的に記憶する。バッファメモリ121は、画像読取装置100からホストPC150への転送を待機するためのメモリとして用いられる。インタフェース回路108は、ホストPC150との間で各種コマンドやデータ等を送受信する。インタフェース回路108として、SCSI、パラレル、USB、IEEE1394、LAN、無線LAN等が用いられる。
作業用メモリ114は、画像処理回路106が画像処理を行う際の一時的なワーキングメモリである。例えば、作業用メモリ114は、ラインイメージセンサ103上に所定のオフセットで平行に配置されて配置されているRGB用の各ラインセンサからの画像信号に生じるRGBライン間オフセットを補正するために用いられる。さらに、作業用メモリ114は、シェーディング補正等において各種データを一時的に記憶するためにも用いられる。ガンマRAM115は、濃度ガンマ変換ルックアップテーブル(LUT)を記憶しており、ガンマ補正のために用いられる。
コントローラ109は、CPUやMPU等を含み、ホストPC150から送信された命令コマンドに従って、図1の各部を含む画像読取装置100全体を統括的に制御する。操作パネル116は、ディスプレイやハードキー等であり、例えば、ユーザは、ディスプレイ上に表示された設定画面により、各種読取設定を設定することができる。操作パネル116が受け付けたユーザからの操作情報(ボタン押下等)は、コントローラ109に出力される。また、その操作情報は、インタフェース回路108を介して、ホストPC150に送信されることもできる。
モータ駆動回路112は、光源ランプ111、CCD103、結像レンズ102等が搭載された読取用のキャリッジ(不図示)を駆動させるモータ113を制御する。モータ113は例えばステッピングモータであり、モータ駆動回路112は、コントローラ109からの制御信号によりモータ113に励磁信号を出力する。キャリッジは、ベルトやガイドシャフト等の駆動機構に設けられており、原稿台に対して相対的に移動することができる。また、画像読取装置100は、上述のように、キャリッジを所定の読取位置に固定的に位置させ、その上方を複数枚の原稿を通過させつつ原稿画像を読み取ることもできる。
画像読取装置100は、RGBの3色を読み取るための3ラインCCDセンサ103と白色光源111の構成により、原稿の読取りを行う。しかしながら、単色の1ラインイメージセンサと、選択的に点灯可能なRGB3色の光源の構成により、原稿の読み取りを行うようにしても良い。その場合には、コントローラ109は、光源点灯回路110により3色の光源LEDの1色を点灯し、その光源により照射された光の反射光をイメージセンサにより受光する。そして、点灯するLEDを順次切り替えながら原稿を読み取ることにより、原稿画像を光源の発色光により色分解して読み取ることができる。
ホストPC150は、モニタディスプレイ151と接続されており、画像読取装置100を動作させるための各種設定画面等を表示することができる。
図2は、ホストPC150の概略構成を示す図である。ホストPC150は、例えば汎用的なPCであり、図1に示す構成においては、画像読取装置100を制御するために用いられる。ホストPC150は、中央処理装置(CPUやMPU等)51と、ROM52と、RAM53と、ディスク装置54と、バス55と、I/F56、57と、外部記憶装置58とを含む。ROM52は、本実施形態の動作を実現するためのプログラムを記憶する。RAM53は、そのプログラムを実行するために必要な記憶領域とワークエリアとして用いられる。中央処理装置51は、ROM52に記憶されているプログラムをRAM53に展開して実行する。
バス55は、上記の各ブロックをデータの送受信が可能なように接続する。インタフェース(I/F)56は、画像読取装置100と通信を行うためのインタフェースである。画像読取装置100のインタフェース回路108と同様に、USB、IEEE1394等、各種のインタフェースの態様で実現される。I/F57は、ポインティングデバイスやキーボード等の入力部61と接続されている。また、外部記憶装置58は、DVD−ROMやCD−ROM等の外部記憶媒体を駆動する。ROM52にプログラムを記憶しておく代わりに、I/F57により外部記憶媒体に記憶されている各種プログラムを読み出してダウンロードするようにしても良い。また、不図示のネットワークコネクタを介して、ネットワーク経由でプログラムをダウンロードするようにしても良い。
本実施形態の動作は、上記のように、ホストPC150で実現されても良いし、画像読取装置100のコントローラ109により実現されても良いし、両装置により実現されても良い。両装置で実現される場合には、画像読取装置100が読取部として機能する。
図3及び図4は、ホストPC150から指示された画像読取を、画像読取装置100で行う処理の手順を示すフローチャートである。まず、S301では、ユーザは、原稿を画像読取装置100の原稿台に置載し、操作パネル116上で読取動作(スキャン)の開始を指示する。すると、画像読取装置100のコントローラ109による制御によって、原稿が読み取られ、当該原稿に対応する原稿領域を含む読取画像が、作業用メモリ114に生成される。
本実施形態においては、図5(b)に示すような複数の白色のレシート用紙を原稿として原稿台に置くこととする。また、その際に、コントローラ109は、原稿の置載方法として原稿同士が接触しないよう、例えば10mm以上間隔を以って置載するように通知する通知画面を操作パネル116に表示する。また、ユーザに通知する方法は、ユーザに対する各種媒体のアナウンス情報など他の方法で実現されても良い。
S302では、光源ランプ111及びCCD103により原稿を読み取って、画像データを取得する。そして、取得した画像データを二値化する。図5(a)は、二値化された結果を示す図である。二値化処理は、例えば、読み取られた輝度値が所定の閾値に対して閾値以上であるか否かを判定することにより行われても良い。図5(a)に示す点線は、説明のために付記したものである。実際には、白色のレシート用紙の薄い境界を検出することはできず、そのため、二値化処理されたデータには現れない。
図5(b)は、実際の原稿領域を示すものである。図5(b)に示すように、S301でユーザは、2枚のレシート用紙502及び503を原稿台における任意の位置に、任意の傾きで置載している。S303では、二値化処理されたデータに対してラベリング処理を実行する。ラベリング処理は、図5(a)に示すような二値化された各画素について、互いに隣接する同じ値(例えば輝度値)の画素をグループ化し、その画素群を原稿に含まれているオブジェクトとして特定するために行われる。具体的には、二値化された読取画像において「黒:輝度値0」と判定された画素群のうち、連続する画素群を特定する。さらに、そのように特定された複数の画素群のうち、距離が近い(例えば距離が閾値C未満)の画素群を、同一文字に含まれる画素群としてグループ化する。
1つのグループ内の画素群には、同じラベル値が付与される。また、ラベリング処理において、他のグループ化された画素群を発見した場合には、それまでの付与に用いられたラベル値のうち最大のものをインクリメントした値を付与する。その結果、ラベリング処理終了時には、グループ間では互いに異なるラベル値が付与され、かつ、画像データ内で最大のラベル値がラベル総数を表すことになる。図5(c)は、ラベリング結果を示す図であり、矩形504で囲まれた領域が同じラベル値が付与された領域を表しており、文字ごとの領域におおよそ対応している。
S304では、以降のループ処理に用いられる、ラベル値を表す変数の初期化が行われる。ここでは、ラベルi及びjと、ラベル総数Lが設定され初期化される。ラベル総数Lは、S303の処理により取得されるラベルの総数である。また、i=1、j=i+1として初期化が行われる。また、S305〜S307のループ処理は、例えば、ラベル1とラベル2、ラベル2とラベル3、といったように、ラベル間の組み合わせで順次行われる。
S305では、ラベルiとラベルjの間の距離が閾値Aより小さいか否かを判定する。最初のループ処理の場合には、ラベル1とラベル2の間の距離について判定される。ここで、ラベル間の距離として、例えば、各ラベル領域の重心間の距離が用いられても良い。また、各ラベル領域を内包する矩形の各頂点同士の最短の長さが用いられても良い。本実施形態では、閾値は、S301でユーザに通知した値に対応する10mmであるが、他の値が用いられても良い。またこの閾値は距離に限らず、例えば読取画像における画素数であってもよい。即ちS305では、ラベル間の画素数が所定の画素数を越えるか否かを判定してもよい。また、距離に対応する画素数は、読み取り解像度に応じて異なる。そこで、当該読取における読み取り解像度に応じた閾値(画素数)を動的に算出し、算出された閾値(画素数)を用いてもよい。この場合、例えば読み取り解像度に関わらず実際の距離が一定となるように、閾値(画素数)を決定してもよい。
さらに、上記S305では、S303における処理により、距離が閾値C未満の画素群が1文字に含まれる画素群として既にグループ化されている。そのため、距離Aを距離Cより大きな値として設定してもよい。
S305でラベルiとラベルjの間の距離が閾値Aより小さいと判定された場合、S306に進み、ラベルjに含まれる画素群のラベル値を全てラベルiの値とする。S306の処理により、10mmより近いラベルiとラベルjは、同じラベルとすることができる。その場合、ラベル総数Lを1減少する。一方、ラベルiとラベルjの間の距離が閾値Aより小さくないと判定された場合には、S306の処理は行わずにS307に進む。S307では、全てのラベル同士の組み合わせについてS305〜S306の処理が行われたかを判定し、全てのラベル同士の組み合わせについて行われたと判定されるまで、S305〜S306の処理を繰り返す。全てのラベル同士の組み合わせについて行われたと判定された場合にはS308に進む。図5(d)は、S305〜S306のループ処理が全て終了した結果を示す図である。図5(d)に示すように、距離が閾値Aより小さい、即ち、所定の距離内のラベル同士は、同じラベル値とされる。
S308では、ラベルごとの傾きが求められる。S308の処理については図4を参照しながら後述する。
S309では、以降のS310〜S312のループ処理のために、ラベル値を表す変数を再度、初期化する。S310では、ラベルiとラベルjの傾きが等しく、かつ、ラベルiとラベルjの間の距離が閾値Bより小さいか否かを判定する。ここで、ラベル間の距離として、例えば、各ラベル領域の重心間の距離が用いられても良い。また、各ラベル領域を内包する矩形の各頂点同士の最短の長さが用いられても良い。閾値Bは、予め設定可能な値でも良いし、S303で取得されたラベリング領域の大きさを文字のポイント数として、そのポイント数に比例するような値でも良い。
なお、本フローチャートでは、S305、S306において、距離が閾値Aよりも小さなラベルが、共通のラベルとして既に決定されている。そのため、S310における閾値Bは、閾値Aよりも大きい値を用いてもよい。
S310でラベルiとラベルjの傾きが等しく、かつ、ラベルiとラベルjの間の距離が閾値Bより小さいと判定された場合、S311に進み、ラベルjに含まれる画素群のラベル値を全てラベルiの値とする。なお、S310において傾きが等しいとの判定は、所定の誤差を考慮してもよい。例えば傾きの差が所定の角度以内であれば、傾きが等しいものとして判定してもよい。
S311の処理により、閾値Bより近いラベルiとラベルjは、同じラベルとすることができる。その場合、ラベル総数Lを1減少する。一方、ラベルiとラベルjの傾きが等しくないか、ラベルiとラベルjの間の距離が閾値Bより小さくないと判定された場合には、S311の処理は行わずにS312に進む。S312では、全てのラベル同士の組み合わせについてS310〜S311の処理が行われたかを判定し、全てのラベル同士の組み合わせについて行われたと判定されるまで、S310〜S311の処理を繰り返す。全てのラベル同士の組み合わせについて行われたと判定された場合にはS313に進む。
S313では、各ラベルのラベリング領域を内包し、S308で求められた傾きとなるような矩形領域を作成する。S313で作成された矩形領域(が、ユーザにより原稿台に置かれた原稿に対応する原稿領域の候補として決定される。この矩形領域の縦横の長さが異なる場合には長方形の領域となるが、両者の長さが等しい場合には、正方形の領域が決定される。
図5の例ではユーザが置いたレシート用紙の大きさに対応する切出領域となる。図5(e)は、S313で矩形領域が作成された結果を示す図である。図5(e)に示すように、各ラベルを内包するように、矩形領域506及び507(切出領域)が作成されている。
図5(d)(e)に示した例では、矩形領域506、507に含まれているラベルは、ある程度距離が離れており、またその傾きも異なる。そのため、S310において、同一のラベルとするための、距離に関する条件(距離が閾値B以上)と傾きに関する条件のいずれかに該当しないため、別のラベル(別の原稿領域)として決定される。
以上のように、本実施形態では、同一の原稿(レシート用紙)内に存在する文字等の傾きは等しいことが多いことを利用して各ラベルの統合を複数回繰返していき、その結果、同一の原稿(一枚のレシート用紙)内に印刷されている情報を一括して切り出すことができる。図5(e)に示す矩形領域は、S303で検出されたラベルを内接する矩形であるため、図5(b)に示す実際のレシート用紙の大きさとは正確には異なる場合がある。ただし、家計簿ソフトウェア等、各種アプリケーション上で管理する分には十分な切り出し精度となる。
以上の処理により原稿領域の候補である候補領域が決定された後に、S301で取得された読取画像から、当該原稿領域の画像を切り出す。そして、切り出した領域を操作パネル116やディスプレイ151に表示する表示制御処理を実行するようにしても良い。或いは、例えばホストPC150もしくは画像読取装置100が、当該候補領域の画像を不図示の印刷装置に印刷させる印刷制御処理を実行する場合であってもよい。また、切り出し領域として、画像の見栄えを考慮して、10mm等の一定量分拡張した領域を使用するようにしてもよい。
図4は、S308の処理の手順を示すフローチャートである。まず、S401では、S308の処理対象となるラベル(オブジェクト)を特定する。例えば、図3のラベリング処理の結果が格納されているメモリと同容量の領域をRAM等に確保して、処理対象となるラベルをその領域にコピーしても良い。
S402では、ラベルの角度を表すパラメータθを用意し、初期値(0度)に設定する。S403では、角度θの傾きを有する2つの直線L1及びL2を処理対象のラベルに対して設定する。図6(a)は、S403の処理結果を示す図である。図6(a)の「商品A ¥100 商品B ¥200」で示されるコンテンツ601は、S401で特定されたラベルであり、直線602及び603は、直線L1及びL2に対応する。S403の処理の際には、図6(a)に示すように、処理対象のラベルの中心を通るように、直線602及び603が設定される。また、このときには、直線602と直線603は、互いに重なるように設定される。
S404では、直線602を角度θ+90度の方向に所定の微小単位分、平行移動する。所定の微小単位とは、例えば1画素である。S405では、直線602上に処理対象のラベルが存在するか否かを判定する。ここで、存在すると判定された場合、S404からの処理を繰り返す。一方、存在しないと判定された場合には、S406に進む。図6(b)は、平行移動の結果、直線602上に処理対象のラベルが存在しないと判定されてS406に進む際の状態を示す図である。
S406では、直線603を角度θ−90度の方向に所定の微小単位分、平行移動する。所定の微小単位とは、例えば1画素である。S407では、直線603上に処理対象のラベルが存在するか否かを判定する。ここで、存在すると判定された場合、S406からの処理を繰り返す。一方、存在しないと判定された場合には、S408に進む。図6(c)は、平行移動の結果、直線603上に処理対象のラベルが存在しないと判定されてS408に進む際の状態を示す図である。
S408では、直線602と直線603の間の距離604を求め、その値をRAM等の記憶領域に保存する。次に、S409では、現在の角度θに所定の微小単位分の角度を加算する。微小単位分の角度は、画像読取装置100の計算精度に応じて決定されるようにしても良い。本実施形態では、現在の角度θから、0.5度〜1.0度の範囲内の所望の角度分ずつ加算していく。
S410では、S409の処理後の角度θが90度より大きいか否かが判定される。ここで、90度より大きいと判定された場合には、S411に進む。一方、90度より大きくないと判定された場合、S403からの処理を繰り返す。
S411では、S408で求められた各角度に対応する距離604のうち最小の距離604を特定する。そして、その最小の距離604に対応する角度θを、本処理対象のラベルの角度として決定する。図6(d)は、角度θ=10度とした場合の距離605を示し、図6(e)は、角度θ=20度とした場合の距離606を示す。本実施形態では、距離605が最小の距離として特定され、距離605に対応する角度θ=10度がコンテンツ(ラベル)601の角度として決定される。
以上の図4の処理により、当該ラベル(図6の例ではコンテンツ601)の読取画像に対する傾きを求めることができる。
以上の実施形態によれば、原稿が置かれた原稿台の全面を読取装置が読み取ることで得られた読取画像において、処理対象のラベル(オブジェクト)を特定することができる。そして、複数のオブジェクトが特定された場合に、そのオブジェクト間の距離や、オブジェクト間の傾きの差分に応じて、当該複数のオブジェクトが同一の原稿に対応するものか、別々の原稿に対応するものであるか判定する。これにより、例えばレシートのように、原稿のエッジを判定しにくい原稿が読み取られた場合であっても、原稿領域を適切に決定することができる。
なお、以上の実施形態では、ラベリングを行うことにより読取画像における文字を判定する例について説明したが、これに限らない。例えば画像読取装置100もしくはホストPC150が不図示のOCR(Optical Character Reader)を備え、文字認識を行う場合であってもよい。また、上記のように、本実施形態の処理は、画像読取装置100において実行されてもよいし、ホストPC150により実行されてもよい。また、その両方で処理を分担して実行されてもよい。
ホストPC150において処理が実行される場合、図3のS301では、画像読取装置100が原稿を読み取ることで得られた読取画像を、画像読取装置100から取得する。このとき、ホストPC150に対してユーザが原稿読取指示を行う所謂プルスキャンであってもよいし、画像読取装置100に対してユーザが原稿読取指示を行う所謂プッシュスキャンであってもよい。
また、画像読取装置100とホストPC150とで処理を分担する場合、その分担は種々の方法を用いることができる。例えば、ホストPC150に対してユーザが原稿読取指示を行う。そして、S303におけるラベリング処理までを画像読取装置100で実行し、それ以降の処理をホストPCで実行することができる。
また、ユーザが読取指示とともに、原稿領域のクロップを行うか指示する場合であってもよい。この指示は、ホストPC150、画像読取装置100のいずれに対して行う場合であってもよい。この場合、図3のS302以降の処理は、ユーザがクロップを指示した場合に実行され、クロップを指示しなかった場合、S302以降の処理は実行されなくてもよい。
さらに、以上の実施形態では、レシート等のエッジを検知し難い原稿を読取画像が読み取ったケースを想定していた。そのため、図3においては、S303において読取画像に対してラベリングを行った後、S305以降の処理を実行していた。しかし、例えば読取画像において原稿のエッジ(例えば4辺)を検知できた場合、S302以降の処理を行わなくてもよい。そして、原稿のエッジが検知できなかった場合に、S302以降の処理が行われてもよい。また、S303におけるラベリングの結果、ラベル(オブジェクト)が1つのみ検出された場合、S304以降の処理を行わず、その1つのオブジェクトを原稿領域として決定してもよい。
また、以上の実施形態では、読取画像として、各画素が輝度値を表す画像に対して処理を行っていた。しかし輝度に限らず、他の成分値(例えばCMYK等の濃度値)を表わす画像に対して処理を行う場合であってもよい。濃度値の場合、濃度値が所定の濃度値より大きな画素群を、原稿の内容に対応するオブジェクトとして特定することができる。
さらに、以上の実施形態では、原稿に対応する原稿領域の候補として決定した候補領域を、読取画像から切り出す例について説明した。しかしこれに限らず、例えば当該候補領域に、色変換等の所定の画像処理を実行する場合であってもよい。
上記実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体をシステム又は装置に供給し、そのシステム又は装置のコンピュータ(CPU、MPU)が記録媒体に格納されたプログラムコードを読出して実行することでも達成される。その場合、記憶媒体から読み出されたプログラムコード自体が上記実施形態の機能を実現することとなり、そのプログラムコードを記憶した記憶媒体が本発明を構成する。
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM、DVDなどを用いることができる。
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施形態の機能が実現されるだけではない。例えば、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOperating System(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施例の機能が実現される場合も含まれる。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる場合もある。その場合に、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって上記実施形態の機能が実現される場合も含まれる。

Claims (9)

  1. 複数の原稿を読取装置が読み取ることで得られた、当該複数の原稿のそれぞれに対応する原稿領域を含む読取画像を取得する取得手段と、
    前記取得手段により取得された読取画像のうちの、輝度値で表された場合に所定の輝度値より小さい輝度値となる画素群に基づいて、当該読取画像において複数のオブジェクトを特定する特定手段と、
    前記特定手段により特定された複数のオブジェクトに含まれる複数の第1オブジェクトにおいて、各オブジェクト間の傾きの差分が第1の所定範囲となり、且つ、前記複数のオブジェクトに含まれる複数の第2オブジェクトにおいて、各オブジェクト間の傾きの差分が前記第1の所定範囲となり、且つ、前記複数の第1オブジェクトと前記複数の第2オブジェクトの間の傾きの差分が前記第1の所定範囲外となり、且つ、前記複数の第1オブジェクトにおいて、各オブジェクト間の距離が第2の所定範囲となり、且つ、前記複数の第2オブジェクトにおいて、各オブジェクト間の距離が前記第2の所定範囲となり、且つ、前記複数の第1オブジェクトと前記複数の第2オブジェクトの間の距離が前記第2の所定範囲外となることを条件として、前記複数の第1オブジェクトを含む第1の原稿領域の候補および前記複数の第2オブジェクトを含む第2の原稿領域の候補を決定する決定手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記所定の輝度値より小さい輝度値となる画素群に対してラベリング処理を行うラベリング手段、をさらに備え、
    前記決定手段は、前記ラベリング手段によりラベリング処理が行われた画素群を前記特定手段により特定された前記複数のオブジェクトのそれぞれとして、前記第1の原稿領域の候補および前記第2の原稿領域の候補を決定することを特徴とする請求項1に記載の画像処理装置。
  3. 前記特定手段は、前記読取画像の画素に対応する輝度値に基づいて、前記複数のオブジェクトを特定することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記読取画像から、前記決定手段により決定された前記第1の原稿領域の候補および前記第2の原稿領域の候補の切出処理を行う切出手段、をさらに備えることを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  5. 前記切出手段により切り出された前記第1の原稿領域の候補および前記第2の原稿領域の候補の画像を表示装置に表示させる表示制御手段をさらに備えることを特徴とする請求項に記載の画像処理装置。
  6. 前記切出手段により切り出された前記第1の原稿領域の候補および前記第2の原稿領域の候補の画像を印刷装置に印刷させる印刷制御手段をさらに備えることを特徴とする請求項に記載の画像処理装置。
  7. 前記読取装置を、原稿を読み取るための読取部としてさらに備えることを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  8. 複数の原稿を読取装置が読み取ることで得られた、当該複数の原稿のそれぞれに対応する原稿領域を含む読取画像を取得する取得工程と、
    前記取得工程において取得された読取画像のうちの、輝度値で表された場合に所定の輝度値より小さい輝度値となる画素群に基づいて、当該読取画像において複数のオブジェクトを特定する特定工程と、
    前記特定工程において特定された複数のオブジェクトに含まれる複数の第1オブジェクトにおいて、各オブジェクト間の傾きの差分が所定の範囲となり、且つ、前記複数のオブジェクトに含まれる複数の第2オブジェクトにおいて、各オブジェクト間の傾きの差分が前記所定の範囲となり、且つ、前記複数の第1オブジェクトと前記複数の第2オブジェクトの間の傾きの差分が前記所定の範囲外となり、且つ、前記複数の第1オブジェクトにおいて、各オブジェクト間の距離が第2の所定範囲となり、且つ、前記複数の第2オブジェクトにおいて、各オブジェクト間の距離が前記第2の所定範囲となり、且つ、前記複数の第1オブジェクトと前記複数の第2オブジェクトの間の距離が前記第2の所定範囲外となることを条件として、前記複数の第1オブジェクトを含む第1の原稿領域の候補および前記複数の第2オブジェクトを含む第2の原稿領域の候補を決定する決定工程と、
    を有することを特徴とする画像処理方法。
  9. 請求項1乃至のいずれか1項に記載の画像処理装置の各手段としてコンピュータを機能させるためのプログラム。
JP2014049311A 2014-03-12 2014-03-12 画像処理装置、画像処理方法およびプログラム Active JP6494166B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014049311A JP6494166B2 (ja) 2014-03-12 2014-03-12 画像処理装置、画像処理方法およびプログラム
US14/633,537 US9471842B2 (en) 2014-03-12 2015-02-27 Image processing apparatus, image processing method, and storage medium storing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014049311A JP6494166B2 (ja) 2014-03-12 2014-03-12 画像処理装置、画像処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2015173418A JP2015173418A (ja) 2015-10-01
JP6494166B2 true JP6494166B2 (ja) 2019-04-03

Family

ID=54069201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014049311A Active JP6494166B2 (ja) 2014-03-12 2014-03-12 画像処理装置、画像処理方法およびプログラム

Country Status (2)

Country Link
US (1) US9471842B2 (ja)
JP (1) JP6494166B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6274175B2 (ja) * 2015-10-09 2018-02-07 京セラドキュメントソリューションズ株式会社 画像読取装置および画像形成装置
JP7013806B2 (ja) * 2017-11-15 2022-02-01 富士フイルムビジネスイノベーション株式会社 画像読取装置及びプログラム
JP7099095B2 (ja) * 2017-12-15 2022-07-12 株式会社リコー 画像処理装置、画像処理システム、方法およびプログラム
JP2020030350A (ja) * 2018-08-23 2020-02-27 コニカミノルタ株式会社 画像検査装置およびプログラム
JP7225017B2 (ja) 2019-04-19 2023-02-20 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7317561B2 (ja) 2019-04-19 2023-07-31 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7297510B2 (ja) 2019-04-19 2023-06-26 キヤノン株式会社 ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム
JP7330742B2 (ja) 2019-04-19 2023-08-22 キヤノン株式会社 スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム
JP7234024B2 (ja) * 2019-04-23 2023-03-07 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3082935B2 (ja) * 1990-10-13 2000-09-04 キヤノン株式会社 画像処理装置
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP5241631B2 (ja) 2008-07-04 2013-07-17 キヤノン株式会社 画像処理方法、画像処理装置及びプログラム
JP5222127B2 (ja) * 2008-12-25 2013-06-26 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP5336939B2 (ja) * 2009-06-15 2013-11-06 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
US9471842B2 (en) 2016-10-18
US20150262034A1 (en) 2015-09-17
JP2015173418A (ja) 2015-10-01

Similar Documents

Publication Publication Date Title
JP6494166B2 (ja) 画像処理装置、画像処理方法およびプログラム
US9497355B2 (en) Image processing apparatus and recording medium for correcting a captured image
JP4541951B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP4653194B2 (ja) 画像処理装置、画像処理装置の制御方法、プログラム及びコンピュータ読取可能な記憶媒体
US8593686B2 (en) Image scanning apparatus, computer readable medium, and image storing method add scanned image data into an image file storing an existing image data associated with an attribute value of the existing image data
JP2006174239A (ja) 画像処理システム
US9858513B2 (en) Document file output apparatus, document file output method, and computer readable medium
JP2007208617A (ja) 画像読取装置および画像読取方法
JP2011024116A (ja) 画像処理装置、画像処理方法、プログラム
US20200076987A1 (en) Image processing apparatus, control method thereof, and storage medium
JP2003338920A (ja) 画像読取装置
JP2015106895A (ja) 画像読取制御装置、画像読取装置、及び画像読取制御方法
JP5618664B2 (ja) 画像処理方法、プログラム、画像読取装置、及び情報機器
US8422785B2 (en) Image processing apparatus, image processing method, and program
EP4007249A1 (en) Image reading device and image reading method
JP4645485B2 (ja) 画像形成システム及び画像形成方法
JP5020777B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP4500865B2 (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP3781192B2 (ja) 画像処理システム及び画像処理方法
JP4124219B2 (ja) 画像処理システム
JP4165617B2 (ja) プログラム及び記録媒体
US20120219182A1 (en) Image processing apparatus and image processing program
JP2013251779A (ja) 画像処理装置及び画像処理方法
JP2021044765A (ja) 画像処理装置、画像出力装置、画像処理方法、及びプログラム
JP2019176336A (ja) 画像処理装置、画像送信装置、画像処理方法及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170313

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190305

R151 Written notification of patent or utility model registration

Ref document number: 6494166

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151