JP6852369B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP6852369B2
JP6852369B2 JP2016232398A JP2016232398A JP6852369B2 JP 6852369 B2 JP6852369 B2 JP 6852369B2 JP 2016232398 A JP2016232398 A JP 2016232398A JP 2016232398 A JP2016232398 A JP 2016232398A JP 6852369 B2 JP6852369 B2 JP 6852369B2
Authority
JP
Japan
Prior art keywords
image
rectangle
module
processing
white
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016232398A
Other languages
English (en)
Other versions
JP2018093264A (ja
Inventor
正和 福永
正和 福永
稔 袖浦
稔 袖浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2016232398A priority Critical patent/JP6852369B2/ja
Priority to US15/583,287 priority patent/US10075614B2/en
Publication of JP2018093264A publication Critical patent/JP2018093264A/ja
Application granted granted Critical
Publication of JP6852369B2 publication Critical patent/JP6852369B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00037Detecting, i.e. determining the occurrence of a predetermined state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00092Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to the original or to the reproducing medium, e.g. imperfections or dirt
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
特許文献1には、名刺等の白い原稿でも原稿領域の自動切り出しを可能にすることを課題とし、原稿台上の読取範囲全面を読取る全面画像データを得る工程と、原稿台上の前記読取範囲全面を覆う黒シートを検出する工程と、全面画像データから矩形の原稿領域を識別する識別工程と、前記識別工程で識別された矩形の原稿領域の画像を前記全面画像データから切り出して原稿領域の画像データを得る工程を有することが開示されている。
特許文献2には、名刺フォルダから名刺を取り出す手間がなく、名刺を裏返す場合に、1枚ずつ名刺を裏返す手間を省くことができ、操作性が向上し、また、データ管理を効率化することができる名刺管理システムを提供することを課題とし、1頁に複数枚の名刺を収納可能で透明な名刺フォルダを画像読取装置にて読取る画像読取システムにおいて、前記画像読取装置が、複数枚の名刺を収納した前記名刺フォルダの表面の画像を読取り、第1画像データを得る第1読取工程と、前記画像読取装置が、前記複数枚の名刺を収納した前記名刺フォルダの裏面の画像を読取り、第2画像データを得る第2読取工程と、前記第1と第2の画像データの天地方向を合わせる工程と、前記第1と第2の画像データから、各名刺を切り出す切出工程と、前記天地方向を合わせた前記第1と第2の画像データにおける各名刺の位置関係から、各名刺の表面と裏面とを関連付ける関連付工程と、前記切出工程で切り出した各名刺の両面分のデータを1つの項目として取り扱う工程とを有することが開示されている。
特許文献3には、原稿地肌への影響を極力小さいものにしつつ、原稿カバー(プラテンカバー)の開閉状態に係わりなく精度のよい原稿検知を可能にすることを課題とし、プラテン上に載置された原稿を光学的に走査して読取られる画像情報の処理を行う画像処理装置にあって、画像処理の対象となる原稿領域を検知する原稿検知装置において、プラテン上にて開閉可能なプラテンカバーの当該原稿押え面を対象となる原稿の色と異なる色にて着色し、プラテンカバーの開放状態と閉鎖状態を判別するプラテン開閉判別手段と、プラテン開閉判別手段がプラテンカバーの開放状態を判別するときに原稿とその背景部との濃度差に基づいて原稿エッジ部を検出する第一の原稿エッジ検出手段と、プラテン開閉判別手段がプラテンカバーの閉鎖状態を判別するときに原稿とプラテンカバーの原稿押え面の色差に基づいて原稿エッジ部を検出する第二の原稿エッジ検出手段と、第一又は第二の原稿エッジ検出手段にて検出された原稿エッジ部を含む所定領域を原稿領域として特定する原稿領域特定手段とを備えたことが開示されている。
特開2003−338920号公報 特許第4795038号公報 特許第2958981号公報
1回のスキャンで複数枚の原稿を読み取ることが行われている。そして、その画像からそれぞれの原稿画像を抽出することが行われている。例えば、背景として黒色の台紙を用いて原稿画像の抽出精度を高めることが行われている。この場合、操作者は規定の黒色の台紙を用いない場合がある。
そこで、本発明は、背景が白色であるか否かを固定せずに原稿画像を抽出する場合にあって、背景に使用できる色を固定したことを想定した処理に比べて、原稿画像の抽出精度を高めることができるようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、複数の原稿画像が含まれている画像から矩形を検出する第1の検出手段と、前記矩形内の背景が白色でない場合は、該矩形に内包されている矩形を原稿画像として検出する第2の検出手段と、予め定められた条件にしたがって、前記第1の検出手段によって検出された矩形内の背景が白色であるか否かを判定する判定手段を有し、前記第2の検出手段は、前記判定手段による判定結果を用い、前記条件として、前記第1の検出手段によって検出された矩形の数と予め定められた閾値との比較を用いる、画像処理装置である。
請求項2の発明は、複数の原稿画像が含まれている画像から矩形を検出する第1の検出手段と、前記矩形内の背景が白色でない場合は、該矩形に内包されている矩形を原稿画像として検出する第2の検出手段と、予め定められた条件にしたがって、前記第1の検出手段によって検出された矩形内の背景が白色であるか否かを判定する判定手段を有し、前記第2の検出手段は、前記判定手段による判定結果を用い、前記条件として、前記第1の検出手段によって検出された矩形に内包されている矩形の数と予め定められた閾値との比較を用いる、画像処理装置である。
請求項の発明は、前記第2の検出手段は、前記矩形の背景が白色である場合は、前記第1の検出手段によって検出された矩形を原稿画像として検出する、請求項1又は2に記載の画像処理装置である。
請求項の発明は、前記第1の検出手段は、前記画像内で最も外側にある矩形を検出する、請求項1から3のいずれか一項に記載の画像処理装置である。
請求項の発明は、コンピュータを、複数の原稿画像が含まれている画像から矩形を検出する第1の検出手段と、前記矩形内の背景が白色でない場合は、該矩形に内包されている矩形を原稿画像として検出する第2の検出手段と、予め定められた条件にしたがって、前記第1の検出手段によって検出された矩形内の背景が白色であるか否かを判定する判定手段として機能させ、前記第2の検出手段は、前記判定手段による判定結果を用い、前記条件として、前記第1の検出手段によって検出された矩形の数と予め定められた閾値との比較を用いる、画像処理プログラムである。
請求項6の発明は、コンピュータを、複数の原稿画像が含まれている画像から矩形を検出する第1の検出手段と、前記矩形内の背景が白色でない場合は、該矩形に内包されている矩形を原稿画像として検出する第2の検出手段と、予め定められた条件にしたがって、前記第1の検出手段によって検出された矩形内の背景が白色であるか否かを判定する判定手段として機能させ、前記第2の検出手段は、前記判定手段による判定結果を用い、前記条件として、前記第1の検出手段によって検出された矩形に内包されている矩形の数と予め定められた閾値との比較を用いる、画像処理プログラムである。
請求項1の画像処理装置によれば、背景が白色であるか否かを固定せずに原稿画像を抽出する場合にあって、背景に使用できる色を固定したことを想定した処理に比べて、原稿画像の抽出精度を高めることができる。また、予め定められた条件にしたがって、矩形内の背景が白色であるか否かを判定することができる。そして、矩形の数と予め定められた閾値との比較を用いることによって、矩形内の背景が白色であるか否かを判定することができる。
請求項2の画像処理装置によれば、背景が白色であるか否かを固定せずに原稿画像を抽出する場合にあって、背景に使用できる色を固定したことを想定した処理に比べて、原稿画像の抽出精度を高めることができる。また、予め定められた条件にしたがって、矩形内の背景が白色であるか否かを判定することができる。そして、矩形に内包されている矩形の数と予め定められた閾値との比較を用いることによって、矩形内の背景が白色であるか否かを判定することができる。
請求項の画像処理装置によれば、矩形の背景が白色である場合にも対応することができる。
請求項の画像処理装置によれば、画像内で最も外側にある矩形を対象にして判定することができる。
請求項の画像処理プログラムによれば、背景が白色であるか否かを固定せずに原稿画像を抽出する場合にあって、背景に使用できる色を固定したことを想定した処理に比べて、原稿画像の抽出精度を高めることができる。また、予め定められた条件にしたがって、矩形内の背景が白色であるか否かを判定することができる。そして、矩形の数と予め定められた閾値との比較を用いることによって、矩形内の背景が白色であるか否かを判定することができる。
請求項6の画像処理プログラムによれば、背景が白色であるか否かを固定せずに原稿画像を抽出する場合にあって、背景に使用できる色を固定したことを想定した処理に比べて、原稿画像の抽出精度を高めることができる。また、予め定められた条件にしたがって、矩形内の背景が白色であるか否かを判定することができる。そして、矩形に内包されている矩形の数と予め定められた閾値との比較を用いることによって、矩形内の背景が白色であるか否かを判定することができる。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を利用したシステム構成例を示す説明図である。 第1の実施の形態における対象となる画像の例を示す説明図である。 第1の実施の形態を用いずに、原稿画像を抽出する処理例の説明図である。 第1の実施の形態の構成例についての概念的なモジュール構成図である。 第1の実施の形態による処理例を示すフローチャートである。 第1の実施の形態による処理例を示すフローチャートである。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態の構成例についての概念的なモジュール構成図である。 第1の実施の形態による処理例を示すフローチャートである。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 処理結果テーブルのデータ構造例を示す説明図である。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態を用いずに、原稿画像を抽出する処理例の説明図である。 第2の実施の形態による処理例を示すフローチャートである。 第2の実施の形態による処理例を示すフローチャートである。 第2の実施の形態による処理例を示すフローチャートである。 第2の実施の形態による処理例を示す説明図である。 第2の実施の形態による処理例を示すフローチャートである。 第2の実施の形態による処理例を示すフローチャートである。 第2の実施の形態による処理例を示す説明図である。 第2の実施の形態による処理例を示すフローチャートである。 第2の実施の形態による処理例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<<第1実施の形態>>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に1対1に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(1対1対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
第1の実施の形態である画像処理装置100は、複数の原稿画像が含まれている画像から、その原稿画像を検出するものであって、図1の例に示すように、データ読込モジュール110、矩形検出モジュール120、条件判定モジュール130、内包矩形検出モジュール140を有している。
例えば、名刺、領収書(レシート)等の原稿の画像を読み取って、文字認識等の処理を行って、名刺データベースの生成処理、経理処理等が行われている。画像の読み取り(スキャン)処理は、それぞれの原稿が小さいことから、1回のスキャン処理で読み取り台(原稿台、プラテンともいわれる)に置いた複数枚の原稿を読み取ることが行われている。この場合、1回のスキャン処理で受け付けた1枚の画像から複数の原稿画像を抽出しなければならない。原稿画像の抽出精度を高めるために、一般に、名刺、領収書等の原稿は白いことが多いので、原稿の背景が黒色となるように、黒台紙や専用のフォルダ(原稿の背景が黒色となり、原稿を予め定められた位置に挿入する書類ばさみ)を用いるようにしている(特許文献1等参照)。黒台紙や専用のフォルダを利用して複数原稿を検出する際に、その黒台紙等をプラテン領域の角に当たるように配置しないとその状態を正しく判定できない。例えば、図3(a)に示すように、黒台紙310aを原稿台300(プラテンともいわれる)の角(左下隅)に合わせるように配置する必要がある。なお、図3の例は、上側から見た場合の図面であるので、複数の原稿は、黒台紙310aの下側(裏側)にある。
しかし、一般的な操作者によって複数原稿の読み取りが実行される際に、理解不足や操作上のミスで、想定外の配置が行われることがあり得る。例えば、図3(b1)に示すように、原稿台300の角に当たるように黒台紙310b1を配置していない場合、また、図3(b2)に示すように、原稿台300に対して黒台紙310b2を斜めに配置してしまう場合等がある。これらの場合、本実施の形態以外(例えば、特許文献1に記載の技術等)では、正しく動作しない可能性がある。逆に、操作者への運用上の制約が厳しいともいる。
また、全面が黒一色となる台紙(縁無し黒台紙)を用いない場合もある。例えば、図3(c)に示すように、黒台紙310cは黒領域330が白縁320で囲まれている。具体的には、プラテンカバーを開けたままコピー操作を行うと、一般的には縁無し印刷機能が無いので、白い縁有りの黒台紙310cが生成されることになる。この場合、本実施の形態以外(例えば、特許文献1に記載の技術等)では、操作者が正しく配置したとしても、原稿画像を検出できなくなることがある。
図4は、第1の実施の形態を用いずに、原稿画像を抽出する処理例の説明図である。画像内の予め定められた領域で、画像の背景の色を判定する場合の例である。2枚の名刺が黒台紙を用いて読み取られているので、本来は、台紙画像420内の名刺画像430、名刺画像435を、2つの原稿画像として検出すべきである。しかし、黒台紙が傾いた状態で読み取りが行われたため、台紙画像420の外側に白い領域ができている。
図4(a1)に示す例では、台紙色判定領域410a1は、画像400a1の左辺の上部の領域である。台紙色判定領域410a1を用いて、黒台紙が用いられたか否かを判断しており、台紙色判定領域410a1が白色のため、黒台紙が用いられていないと判定してしまう。
図4(a2)に示す例では、台紙色判定領域410a2は、画像400a2の4辺の周辺領域であり、その台紙色判定領域410a2を用いて、黒台紙が用いられたか否かを判断しており、図4(a1)に示す例よりも広い領域を判定に用いている。しかし、台紙色判定領域410a2が白色のため、黒台紙が用いられていないと判定してしまう。
図4(a1)、(a2)に示す例の処理では、図4(b)に示すように、画像450を名刺の画像として検出してしまう。つまり、本来の名刺画像460、名刺画像465を検出できていない。
データ読込モジュール110は、矩形検出モジュール120と接続されている。データ読込モジュール110は、複数の原稿画像が含まれている画像を受け付ける。画像を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(画像処理装置100に内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、多値画像(カラー画像を含む)である。
原稿を読み込む場合、白色以外の色(例えば、黒色や濃紺色や濃い灰色などの明度の低い濃い色や、金属色のような読み取り光の反射特性が異なる色等、以下、本実施の形態では黒色と表現する)の台紙を用いて読み込まれる場合もあるし、白色の台紙を用いて読み込まれる場合もある。この台紙の色が、画像の背景色となる。また、台紙そのものを用いずに読み込まれる場合もあり、この場合は、プラテンカバーの裏側の色(例えば、白色等)が画像の背景色となる。台紙として、予め定められた台紙(画像処理装置100を組み込んだ製品の付属品等)であってもよいし、操作者が用意した台紙であってもよい。例えば、前述の縁無し黒台紙、白い縁有り黒台紙等であってもよい。また、原稿台300の角に当たるように黒台紙310を配置することが推奨されるが、前述の図3(b1)、(b2)の例に示すように、角から離れたり、黒台紙310が斜めに配置されていてもよい。
なお、操作者に対しては、複数枚の原稿を読み込ませる場合は、黒い台紙を用いることを推奨するようにしてもよい。例えば、「複数枚の原稿を読み込ませる」指示を受け付けた場合は、黒い台紙を用いる旨を表示するようにしてもよい。ただし、操作者は、必ずしもそれにしたがって、黒い台紙を用いるとは限らない。
矩形検出モジュール120は、データ読込モジュール110、条件判定モジュール130と接続されている。矩形検出モジュール120は、複数の原稿画像が含まれている画像から矩形を検出する。
また、矩形検出モジュール120は、対象としている画像内で最も外側にある矩形を検出するようにしてもよい。「最も外側にある矩形」とは、内包関係を考慮した場合の矩形をいい、その矩形が他の矩形に含まれていないことをいう。内包されているか否かは、矩形の角の座標から矩形内、矩形外の領域を区別し、他の矩形との包含関係を判定すればよい。また、対象としている画像の外縁から走査して、最初の矩形としてもよい。
「最も外側にある矩形」は、複数あってもよい。例えば、画像内の背景が白色である場合は、「最も外側にある矩形」は、原稿画像の矩形となるので、原稿の数だけ矩形を抽出することになる。
また、画像内の背景が黒色である場合は、一般的には、1枚の台紙を用いるので、1つの矩形となる。ただし、複数の台紙を用いた場合は、複数の矩形となることがある。例えば、画像内に2つの黒背景の領域がある場合がある。具体的には、2つの縁有り黒台紙を並べて、スキャンした場合が該当する。縁有り黒台紙であることから、黒背景の領域となるが、それが2つ並べられているので、「最も外側にある矩形」は2つの黒領域となる。
条件判定モジュール130は、矩形検出モジュール120、内包矩形検出モジュール140と接続されている。条件判定モジュール130は、予め定められた条件にしたがって、矩形検出モジュール120によって検出された矩形内の背景が白色であるか否かを判定する。ここでの「矩形内の背景」とは、矩形内の下地である。また、「白色でない場合」として、例えば、「黒色である場合」、「灰色である場合」等がある。以下の説明では、「白色でない」の例として「黒色」を用いて説明する。この背景が白色でない場合は、推奨された台紙(例えば、黒い台紙等)が用いられて原稿画像が読み込まれたことを意味し、この背景が白色である場合は、台紙が用いられていない、又は推奨された台紙以外の台紙(例えば、白い縁がある台紙等)が用いられて原稿画像が読み込まれたことを意味する。なお、予め定められた条件を複数用意しておき、台紙と原稿の組み合わせに対して、適用する条件を切り替えるようにしてもよい。
予め定められた条件として、矩形検出モジュール120によって検出された矩形の数と予め定められた閾値との比較を用いるようにしてもよい。
また、予め定められた条件として、矩形検出モジュール120によって検出された矩形内の予め定められた領域内の黒画素数又は白画素数と予め定められた閾値との比較を用いるようにしてもよい。ここで「黒画素数又は白画素数と予め定められた閾値との比較」とは、もちろんのことながら、「黒画素数と予め定められた閾値との比較」、「白画素数と予め定められた閾値との比較」、「黒画素数と予め定められた閾値との比較、そして、白画素数と予め定められた閾値との比較」のいずれかとなる。
また、予め定められた条件として、矩形検出モジュール120によって検出された矩形のサイズと予め定められた閾値との比較を用いるようにしてもよい。予め定められたサイズ以下である矩形は、原稿である可能性が高いので、原稿を台紙と判定してしまう誤処理がされないように抑制できる。
また、予め定められた条件として、矩形検出モジュール120によって検出された矩形に内包されている矩形の数と予め定められた閾値との比較を用いるようにしてもよい。そもそも内包される矩形がなければ、原稿そのものである可能性が高いからである。
なお、条件判定モジュール130による判定処理は縮小した画像を用いて実行し、出力用の原稿画像の切り出し処理は元の解像度の画像から行うようにしてもよい。判定処理を高速に実施でき、縮小画像であるので、微小な検出領域のずれを押えてロバストに判断ができるようになる。
内包矩形検出モジュール140は、条件判定モジュール130と接続されている。内包矩形検出モジュール140は、矩形検出モジュール120が検出した矩形内の背景が白色でない場合(条件判定モジュール130の判定結果が白色でない場合)は、その矩形に内包されている矩形を原稿画像として検出する。
また、内包矩形検出モジュール140は、矩形検出モジュール120が検出した矩形の背景が白色である場合は、矩形検出モジュール120によって検出された矩形を原稿画像として検出するようにしてもよい。
内包矩形検出モジュール140は、処理結果として、例えば、処理結果テーブル1400を生成する。図14は、処理結果テーブル1400のデータ構造例を示す説明図である。処理結果テーブル1400は、画像ID欄1405、原稿画像数欄1410、原稿画像ID欄1415、頂点A欄1420、頂点B欄1425、頂点C欄1430、頂点D欄1435等を有している。画像ID欄1405は、本実施の形態において、データ読込モジュール110が受け付けた画像を一意に識別するための情報(画像ID:IDentification)を記憶している。原稿画像数欄1410は、原稿画像数を記憶している。原稿画像数欄1410以降、原稿画像ID欄1415から頂点D欄1435の組が原稿画像数だけ続く。原稿画像ID欄1415は、本実施の形態において、原稿画像を一意に識別するための情報(原稿画像ID)を記憶している。頂点A欄1420は、頂点Aの座標を記憶している。頂点B欄1425は、頂点Bの座標を記憶している。頂点C欄1430は、頂点Cの座標を記憶している。頂点D欄1435は、頂点Dの座標を記憶している。
内包矩形検出モジュール140は、画像と処理結果テーブル1400を出力、又は、処理結果テーブル1400にしたがって画像から各原稿画像を抽出して出力する。例えば、その抽出した原稿画像の出力には、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること、ファックス等の画像送信装置で画像を送信すること、画像データベース等の画像記憶装置へ書き込むこと、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置(後述する原稿処理装置250等)へ渡すこと等が含まれる。
図2は、本実施の形態を利用したシステム構成例を示す説明図である。
図2(a)の例は、スタンドアロンとして構成した場合を示すものである。画像読取装置200は、画像処理装置100を有している。
例えば、操作者は、複数枚の原稿を画像読取装置200のプラテン上に配置して、画像処理装置100に複数枚原稿の抽出処理を行わせる。背景となる台紙として、黒色のものを用いてもよいし、白色であってもよい。その抽出結果を印刷してもよいし、USBメモリ等に出力してもよい。
図2(b)に示す例は、通信回線290を介してシステムを構成したものである。画像読取装置200A、画像読取装置200B、画像読取装置200C、画像読取装置200D、原稿画像処理装置240、原稿処理装置250は、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、原稿画像処理装置240、原稿処理装置250による機能は、クラウドサービスとして実現してもよい。
画像読取装置200Aは、画像処理装置100Aを有している。画像読取装置200Bは、画像処理装置100Bを有している。原稿画像処理装置240は、画像処理装置100を有している。
例えば、操作者は、複数枚の原稿を画像読取装置200Aのプラテン上に配置する。背景となる台紙として、黒色のものを用いてもよいし、白色であってもよい。そして、画像処理装置100Aに複数の原稿画像の抽出処理を行わせる。画像処理装置100Aは、複数の原稿画像が含まれている画像とその抽出結果である処理結果テーブル1400、又は、処理結果テーブル1400にしたがって画像から抽出した原稿画像を原稿処理装置250に送信する。原稿処理装置250では、各原稿画像の文字認識処理を行い、名刺画像である場合は名刺データベースの生成処理等、原稿画像が領収書画像である場合は経理処理等を行う。
また、画像処理装置100を備えていない画像読取装置200C、画像読取装置200Dでは、原稿画像処理装置240を用いるようにしてもよい。例えば、操作者は、複数枚の原稿を画像読取装置200Cのプラテン上に配置する。背景となる台紙として、黒色のものを用いてもよいし、白色であってもよい。そして、画像読取装置200Cは、それらの原稿を読み取り、読み取った画像を原稿画像処理装置240に送信する。原稿画像処理装置240内の画像処理装置100が、複数の原稿画像の抽出処理を行い、その処理結果に対して、原稿画像処理装置240が、原稿処理装置250と同等の処理(名刺データベースの生成処理、経理処理等)を行う。
図5は、第1の実施の形態の構成例についての概念的なモジュール構成図である。図1の例に示したモジュール構成をさらに詳細にしたものである。
データ読込モジュール110は、矩形検出モジュール120の画像縮小モジュール510、矩形切出&傾き補正モジュール540と接続されている。データ読込モジュール110は、受け付けた画像を画像縮小モジュール510、矩形切出&傾き補正モジュール540に渡す。
矩形検出モジュール120は、画像縮小モジュール510、矩形検出処理モジュール520、座標復元モジュール530、矩形切出&傾き補正モジュール540、矩形切出&傾き補正モジュール550を有している。
画像縮小モジュール510は、データ読込モジュール110、矩形検出処理モジュール520、矩形切出&傾き補正モジュール550と接続されている。矩形検出モジュール120は、黒台紙であるか否かの判定を低解像度で行う。そのため、画像縮小モジュール510は、データ読込モジュール110によって受け付けられた画像を縮小する。例えば、予め定められた縮小率で縮小してもよいし、予め定められたサイズに縮小してもよい。縮小処理は、既存の技術を用いて行う。例えば、単純間引き等を用いればよい。縮小後の画像を矩形検出処理モジュール520、矩形切出&傾き補正モジュール550に渡す。
矩形検出処理モジュール520は、画像縮小モジュール510、座標復元モジュール530、矩形切出&傾き補正モジュール550と接続されている。矩形検出処理モジュール520は、縮小された画像内で、最も外側に位置する矩形を検出する。例えば、後述する第2の実施の形態の固定濃度差算出モジュール1530又はエッジ成分算出モジュール1540による処理を行うようにしてもよい。処理結果(座標情報等)を、座標復元モジュール530、矩形切出&傾き補正モジュール550に渡す。
座標復元モジュール530は、矩形検出処理モジュール520、矩形切出&傾き補正モジュール540と接続されている。座標復元モジュール530は、矩形検出処理モジュール520によって検出された座標情報を縮小前の座標に復元(拡大)する。復元した座標情報を矩形切出&傾き補正モジュール540に渡す。
矩形切出&傾き補正モジュール540は、データ読込モジュール110、座標復元モジュール530、内包矩形検出モジュール140と接続されている。矩形切出&傾き補正モジュール540は、座標復元モジュール530によって復元された座標情報を用いて、データ読込モジュール110によって受け付けられた画像から矩形の画像を抽出し、傾き補正を行う。傾き補正は、既存の技術を用いて行う。例えば、座標情報から各辺が水平又は垂直となるようにアフィン変換(回転処理)等を用いればよい。処理結果の矩形の画像を内包矩形検出モジュール140に渡す。
矩形切出&傾き補正モジュール550は、画像縮小モジュール510、矩形検出処理モジュール520、条件判定モジュール130と接続されている。矩形切出&傾き補正モジュール550は、矩形検出処理モジュール520によって検出された座標情報を用いて、画像縮小モジュール510によって縮小された画像から矩形の画像を抽出し、傾き補正を行う。矩形切出&傾き補正モジュール540と異なるのは、縮小された画像を対象としていることである。黒台紙が用いられているか否かの判定は、縮小された画像を対象としても十分に行うことができ、処理量を減少させて処理速度を速めるためである。処理結果の矩形の画像を条件判定モジュール130に渡す。
条件判定モジュール130は、矩形検出モジュール120の矩形切出&傾き補正モジュール550、内包矩形検出モジュール140と接続されている。条件判定モジュール130は、予め定められた条件にしたがって、矩形切出&傾き補正モジュール550による処理結果である矩形内の背景が黒色であるか否かを判定する。詳細な処理については、図10の例を用いて後述する。
内包矩形検出モジュール140は、黒台紙用矩形検出処理モジュール580、矩形切出&傾き補正モジュール590を有しており、矩形検出モジュール120の矩形切出&傾き補正モジュール540、条件判定モジュール130と接続されている。内包矩形検出モジュール140は、条件判定モジュール130による判定結果にしたがって、処理結果テーブル1400を作成する。具体的には、条件判定モジュール130の判定結果が「黒台紙あり」である場合、黒台紙用矩形検出処理モジュール580、矩形切出&傾き補正モジュール590による処理を行い、処理結果テーブル1400を作成する。そして、条件判定モジュール130の判定結果が「黒台紙なし」である場合、矩形切出&傾き補正モジュール540の結果を用いて処理結果テーブル1400を作成する。つまり、「黒台紙なし」である場合、黒台紙用矩形検出処理モジュール580、矩形切出&傾き補正モジュール590による処理は不要である。「黒台紙なし」である場合(背景が白色である場合)は、矩形検出モジュール120の処理結果が、原稿画像を検出しているからである。
黒台紙用矩形検出処理モジュール580は、矩形切出&傾き補正モジュール590と接続されている。黒台紙用矩形検出処理モジュール580は、矩形切出&傾き補正モジュール540の検出結果(傾き補正された矩形の画像)に内包されている矩形を検出する。例えば、後述する第2の実施の形態の固定濃度差算出モジュール1530、エッジ成分算出モジュール1540、又は、画像処理装置1500そのものによる処理を行うようにしてもよい。黒台紙と判定されているので、固定濃度差算出モジュール1530、又は、画像処理装置1500そのものによる処理が効果的である。特に、原稿画像にデザインが施されているような場合には、画像処理装置1500そのものによる処理が効果的である。
矩形切出&傾き補正モジュール590は、黒台紙用矩形検出処理モジュール580と接続されている。矩形切出&傾き補正モジュール590は、黒台紙用矩形検出処理モジュール580によって検出された座標情報を用いて、矩形切出&傾き補正モジュール540によって抽出された矩形の画像から原稿画像を抽出し、傾き補正を行う。矩形切出&傾き補正モジュール540と異なるのは、データ読込モジュール110によって受け付けられた画像ではなく、矩形切出&傾き補正モジュール540によって抽出された画像を対象としていることである。
図6、図7は、第1の実施の形態による処理例を示すフローチャートである。
ステップS602では、データ読込モジュール110は、画像を読み取る。
ステップS604では、画像縮小モジュール510は、画像を縮小する。
ステップS606では、矩形検出処理モジュール520は、縮小した画像内から矩形を検出する。
ステップS608では、座標復元モジュール530は、矩形の座標を縮小前の座標に戻す。
ステップS610では、矩形切出&傾き補正モジュール540は、元の画像から矩形の画像を切り出す。
ステップS612では、矩形切出&傾き補正モジュール540は、ステップS610で切り出した矩形の画像の傾きを補正する。
ステップS614では、矩形切出&傾き補正モジュール550は、縮小した画像から矩形の画像を切り出す。
ステップS616では、矩形切出&傾き補正モジュール550は、ステップS614で切り出した矩形の画像の傾きを補正する。
ステップS618では、条件判定モジュール130は、条件判定処理を行う。ステップS618の詳細な処理については、図10〜13の例を用いて後述する。
ステップS620では、条件判定モジュール130は、黒台紙があるか否かを判断し、ある場合はステップS622へ進み、それ以外の場合はステップS628へ進む。
ステップS622では、黒台紙用矩形検出処理モジュール580は、黒背景から矩形を検出する。
ステップS624では、矩形切出&傾き補正モジュール590は、矩形の画像を切り出す。
ステップS626では、矩形切出&傾き補正モジュール590は、ステップS624で切り出した矩形の画像の傾きを補正する。
ステップS628では、内包矩形検出モジュール140は、傾き補正後の画像を原稿画像として出力する。「傾き補正後の画像」は、黒台紙ありと判定された場合(ステップS620:Yes)は、ステップS626による処理結果であり、黒台紙ではないと判定された場合(ステップS620:No)は、ステップS612による処理結果である。
図8は、第1の実施の形態による処理例を示す説明図である。黒台紙を用いた読み取りが行われた場合の処理例を示している。
データ読込モジュール110は、画像800を受け付ける。画像800は、図4の例で示した画像と同じであり、黒台紙を用いているが、その黒台紙は傾いている。
画像縮小モジュール510は、画像800を縮小して、縮小画像810を生成する。
矩形検出処理モジュール520は、縮小画像810内の最も外側の矩形を検出する。矩形検出結果820として、矩形825を検出する。
座標復元モジュール530は、元の大きさに復元する。復元結果830として、矩形復元結果835を生成する。
矩形切出&傾き補正モジュール540は、矩形復元結果835を用いて、画像800から切出結果画像840を切り出す。
矩形切出&傾き補正モジュール550は、矩形825を用いて、縮小画像810から縮小切出結果画像850を切り出す。
条件判定モジュール130は、縮小切出結果画像850から「黒台紙あり」855との判定を行う。
内包矩形検出モジュール140は、切出結果画像840から原稿画像860、原稿画像870を検出する。
図9は、第1の実施の形態による処理例を示す説明図である。白台紙を用いた読み取りが行われた場合の処理例を示している。
データ読込モジュール110は、画像900を受け付ける。画像900は、白台紙を用いている。
画像縮小モジュール510は、画像900を縮小して、縮小画像910を生成する。
矩形検出処理モジュール520は、縮小画像910内の最も外側の矩形を検出する。矩形検出結果920として、矩形925、矩形927の2つの矩形を検出する。
座標復元モジュール530は、元の大きさに復元する。復元結果930として、矩形復元結果935、矩形復元結果937を生成する。
矩形切出&傾き補正モジュール540は、矩形復元結果935、矩形復元結果937を用いて、画像900から切出結果画像940、切出結果画像942を切り出す。
矩形切出&傾き補正モジュール550は、矩形925、矩形927を用いて、縮小画像910から縮小切出結果画像950、縮小切出結果画像952を切り出す。
条件判定モジュール130は、縮小切出結果画像950、縮小切出結果画像952から「黒台紙なし」955との判定を行う。
内包矩形検出モジュール140は、切出結果画像940、切出結果画像942をそのまま原稿画像960、原稿画像970として検出する。つまり、黒台紙用矩形検出処理モジュール580、矩形切出&傾き補正モジュール590の処理は不要である。
図10は、第1の実施の形態の構成例についての概念的なモジュール構成図である。特に、条件判定モジュール130内のモジュール構成を示している。
条件判定モジュール130は、矩形数判定モジュール1010、背景状態判定処理モジュール1020、サイズ判定モジュール1050を有している。
矩形数判定モジュール1010は、背景状態判定処理モジュール1020の下地色参照領域決定モジュール1025と接続されている。矩形数判定モジュール1010は、図8の例では縮小切出結果画像850、図9の例では縮小切出結果画像950、縮小切出結果画像952を受け付ける。そして、矩形数判定モジュール1010は、受け付けた矩形の数が予め定められた数以上であるならば、白台紙である(黒台紙なし)と判定する。例えば、予め定められた数として2がある。この場合、矩形の数が2個以上である場合は、白台紙と判定する。矩形の数が1個の場合は、背景状態判定処理モジュール1020による判定処理を行う。
背景状態判定処理モジュール1020は、下地色参照領域決定モジュール1025、二値化モジュール1030、黒画素計数モジュール1035、黒台紙判定モジュール1040を有している。
下地色参照領域決定モジュール1025は、矩形数判定モジュール1010、二値化モジュール1030と接続されている。下地色参照領域決定モジュール1025は、対象としている画像(縮小された矩形画像)の下地色(背景色)を判定するための領域を決定する。
二値化モジュール1030は、下地色参照領域決定モジュール1025、黒画素計数モジュール1035と接続されている。二値化モジュール1030は、下地色参照領域決定モジュール1025によって決定された領域内の画像に対して、二値化処理を行う。例えば、単純二値化等(固定二値化処理)等がある。
黒画素計数モジュール1035は、二値化モジュール1030、黒台紙判定モジュール1040と接続されている。黒画素計数モジュール1035は、二値化処理の結果の黒画素を計数する。
黒台紙判定モジュール1040は、黒画素計数モジュール1035、サイズ判定モジュール1050と接続されている。黒台紙判定モジュール1040は、黒画素数を用いて、白台紙である(黒台紙なし)か否かを判定する。
サイズ判定モジュール1050は、背景状態判定処理モジュール1020の黒台紙判定モジュール1040と接続されている。サイズ判定モジュール1050は、矩形切出&傾き補正モジュール550で切り出した矩形のサイズが予め定められたサイズ以下であるか否かを判定する。例えば、予め定められたサイズとしてB5等がある。この場合、矩形のサイズがB5以下である場合は、白台紙と判定する。
矩形のサイズが予め定められたサイズより大きい場合は、さらに、矩形切出&傾き補正モジュール550で切り出した矩形内にある矩形Bを計数し、矩形Bの数が予め定められた数未満であるならば、白台紙である(黒台紙なし)と判定する。例えば、予め定められた数として1がある。この場合、矩形の数が0個である場合(矩形Bがない場合)は、白台紙と判定する。矩形の数が1個以上の場合は、黒台紙であると判定する。例えば、矩形Bの検出は、後述する第2の実施の形態における固定濃度差算出モジュール1530の処理を行ってもよいし、画像処理装置1500そのものの処理を行ってもよい。
条件判定モジュール130の判定結果として、「黒台紙あり又は黒台紙なし」1090を出力する。具体的には、判定結果として、図8の例に示した「黒台紙あり」855、図9の例に示した「黒台紙なし」955がある。
図11は、第1の実施の形態による処理例を示すフローチャートである。
ステップS1102では、矩形数判定モジュール1010は、矩形を計数する。
ステップS1104では、矩形がN個以上か否かを判断し、N個以上の場合はステップS1124へ進み、それ以外の場合はステップS1106へ進む。
ステップS1106では、下地色参照領域決定モジュール1025は、下地色を判定するための参照領域を決定する。図12を用いて、下地色参照領域決定モジュール1025の処理例について説明する。例えば、図12(a)に示す縮小切出結果画像850に対して、図12(b)に示す対象画像1200(縮小切出結果画像850)の下地色判定参照幅1210を有している4辺の周辺領域とする。下地色判定参照幅1210は、変更可能なパラメータである。下地色判定参照幅1210は、予め定められた値(例えば、5[mm]等)であってもよいし、データ読込モジュール110が受け付けた画像のサイズに応じて決定するようにしてもよい。
例えば、対象画像1200の右下の領域1220では、図12(c)に示す領域1220のようになっている。領域1220は、8×8(64pix)の領域である。
図12(c)の例では、探索対象画素数は、以下のようになる。
探索対象画素数=2×(H×Δ)+2×(W−2×Δ)×Δ=2Δ(H+W)−4Δ^2
なお、Hは対象画像1200の高さ(画素数)、Wは対象画像1200の幅(画素数)であり、例えば、Δは以下のように設定してもよい。
Δ=4[pix] @18.75dpi,5mm
ステップS1108では、二値化モジュール1030は、参照領域内の画像に対して二値化処理を行う。図13を用いて、二値化モジュール1030、黒画素計数モジュール1035、黒台紙判定モジュール1040の処理例について説明する。例えば、二値化モジュール1030は、二値化スケール1310内の二値化閾値1320(予め定められた値であり、例えば、30等)を用いて二値化処理を行う。
ステップS1110では、黒画素計数モジュール1035は、参照領域内の二値化後の黒画素を計数する。なお、黒画素数をSとする。
ステップS1112では、黒台紙判定モジュール1040は、判定式の算出結果を判断し、算出結果が「黒の可能性あり」の場合はステップS1114へ進み、算出結果が「黒ではない」の場合はステップS1124へ進む。例えば、黒台紙であると判定する比率閾値として、予め定められた閾値(例えば、参照領域内の画素数の70%)より大きい場合は、黒台紙ありと判定する。具体的には、以下の判定式を用いる。
S/[2Δ(H+W)−4Δ^2]>0.7が成立すれば、黒台紙ありと判定する。
ステップS1114では、サイズ判定モジュール1050は、矩形のサイズを計測する。
ステップS1116では、矩形のサイズが予め定められたサイズ以下か否かを判断し、予め定められたサイズ以下の場合はステップS1124へ進み、それ以外の場合はステップS1118へ進む。
ステップS1118では、矩形に内包されている矩形Bを計数する。
ステップS1120では、矩形Bの数は予め定められた数未満か否かを判断し、予め定められた数未満の場合はステップS1124へ進み、それ以外の場合はステップS1122へ進む。
ステップS1122では、「黒台紙あり」と判定する。
ステップS1124では、「黒台紙なし」と判定する。
なお、図11の例に示したフローチャートの処理順序について、(処理A)ステップS1102とステップS1104の処理、(処理B)ステップS1106〜ステップS1112の処理、(処理C)ステップS1114とステップS1116の処理、(処理D)ステップS1118とステップS1120の処理の4つの処理は、いずれを先に行ってもよいし、並列的に処理を行ってもよい。なお、(処理A)を最初に行うことは、白台紙であって複数の原稿画像がある場合には、処理そのものが簡単であり、他の処理を行う必要がなくなるので、高速化に寄与する。
また、全ての処理を行った後に、多数決で黒台紙であるか否かを決定するようにしてもよい。黒台紙か否かを正確に行うことができるようになる。
また、(処理B)を繰り返して行うようにしてもよい。つまり、ステップS1112で「黒ではない」と判定した場合は、参照領域の幅(前述のΔ)を太くして、ステップS1106からの処理を行うようにしてもよい。黒台紙が利用されているが、黒台紙の端(参照領域内)に原稿が含まれている場合、「黒ではない」と判定してしまうことがあるので、参照領域の幅を太くして、そのような場合にも対応できるようしたものである。なお、(処理B)の繰り返し回数は予め定められた回数であってもよいし、参照領域の幅が予め定められた値以上となった場合に、(処理B)を終了させてもよい。
<<第2実施の形態>>
第2実施の形態である画像処理装置1500は、複数の原稿画像が含まれている画像から、その原稿画像を抽出するものであって、図15の例に示すように、画像処理装置1500は、データ読込モジュール1510、背景色特徴算出モジュール1520、固定濃度差算出モジュール1530、エッジ成分算出モジュール1540、背景色判断モジュール1550、原稿領域推定モジュール1560を有している。ここでの原稿画像は、第1の実施の形態と同様に、名刺、領収書等であり、1回のスキャン処理で複数枚の原稿を読み取った画像を対象とする。
例えば、第1の実施の形態と同様に、原稿画像の抽出精度を高めるために、一般に、黒色の背景となるように、黒台紙等を用いている。
しかし、この黒台紙に近い色で配色された原稿は逆に検出することが困難になる。例えば、デザインが施された名刺等では、黒色に近い色で塗りつぶされている場合がある。
また、操作者は、必ずしも黒シートを用いるとは限らず、白色を背景として複数の原稿を読み込ませる場合がある。
データ読込モジュール1510は、背景色特徴算出モジュール1520、固定濃度差算出モジュール1530、エッジ成分算出モジュール1540と接続されている。データ読込モジュール1510は、複数の原稿画像が含まれている画像を受け付ける。画像を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(画像処理装置1500に内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、多値画像(カラー画像を含む)である。
原稿を読み込む場合、白色以外の色(例えば、黒色や濃紺色や濃い灰色などの明度の低い濃い色や、金属色のような読み取り光の反射特性が異なる色等、以下、本実施の形態では黒色と表現する)の台紙を用いて読み込まれる場合もあるし、白色の台紙を用いて読み込まれる場合もある。この台紙の色が、画像の背景色となる。また、台紙そのものを用いずに読み込まれる場合もあり、この場合は、プラテンカバーの裏側の色(例えば、白色等)が画像の背景色となる。台紙として、予め定められた台紙(画像処理装置1500を組み込んだ製品の付属品等)であってもよいし、操作者が用意した台紙であってもよい。例えば、プラテンカバーを開けたままコピーすることによって、黒紙を生成したものであってもよい。
なお、操作者に対しては、複数枚の原稿を読み込ませる場合は、黒い台紙を用いることを推奨するようにしてもよい。例えば、「複数枚の原稿を読み込ませる」指示を受け付けた場合は、黒い台紙を用いる旨を表示するようにしてもよい。ただし、操作者は、必ずしもそれにしたがって、黒い台紙を用いるとは限らない。
背景色特徴算出モジュール1520は、データ読込モジュール1510、背景色判断モジュール1550と接続されている。背景色特徴算出モジュール1520は、データ読込モジュール1510が受け付けた画像内の予め定められた領域を検査して輝度値の分布から特徴量を抽出する。例えば、「予め定められた領域」として、画像の周辺領域(原稿が矩形(長方形、正方形を含む)の場合は4つの辺に沿った領域)がある。その領域には、原稿が置かれている可能性が低いからである。また、領域を1つの画像内で複数設定し、それぞれの背景色推定の結果を合わせて、背景色判断モジュール1550が最終的な判断を行う。詳細については、図20の例を用いて後述する。これによって、特許文献2等に記載されている名刺等をセットする専用フォルダのように、その専用フォルダの固定位置に黒紙か否かの判定領域を設ける必要がなくなる。つまり、本実施の形態では、専用フォルダ等は不要で、例えば、ユーザーが有している濃い色の紙(例えば、前述したように、プラテンカバーを開けたままコピーすることによって生成した黒紙等)を利用できる。
固定濃度差算出モジュール1530は、データ読込モジュール1510、原稿領域推定モジュール1560と接続されている。固定濃度差算出モジュール1530は、データ読込モジュール1510が受け付けた画像の低周波な特徴を有する第1領域を抽出する。例えば、二値化処理によって第1領域を抽出するようにしてもよい。二値化処理として、例えば、閾値との比較によってラベリングする単純二値化等の処理を含む。
また、固定濃度差算出モジュール1530は、背景色特徴算出モジュール1520による処理結果を用いて、閾値を決定するようにしてもよい。例えば、単純二値化の閾値を平均色から決定することにより黒紙以外の台紙も利用可能になる。
エッジ成分算出モジュール1540は、データ読込モジュール1510、原稿領域推定モジュール1560と接続されている。エッジ成分算出モジュール1540は、データ読込モジュール1510が受け付けた画像の高周波な特徴を有する第2領域を抽出する。例えば、エッジ検出処理、色差検出処理によって第2領域を抽出するようにしてもよい。エッジ検出処理として、例えば、sobel(sobel filter)、キャニーエッジフィルター(Canny edge filter)等を用いればよい。色差検出処理として、色差信号(例えば、R−Y、B−Y等)を用いるようにしてもよい。
背景色判断モジュール1550は、背景色特徴算出モジュール1520、原稿領域推定モジュール1560と接続されている。背景色判断モジュール1550は、背景色特徴算出モジュール1520によって抽出された特徴量から白色の背景であるか否かを判断する。例えば、背景色判断モジュール1550は、画像の周辺領域の輝度値にしたがって背景が白色であるか否かを判断する。より具体的には、背景色判断モジュール1550は、4つの周辺領域毎の背景が白色であるか否かの判断結果を用いて、画像の背景が白色であるか否かを判断するようにしてもよい。
原稿領域推定モジュール1560は、固定濃度差算出モジュール1530、エッジ成分算出モジュール1540、背景色判断モジュール1550と接続されている。原稿領域推定モジュール1560は、画像の背景が白色であるか否か(背景色判断モジュール1550による判断結果)に応じて、第1領域と第2領域を組み合わせて、原稿画像の領域を抽出する。例えば、画像の背景が白色であるか否かに応じた比率で、第1領域と第2領域を組み合わせて、原稿画像の領域を抽出する。
ここで第1領域と第2領域を組み合わせる比率は、例えば、1対1等のように両方を等分に用いる場合の他に、70%対30%等のように一方を他方よりも優先させる場合、さらに、一方のみを用いる場合を含む。一方のみを用いる場合、例えば、第2領域のみを用いる場合は、第2領域そのものが原稿画像の領域となる。
原稿領域推定モジュール1560は、画像の背景が白色でない場合は、第1領域と第2領域の両方を用いて、原稿画像の領域を抽出するようにしてもよい。さらに、原稿領域推定モジュール1560は、画像の背景が白色である場合は、第2領域を優先して、原稿画像の領域を抽出するようにしてもよい。ここでの「優先して」とは、第1領域を用いずに、第2領域だけで原稿画像の領域を抽出することを含む。つまり、第2領域は、原稿画像の領域と同義となる。
原稿領域推定モジュール1560は、処理結果として、例えば、処理結果テーブル1400を生成する。そして、原稿領域推定モジュール1560は、画像と処理結果テーブル1400を出力、又は、処理結果テーブル1400にしたがって画像から各原稿画像を抽出して出力する。例えば、その抽出した原稿画像の出力には、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること、ファックス等の画像送信装置で画像を送信すること、画像データベース等の画像記憶装置へ書き込むこと、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置(前述した原稿処理装置250等)へ渡すこと等が含まれる。
図16は、第2の実施の形態を用いずに(従来技術による)、原稿画像を抽出する処理例の説明図である。この例では、背景として黒色の場合の処理例を示している。
図16(a1)の例に示す画像1600aに対して、単純二値化処理を行った例を図16(a2)の例に示す処理結果画像1605aとして示している。なお、画像1600aは、黒色の台紙を用いて、6枚の名刺を読み込んだ画像である。
画像1600aには、名刺画像1610a、名刺画像1620a、名刺画像1630a、名刺画像1640a、名刺画像1650a、名刺画像1660aが配置されている。名刺画像1610a等は、ほとんどが白色であるため、単純二値化処理によって、処理結果画像1605aから、名刺画像領域1615a、名刺画像領域1625a、名刺画像領域1635a、名刺画像領域1645a、名刺画像領域1655a、名刺画像領域1665aを抽出できる。つまり、白い原稿の名刺画像領域1615a等は、正しく前景領域としての抽出が成功している。なお、図では、抽出結果を黒色で示している。
図16(b1)の例に示す画像1600bに対して、単純二値化処理を行った例を図16(b2)の例に示す処理結果画像1605bとして示している。なお、画像1600bは、黒色の台紙を用いて、6枚の名刺を読み込んだ画像である。ここでの名刺画像には、デザインが施されているものがある。例えば、名刺画像1610bは、白領域画像1612bと青領域画像1614bによって構成されている。名刺画像1620bは、白領域画像1622bと青領域画像1624bによって構成されている。名刺画像1660bは、青領域画像1664bによって構成されている。
画像1600bには、名刺画像1610b、名刺画像1620b、名刺画像1630b、名刺画像1640b、名刺画像1650b、名刺画像1660bが配置されている。名刺画像1610b等は、台紙の黒色に近い色である青領域画像1614b等があるため、単純二値化処理によって、名刺画像領域1615bの領域だけが抽出され、青領域画像1614bに対応する領域は抽出されていない。つまり、処理結果画像1605bから、名刺画像領域1615b、名刺画像領域1625b、名刺画像領域1635b、名刺画像領域1645b、名刺画像領域1655bが抽出されている。つまり、名刺画像1610bは、白領域画像1612bの部分だけが検出され、青領域画像1614bの部分は検出されていない。名刺画像1620bは、白領域画像1622bの部分だけが検出され、青領域画像1624bの部分は検出されていない。名刺画像1660bは検出されていない。つまり、濃い部分(青領域画像1614b等)が単純二値化処理によって、背景側として処理されるので原稿画像として求められるべき検出に失敗している。
図17は、第2の実施の形態による処理例を示すフローチャートである。
ステップS1702では、データ読込モジュール1510は、画像を読み取り、ステップS1704とステップS1710とステップS1712へ進む。
ステップS1704では、背景色特徴算出モジュール1520は、画像内の4辺の周囲領域を対象として、輝度値成分の分布を抽出する。
ステップS1706では、背景色判断モジュール1550は、背景色判断処理を行う。ステップS1706の詳細な処理については、図18又は図19の例に示すフローチャートを用いて後述する。
ステップS1708では、背景色判断モジュール1550は、背景色を判断し、背景色が黒の場合はステップS1714へ進み、背景色が白の場合はステップS1716へ進む。
ステップS1710では、固定濃度差算出モジュール1530は、画像から低周波な特徴を有する領域を抽出し、ステップS1714とステップS1716へ進む。
ステップS1712では、エッジ成分算出モジュール1540は、画像から高周波な特徴を有する領域を抽出し、ステップS1714とステップS1716へ進む。
ステップS1714では、原稿領域推定モジュール1560は、原稿領域抽出処理Aを行う。ステップS1714の詳細な処理については、図22の例に示すフローチャートを用いて後述する。
ステップS1716では、原稿領域推定モジュール1560は、原稿領域抽出処理Bを行う。ステップS1716の詳細な処理については、図24の例に示すフローチャートを用いて後述する。
なお、ステップS1704、ステップS1710、ステップS1712は、並列して処理を行ってもよいし、順次処理を行うようにしてもよい。また、ステップS1710、ステップS1712の処理は、ステップS1708の判断処理の後(ステップS1714、ステップS1716の前)に行うようにしてもよい。さらに、ステップS1708で白と判断した場合は、ステップS1712だけの処理を行う(ステップS1710の処理は行わない)ようにしてもよい。
図18は、第2の実施の形態による処理例を示すフローチャートである。ステップS1706の処理の一例である。図20に示す例を参照して説明する。
ステップS1802では、各辺の周囲領域における輝度値の分布の上位a%の位置(輝度値)を抽出する。例えば、図20(a)に示す画像2000を対象とする。画像2000には、複数の名刺画像が含まれている。そして、図20(b)の例に示すように、画像2000の4辺の上辺領域2010、右辺領域2020、下辺領域2030、左辺領域2040内の画素の輝度値の分布を生成する。具体的には、各輝度値(図の例では、0〜255の値)における画素数を計数する。図20(c1)〜(c4)の例に示すグラフは、横軸に輝度値の値を示しており、左端が0(白)、右端が255(黒)を示しており、縦軸は、その輝度値の画素の個数を示している。(c1)のグラフは、上辺領域2010内の輝度値の分布を示すものである。(c2)のグラフは、右辺領域2020内の輝度値の分布を示すものである。(c3)のグラフは、下辺領域2030内の輝度値の分布を示すものである。(c4)のグラフは、左辺領域2040内の輝度値の分布を示すものである。図20では、「上位a%」を上位5%としている。ここで上位とは、255に近い輝度値を有している画素群のことであり、「上位a%」の位置が低い(0に近い)ことは、黒画素が少ないこと(白画素が多いこと)を示している。図20(c1)のグラフでは、その位置は11であり、図20(c2)のグラフでは、その位置は12であり、図20(c3)のグラフでは、その位置は70であり、図20(c4)のグラフでは、その位置は15である。
ステップS1804では、抽出した位置は閾値X以下であるか否かを判断し、閾値X以下の場合はステップS1806へ進み、それ以外の場合はステップS1808へ進む。例えば、図20では、「閾値X」を閾値60としている。したがって、ステップS1804の判断処理で、図20(c1)のグラフでは「Yes」、図20(c2)のグラフでは「Yes」、図20(c3)のグラフでは「No」、図20(c4)のグラフでは「Yes」となる。つまり、白色領域と判断されたものが3つ、白色以外の領域と判断されたものが1つとなる。
ステップS1806では、白色領域と判断する。
ステップS1808では、黒色領域と判断する。もちろんのことながら、黒色は白色以外の一例である。
ステップS1810では、4辺の判断が終了したか否かを判断し、終了した場合はステップS1812へ進み、それ以外の場合はステップS1804へ戻る。
ステップS1812では、3つ以上の周囲領域が同じ色と判断されたか否かを判断し、3つ以上の周囲領域が同じ色と判断された場合はステップS1814へ進み、それ以外の場合はステップS1816へ進む。
ステップS1814では、背景はその色と判断する。図20の例では、白色領域と判断されたものが3つであるので、画像2000の背景は白色であると判断される。もちろんのことながら、黒色領域と判断されたものが3つである場合は、画像2000の背景は黒色であると判断される。
ステップS1816では、再判断処理を行う。ステップS1816の詳細な処理については、図21の例に示すフローチャートを用いて後述する。
図19は、第2の実施の形態による処理例を示すフローチャートである。ステップS1706の処理の一例である。図18の例に示すフローチャートでは、周辺領域が白色でなければ、黒色であると判断したが、黒色領域であるか否かの判断処理(ステップS1908)を付加したものである。したがって、ステップS1908、ステップS1912以外の処理は、図18の例に示すものと同じである。
ステップS1902では、各辺の周囲領域における輝度値の分布の上位a%の位置を抽出する。
ステップS1904では、抽出した位置は閾値X以下であるか否かを判断し、閾値X以下の場合はステップS1906へ進み、それ以外の場合はステップS1908へ進む。
ステップS1906では、白色領域と判断する。
ステップS1908では、輝度値の分布の平均値は閾値Y以上であるか否かを判断し、閾値Y以上の場合はステップS1910へ進み、それ以外の場合はステップS1912へ進む。周辺領域における白色領域の判断と黒領域の判断を異ならせている。例えば、白色領域の判断を厳しくし、黒色領域の判断を緩やかにしてもよい。具体的には、ステップS1908で、「閾値Y」を閾値128以上としてもよい。これは、輝度値の分布の下位5%の位置が閾値195以上(ステップS1904の判断基準である「下位5%の位置が閾値60以下」を反転させて、黒色にそのまま適用した場合の判断基準)とするよりも、判断基準は緩やかである。
ステップS1910では、黒色領域と判断し、ステップS1914へ進む。
ステップS1912では、不定と判断し、ステップS1914へ進む。
ステップS1914では、4辺の判断が終了したか否かを判断し、終了した場合はステップS1916へ進み、それ以外の場合はステップS1904へ戻る。
ステップS1916では、3つ以上の周囲領域が同じ色と判断されたか否かを判断し、3つ以上の周囲領域が同じ色と判断された場合はステップS1918へ進み、それ以外の場合はステップS1920へ進む。
ステップS1918では、背景はその色と判断する。
ステップS1920では、再判断処理を行う。ステップS1920の詳細な処理については、図21の例に示すフローチャートを用いて後述する。
図21は、第2の実施の形態による処理例を示すフローチャートである。ステップ1816、ステップS1920における処理例である。
ステップS2102では、白色領域が黒色領域より多いか否かを判断し、白色領域が黒色領域より多い場合はステップS2104へ進み、それ以外の場合はステップS2106へ進む。
ステップS2104では、白色背景と判断し、処理を終了する(ステップS2199)。
ステップS2106では、黒色領域が白色領域より多いか否かを判断し、黒色領域が白色領域より多い場合はステップS2108へ進み、それ以外の場合(つまり、背景が白色であるか否かを判断できない場合)はステップS2110へ進む。
ステップS2108では、黒色背景と判断し、処理を終了する(ステップS2199)。
ステップS2110では、ユーザーに尋ねる。例えば、ユーザーに白色かそれ以外の色であるかを指示させる旨の表示を行う、又は、ユーザーに再度スキャンさせる旨の表示を行う。具体的には、台紙として「白」を用いたか、「黒」を用いたか、又は、「再読み込み(再スキャン)」を行うかを尋ねる表示を行い(それぞれを示す3つのボタンを表示し)、回答を選択させるようにすればよい。また、「再度スキャンさせる旨の表示」の場合には、さらに、黒色の台紙を用いるようにすること、原稿を台紙の中央に寄せること等の注意を表示するようにしてもよい。
ステップS2112では、回答を判断し、回答が「白」の場合はステップS2114へ進み、回答が「黒」の場合はステップS2116へ進み、回答が「再読み込み」の場合はステップS2118へ進む。
ステップS2114では、白色背景と判断する。
ステップS2116では、黒色背景と判断する。
ステップS2118では、原稿を中央に寄せて、再度スキャンを行う旨のアドバイスを提示する。
図22は、第2の実施の形態による処理例を示すフローチャートである。ステップS1714の処理例を示すものである。
ステップS2202では、ステップS1710とステップS1712の処理結果を採用する。
ステップS2204では、2つの処理結果の論理和によって、原稿の領域を抽出する。
図23は、図22に示すフローチャートによる処理例を示す説明図である。
図23(a)の例に示す画像2300を対象とする。画像2300は、黒色の台紙を用いて、6枚の名刺を読み込んだ画像である。図16(b1)の例に示した画像1600bと同等のものである。
図23(b1)の例に示す処理結果画像2305aは、画像2300を単純二値化した画像である。
図23(b2)の例に示す処理結果画像2305bは、画像2300をエッジ検出した画像である。この処理によって、単純二値化では抽出できなかった濃い部分(青領域画像2314、青領域画像2324、青領域画像2364)のエッジを抽出することができている。
図23(c)の例に示す処理結果画像2305cは、処理結果画像2305aと処理結果画像2305bの論理和(OR)処理を行ったものである。この処理によって、濃い部分(青領域画像2314、青領域画像2324、青領域画像2364)のエッジを抽出することができるので、領域(名刺エッジ2315b、名刺エッジ23025b、名刺エッジ2365b)の検出に成功する。
この例では、2つの処理結果の論理和、つまり、2つの処理結果を1対1の比率で用いることを示しているが、いずれかの処理結果を強く反映させるようにしてもよい。例えば、第2領域(エッジ成分算出モジュール1540による処理結果)を優先して採用してもよい。例えば、ステップS1814(ステップS1918)で判断された場合と、ステップ1816(ステップS1920)で判断された場合とで、2つの処理結果の反映率を調整してもよい。具体的には、ステップS1814(ステップS1918)で判断された場合は、2つの処理結果を1対1の比率で用い、ステップ1816(ステップS1920)で判断された場合は、エッジ成分算出モジュール1540による処理結果を優先するようにしてもよい。ステップ1816(ステップS1920)で判断された場合は、ステップS1814(ステップS1918)で判断された場合に比べて、背景が黒色であるとの判断が誤っている可能性があるからである。
なお、処理結果画像2305aを用いているのは、処理結果画像2305bでは、エッジとして検出された線が途切れることがあり、それを補間するためである。また、台紙にしわを有する場合、処理結果画像2305bには、しわをエッジとして検出した線が生じる可能性もあり、処理結果画像2305aと和集合演算を行うことにより、しわによるエッジを矩形領域を示す線ではないと判断することが可能となる。
図24は、第2の実施の形態による処理例を示すフローチャートである。ステップS1716の処理例を示すものである。
ステップS2402では、ステップS1712の処理結果を採用する。
ステップS2404では、ステップS1712の処理結果から原稿の領域を抽出する。
図25は、図24に示すフローチャートによる処理例を示す説明図である。
図25(a)の例に示す画像2500を対象とする。画像2500は、白色の台紙を用いて、6枚の名刺を読み込んだ画像である。名刺については、図16(b1)の例に示した名刺画像1610b等と同等のものである。
図25(b1)の例に示す処理結果画像2505aは、画像2500を単純二値化した画像である。この処理では、濃い部分(青領域画像2514、青領域画像2524、青領域画像2564)は抽出できているが、名刺画像2510の白領域画像2512の部分、名刺画像2520の青領域画像2524の部分、名刺画像2530、名刺画像2540、名刺画像2550は抽出できていない。
図25(b2)の例に示す処理結果画像2505bは、画像2500をエッジ検出した画像である。この処理によって、単純二値化では抽出できなかった白色の部分(名刺画像2510の白領域画像2512の部分、名刺画像2520の青領域画像2524の部分、名刺画像2530、名刺画像2540、名刺画像2550)のエッジを抽出することができている。
図25(c)の例に示す処理結果画像2505cは、処理結果画像2505bをそのまま採用したものである。この処理によって、前述したように、白色の部分のエッジの検出に成功する。
なお、背景色判断モジュール1550による処理を行った結果、背景が白色であると判断した場合は、固定濃度差算出モジュール1530による処理を行わないようにしてもよい。
図26を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図26に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部2617と、プリンタ等のデータ出力部2618を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)2601は、前述の実施の形態において説明した各種のモジュール、すなわち、データ読込モジュール110、矩形検出モジュール120、条件判定モジュール130、内包矩形検出モジュール140、画像縮小モジュール510、矩形検出処理モジュール520、座標復元モジュール530、矩形切出&傾き補正モジュール540、矩形切出&傾き補正モジュール550、黒台紙用矩形検出処理モジュール580、矩形切出&傾き補正モジュール590、矩形数判定モジュール1010、背景状態判定処理モジュール1020、下地色参照領域決定モジュール1025、二値化モジュール1030、黒画素計数モジュール1035、黒台紙判定モジュール1040、サイズ判定モジュール1050、データ読込モジュール1510、背景色特徴算出モジュール1520、固定濃度差算出モジュール1530、エッジ成分算出モジュール1540、背景色判断モジュール1550、原稿領域推定モジュール1560等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)2602は、CPU2601が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)2603は、CPU2601の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス2604により相互に接続されている。
ホストバス2604は、ブリッジ2605を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス2606に接続されている。
キーボード2608、マウス等のポインティングデバイス2609は、操作者により操作されるデバイスである。ディスプレイ2610は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。また、ポインティングデバイス2609とディスプレイ2610の両方の機能を備えているタッチスクリーン等であってもよい。
HDD(Hard Disk Drive)2611は、ハードディスク(フラッシュ・メモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU2601によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、対象としている画像、処理結果テーブル1400、原稿画像、各モジュールの処理結果等が格納される。さらに、その他の各種データ、各種コンピュータ・プログラム等が格納される。
ドライブ2612は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2613に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2607、外部バス2606、ブリッジ2605、及びホストバス2604を介して接続されているRAM2603に供給する。なお、リムーバブル記録媒体2613も、データ記録領域として利用可能である。
接続ポート2614は、外部接続機器2615を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート2614は、インタフェース2607、及び外部バス2606、ブリッジ2605、ホストバス2604等を介してCPU2601等に接続されている。通信部2616は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部2617は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2618は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図26に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図26に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図26に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
また、前述の実施の形態の説明内での比較処理において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
前述の実施の形態(特に、第2の実施の形態)は以下のように把握してもよい。特に、第1の実施の形態と組み合わせてもよいし、第1の実施の形態内のモジュールを、第2の実施の形態内のモジュールとしてもよい。
[A1]複数の原稿画像が含まれている画像の低周波な特徴を有する第1領域を抽出する第1抽出手段と、
前記画像の高周波な特徴を有する第2領域を抽出する第2抽出手段と、
前記画像の背景が白色であるか否かに応じて、前記第1領域と前記第2領域を組み合わせて、前記原稿画像の領域を抽出する第3抽出手段
を有する画像処理装置。
[A2]前記画像の周辺領域の輝度値にしたがって背景が白色であるか否かを判断する判断手段
をさらに有し、
前記第3抽出手段は、前記第3抽出手段は、前記判断手段による判断結果を用いる、
[A1]に記載の画像処理装置。
[A3]前記判断手段は、4つの前記周辺領域毎の背景が白色であるか否かの判断結果を用いて、前記画像の背景が白色であるか否かを判断する、
[A2]に記載の画像処理装置。
[A4]前記第3抽出手段は、前記判断手段によって前記画像の背景が白色でないと判断された場合は、前記第1領域と前記第2領域の両方を用いて、前記原稿画像の領域を抽出する、
[A2]に記載の画像処理装置。
[A5]前記第3抽出手段は、前記判断手段によって前記画像の背景が白色であると判断された場合は、前記第2領域を優先して、前記原稿画像の領域を抽出する、
[A4]に記載の画像処理装置。
[A6]前記第1抽出手段は、二値化処理によって前記第1領域を抽出する、
[A1]から[A5]のいずれか一項に記載の画像処理装置。
[A7]前記第2抽出手段は、エッジ検出処理又は色差検出処理によって前記第2領域を抽出する、
[A1]から[A6]のいずれか一項に記載の画像処理装置。
[A8]前記判断手段によって、背景が白色であるか否かを判断できない場合は、利用者に白色かそれ以外の色であるかを指示させる旨の表示を行う、又は、利用者に再度スキャンさせる旨の表示を行う表示手段
をさらに有する[A2]、[A2]を直接的又は間接的に引用する[A3]から[A7]のいずれか一項に記載の画像処理装置。
[A9]コンピュータを、
複数の原稿画像が含まれている画像の低周波な特徴を有する第1領域を抽出する第1抽出手段と、
前記画像の高周波な特徴を有する第2領域を抽出する第2抽出手段と、
前記画像の背景が白色であるか否かに応じて、前記第1領域と前記第2領域を組み合わせて、前記原稿画像の領域を抽出する第3抽出手段
として機能させるための画像処理プログラム。
そして、前述の発明は、以下の効果を有する。
[A1]の画像処理装置によれば、背景が白色であるか否かを固定せずに原稿画像を抽出する場合にあって、背景に使用できる色を固定したことを想定した処理に比べて、原稿画像の抽出精度を高めることができる。
[A2]の画像処理装置によれば、原稿画像の影響が少ない画像の周辺領域の輝度値を用いて、背景が白色であるか否かの判断をすることができる。
[A3]の画像処理装置によれば、4つの各周辺領域に背景が白色であるか否かの判断結果を用いて、背景が白色であるか否かの判断をすることができる。
[A4]の画像処理装置によれば、背景が白色でないと判断された場合は、第1領域又は第2領域のいずれか一方を用いる場合に比べて、原稿画像の抽出精度を高めることができる。
[A5]の画像処理装置によれば、背景が白色であると判断された場合は、第1領域を優先させて用いた場合に比べて、原稿画像の抽出精度を高めることができる。
[A6]の画像処理装置によれば、二値化処理を用いて第1領域を抽出することができる。
[A7]の画像処理装置によれば、エッジ検出処理又は色差検出処理を用いて第2領域を抽出することができる。
[A8]の画像処理装置によれば、背景が白色であるか否かを判断できない場合は、利用者の操作を促すことができる。
[A9]の画像処理プログラムによれば、背景が白色であるか否かを固定せずに原稿画像を抽出する場合にあって、背景に使用できる色を固定したことを想定した処理に比べて、原稿画像の抽出精度を高めることができる。
100…画像処理装置
110…データ読込モジュール
120…矩形検出モジュール
130…条件判定モジュール
140…内包矩形検出モジュール
200…画像読取装置
240…原稿画像処理装置
250…原稿処理装置
290…通信回線
510…画像縮小モジュール
520…矩形検出処理モジュール
530…座標復元モジュール
540…矩形切出&傾き補正モジュール
550…矩形切出&傾き補正モジュール
580…黒台紙用矩形検出処理モジュール
590…矩形切出&傾き補正モジュール
1010…矩形数判定モジュール
1020…背景状態判定処理モジュール
1025…下地色参照領域決定モジュール
1030…二値化モジュール
1035…黒画素計数モジュール
1040…黒台紙判定モジュール
1050…サイズ判定モジュール
1500…画像処理装置
1510…データ読込モジュール
1520…背景色特徴算出モジュール
1530…固定濃度差算出モジュール
1540…エッジ成分算出モジュール
1550…背景色判断モジュール
1560…原稿領域推定モジュール

Claims (6)

  1. 複数の原稿画像が含まれている画像から矩形を検出する第1の検出手段と、
    前記矩形内の背景が白色でない場合は、該矩形に内包されている矩形を原稿画像として検出する第2の検出手段と、
    予め定められた条件にしたがって、前記第1の検出手段によって検出された矩形内の背景が白色であるか否かを判定する判定手段
    を有し、
    前記第2の検出手段は、前記判定手段による判定結果を用い、
    前記条件として、前記第1の検出手段によって検出された矩形の数と予め定められた閾値との比較を用いる、
    画像処理装置。
  2. 複数の原稿画像が含まれている画像から矩形を検出する第1の検出手段と、
    前記矩形内の背景が白色でない場合は、該矩形に内包されている矩形を原稿画像として検出する第2の検出手段と、
    予め定められた条件にしたがって、前記第1の検出手段によって検出された矩形内の背景が白色であるか否かを判定する判定手段
    を有し、
    前記第2の検出手段は、前記判定手段による判定結果を用い、
    前記条件として、前記第1の検出手段によって検出された矩形に内包されている矩形の数と予め定められた閾値との比較を用いる、
    画像処理装置。
  3. 前記第2の検出手段は、前記矩形の背景が白色である場合は、前記第1の検出手段によって検出された矩形を原稿画像として検出する、
    請求項1又は2に記載の画像処理装置。
  4. 前記第1の検出手段は、前記画像内で最も外側にある矩形を検出する、
    請求項1から3のいずれか一項に記載の画像処理装置。
  5. コンピュータを、
    複数の原稿画像が含まれている画像から矩形を検出する第1の検出手段と、
    前記矩形内の背景が白色でない場合は、該矩形に内包されている矩形を原稿画像として検出する第2の検出手段と、
    予め定められた条件にしたがって、前記第1の検出手段によって検出された矩形内の背景が白色であるか否かを判定する判定手段
    として機能させ
    前記第2の検出手段は、前記判定手段による判定結果を用い、
    前記条件として、前記第1の検出手段によって検出された矩形の数と予め定められた閾値との比較を用いる、
    画像処理プログラム。
  6. コンピュータを、
    複数の原稿画像が含まれている画像から矩形を検出する第1の検出手段と、
    前記矩形内の背景が白色でない場合は、該矩形に内包されている矩形を原稿画像として検出する第2の検出手段と、
    予め定められた条件にしたがって、前記第1の検出手段によって検出された矩形内の背景が白色であるか否かを判定する判定手段
    として機能させ
    前記第2の検出手段は、前記判定手段による判定結果を用い、
    前記条件として、前記第1の検出手段によって検出された矩形に内包されている矩形の数と予め定められた閾値との比較を用いる、
    画像処理プログラム。
JP2016232398A 2016-11-30 2016-11-30 画像処理装置及び画像処理プログラム Active JP6852369B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016232398A JP6852369B2 (ja) 2016-11-30 2016-11-30 画像処理装置及び画像処理プログラム
US15/583,287 US10075614B2 (en) 2016-11-30 2017-05-01 Image processing apparatus and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016232398A JP6852369B2 (ja) 2016-11-30 2016-11-30 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2018093264A JP2018093264A (ja) 2018-06-14
JP6852369B2 true JP6852369B2 (ja) 2021-03-31

Family

ID=62190638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016232398A Active JP6852369B2 (ja) 2016-11-30 2016-11-30 画像処理装置及び画像処理プログラム

Country Status (2)

Country Link
US (1) US10075614B2 (ja)
JP (1) JP6852369B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6852364B2 (ja) * 2016-11-25 2021-03-31 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN110321808B (zh) * 2019-06-13 2021-09-14 浙江大华技术股份有限公司 遗留物与盗移物检测方法、设备和存储介质
GB2590619B (en) * 2019-12-20 2022-01-05 Restricted Image Ltd Image management system and method
CN111127371B (zh) * 2020-03-30 2020-07-07 南京安科医疗科技有限公司 图像增强参数自动优化方法、存储介质和x射线扫描装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2958981B2 (ja) 1989-07-24 1999-10-06 富士ゼロックス株式会社 原稿検知装置
US6549681B1 (en) * 1995-09-26 2003-04-15 Canon Kabushiki Kaisha Image synthesization method
JPH09163121A (ja) * 1995-12-12 1997-06-20 Minolta Co Ltd デジタル画像形成装置
JP3994595B2 (ja) * 1998-11-16 2007-10-24 株式会社デンソー バーコード読取方法及び記録媒体
JP3999505B2 (ja) * 2001-11-30 2007-10-31 オリンパス株式会社 カメラ
JP2003338920A (ja) * 2002-05-21 2003-11-28 Canon Inc 画像読取装置
JP4795038B2 (ja) 2006-02-01 2011-10-19 キヤノン株式会社 名刺管理システム、はがき管理システム、名刺管理方法およびはがき管理方法
WO2007126033A1 (en) * 2006-04-25 2007-11-08 Canon Kabushiki Kaisha Image sensing apparatus and method for controlling the same
JP2008149685A (ja) * 2006-12-20 2008-07-03 Brother Ind Ltd 画像処理装置、画像形成装置、画像処理プログラム、及び画像処理方法
US8174737B2 (en) * 2007-12-28 2012-05-08 Brother Kogyo Kabushiki Kaisha Image reading apparatus
JP4525787B2 (ja) * 2008-04-09 2010-08-18 富士ゼロックス株式会社 画像抽出装置、及び画像抽出プログラム
JP4803274B2 (ja) * 2009-03-19 2011-10-26 コニカミノルタビジネステクノロジーズ株式会社 画像処理方法およびコンピュータプログラム
US9113064B2 (en) * 2009-11-05 2015-08-18 Olympus Corporation Image pickup apparatus and image acquisition method
JP5932289B2 (ja) * 2011-10-20 2016-06-08 キヤノン株式会社 画像形成装置およびその制御方法
JP6003574B2 (ja) * 2012-11-22 2016-10-05 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN105556539A (zh) * 2014-05-16 2016-05-04 联发科技股份有限公司 检测兴趣区域的检测装置和方法
JP2016076771A (ja) * 2014-10-03 2016-05-12 キヤノン株式会社 撮像装置
JP6585006B2 (ja) * 2016-06-07 2019-10-02 株式会社東芝 撮影装置および車両
US20180025305A1 (en) * 2016-07-21 2018-01-25 Sean Edward Rutherford Calendar Based Economic Engine
KR102522565B1 (ko) * 2016-08-31 2023-04-17 삼성전자주식회사 영상 표시 장치 및 그 동작 방법

Also Published As

Publication number Publication date
JP2018093264A (ja) 2018-06-14
US20180152594A1 (en) 2018-05-31
US10075614B2 (en) 2018-09-11

Similar Documents

Publication Publication Date Title
JP6852369B2 (ja) 画像処理装置及び画像処理プログラム
JP7017060B2 (ja) 画像処理装置及び画像処理プログラム
US8494304B2 (en) Punched hole detection and removal
CN1874395B (zh) 图像处理装置和图像处理方法
US8941864B2 (en) Image processing apparatus, image reading apparatus, image forming apparatus, and image processing method
EP2693732B1 (en) Image processing apparatus and image processing method
KR102553581B1 (ko) 멀티 크롭 처리를 행하는 화상 처리 장치, 멀티 크롭 처리에 의해 문서 단위의 화상을 생성하는 방법 및 저장 매체
US8630025B2 (en) Image processing apparatus, image processing method, and image processing program recorded recording medium
JP2012169755A (ja) 画像処理装置及び画像処理方法、プログラム。
CN101626448A (zh) 图像处理装置和图像处理方法
JP2021128356A (ja) 情報処理装置及びプログラム
JP6957889B2 (ja) 画像処理装置及び画像処理プログラム
CN110879689A (zh) 信息处理装置、记录媒体及信息处理方法
US20110242610A1 (en) Image processing system with electronic book reader mode
JP6852364B2 (ja) 画像処理装置及び画像処理プログラム
JP6780271B2 (ja) 画像処理装置及び画像処理プログラム
EP1492327A1 (en) Image processing device
JP5222127B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6922421B2 (ja) 読取方法案内装置、読取方法案内プログラム及び画像処理システム
JP2014120832A (ja) 画像処理装置及び画像処理プログラム
JP6876917B2 (ja) 原稿サイズ検出装置、原稿サイズ検出プログラム及び画像処理システム
JP2009060216A (ja) 画像処理装置及び画像処理プログラム
JP6714859B2 (ja) 画像形成装置およびプログラム
WO2012091180A1 (ja) 文字検出装置、文字検出方法、および記録媒体
JP2015216551A (ja) 画像形成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191024

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200901

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210222

R150 Certificate of patent or registration of utility model

Ref document number: 6852369

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350