JP2018018303A - 情報抽出装置及びこれを備えた画像形成装置 - Google Patents

情報抽出装置及びこれを備えた画像形成装置 Download PDF

Info

Publication number
JP2018018303A
JP2018018303A JP2016148095A JP2016148095A JP2018018303A JP 2018018303 A JP2018018303 A JP 2018018303A JP 2016148095 A JP2016148095 A JP 2016148095A JP 2016148095 A JP2016148095 A JP 2016148095A JP 2018018303 A JP2018018303 A JP 2018018303A
Authority
JP
Japan
Prior art keywords
image data
information
extraction
document
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016148095A
Other languages
English (en)
Inventor
山田 篤志
Atsushi Yamada
篤志 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2016148095A priority Critical patent/JP2018018303A/ja
Priority to US15/650,162 priority patent/US10452903B2/en
Priority to CN201710579911.8A priority patent/CN107665346A/zh
Publication of JP2018018303A publication Critical patent/JP2018018303A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

【課題】PCを用いずに情報を抽出する領域を容易に設定できるようにする。
【解決手段】情報抽出装置は、記憶部、画像読取装置、制御部を含む。制御部は、参照原稿に基づく参照画像データのうちの彩色領域を認識し、彩色領域の色に基づき彩色領域を第1彩色領域と第2彩色領域に分類し、第1彩色領域を含む特徴画像データと、特徴画像データから第2彩色領域までの距離と方向を示す位置データを記憶部に記憶させ、参照原稿の読み取り後の比較原稿の読み取りで得られた比較画像データ内に特徴画像データとマッチングする領域が含まれているとき、特徴画像データとマッチングする領域の位置と位置データに基づく距離と方向に基づき抽出領域を定め、抽出領域から抽出した抽出情報を記憶部に記憶させる。
【選択図】図5

Description

本発明は、画像データから情報を抽出する装置に関する。
書類のフォーマット(書式)を登録しておき、書類(原稿)のスキャンで得られた画像データのフォーマットが、登録フォーマットと一致するか否かを判定し、登録フォーマットを含む画像データから情報を抽出することがある。このようなフォーマットに基づく情報の抽出に関する技術の一例が特許文献1に記載されている。
具体的に、特許文献1には、記憶されたフォーマットデータを参照して複数のセルがある規則に従って配置されている文書のレイアウトを解析し、各セルに存在する情報のタイプとセル間の隣接関係を規定したフォーマットデータを記憶し、文書のイメージデータを抽出し、イメージデータからの複数のセルの抽出とセル間の隣接関係を求め、文書のセル間の隣接関係をフォーマットデータが規定するセル間の隣接関係と比較し、文書におけるセルのうち対応するフォーマットデータが規定するセルを特定して文書中の情報の配置を特定し、特定された情報の配置に従って文書に含まれる情報を認識するシステムの一例が記載されている。これにより、セルの配置の順序は変わらないがセルの位置、大きさが異なる文書に対応可能なフォーマットを提供しようとする(特許文献1:請求項9、段落[0008])。
特開平10−063744号公報
帳票のような書類には、例えば、氏名、住所、電話番号のような情報が記載される。書類の画像データから所望の情報を自動的に抽出し、データ化できれば、書類を見ながら入力者が情報をキーボードで手入力する必要がなくなり、便利である。また、書類には、回答者の選択肢の記入欄(回答欄)が設けられることもある。例えば、回答欄は、チェックボックスや丸で囲われる記号を含む。記入者は、該当するボックスへのチェックや、該当する記号を丸で囲む。回答欄でどのような選択がなされているか(どのような記号がどのような位置に記入されているか)の情報を自動的に抽出してまとめることができれば、作業者が書類を1枚ずつめくって選ばれた回答を確認しなくて済む。
従来、書類に含まれる情報を自動抽出するには、書類のフォーマットを定義するための画像データやフォーマットのうち、情報を抽出する領域(情報抽出領域)の位置を情報処理装置に予め登録しておくことが必要である。例えば、フォーマットの画像データをPCで閲覧しつつ、マウスのようなポインティングデバイスを用いて矩形の領域を定める操作によって、情報抽出領域が定められる。通常、フォーマットの登録や情報抽出領域の設定作業にはPCが用いられる。
また、設定した情報抽出領域にズレがあると、正確に所望の情報を得られない場合がある。そのため、情報抽出領域のサイズや位置を細かく調整できる(設定できる)ようにする場合がある。しかし、PC上での操作が細かいほど、情報抽出領域の設定操作が難しくなりやすいという問題がある。
特許文献1に記載の技術では、1つのフォーマットデータで、セルの大きさは異なるが隣接関係が同じ文書を識別する点は記載されている。しかし、PCでの利用が前提である。また、情報を抽出する領域を設定する点は記載されていない。従って、特許文献1記載の技術は、上記の問題を解決できない。
本発明は、上記問題点を鑑み、PCを用いずに情報を抽出する領域を容易に設定できるようにする。
上記目的を達成するために請求項1に係る情報抽出装置は、記憶部、画像読取装置、制御部を含む。前記記憶部は、データを記憶する。前記画像読取装置は、原稿を読み取って前記原稿の画像データを生成する。前記制御部は、前記画像読取装置による参照原稿の読み取りで得られた参照画像データのうち、彩色された領域である彩色領域を認識し、前記彩色領域の色に基づき前記彩色領域を第1彩色領域と第2彩色領域に分類し、前記参照画像データから前記第1彩色領域を含む特徴画像データを前記記憶部に記憶させ、前記特徴画像データから前記第2彩色領域までの距離と方向を示す位置データを前記記憶部に記憶させ、前記参照原稿の読み取り後の前記画像読取装置による比較原稿の読み取りで得られた比較画像データ内に前記特徴画像データとマッチングする領域が含まれているか否かを判定し、含まれていると判定したとき、前記比較画像データ内の前記特徴画像データとマッチングする領域の位置と前記位置データに基づく距離と方向に基づき抽出領域を定め、前記抽出領域に含まれる情報を抽出情報として抽出し、前記抽出情報を前記記憶部に記憶させ、含まれていないと判定したとき、前記抽出領域を定めず前記抽出情報を抽出しない。
本発明によれば、マーカーで着色するだけで、情報抽出の対象とする書類(フォーマット)や情報を抽出する領域の位置を容易に設定することができる。また、PCを用いて複雑で細かな操作、作業をしなくてすむ。
実施形態に係る複合機の一例を示す図である。 実施形態に係る情報抽出装置での参照原稿の読み取りの流れの一例を示すフローチャートである。 実施形態に係る参照原稿の一例を示す図である。 実施形態に係る情報抽出モード設定画面の一例を示す図である。 実施形態に係る情報抽出装置での比較原稿の読み取りの流れの一例を示すフローチャートである。
以下、図1〜図5を用いて、本発明に係る情報抽出装置1と、情報抽出装置1を含む画像形成装置を説明する。画像形成装置として複合機100を例に挙げて説明する。但し、本実施の形態に記載されている構成、配置等の各要素は、発明の範囲を限定するものではなく単なる説明例にすぎない。
(複合機100の概要)
まず、図1を用いて実施形態に係る複合機100を説明する。図1は、実施形態に係る複合機100の一例を示す図である。
複合機100は、制御部2と記憶部3を含む。制御部2は、装置全体の動作を統括し複合機100の各部を制御する。制御部2はCPU21、画像処理部22、マッチング処理部23、OCR処理部24を含む。CPU21は、制御に関する演算を行う。画像処理部22は、ジョブに必要な画像処理を画像データに施す。
マッチング処理部23は、特徴画像データD2と比較画像データD4との比較を行う(詳細は後述)。そして、マッチング処理部23は、特徴画像データD2とマッチングする領域(類似度が閾値以上である領域)が比較画像データD4に含まれているか否かを判定する。OCR処理部24は、画像データのOCR処理を行い、画像データからテキストデータを抽出する。記憶部3は、ROM、RAM、HDDのような記憶装置を含み、制御用プログラムや各種データを記憶する。
又、制御部2は、画像読取装置4と通信可能に接続される。画像読取装置4は、原稿搬送部4a、画像読取部4bを含む。原稿搬送部4aは、セットされた1又は複数枚の原稿を読み取り位置に向けて搬送する。画像読取部4bは、光源やイメージセンサーを含むスキャナユニットである。画像読取部4bは、原稿搬送部4aが搬送する原稿や、原稿台(コンタクトガラス)にセットされた原稿を読み取り、画像データを生成する。画像読取部4bは、カラーでの読み取りが可能である。制御部2は、原稿搬送部4aと画像読取部4bの動作を制御する。
操作パネル5は、表示パネル51(メッセージ出力部に相当)、タッチパネル52、ハードキー53を含む。制御部2は表示パネル51の表示を制御する。制御部2は、設定用画面を表示パネル51に表示させる。制御部2は、タッチパネル52の出力に基づき、表示パネル51に表示されたソフトキーのような操作画像のうち操作された画像を認識する。また、制御部2は、操作されたハードキー53を認識する。制御部2は操作に応じた画面への切替を表示パネル51に行わせる。制御部2は、操作パネル5でなされた設定操作の内容を認識し、設定どおりに動作するように複合機100を制御する。
又、複合機100は、印刷部6を含む。印刷部6は、給紙部6a、搬送部6b、画像形成部6c、中間転写部6d、定着部6eを含む。制御部2は、印刷ジョブのとき用紙を一枚ずつ給紙部6aに供給させる。制御部2は、用紙を画像形成部6c、定着部6eを経て機外(排出トレイ)まで搬送部6bに搬送させる。制御部2は、搬送部6bより搬送される用紙にのせるトナー像を画像形成部6cに形成させる。制御部2は、画像形成部6cで形成されたトナー像の中間転写ベルトへの一次転写を中間転写部6dに行わせ、中間転写ベルト上のトナー像の用紙への二次転写を中間転写部6dに行わせる。制御部2は、用紙の加熱、加圧を定着部6eに行わせる。これにより、トナー像は用紙に定着する。印刷済用紙は搬送部6bにより排出トレイに排出する。
又、複合機100は通信部25を含む。通信部25は、PCやサーバーのようなコンピューター200と通信するためのインターフェイスである。通信部25は、コンピューター200から画像データのような印刷内容を示すデータや印刷に関する設定を示すデータを含むジョブ用データを受信する。制御部2は、ジョブ用データに基づく印刷を印刷部6に行わせる。
(参照原稿7の読み取り)
次に、図2〜図4を用いて、実施形態に係る情報抽出装置1での参照原稿7の読み取りの流れの一例を説明する。図2は、実施形態に係る情報抽出装置1での参照原稿7の読み取りの流れの一例を示すフローチャートである。図3は実施形態に係る参照原稿7の一例を示す図である。図4は、実施形態に係る情報抽出モード設定画面S1の一例を示す図である。
原稿から情報の抽出を行うモードとするための操作を操作パネル5に行うことにより、複合機100は、情報抽出モードとなる。この情報抽出モードのとき、記憶部3、画像読取装置4、制御部2、操作パネル5は情報抽出装置1として機能する。言い換えると、複合機100は、情報抽出装置1を含む。
情報抽出モードでは、情報の抽出が行われる。情報を抽出する原稿を読み取る前に、1枚の参照原稿7を読み取る。参照原稿7は、これから情報を抽出しようとする書類のフォーマットの原稿であって、使用者に彩色された原稿である。参照原稿7の読み取りの後、情報を抽出する原稿の読み取りと、読み取りで得られた画像データからの情報を抽出する処理がなされる(情報の抽出の詳細は後述)。
図2のフローチャートを用いて、参照原稿7の読み取りを説明する。図2のスタートは、情報抽出モードを利用する操作が操作パネル5になされた時点である。情報抽出モードの開始に伴い、使用者によって参照原稿7が原稿搬送部4a又は画像読取部4bにセットされる(ステップ♯11)。
図3は、参照原稿7の一例を示す図である。図3は、ある申請書の一例を示す。参照原稿7は、情報を抽出しようとする書類のフォーマットを有する原稿から1枚を選び出したものである。参照原稿7は、情報を抽出しようとする書類と同じフォーマットを有し、情報の記入欄が空欄状態の用紙(未記入用紙)でもよい。参照原稿7は1枚あればよい。
使用者は、枠線や表題や様式番号のようなフォーマットの特徴点(特徴箇所71)を有彩色のマーカーで彩色する。使用者は、フォーマット内で抽出しようとする情報が記載された部分(情報箇所72)を特徴箇所71と異なる色であって有彩色のマーカーで彩色する。例えば、マーカーは、蛍光ペンである。マーカーには、特徴箇所71の文字、図形、記号が識別不能とならない程度の濃さのものを利用できる。例えば、特徴箇所71を緑の蛍光ペン、情報箇所72を青の蛍光ペンで彩色する。
図3の各図は、「○○申請書」という標題部分を特徴箇所71として彩色し、氏名の欄を情報箇所72として彩色する例を示す。
図3の左側の図に示すように、特徴箇所71の色として選択した色のマーカーで特徴箇所71とする領域を塗りつぶしてもよい。また、情報箇所72の色として選択した色のマーカーで情報箇所72とする領域を塗りつぶしてもよい。
また、図3の右側の図に示すように、特徴箇所71の色として選択した色のマーカーを用いて、特徴箇所71とする領域を線で囲ってもよい。また、情報箇所72の色として選択した色のマーカーを用いて情報箇所72とする領域を線で囲ってもよい。この場合、使用者は、特徴箇所71又は情報箇所72とする枠線や、文字、図形、記号の周囲をマーカーでなぞる。マーカーの線内は塗りつぶさなくてもよい。
制御部2は、セットされた参照原稿7を画像読取装置4に読み取らせる(ステップ♯12)。続いて、制御部2は、参照原稿7の読み取りで得られた画像データ(参照画像データD1、参照原稿7をカラーで読み取って得られた画像データ)を記憶部3に記憶させる(ステップ♯13)。
制御部2(画像処理部22)は、参照画像データD1のうち彩色された領域(彩色領域、有彩色の領域)を認識する(ステップ♯14)。彩色領域の色に基づき、制御部2は、彩色領域を特徴箇所71を含む第1彩色領域71aと、情報箇所72を含む第2彩色領域72aに分類する(ステップ♯15)。図3の例で言えば、制御部2は、「○○申請書」の文字を含むように彩色された領域を第1彩色領域71aに分類する。また、制御部2は、氏名記入欄の領域を第2彩色領域72aに分類する。
具体的に、制御部2(画像処理部22)は、参照画像データD1内の各画素の画素値を確認し、特徴箇所71の色として選択された色に対応する画素値の画素で塗られている(覆われている)領域、または、特徴箇所71の色として選択された色に対応する画素値の色の線で囲まれている領域(輪郭内の領域)を第1彩色領域71aと認識する。
また、制御部2(画像処理部22)は、参照画像データD1内の各画素の画素値を確認し、情報箇所72の色として選択された色に対応する画素値の画素で塗られている(覆われている)の領域、または、情報箇所72の色として選択された色に対応する画素値の色の線で囲まれている領域(輪郭内の領域)を第2彩色領域72aと認識する。
ここで、図4に示すように、特徴箇所71を彩色する色(第1彩色領域71aに分類する色)と情報箇所72を彩色する色(第2彩色領域72aに分類する色)を設定できるようにしてもよい。図4は、情報抽出モード設定画面S1の一例を示す。操作パネル5の画面に所定の操作が行われたとき、制御部2は、情報抽出モード設定画面S1を表示パネル51に表示させる。情報抽出モード設定画面S1には、複数の色選択キーK1が設けられる。制御部2は、色選択キーK1への操作に基づき、特徴箇所71と情報箇所72を彩色する色を認識する。
桃、赤、黄、青、緑、橙、紫のような各色選択キーK1に対応する色ごとに、その色と扱う画素値の組み合わせが予め定められ、組み合わせを定義したデータが記憶部3に記憶される。24ビットのRGB形式において、例えば緑色の場合、R:G:B=103:228:126(薄緑)、11:218:81(マラカイトグリーン)、127:246:85(萌葱)のような緑色と扱う値の組み合わせが予め定められる。
そして、制御部2は、参照画像データD1のうち、第1彩色領域71aに基づいて特徴画像データD2と扱う部分を定める(ステップ♯16)。そして、制御部2は、特徴画像データD2を記憶部3に記憶させる(ステップ♯17)。
制御部2は、第1彩色領域71aそのものを特徴画像データD2として記憶部3に記憶させてもよい。また、第1彩色領域71aが枠内に含まれている場合もある。そこで、制御部2は、第1彩色領域71aを含む枠内の全領域を特徴画像データD2として記憶部3に記憶させてもよい。例えば、制御部2(画像処理部22)は、参照画像データD1のうち、所定値以上の濃さの画素値が所定の長さ以上連続する直線を罫線と認識し、複数本(4本)の罫線で閉じられた領域を枠と認識する。
蛍光ペンは画像データで濃く現れにくい傾向はある。しかし、マーカーによる彩色のため、特徴画像データD2の各画素の画素値は、彩色されていない参照原稿(彩色されていない同じフォーマットの原稿)には含まれない色成分を含む。そこで、制御部2は、特徴画像データD2の色の調整を行ってもよい。調整を行う場合、マーカーの彩色のために加わっている色成分を除去するため、例えば、制御部2の画像処理部22は、特徴画像データD2の画素の色味を補正する。どの色の濃度をどれだけ弱めるかというような色味の補正処理の内容は、特徴箇所71の指定に用いた色ごと定めればよい。
また、制御部2は、第2彩色領域72aの位置に基づき、特徴画像データD2から第2彩色領域72aまでの距離と方向を示す位置データD3を記憶部3に記憶させる(ステップ♯18)。なお、以降の処理では参照画像データD1を用いないので、制御部2は参照画像データD1を記憶部3に消去させる(ステップ♯19)。そして、参照原稿7の読み取りに関する処理は終了する(エンド)。
制御部2は、特徴画像データD2中の特定位置の画素を第1基準画素とし、第2彩色領域72a中の特定位置の画素を第2基準画素とし、第1基準画素から第2基準画素までの距離と方向を示すデータを位置データD3として記憶させる。特定位置は適宜定めることができる。特定位置は、特徴画像データD2や第2彩色領域72aの中心でもよいし、右上、右下、左上、左下のような隅を特定位置としてもよい。制御部2は、第1基準画素に対し、第2基準画素は、上(又は下)方向に何画素、左(又は右)方向に何画素ずれているというように、特徴画像データD2と第2彩色領域72aの相対的な位置(座標)の差を位置データD3と記憶させてもよい。
(比較原稿の読み取りと情報抽出)
次に、図5を用いて、実施形態に係る情報抽出装置1での比較原稿の読み取りの流れの一例を説明する。図5は、実施形態に係る情報抽出装置1での比較原稿の読み取りの流れの一例を示すフローチャートである。
以下、比較原稿の読み取りと、比較原稿の読み取りで得られた画像データからの情報の抽出を説明する。比較原稿は、画像読取装置4(原稿搬送部4a)にセットされる。使用者は、参照原稿7と同じフォーマットの書類のみの束を比較原稿としてセットしてもよい。また、比較原稿の束のなかに参照原稿7と異なるフォーマットの原稿が含まれていてもよい。例えば、複数種の書類を含む書類ファイルから取り出した全書類を原稿搬送部4aにそのままセットしてもよい。図5のフローチャートでは、原稿搬送部4aに複数枚の原稿束をセットしてデータ抽出を行う例を説明する。
図5のスタートは、図2のフローチャートが完了した時点(参照原稿7の読み取りが完了した時点)である。参照原稿7の読み取り完了に伴い、使用者によって比較原稿が原稿搬送部4aにセットされる(ステップ♯21)。なお、図2のステップ♯11の段階で、参照原稿7を1枚目とし、2枚目以降を比較原稿とした原稿束を原稿搬送部4aにセットするようにしてもよい。
原稿搬送部4aは、原稿が載置される原稿トレイ(不図示)を含む。原稿搬送部4aには原稿セットセンサー41(図1参照)が設けられる。原稿セットセンサー41は、例えば、光センサーである。原稿セットセンサー41の出力値のレベルは、原稿トレイに原稿がセットされているときと、セットされていないときで異なる。制御部2は、原稿セットセンサー41の出力に基づき、原稿搬送部4a(原稿トレイ)に原稿がセットされているか否かを認識する。
制御部2は、セットされた比較原稿を1枚、原稿搬送部4aに搬送させ、画像読取部4bに搬送されている比較原稿を読み取らせる(ステップ♯22)。なお、原稿搬送部4aは、読み取った比較原稿を排出トレイ(不図示)に排出する。また、制御部2は、比較原稿の読み取りで得られた画像データ(比較画像データD4、比較原稿を読み取って得られた画像データ)を記憶部3に記憶させる(ステップ♯23)。
そして、制御部2(マッチング処理部23)は、比較画像データD4に特徴画像データD2とマッチングする領域が含まれるか否かを判定する(ステップ♯24)。例えば、マッチング処理部23は、特徴画像データD2をテンプレートとするテンプレートマッチングを行ってもよい。テンプレートマッチングを行う場合、マッチング処理部23は、特徴画像データD2をテンプレートとし、比較画像データD4上で移動させつつ、比較画像データD4の画素と特徴画像データD2の画素を比較し、類似度が最大となる位置を求める。そして、マッチング処理部23は、類似度が最大となる位置での類似度が所定値以上のとき、比較画像データD4に特徴画像データD2とマッチングする領域が含まれると判定し、所定値未満のとき、比較画像データD4に特徴画像データD2とマッチングする領域が含まれないと判定する。また、マッチング処理部23は、特徴画像データD2と比較画像データD4のそれぞれから予め定められた条件に合致する特徴点を検出し、特徴点の配置に基づきマッチングを行ってもよい。
更に、マッチングの判定に制御部2のOCR処理部24を用いてもよい。この場合、OCR処理部24は、比較画像データD4と特徴画像データD2のそれぞれに含まれる文字や数字のような情報をOCR処理部24にテキストデータ化させる。特徴画像データD2から抽出されたテキスト列と同じテキスト列が比較画像データD4から抽出されたテキストに含まれているとき、制御部2(マッチング処理部23)は、比較画像データD4に特徴画像データD2とマッチングする領域が含まれると判定する。特徴画像データD2から抽出されたテキスト列と同じテキスト列が比較画像データD4から抽出されたテキストに含まれていないとき、制御部2は、比較画像データD4に特徴画像データD2とマッチングする領域が含まれないと判定する。
判定結果に基づき、制御部2は、比較原稿が参照原稿7と同じフォーマットの書類であるか否かを確認する(ステップ♯25)。比較画像データD4に特徴画像データD2とマッチングする領域が含まれるとき(ステップ♯25のYes)、制御部2は、同じフォーマットの書類と判断する。比較画像データD4に特徴画像データD2とマッチングする領域が含まれないとき(ステップ♯25のNo)、制御部2は、異なるフォーマットの書類と判断する。
同じフォーマットのとき(ステップ♯25のYes)、比較画像データD4中の特徴画像データD2とマッチングした領域(特徴画像データD2と最もマッチングした領域)と位置データD3に基づき、制御部2は、抽出領域を定める(ステップ♯26)。
例えば、制御部2は、マッチングした領域のうちの特定位置の画素(第3基準画素)から位置データD3で示される距離、方向分、移動した先の画素を抽出領域の特定位置の画素(第4基準画素)と定める。言い換えると、第3基準画素と第4基準画素の相対的な位置関係と、第1基準画素と第2基準画素の相対的な位置関係を同じにする。
そして、制御部2は、第4基準画素が抽出領域の特定位置の画素となるように、かつ、第2彩色領域72aと同じ面積(広さ)となるように抽出領域を定めてもよい。また、第4基準画素が枠内の画素のとき、制御部2は、第4基準画素が含まれる枠内の全領域を抽出領域と定めてもよい。この場合、抽出領域は、第2彩色領域72aより広くてもよい。
そして、制御部2は、抽出領域に含まれる情報を抽出し、抽出情報D5を記憶部3に記憶させる(ステップ♯27)。制御部2は、抽出領域の画像データを抽出情報D5として記憶部3に記憶させてもよい。また、制御部2は、抽出領域の画像データに対して、OCR処理部24がOCR処理を行うことにより得られたテキストデータを抽出情報D5として記憶部3に記憶させてもよい。また、制御部2は、画像データとテキストデータの両方を記憶部3に記憶させてもよい。なお、図4に示すように、情報抽出モード設定画面S1にチェックボックスC1、C2を設け、画像データとテキストデータのうちいずれを抽出情報D5として記憶部3に記憶させるか、操作パネルで予め設定できるようにしてもよい。
比較原稿のうち、所望の領域に印刷されている情報や、所望の領域に手書きで記入された情報を自動的にデータ化することができる。そして、制御部2は、抽出情報D5が抽出された旨のメッセージを表示パネル51に表示出力させる(ステップ♯28)。
一方、比較画像データD4に特徴画像データD2とマッチングする領域が含まれないとき(ステップ♯25のNo)、制御部2は、読み取った比較原稿は参照原稿7と同じフォーマットではないと判定する(ステップ♯29)。そして、制御部2は、抽出情報D5が抽出されなかった旨のメッセージを表示パネル51に表示出力させる(ステップ♯210)。
ステップ♯28及びステップ♯210の後、制御部2は、原稿セットセンサー41の出力に基づき、読み取るべき比較原稿が残っているかを確認する(ステップ♯211)。比較原稿が残っていないとき(ステップ♯211のNo)、本フローは終了する(エンド)。なお、参照原稿7のときと同様に、制御部2は、全ての比較画像データD4を記憶部3に消去させてもよい。
一方、比較原稿が残っているとき(ステップ♯211のYes)、制御部2は、次の比較原稿の給紙を原稿搬送部4aに開始させる(ステップ♯212)。そして、フローは、ステップ♯22に戻る。
(抽出情報D5の出力)
次に、図1を用いて、比較原稿から抽出した抽出情報D5の出力を説明する。
情報抽出装置1(複合機100)では、データ化された抽出情報D5を印刷出力することができる。抽出情報D5の印刷出力を指示する操作が操作パネル5になされたとき、制御部2は、データ化された抽出情報D5を印刷部6に印刷させる。
また、情報抽出装置1(複合機100)では、通信部25を介し、コンピューター200にデータ化された抽出情報D5を送信出力することができる。抽出情報D5の送信出力を指示する操作が操作パネル5になされたとき、制御部2は、指定されたコンピューター200に向けて、データ化された抽出情報D5を通信部25に送信させる。抽出情報D5がテキストデータ化されている場合、送信する抽出情報D5の形式は、CSVファイルのようなデータ編集に用いやすいデータ形式としてもよい。なお、図4に示すように、情報抽出モード設定画面S1に送信先設定欄C3を設け、送信先のコンピューター200を予め設定できるようにしてもよい。
このようにして、実施形態に係る情報抽出装置1は、記憶部3、画像読取装置4、制御部2を含む。記憶部3は、データを記憶する。画像読取装置4は、原稿を読み取って原稿の画像データを生成する。制御部2は、画像読取装置4による参照原稿7の読み取りで得られた参照画像データD1のうち、彩色された領域である彩色領域を認識し、彩色領域の色に基づき彩色領域を第1彩色領域71aと第2彩色領域72aに分類し、参照画像データD1から第1彩色領域71aを含む特徴画像データD2を記憶部3に記憶させ、特徴画像データD2から第2彩色領域72aまでの距離と方向を示す位置データD3を記憶部3に記憶させ、参照原稿7の読み取り後の画像読取装置4による比較原稿の読み取りで得られた比較画像データD4内に特徴画像データD2とマッチングする領域が含まれているか否かを判定し、含まれていると判定したとき、比較画像データD4内の特徴画像データD2とマッチングする領域の位置と位置データD3に基づく距離と方向に基づき抽出領域を定め、抽出領域に含まれる情報を抽出情報D5として抽出し、抽出情報D5を記憶部3に記憶させ、含まれていないと判定したとき、抽出領域を定めず抽出情報D5を抽出しない。
これにより、参照原稿7にマーカー(蛍光ペンのような筆記具)で色を付すだけで書類のフォーマット(書式)を識別するための特徴部分(特徴画像データD2)を指定することができる。また、参照原稿7にマーカーで色を付すだけで情報を抽出する領域を指定することができる。従って、比較原稿の束に複数のフォーマットの書類が混在していても、比較原稿のうち、参照原稿7と同じフォーマットの原稿のみから、第2彩色領域72aに対応する色で彩色した場所に位置する情報を抽出することができる。このように、情報を抽出するフォーマットの指定とフォーマット内で情報を抽出する領域の指定にPCを用いる必要がない。また、マーカーで色を参照原稿7に付けるだけでよいので、フォーマットと情報抽出領域の指定を容易に行うことができる。
また、罫線機能の豊富なワープロソフトとして表計算ソフトを用いて書類が作成されることがある。例えば、セルを方眼紙のマスのように扱ったり、セルの結合を駆使したりして視覚的な美しさ(見栄え)が優先して書類が作成されることがある。見栄えを優先して作られた書類は、表計算ソフトで作成されているのに、データの再利用性が極めて低い。例えば、CSVファイル化した場合、セル結合や罫線が消え、意味がとれなくなる。しかし、このような見栄えを優先して作られた書類でも、表計算ソフトで作成されたファイルの解析や加工を行わなくても、特定のフォーマットの書類から所望の情報を抽出することができる。
また、情報抽出装置1は、参照原稿7の読み取り後、比較原稿の読み取りごとに抽出情報D5が抽出されたか否かを示すメッセージを出力するメッセージ出力部(表示パネル51)を含む。これにより、画像読取装置4が読み取った原稿のうち、どの原稿で情報が抽出され、どの原稿で情報が抽出されなかったかを使用者に示すことができる。使用者は、参照原稿7と同じフォーマットの書類で情報の抽出漏れがあったことや、参照原稿7と異なるフォーマットの書類から誤って情報が抽出されたことを認識できる。
また、制御部2は、抽出領域の画像データと、抽出領域の画像データに対してOCR処理を行って得られたテキストデータの何れか一方又は両方を抽出情報D5として記憶部3に記憶させる。これにより、比較原稿内の所望の領域に記された情報を、画像データやテキストデータとして抽出することができる。
また、制御部2は、第2彩色領域72aと同じ大きさ又は第2彩色領域72aよりも広い領域を抽出領域と定める。これにより、比較原稿から所望の情報を正確に抽出することができる。
また、制御部2は、枠を基準に特徴画像データD2の範囲及び抽出領域を定める。これにより、枠内の情報を漏れなく抽出することができる。
また、操作パネル5は、第1彩色領域71aと分類する色と、第2彩色領域72aと分類する色の設定を受け付ける。制御部2は、操作パネル5で設定された色に基づき、第1彩色領域71aと第2彩色領域72aを分類する。これにより、特徴画像データD2の指定に用いる色を設定することができる。また、情報を抽出する領域を指定するために用いる色を設定することができる。従って、使用者は、所望の色のマーカーを用いて書類から情報を抽出することができる。
また、画像形成装置は、情報抽出装置1を含む。書類の束に複数種の書類が混ざっていても、所望のフォーマットの書類から、所望の情報を抽出する画像形成装置を提供することができる。
以上、本発明の実施形態について説明したが、本発明の範囲はこれに限定されるものではなく、発明の主旨を逸脱しない範囲で種々の変更を加えて実施することができる。
本発明は、原稿を読み取る画像読取装置を含む装置に利用可能である。
100 複合機(画像形成装置) 1 情報抽出装置
2 制御部 23 マッチング処理部
24 OCR処理部 3 記憶部
4 画像読取装置 4a 原稿搬送部
4b 画像読取部 5 操作パネル
51 表示パネル(メッセージ出力部) 7 参照原稿
71a 第1彩色領域 72a 第2彩色領域
D1 参照画像データ D2 特徴画像データ
D3 位置データ D4 比較画像データ
D5 抽出情報

Claims (7)

  1. データを記憶する記憶部と、
    原稿を読み取って前記原稿の画像データを生成する画像読取装置と、
    前記画像読取装置による参照原稿の読み取りで得られた参照画像データのうち、彩色された領域である彩色領域を認識し、前記彩色領域の色に基づき前記彩色領域を第1彩色領域と第2彩色領域に分類し、前記参照画像データから前記第1彩色領域を含む特徴画像データを前記記憶部に記憶させ、前記特徴画像データから前記第2彩色領域までの距離と方向を示す位置データを前記記憶部に記憶させ、前記参照原稿の読み取り後の前記画像読取装置による比較原稿の読み取りで得られた比較画像データ内に前記特徴画像データとマッチングする領域が含まれているか否かを判定し、含まれていると判定したとき、前記比較画像データ内の前記特徴画像データとマッチングする領域の位置と前記位置データに基づく距離と方向に基づき抽出領域を定め、前記抽出領域に含まれる情報を抽出情報として抽出し、前記抽出情報を前記記憶部に記憶させ、含まれていないと判定したとき、前記抽出領域を定めず前記抽出情報を抽出しない制御部と、を含むことを特徴とする情報抽出装置。
  2. 前記参照原稿の読み取り後、前記比較原稿の読み取りごとに前記抽出情報が抽出されたか否かを示すメッセージを出力するメッセージ出力部を含むことを特徴とする請求項1に記載の情報抽出装置。
  3. 前記制御部は、前記抽出領域の画像データと、前記抽出領域の画像データに対してOCR処理を行って得られたテキストデータの何れか一方又は両方を前記抽出情報として前記記憶部に記憶させることを特徴とする請求項1又は2に記載の情報抽出装置。
  4. 前記制御部は、前記第2彩色領域と同じ大きさ又は前記第2彩色領域よりも広い領域を前記抽出領域と定めることを特徴とする請求項1乃至3の何れか1項に記載の情報抽出装置。
  5. 前記制御部は、枠を基準に前記特徴画像データの範囲及び前記抽出領域を定めることを特徴とする請求項1乃至4の何れか1項に記載の情報抽出装置。
  6. 前記第1彩色領域と分類する色と、前記第2彩色領域と分類する色の設定を受け付ける操作パネルを含み、
    前記制御部は、前記操作パネルで設定された色に基づき、前記第1彩色領域と前記第2彩色領域を分類することを特徴とする請求項1乃至5の何れか1項に記載の情報抽出装置。
  7. 請求項1乃至6の何れか1項に記載の情報抽出装置を含むことを特徴とする画像形成装置。
JP2016148095A 2016-07-28 2016-07-28 情報抽出装置及びこれを備えた画像形成装置 Pending JP2018018303A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016148095A JP2018018303A (ja) 2016-07-28 2016-07-28 情報抽出装置及びこれを備えた画像形成装置
US15/650,162 US10452903B2 (en) 2016-07-28 2017-07-14 Information extraction device, image forming apparatus including information extraction device and method of controlling information extraction device
CN201710579911.8A CN107665346A (zh) 2016-07-28 2017-07-17 信息提取装置、具有信息提取装置的图像形成装置、信息提取装置的控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016148095A JP2018018303A (ja) 2016-07-28 2016-07-28 情報抽出装置及びこれを備えた画像形成装置

Publications (1)

Publication Number Publication Date
JP2018018303A true JP2018018303A (ja) 2018-02-01

Family

ID=61010097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016148095A Pending JP2018018303A (ja) 2016-07-28 2016-07-28 情報抽出装置及びこれを備えた画像形成装置

Country Status (3)

Country Link
US (1) US10452903B2 (ja)
JP (1) JP2018018303A (ja)
CN (1) CN107665346A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019191725A (ja) * 2018-04-20 2019-10-31 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像形成プログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7031465B2 (ja) * 2018-04-18 2022-03-08 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN110264478A (zh) * 2019-06-21 2019-09-20 腾讯科技(深圳)有限公司 一种线稿图像上色的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004246597A (ja) * 2003-02-13 2004-09-02 Ricoh Co Ltd 画像処理装置、記録媒体およびプログラム
JP2008276677A (ja) * 2007-05-07 2008-11-13 Fuji Xerox Co Ltd 文字認識支援装置、文字認識装置及びプログラム
JP2012221183A (ja) * 2011-04-08 2012-11-12 Fujitsu Marketing Ltd レシートデータ認識装置およびそのプログラム
JP2014170452A (ja) * 2013-03-05 2014-09-18 Fuji Xerox Co Ltd 画像処理装置及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063744A (ja) 1996-07-18 1998-03-06 Internatl Business Mach Corp <Ibm> 文書のレイアウト解析方法及びシステム
US20060122956A1 (en) * 2004-12-03 2006-06-08 Kabushiki Kaisha Toshiba Electronic document management apparatus and electronic document management program
WO2009070032A1 (en) * 2007-11-28 2009-06-04 Lumex A/S A method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
JP2010231541A (ja) * 2009-03-27 2010-10-14 Oki Electric Ind Co Ltd 情報処理装置、文字認識方法、およびプログラム
WO2012077729A1 (ja) * 2010-12-07 2012-06-14 株式会社プロスパークリエイティブ 色処理方法、色処理装置及び色処理システム
US9165188B2 (en) * 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
CN103488984B (zh) * 2013-10-11 2017-04-12 瑞典爱立信有限公司 基于智能移动设备的二代身份证识别方法及装置
CN105095900B (zh) * 2014-05-04 2020-12-08 斑马智行网络(香港)有限公司 一种提取标准卡片中特定信息的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004246597A (ja) * 2003-02-13 2004-09-02 Ricoh Co Ltd 画像処理装置、記録媒体およびプログラム
JP2008276677A (ja) * 2007-05-07 2008-11-13 Fuji Xerox Co Ltd 文字認識支援装置、文字認識装置及びプログラム
JP2012221183A (ja) * 2011-04-08 2012-11-12 Fujitsu Marketing Ltd レシートデータ認識装置およびそのプログラム
JP2014170452A (ja) * 2013-03-05 2014-09-18 Fuji Xerox Co Ltd 画像処理装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019191725A (ja) * 2018-04-20 2019-10-31 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像形成プログラム

Also Published As

Publication number Publication date
CN107665346A (zh) 2018-02-06
US10452903B2 (en) 2019-10-22
US20180032809A1 (en) 2018-02-01

Similar Documents

Publication Publication Date Title
US8610929B2 (en) Image processing apparatus, control method therefor, and program
US8941864B2 (en) Image processing apparatus, image reading apparatus, image forming apparatus, and image processing method
US8125683B2 (en) Image preview processing apparatus, image preview processing method, and image preview computer product
US9454696B2 (en) Dynamically generating table of contents for printable or scanned content
JP4807489B2 (ja) 教材処理装置、教材処理方法および教材処理プログラム
JP2018018303A (ja) 情報抽出装置及びこれを備えた画像形成装置
JP2018151699A (ja) 情報処理装置及びプログラム
US7920742B2 (en) Image processing apparatus, program and recording medium for document registration
JP4167680B2 (ja) 原稿読取装置および原稿読取方法
JP2007082021A (ja) 画像処理装置、プログラムおよび画像データ処理方法
JP5789621B2 (ja) 画像形成装置及び画像形成システム
JP5143059B2 (ja) 画像処理装置及びその制御方法並びにプログラム
US11399119B2 (en) Information processing apparatus and non-transitory computer readable medium storing program for color conversion
US10839206B2 (en) Information processing device and method performing character recognition on document image data masked or not based on text image count
US20110134494A1 (en) Image scanning apparatus, control method for image scanning apparatus, and storage medium
US10097705B2 (en) Image processing apparatus that emphasizes important information added to margin region and image forming apparatus including the same
US20110157659A1 (en) Information processing apparatus, method for controlling the information processing apparatus, and storage medium
JP4387275B2 (ja) 画像形成装置および画像形成方法
US11113521B2 (en) Information processing apparatus
US10805483B2 (en) Image processing apparatus which performs an image process based upon acquired image data and method for controlling image processing apparatus
WO2022097408A1 (ja) 画像処理装置及び画像形成装置
JP6274121B2 (ja) 画像形成装置
JP2022142103A (ja) 画像読取装置
JP2017157981A (ja) 電子機器
JP2021153276A (ja) 画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180529

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190528

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191126