JP2010061449A - 原画像探索装置及び原画像探索プログラム - Google Patents

原画像探索装置及び原画像探索プログラム Download PDF

Info

Publication number
JP2010061449A
JP2010061449A JP2008227167A JP2008227167A JP2010061449A JP 2010061449 A JP2010061449 A JP 2010061449A JP 2008227167 A JP2008227167 A JP 2008227167A JP 2008227167 A JP2008227167 A JP 2008227167A JP 2010061449 A JP2010061449 A JP 2010061449A
Authority
JP
Japan
Prior art keywords
image
area
original image
changed
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008227167A
Other languages
English (en)
Other versions
JP5169648B2 (ja
Inventor
Toshiya Koyama
俊哉 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2008227167A priority Critical patent/JP5169648B2/ja
Priority to US12/405,660 priority patent/US8923625B2/en
Publication of JP2010061449A publication Critical patent/JP2010061449A/ja
Application granted granted Critical
Publication of JP5169648B2 publication Critical patent/JP5169648B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】原画像の探索に際し、画像データ全体を用いて照合を行うよりも処理負荷を軽減する。
【解決手段】原画像特定部22は、画像取得部21から送られてきた変更後画像をディスプレイに表示し、その表示した画像の中から変更後画像とその原画像とに共通した画像を含む識別領域を指定させ、それを受け付ける識別領域取得部28を有し、その識別領域を照合領域として特定する照合領域特定部26と、画像記憶部25に記憶された各画像と変更後画像の各照合領域を照合することによって画像記憶部25の中から変更後画像の原画像となる画像を探し出す画像比較部27とを有する。
【選択図】図3

Description

本発明は、原画像探索装置及び原画像探索プログラムに関する。
ある文書(変更前文書)は、スキャナにより読み取られ、原画像として電子化され画像データベースに蓄積される。この変更前文書に対して何らかの変更が加えられて作成された文書(変更後文書)が入手されると、変更前文書に対してどのような変更が加えられたかを抽出するために差分抽出技術が利用される。すなわち、変更後文書をスキャナにより読み取って変更後画像を生成し、原画像と比較することによって差分を抽出する。ただ、大量の画像が蓄積されたデータベースの中から原画像を迅速に探し出すためには、何らかの工夫が必要になる。従来では、投影ヒストグラムを採取し、累積値系列を用いて画像データ全体の照合処理を行う技術が提案されている(例えば、特許文献1)。
特開2003−091730号公報
従来においては、画像データ全体を用いて照合を行うために処理負荷が増大する。
本発明は、原画像の探索に際し、画像データ全体を用いて照合を行うよりも処理負荷を軽減することを目的とする。
本発明に係る原画像探索装置は、変更が加えられたことにより原画像と異なる内容の変更後画像を取得する取得手段と、原画像と変更後画像に共通した画像を含む識別領域を照合領域として特定し、画像記憶手段に記憶された各画像と変更後画像の各照合領域を比較することにより変更後画像の原画像を特定する原画像特定手段と、を有することを特徴とする。
また、前記原画像特定手段は、前記識別領域のうち、利用者により指定された変更後画像上の領域を照合領域として特定することを特徴とする。
また、フォーム画像と当該フォーム画像において前記識別領域を特定する情報とを対応付けして記憶するフォーム画像情報記憶手段を有し、前記原画像特定手段は、前記フォーム画像情報記憶手段に記憶された各フォーム画像と変更後画像とを比較することにより変更後画像のフォーム画像を特定するフォーム画像特定部を有し、その特定したフォーム画像に対応付けられた前記識別領域を特定する情報を前記フォーム画像情報記憶手段から読み出し、その情報から特定できる識別領域を照合領域として特定することを特徴とする。
また、フォーム画像を記憶するフォーム画像情報記憶手段を有し、前記原画像特定手段は、前記フォーム画像情報記憶手段に記憶された各フォーム画像と変更後画像とを比較することにより変更後画像のフォーム画像を特定するフォーム画像特定部と、特定したフォーム画像と変更後画像の差分から前記識別領域を決定する識別領域決定部と、を有し、その決定した識別領域を照合領域として特定することを特徴とする。
また、前記原画像特定手段は、前記画像記憶手段に記憶されている各画像を比較し、その比較の結果、各画像とも一致していない部分画像を含む領域を各画像に共通した識別領域と決定し、その決定した識別領域を照合領域として照合することを特徴とする。
本発明に係る原画像探索プログラムは、コンピュータを、変更が加えられたことにより原画像と異なる内容の変更後画像を取得する取得手段、原画像と変更後画像に共通した画像を含む識別領域を照合領域として特定し、画像記憶手段に記憶された各画像と変更後画像の各照合領域を比較することにより変更後画像の原画像を特定する原画像特定手段、として機能させることを特徴とする。
請求項1、6記載の発明によれば、原画像の探索に際し、画像データ全体を用いて照合を行うよりも処理負荷を軽減することができる。
請求項2記載の発明によれば、照合領域を利用者に指定させることができる。
請求項3記載の発明によれば、フォーム画像に対応付けされている識別領域を利用して画像比較を行う照合領域を特定することができる。
請求項4記載の発明によれば、変更後画像とフォーム画像とから求めた識別領域を利用して画像比較を行う照合領域を特定することができる。
請求項5記載の発明によれば、原画像となりうる変更前文書の画像から求めた識別領域を利用して画像比較を行う照合領域を特定することができる。
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
実施の形態1.
図1は、本実施の形態における差分抽出装置の基本構成を示したブロック構成図である。また、図2は、本実施の形態における差分抽出装置20を形成するコンピュータのハードウェア構成の一例を示した図である。本実施の形態において差分抽出装置20を形成するコンピュータは、従前から存在する汎用的なハードウェア構成で実現できる。すなわち、コンピュータは、図2に示したようにCPU1、ROM2、RAM3、ハードディスクドライブ(HDD)4を接続したHDDコントローラ5、入力手段として設けられたマウス6とキーボード7、及び表示装置として設けられたディスプレイ8をそれぞれ接続する入出力コントローラ9、通信手段として設けられたネットワークコントローラ10を内部バス11に接続して構成される。
図1に戻り、本実施の形態における差分抽出装置20は、画像取得部21、原画像特定部22、差分抽出部23、差分画像出力部24及び画像記憶部25を有している。本実施の形態における差分抽出装置20は、本発明に係る原画像探索装置の一実施の形態を有しているが、本実施の形態では、画像取得部21及び原画像特定部22が原画像探索装置を構成する。変更前文書に対して何らかの変更が加えられて作成された文書(変更後文書)は、スキャナにより読み取られるなどして電子化されるが、画像取得部21は、この電子化された画像(変更後画像)を取得する。画像記憶部25には、変更後画像の原画像となりうる画像が大量に蓄積されているが、原画像特定部22は、原画像と変更後画像に共通した画像を含む識別領域を照合領域として特定し、画像記憶部25に記憶された各画像と変更後画像の各照合領域を照合することによって画像記憶部25の中から変更後画像の原画像となる画像を探し出す。なお、原画像は、ある文書(変更前文書)をスキャナにより読み取られて生成される画像データであるため、変更前画像とも称する場合もある。差分抽出部23は、画像取得部21が取得した変更後画像と、原画像特定部22が特定した変更後画像の原画像との差分画像を抽出する。差分画像出力部24は、抽出された差分画像を、データファイルとしていずれかの記憶手段、あるいは図示しないプリンタに出力する。
図3は、図1に示した差分抽出装置20の一部分を抽出したブロック構成図であり、本実施の形態における原画像特定部22の内部構成の一例を示したブロック図である。本実施の形態における原画像特定部22は、照合領域特定部26及び画像比較部27を有している。照合領域特定部26は、照合領域を特定する。照合領域というのは、原画像と変更後画像とを照合する画像を含む領域であり、原画像及び変更後画像の一部を形成する領域である。原画像と変更後画像の形状及び大きさは基本的には同一であることから、照合領域は各画像上の同一位置に存在する。照合領域特定部26に含まれる識別領域取得部28は、利用者により指定された変更後画像上の識別領域を受け付けることによって取得する。識別領域というのは、原画像に特有な画像情報が含まれている画像領域である。この識別領域内の情報を参照することによって他の原画像と識別することが可能である。従って、後述するように識別領域を照合領域として画像記憶部25から読み出した画像と変更後画像とを照合し一致すれば、その読み出した画像は、その変更後画像の原画像と特定できる。画像比較部27は、画像記憶部25から読み出した画像と変更後画像の各照合領域を比較する。
差分抽出装置20における各構成要素21〜24は、差分抽出装置20を形成するコンピュータと、コンピュータに搭載されたCPU1で動作するプログラムとの協調動作により実現される。また、画像記憶部25は、差分抽出装置20に搭載されたHDD4にて実現される。
また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD−ROMやDVD−ROM等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPUがインストールプログラムを順次実行することで各種処理が実現される。
次に、本実施の形態において、変更後画像の原画像を探索し、その原画像と変更後画像との差分画像を抽出、出力する差分抽出処理について図4に示したフローチャートを用いて説明する。
画像取得部21は、変更前文書に対して書込などの変更が加えられた変更後文書をスキャナ等の文書読取手段により読み取られて生成された変更後画像を取得する(ステップ111)。画像取得部21は、スキャナ等と連携動作し読取画像をそのまま変更後画像として取得してもよいし、いずれかの記憶手段に記憶された画像データを変更後画像として読み出してもよい。画像取得部21が取得した変更後画像は、原画像特定部22及び差分抽出部23に送られる。
次に、識別領域取得部28は、利用者により指定された変更後画像上の識別領域を受け付ける。より具体的に説明すると、画像取得部21から送られてきた変更後画像をディスプレイ8に表示し、その表示した画像の中から識別領域に該当する領域を指定させる。識別領域取得部28は、この指定された領域を受け付ける(ステップ112)。本実施の形態では、このように識別領域を利用者にその都度指定させる。
例えば、変更後画像が個人情報の記入用紙の読取画像である場合、個人識別番号の記入欄が識別領域に相当する。個人識別番号によって他の記入用紙と識別可能であるために、当該変更後画像は、個人識別番号の画像によって他の変更後画像と識別することができる。もちろん、原画像においても同様である。領域の指定方法は、マウス6を使って個人識別番号が記入された左上と右下の矩形領域を指定させるようにしてもよいし、記入欄が設けられている場合、カーソルにて指し示された位置を含む閉領域を識別領域として抽出してもよい。このようにして、識別領域を受け付けると、照合領域特定部26は、変更後画像上においてその識別領域を照合領域として特定する。照合領域は、画像上の座標データにより特定できるようにしてもよい。
続いて、画像比較部27は、画像取得部21から送られてきた変更後画像と比較する画像を画像記憶部25から順次読み出し(ステップ113)、その読み出した画像と変更後画像の各照合領域に含まれる画像を比較する(ステップ114)。本実施の形態では、このように画像全体ではなく、識別領域により特定された照合領域に含まれる画像のみを比較対象とする。なお、画像を比較する場合、比較対象の各画像の位置合わせ、歪み補正等の画像処理を行う必要があるかもしれないが、この処理は本実施の形態の要旨ではないので説明を省略する。なお、以降の実施の形態においても、また他の種類の画像比較において同様である。比較した結果、読み出した画像が変更後画像の原画像であると判断した場合(ステップ115でY)、原画像特定部22は、その読み出した画像を変更後画像の原画像として差分抽出部23に送る。
ここで、本実施の形態では、読み出した画像の照合領域に含まれている画像全てが変更後画像に含まれている場合を、読み出した画像が変更後画像の原画像であると判断するようにした。通常であれば、照合領域は識別可能な情報の画像が含まれているので、比較した結果は完全一致するはずである。ただ、変更後文書に人手により変更が加えられる際に識別領域の中にはみ出して記入される可能性がある。また、識別領域を指定する際の矩形領域の指定が大きすぎたりして余分な情報や文書上の汚れが含まれてしまう可能性がある。そこで、本実施の形態では、読み出した画像の照合領域に含まれる画像の全てが変更後画像の照合領域に含まれている場合には、その読み出した画像を変更後画像の原画像とみなすようにした。つまり、読み出した画像と変更後画像とは、上記のように包含関係にあればよい。
一方、読み出した画像と変更後画像とを比較した結果、読み出した画像が変更後画像の原画像ではないと判断した場合(ステップ115でN)、画像比較部27は、画像記憶部25からまだ読み出していない画像を読み出し、その画像と変更後画像の各照合領域内容画像を比較する(ステップ113)。なお、本実施の形態では、変更後画像の原画像は、画像記憶部25に必ず登録されていることを前提としているので、ステップ113〜115を繰り返すことで、いずれステップ116に移行する。
差分抽出部23は、原画像特定部22と画像取得部21からそれぞれ原画像とその原画像の変更後画像とが送られてくると、各画像を比較することによって原画像と変更後画像との差分画像を抽出する(ステップ116)。そして、差分画像出力部24は、差分抽出部23から送られてきた差分画像を受け付けると、その差分画像を出力する(ステップ117)。出力先は、ディスプレイ8、HDD4、入出力コントローラ9を介して図示していないプリンタ、あるいはネットワークコントローラ10を介して外部機器としてもよい。
実施の形態2.
図5は、本実施の形態における差分抽出装置20の一部分を抽出して示したブロック構成図であり、主に本実施の形態における原画像特定部22の内部構成の一例を示したブロック図である。本実施の形態における差分抽出装置20は、図5に示した以外の構成は実施の形態1と同じでよい。なお、実施の形態1と同じ構成要素には同じ符号を付け、説明を省略する。以降の実施の形態においても同様である。図5には、画像取得部21、原画像特定部22、画像記憶部25及びフォーム画像記憶部30が示されている。フォーム画像記憶部30には、変更前文書の種々のフォームの画像と当該フォーム画像において識別領域を特定する情報とが対応付けられて記憶される。前述した例に従うならば、フォームのどの領域に個人識別番号が記入されるのかは事前に把握できるので、フォーム画像における識別領域を特定する情報をフォーム画像に対応付けしてフォーム画像記憶部30に予め登録しておくことができる。識別領域を特定する情報は、画像上の座標データにより特定できるようにしてもよい。なお、フォーム画像記憶部30は、HDD4にて実現してもよい。原画像特定部22に含まれるフォーム画像特定部29は、フォーム画像記憶部30に記憶された各フォーム画像と変更後画像とを比較することにより変更後画像のフォーム画像を特定する。
次に、本実施の形態における差分抽出処理について図6に示したフローチャートを用いて説明する。なお、実施の形態1と同じ処理には同じステップ番号を付け、説明を適宜省略する。
画像取得部21から送られてきた変更後画像を取得すると(ステップ111)、フォーム画像特定部29は、フォーム画像を1つずつフォーム画像記憶部30から読み出す(ステップ121)。そして、読み出したフォーム画像と変更後画像とを比較する(ステップ122)。ここで、読み出したフォーム画像が変更後画像のフォーム画像でないと判断した場合(ステップ123でN)、ステップ121に戻り、フォーム画像特定部29は、まだ読み出していないフォーム画像をフォーム画像記憶部30から読み出す。この処理を変更後画像のフォーム画像が見つけ出されるまで繰り返し行う。なお、変更後画像のフォーム画像は、フォーム画像記憶部30に必ず登録されていることを前提としているので、ステップ121〜123を繰り返すことで、いずれステップ124に移行する。
読み出したフォーム画像が変更後画像のフォーム画像であると判断した場合(ステップ123でY)、照合領域特定部26は、そのフォーム画像に対応付けられた識別領域を特定する情報をフォーム画像記憶部30から読み出し、その情報から特定できる識別領域を照合領域として特定する(ステップ124)。なお、変更後画像は、所定のフォームに文字等のデータが書き込まれて作成された変更後文書の読取画像データであることから、変更後画像には、自己のフォーム画像全体が含まれているはずである。よって、読み出したフォーム画像全体が変更後画像に含まれている場合、そのフォーム画像が変更後画像のフォーム画像と判断できる。本実施の形態では、このようにフォーム画像に識別領域を予め関連付けておき、そして変更後画像のフォーム画像を特定することによって識別領域を特定できるようにした。
照合領域が特定されると、画像比較部27は、画像取得部21から送られてきた変更後画像と比較する画像を画像記憶部25から順次読み出し(ステップ113)、その読み出した画像と変更後画像の各照合領域に含まれる画像を比較する(ステップ114)。この比較処理により変更後画像の原画像が特定されると、その原画像は差分抽出部23に送られることになる。これ以降の処理は、実施の形態1と同じなので説明を省略する。
実施の形態3.
図7は、本実施の形態における差分抽出装置20の一部分を抽出して示したブロック構成図であり、主に本実施の形態における原画像特定部22の内部構成の一例を示したブロック図である。本実施の形態における差分抽出装置20は、図7に示した以外の構成は実施の形態1と同じでよい。図7には、画像取得部21、原画像特定部22、画像記憶部25及びフォーム画像記憶部31が示されている。本実施の形態におけるフォーム画像記憶部31には、変更前文書の種々のフォームの画像が記憶される。なお、フォーム画像記憶部31は、HDD4にて実現してもよい。原画像特定部22に含まれるフォーム画像特定部29は、フォーム画像記憶部30に記憶された各フォーム画像と変更後画像とを比較することにより変更後画像のフォーム画像を特定する。照合領域特定部に含まれる識別領域決定部32は、変更前後の各画像における識別領域を決定する。
次に、本実施の形態における差分抽出処理について図8に示したフローチャートを用いて説明する。なお、実施の形態1,2と同じ処理には同じステップ番号を付け、説明を適宜省略する。
画像取得部21から送られてきた変更後画像を取得すると(ステップ111)、フォーム画像特定部29は、フォーム画像記憶部31に記憶されたフォーム画像と変更後画像とを比較することで変更後画像のフォーム画像を特定する(ステップ121〜123)。
続いて、識別領域決定部32は、特定したフォーム画像と変更後画像との差分画像を抽出し、その抽出した画像を含む領域を識別領域として決定する。そして、照合領域特定部26は、識別領域決定部32にて決定した識別領域を照合領域として特定する(ステップ131)。例えば、個人情報入力用のフォーム画像であれば、抽出された画像は、フォームに対して記入された内容である。記入内容を含む領域は、記入内容の外接を識別領域とする。また、フォームに矩形形状の記入欄が設けられている場合、その記入欄を形成する閉領域を識別領域として抽出してもよい。本実施の形態では、このように画像比較を行うことで識別領域を自動的に抽出して特定するようにした。なお、本実施の形態の場合、複数の照合領域が特定される場合がある。
照合領域が特定されると、画像比較部27は、画像取得部21から送られてきた変更後画像と比較する画像を画像記憶部25から順次読み出し(ステップ113)、その読み出した画像と変更後画像の各照合領域に含まれる画像を比較する(ステップ114)。
ここで、1つの照合領域に注目する。照合領域は、フォーム画像と変更後画像との差分画像を抽出することによって特定された。この照合領域に記入された内容について原画像と変更後画像とを比較してみると、フォームに何らかの書き込みがあって変更前文書が作成され、その変更前文書に変更が加えられて変更後文書が作成されるのだから、照合領域における変更前画像(原画像)と変更後画像とは、前述した包含関係にあるはずである。すなわち、比較対象の画像が変更後画像の原画像であるならば、その変更後画像における照合領域には、原画像における照合領域の画像全体が含まれているはずである。よって、本実施の形態においても、上記各実施の形態と同様に、照合領域を比較することで変更後画像の原画像を探し出すことができる。
そして、本実施の形態の場合、複数の照合領域が存在する可能性があるが、ステップ115では、複数の照合領域における全ての画像比較において画像記憶部25から読み出した比較対象の画像が変更後画像の原画像であると判断された場合に、原画像特定部22は、その読み出した画像を変更後画像の原画像として特定することになる。あるいは、複数の照合領域のうち1又は複数の照合領域において画像比較処理を行うようにしてもよい。
このようにして特定された変更後画像の原画像は、差分抽出部23に送られることになるが、これ以降の処理は、実施の形態1と同じなので説明を省略する。
なお、ステップ131において抽出した識別領域を特定する情報を記憶手段で保存して、再利用できるようにしてもよい。
実施の形態4.
図9は、本実施の形態における差分抽出装置20の一部分を抽出して示したブロック構成図であり、主に本実施の形態における原画像特定部22の内部構成の一例を示したブロック図である。本実施の形態における差分抽出装置20は、図9に示した以外の構成は実施の形態1と同じでよい。図9には、画像取得部21、原画像特定部22及び画像記憶部25が示されている。照合領域特定部26に含まれる識別領域決定部33は、画像記憶部25から各画像を読み出し、その読み出した画像を比較することによって画像記憶部25に記憶された画像に共通した識別領域を決定する。
上記実施の形態2,3では、識別領域を特定する情報をフォーム画像に対応付けして事前に登録しておくようにしたが、本実施の形態においては、フォーム画像がない画像を取り扱う場合にも適用可能にする。但し、画像記憶部25には、同種の変更前文書だけが記憶されているものとする。ここで同種の文書というのは、識別領域となりうる領域が文書上の同じ領域に設けられている文書のことをいう。前述した例に従うならば、同種の文書では、個人識別番号の記入欄が同じ領域に設けられていることになる。
次に、本実施の形態における差分抽出処理について図10に示したフローチャートを用いて説明する。なお、上記各実施の形態と同じ処理には同じステップ番号を付け、説明を適宜省略する。
画像取得部21から送られてきた変更後画像を取得すると(ステップ111)、識別領域決定部33は、画像記憶部25から全ての画像を読み出す(ステップ141)。そして、読み出した画像の中から2つの画像を1組として比較する。識別領域決定部33は、画素位置毎に初期値がゼロのカウンタを有しており、比較した結果、同一位置に存在する画素の値が異なる場合に、対応するカウンタに1を加算する。この処理を画像記憶部25から読み出した全画像の組合せに対して行うことで、同一位置に存在する画素の値が異なる場合の累積値を求める。画像の数が10であれば、45組の画像に対して実施する。
このようにして、全ての画像の組合せで比較が終了し、前述した累積値が得られると(ステップ142)、識別領域決定部33は、予め決められている閾値と累積値とを画素毎に比較し、閾値以上となった画素の位置を抽出する。そして、閾値以上の画素位置に対してラベリングをし、外接矩形を求める。また、重なったり、近傍にある外接矩形同士を結合する。また、結合により矩形形状でなくなった場合には、その領域を矩形形状に整形する。識別領域取得部28は、このようにして得られた矩形形状の領域を識別領域として決定する。そして、照合領域特定部26は、識別領域決定部33にて決定した識別領域を照合領域として特定する(ステップ143)。
ところで、前述した処理により得られる累積値は、画素値が一致していなかった場合の累積数である。文書上の識別領域には、識別可能なユニークな内容が記入されていることから、本実施の形態では、累積値が大きい画素群を含む領域を識別領域として選出するようにした。本実施の形態においては、このように画像記憶部25に記憶されている画像から、これらの画像に共通した識別領域を自動的に決定するようにした。
なお、本実施の形態では、識別領域を精度良く自動的に決定するためには、画像記憶部25に同種の変更前文書だけが記憶されていることが望ましい。従って、上記説明では、画像記憶部25に同種の変更前文書だけが記憶されているものとして説明した。但し、同種の変更前文書がフォルダ毎に分類されて記憶されている場合には、フォルダ単位に識別領域を取得すればよい。また、本実施の形態では、ステップ141において画像記憶部25から全ての画像を読み出し、その読み出した画像の中から2つの画像を1組として選出するようにしたが、ステップ142では、同一位置に存在する画素の値が異なる場合の累積値を得られればよいので、比較する2つの画像のみを画像記憶部25から順次読み出すように処理してもよい。
照合領域が特定された後の処理(ステップ113〜117)は、実施の形態1と同じでよいため説明を省略する。
前述した各実施の形態においては、予め登録されている画像の中から、変更後文書の画像の原画像を探索する際に、画像の照合領域とする識別領域をどのようにして決めるかという手法について説明した。ところで、比較する画像の元となる文書は、1ページにより形成されているとは限らない。この場合は、先頭ページなどの所定の1ページで前述した処理を実行して原画像の探索を行い、そして各ページに対して差分抽出を行うようにしてもよい。また、画像取得部21が、複数の変更後画像を統合された状態にて取得する場合もあり得る。この場合、取得した画像を文書単位に分離してから前述した原画像の探索処理を行い、そして差分抽出処理を行えばよい。
実施の形態1における差分抽出装置の基本構成を示したブロック構成図である。 実施の形態1における差分抽出装置20を形成するコンピュータのハードウェア構成の一例を示した図である。 実施の形態1における原画像特定部の内部構成の一例を示したブロック図である。 実施の形態1における差分抽出処理を示したフローチャートである。 実施の形態2における原画像特定部の内部構成の一例を示したブロック図である。 実施の形態2における差分抽出処理を示したフローチャートである。 実施の形態3における原画像特定部の内部構成の一例を示したブロック図である。 実施の形態3における差分抽出処理を示したフローチャートである。 実施の形態4における原画像特定部の内部構成の一例を示したブロック図である。 実施の形態4における差分抽出処理を示したフローチャートである。
符号の説明
1 CPU、2 ROM、3 RAM、4 ハードディスクドライブ(HDD)、5 HDDコントローラ、6 マウス、7 キーボード、8 ディスプレイ、9 入出力コントローラ、10 ネットワークコントローラ、11 内部バス、20 差分抽出装置、21 画像取得部、22 原画像特定部、23 差分抽出部、24 差分画像出力部、25 画像記憶部、26 照合領域特定部、27 画像比較部、28 識別領域取得部、29 フォーム画像特定部、30,31 フォーム画像記憶部、32,33 識別領域決定部。

Claims (6)

  1. 変更が加えられたことにより原画像と異なる内容の変更後画像を取得する取得手段と、
    原画像と変更後画像に共通した画像を含む識別領域を照合領域として特定し、画像記憶手段に記憶された各画像と変更後画像の各照合領域を比較することにより変更後画像の原画像を特定する原画像特定手段と、
    を有することを特徴とする原画像探索装置。
  2. 請求項1記載の原画像探索装置において、
    前記原画像特定手段は、前記識別領域のうち、利用者により指定された変更後画像上の領域を照合領域として特定することを特徴とする原画像探索装置。
  3. 請求項1記載の原画像探索装置において、
    フォーム画像と当該フォーム画像において前記識別領域を特定する情報とを対応付けして記憶するフォーム画像情報記憶手段を有し、
    前記原画像特定手段は、前記フォーム画像情報記憶手段に記憶された各フォーム画像と変更後画像とを比較することにより変更後画像のフォーム画像を特定するフォーム画像特定部を有し、その特定したフォーム画像に対応付けられた前記識別領域を特定する情報を前記フォーム画像情報記憶手段から読み出し、その情報から特定できる識別領域を照合領域として特定することを特徴とする原画像探索装置。
  4. 請求項1記載の原画像探索装置において、
    フォーム画像を記憶するフォーム画像情報記憶手段を有し、
    前記原画像特定手段は、
    前記フォーム画像情報記憶手段に記憶された各フォーム画像と変更後画像とを比較することにより変更後画像のフォーム画像を特定するフォーム画像特定部と、
    特定したフォーム画像と変更後画像の差分から前記識別領域を決定する識別領域決定部と、
    を有し、その決定した識別領域を照合領域として特定することを特徴とする原画像探索装置。
  5. 請求項1記載の原画像探索装置において、
    前記原画像特定手段は、前記画像記憶手段に記憶されている各画像を比較し、その比較の結果、各画像とも一致していない部分画像を含む領域を各画像に共通した識別領域と決定し、その決定した識別領域を照合領域として照合することを特徴とする原画像探索装置。
  6. コンピュータを、
    変更が加えられたことにより原画像と異なる内容の変更後画像を取得する取得手段、
    原画像と変更後画像に共通した画像を含む識別領域を照合領域として特定し、画像記憶手段に記憶された各画像と変更後画像の各照合領域を比較することにより変更後画像の原画像を特定する原画像特定手段、
    として機能させることを特徴とする原画像探索プログラム。
JP2008227167A 2008-09-04 2008-09-04 原画像探索装置及び原画像探索プログラム Expired - Fee Related JP5169648B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008227167A JP5169648B2 (ja) 2008-09-04 2008-09-04 原画像探索装置及び原画像探索プログラム
US12/405,660 US8923625B2 (en) 2008-09-04 2009-03-17 Original image searching device, original image searching method, and computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008227167A JP5169648B2 (ja) 2008-09-04 2008-09-04 原画像探索装置及び原画像探索プログラム

Publications (2)

Publication Number Publication Date
JP2010061449A true JP2010061449A (ja) 2010-03-18
JP5169648B2 JP5169648B2 (ja) 2013-03-27

Family

ID=41725551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008227167A Expired - Fee Related JP5169648B2 (ja) 2008-09-04 2008-09-04 原画像探索装置及び原画像探索プログラム

Country Status (2)

Country Link
US (1) US8923625B2 (ja)
JP (1) JP5169648B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015114734A (ja) * 2013-12-09 2015-06-22 富士ゼロックス株式会社 画像処理装置及びプログラム。

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6175981B2 (ja) * 2013-08-23 2017-08-09 富士ゼロックス株式会社 情報処理装置及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006203429A (ja) * 2005-01-19 2006-08-03 Fuji Xerox Co Ltd 画像データ処理装置
JP2008123456A (ja) * 2006-11-15 2008-05-29 Sharp Corp 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6077271A (ja) * 1983-10-03 1985-05-01 Fuji Xerox Co Ltd 画像フアイル装置
US4827330A (en) * 1987-07-20 1989-05-02 Litton Industrial Automation Systems, Inc. Automatic document image revision
US6446099B1 (en) 1998-09-30 2002-09-03 Ricoh Co., Ltd. Document matching using structural information
JP4140221B2 (ja) 2001-09-18 2008-08-27 富士ゼロックス株式会社 画像照合装置および画像照合プログラム
JP4266695B2 (ja) * 2003-04-30 2009-05-20 キヤノン株式会社 画像処理装置及び画像処理方法
EP1722331B1 (en) * 2004-03-03 2010-12-01 NEC Corporation Image similarity calculation system, image search system, image similarity calculation method, and image similarity calculation program
US8176054B2 (en) * 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
JP4591230B2 (ja) * 2005-06-23 2010-12-01 富士ゼロックス株式会社 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006203429A (ja) * 2005-01-19 2006-08-03 Fuji Xerox Co Ltd 画像データ処理装置
JP2008123456A (ja) * 2006-11-15 2008-05-29 Sharp Corp 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015114734A (ja) * 2013-12-09 2015-06-22 富士ゼロックス株式会社 画像処理装置及びプログラム。

Also Published As

Publication number Publication date
JP5169648B2 (ja) 2013-03-27
US20100054610A1 (en) 2010-03-04
US8923625B2 (en) 2014-12-30

Similar Documents

Publication Publication Date Title
US8467614B2 (en) Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images
WO2014030399A1 (ja) 物体識別装置、物体識別方法、及びプログラム
JP4661921B2 (ja) 文書処理装置およびプログラム
JP2005173730A (ja) 帳票ocrプログラム、方法及び装置
JP2012083951A (ja) 情報処理装置、情報処理方法及びプログラム
US9575935B2 (en) Document file generating device and document file generation method
JP6531368B2 (ja) 情報処理システム、情報処理装置、処理方法及びプログラム
CN112784220B (zh) 一种纸质合同防篡改校验方法及系统
JP2021043775A (ja) 情報処理装置及びプログラム
CN114005126A (zh) 表格重构方法、装置、计算机设备及可读存储介质
JP2013058092A (ja) 情報処理装置、情報処理方法及びプログラム
CN114529933A (zh) 一种合同数据差异性的比对方法、装置、设备和介质
JP5169648B2 (ja) 原画像探索装置及び原画像探索プログラム
JP2008282094A (ja) 文字認識処理装置
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP5188290B2 (ja) アノテーション装置、アノテーション方法およびプログラム
JP2014154066A (ja) 文字認識システム、文字認識プログラム及び文字認識方法
JP2021140831A (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
JP6759955B2 (ja) 地名抽出プログラム、地名抽出装置および地名抽出方法
JP2021152696A (ja) 情報処理装置及びプログラム
RU2634192C1 (ru) Ввод данных из серии изображений, соответствующих шаблонному документу
JPWO2008107985A1 (ja) パターン検出プログラム、パターン検出方法およびパターン検出装置
JP6303742B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2014044555A (ja) 画像処理装置、画像処理システム及びプログラム
JP5669044B2 (ja) 文書検定システム及び文書検定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120717

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121217

R150 Certificate of patent or registration of utility model

Ref document number: 5169648

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees