JP4518212B2 - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP4518212B2
JP4518212B2 JP2010003273A JP2010003273A JP4518212B2 JP 4518212 B2 JP4518212 B2 JP 4518212B2 JP 2010003273 A JP2010003273 A JP 2010003273A JP 2010003273 A JP2010003273 A JP 2010003273A JP 4518212 B2 JP4518212 B2 JP 4518212B2
Authority
JP
Japan
Prior art keywords
image data
original
input
original image
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010003273A
Other languages
English (en)
Other versions
JP2010102734A (ja
Inventor
俊哉 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2010003273A priority Critical patent/JP4518212B2/ja
Publication of JP2010102734A publication Critical patent/JP2010102734A/ja
Application granted granted Critical
Publication of JP4518212B2 publication Critical patent/JP4518212B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)

Description

本発明は、追記がなされた文書の原本を探索するための技術に関する。
文書には、各種のコメントや、校正ないし修正の指示などが記されたり、或いは、その文書の内容を承認したことを示すための承認者のサインや印影などが付されることがある。このような各種の追記がなされた文書(以下、追記文書という)をスキャナで読み込んで、追記された内容(以下、追記部分という)と、その追記前の文書原本の内容とを対応付けて保存しておけば、これを様々な利用シーンで活用することができる。例えば、或る承認者のコメントだけを一斉に検索するといったように、追記部分のみを対象とした検索作業を行うことが可能となる。また、文書原本のみを表示した画面と、文書原本に追記部分を重ね合わせて表示した画面とを、ユーザの操作に応じて切り替えて表示する、といった使い方も可能である。
そこで、従来から、このような追記部分だけを抽出するための技術が提案されている。例えば特許文献1には、文書原本と、その原本に追記がなされた追記文書を比較照合することにより、追記部分のみを抽出するという技術が記載されている。特許文献2には、ある文書がすでにデータベースに登録済みの文書Aの追記文書Bであった場合には、その追記文書Bと文書Aとを比較して追記部分の画像データを抽出し、抽出した画像データを文書Aに対応付けるという仕組みが提案されている。そして、特許文献3には、特許文献2に記載されているように追記文書Bと文書Aとを比較して追記部分の画像データを抽出したうえで、その追記部分の画像データに関する情報(例えばキーワードや更新日時)をユーザが入力し、これらの入力情報を追記部分の画像データと共に記憶しておくことが記載されている。これにより、保存後の検索作業において、例えばキーワード検索を行って所望の文書を抽出することが可能となる。
特許文献1〜3に記載されているように、追記前の文書と追記後の文書とを比較し、その差分を追記部分として特定するという方法を用いた場合、追記部分のみを確実に抽出することができる。ただし、実際の利用シーンを想定すると、追記後の文書に対し、その追記がなされる前の文書をどのようにして見つけだすかという作業は、それほど容易ではない。例えば特許文献1−3においては、ユーザが追記前の文書をファイル名で指定するようになっているが、この方法では、膨大な数の全ての文書についてファイル名を覚えておかなければならず、非常に使い勝手が悪い。
特開昭61−67177号公報 特開平8−317155号公報 特開2000−148790号公報
本発明は、このような背景に鑑みてなされたものであり、その目的は、複数の原本画像データの中から、特定の追記文書の原本に相当する原本画像データを速やかに見つけだすことが可能な仕組みを提供することにある。
請求項1に係る発明は、複数の原本画像データを記憶する記憶手段と、画像データが入力される入力手段と、前記記憶手段によって記憶されている複数の原本画像データと、前記入力手段に入力された入力画像データとの差分画像をそれぞれ抽出する抽出手段と、前記抽出手段によって抽出された各々の前記差分画像に基づいて各々の前記差分画像の画素の分布を求め、前記記憶手段によって記憶されている複数の原本画像データの中から、求めた画素分布が他の原本画像データよりも特定の領域に偏っている原本画像データを、前記入力画像データの原本に相当する原本画像データとして特定する特定手段と、前記特定手段によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御手段とを備える画像処理装置である。
請求項2に係る発明は、複数の原本画像データを記憶する記憶手段と、画像データが入力される入力手段と、前記記憶手段によって記憶されている複数の原本画像データと、前記入力手段に入力された入力画像データとの差分画像をそれぞれ抽出する抽出手段と、前記抽出手段によって抽出された各々の前記差分画像に対してレイアウト解析を行い、これによって得られたレイアウト単位領域のサイズまたは位置に基づいて、前記記憶手段によって記憶されている複数の原本画像データの中から、前記入力画像データの原本に相当する原本画像データを特定する特定手段と、前記特定手段によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御手段とを備える画像処理装置である。
請求項3に係る発明は、請求項1または2に記載の構成において、前記記憶制御手段は、前記追記画像データが複数ある場合には、前記入力画像データが表す画像において互いに近傍にある追記画像を表す追記画像データどうしをグルーピングし、これら追記画像データをグループ単位で前記記憶手段に記憶させることを特徴とする画像処理装置である。
請求項4に係る発明は、請求項3に記載の構成において、前記記憶制御手段は、前記入力画像データが表す画像における追記画像の位置を含む電子付箋データとして、前記追記画像データを前記記憶手段に記憶させることを特徴とする画像処理装置である。
請求項5に係る発明は、コンピュータに、記憶手段によって記憶されている複数の原本画像データと、入力された入力画像データとを比較し、両者の差分画像をそれぞれ抽出する抽出機能と、前記抽出機能によって抽出された各々の前記差分画像に基づいて各々の前記差分画像の画素の分布を求め、前記記憶手段によって記憶されている複数の原本画像データの中から、求めた画素分布が他の原本画像データよりも特定の領域に偏っている原本画像データを、前記入力画像データの原本に相当する原本画像データとして特定する特定機能と、前記特定機能によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御機能とを実現させるためのプログラムである。
請求項6に係る発明は、コンピュータに、記憶手段によって記憶されている各々の原本画像データと、入力された入力画像データとを比較し、両者の差分画像をそれぞれ抽出する抽出機能と、前記抽出機能によって抽出された各々の前記差分画像に対してレイアウト解析を行い、これによって得られたレイアウト単位領域のサイズまたは位置に基づいて、前記記憶手段によって記憶されている複数の原本画像データの中から、前記入力画像データの原本に相当する原本画像データとして特定する特定機能と、前記特定機能によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御機能とを実現させるためのプログラムである。
本発明の第1実施形態に係る画像処理装置の構成を示したブロック図である。 同実施形態に係る画像処理装置が実行する手順を示すフローチャートである。 同実施形態における追記文書の内容を例示した図である。 同実施形態における文書原本の内容を例示した図である。 同実施形態に係る画像処理装置が原本画像データを特定する原理を説明する図である。 同実施形態に係る画像処理装置が原本画像データを特定する原理を説明する図である。 同実施形態に係る画像処理装置が原本画像データを特定する原理を説明する図である。 同実施形態に係る画像処理装置が原本画像データを特定する原理を説明する図である。 本発明の第2実施形態に係る画像処理装置が実行する手順を示すフローチャートである。同実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。 同実施形態に係る画像処理装置が原本画像データを特定する原理を説明する図である。 同実施形態に係る画像処理装置が入力画像データと原本画像データとの差分を抽出する様子を例示した図である。
まず、本発明の実施形態で用いる主要な用語を定義しておく。
「文書原本」とは、プリンタ等の画像形成装置によって画像が形成されてから追記者による追記が一切なされていない文書を意味している。「原本画像データ」とは、この文書原本の内容を表した画像データである。なお、ここでいう「原本画像データ」という用語の意味には、文書の内容が画像として表現された画像データの他にも、例えば、文書作成アプリケーションプログラムによって固有のコード情報を用いて表現された文書データも含むものとする。なぜならこのような文書データを画像データに適宜変換することは容易であるし、また、特に本発明では、画像データであろうが文書データであろうが、文書原本の内容を解析してその特徴を抽出するために用いることができるという点では、これらのデータは共通するからである。
これに対し、「追記文書」とは、文書原本に対して追記がなされた状態の文書を意味している。また、「追記画像」とは、追記部分の画像を意味している。例えば或る文字列についてペンでアンダーラインが施されている場合には、そのアンダーラインそのものが追記画像である。「追記画像データ」とは、追記画像の内容を表した画像データである。
(1)第1実施形態
図1は、第1実施形態に係る画像処理装置1の構成を示したブロック図である。画像処理装置1は、例えばパーソナルコンピュータであり、制御部11と、不揮発性記憶部12と、入力部13と、表示部14と、操作部15とを備えている。入力部13には通信ケーブルを介してスキャナ等の画像読取装置2が接続されている。
制御部11は、CPU(Central Processing Unit)111、ROM(Read Only Memory)112及びRAM(Random Access Memory)113を備えており、画像読取装置2か
ら入力部13を介して入力された画像データに対し、各種の画像処理を実行する。不揮発性記憶部12は例えばハードディスクであり、制御部11が実行する画像処理の手順が記述された画像処理プログラムPRGを記憶している。また、不揮発性記憶部12は、追記がなされる前の文書原本の原本画像データを複数記憶している。操作部15は、例えばキーボードやマウスを備えており、ユーザによる入力操作を受け付けて、その操作に応じた信号を制御部11に供給する。表示部14は例えば液晶ディスプレイ装置であり、制御部11による制御の下で各種画像を表示する。
図2は、画像処理プログラムPRGに記述された手順を示すフローチャートである。
追記者は文書原本に追記を行う。追記がなされた追記文書は画像読取装置2によって読み取られる。画像読取装置2は、読み取った画像を表す画像データを画像処理装置1の入力部13に入力する。
入力部13に画像データが入力されると(ステップS1)、制御部11は、入力された画像データ(以下、入力画像データという)が表す画像の内容を、予め決められたアルゴリズムに従って解析し、その画像の特徴を抽出する(ステップS2)。画像の特徴を抽出するための具体的なアルゴリズムについては後で詳述する。次いで、制御部11は、不揮発性記憶部12に記憶されている原本画像データの中から、ステップS2で抽出した特徴にほぼ一致するような特徴を有する原本画像データを探索する(ステップS3)。ここでは、両者の特徴が完全に一致する必要はなく、不揮発性記憶部12に記憶されている原本画像データのうち、ステップS2で抽出した特徴に最も近い特徴を有する原本画像データであればよい。なお、ここで、不揮発性記憶部12に記憶されている原本画像データがいわゆる「画像データ」でなく、冒頭で説明したような文書データであった場合は、必要に応じて、この文書データをラスタライズして画像に展開すればよい。もちろん、これはその必要がある場合に変換すればよく、後述するように文字列を特徴として使う場合には、文書データを敢えて画像に展開する必要は無い。
次に、制御部11は、ステップS3の探索により得られた原本画像データと、ステップS1で得られた入力画像データとを比較し(ステップS4)、両者の差分を追記画像データとして抽出する(ステップS5)。そして、制御部11は、抽出した追記画像データを、ステップS3の探索により得られた原本画像データに対応付けて不揮発性記憶部12に記憶させる(ステップS6)。
ステップS6において、制御部11は、追記画像データが複数ある場合には、入力画像データが表す画像において互いに近傍にある追記画像を表す追記画像データどうしをグルーピングし、これら追記画像データをグループ単位で不揮発性記憶部12に記憶させるようにしてもよい。望ましくは、制御部11は、この追記画像データを電子付箋データとして不揮発性記憶部12に記憶させる。ここでいう電子付箋データとは、入力画像データが表す画像中で追記画像がどこに配置されているかということを示す位置情報を含むデータである。
以上が、制御部11の基本動作である。
次に、前述のステップS2で画像の特徴を抽出するための方法について説明する。具体的な方法を列挙すると次のようになる。
(1−1)可視または不可視のコード画像を特徴として抽出する方法
(1−2)レイアウト解析処理によって得られた各々のレイアウト単位領域の位置、形状及びサイズを特徴として抽出する方法
(1−3)文字認識処理によって得られた文字列を特徴として抽出する方法
(1−4)レイアウト解析処理によって得られたレイアウト単位領域のうち、特定のレイアウト単位領域に対して文字認識処理を行って得られた文字列を特徴として抽出する方法(1−5)画像を複数の領域に分割し、各々の領域に対して周波数解析を行って得られた周波数分布を特徴として抽出する方法
(1−6)画像の投影分布を特徴として抽出する方法
以下、これらの方法について順番に説明する。
(1−1)可視または不可視のコード画像を特徴として抽出する方法
図3は追記文書の一例を示す図である。追記文書Dにおいては、図4に示すような文書原本Doに対し、「総務部田中宛」という文字列のうち「田中」の部分を「中村」に修正
するような指示が追記者によって追記されている。これらの文書原本Do及び追記文書D
の所定箇所(図3,4では右上隅)には、それぞれの原本文書に対して一意に割り当てられた識別情報であるバーコードC(コード画像)が形成されている。このバーコードCは、文書原本の画像が形成されるべき記録紙に予め印刷されたものであってもよいし、プリンタ等の画像形成装置が記録紙に文書原本の画像を形成する際に同時に形成したものであってもよい。
従って、図2において、制御部11は、追記文書の画像データの所定箇所に形成されているバーコードを解析して識別情報を抽出することにより、追記文書の特徴を抽出する(ステップS2)。次に、制御部11は、抽出した識別情報と一致するような識別情報を表すバーコードが形成された原本画像データを不揮発性記憶部12で探索すればよい(ステップS3)。
なお、コード画像は、バーコードに限らず、図形または文字の組み合わせによって表されたものであればよい。例えばバーコードに代えて、QRコード等の2次元コードなどのコード画像を用いてもよいし、文字コードであってもよい。。また、このコード画像は可視画像である必要はなく、画像読取装置2が不可視トナーで形成された不可視画像を読み取るセンサを備えている場合には、コード画像は不可視であってもよい。
(1−2)レイアウト解析処理によって得られた各々のレイアウト単位領域の位置、形状及びサイズを特徴として抽出する方法
図5は、レイアウト解析によって原本画像データを探索する仕組みを説明する図である。図5に示すレイアウト構造R1は、追記文書(入力画像データ)に対してレイアウト解析を行い、文字領域とか写真領域等のレイアウト単位領域a1〜a7に分割された例を示している。画像処理装置の制御部11は、図2のステップS2において、このようなレイアウト解析によって得られた各々のレイアウト単位領域a1〜a7の位置、形状及びサイズを特徴として抽出する。一方、制御部11は、処理の開始以前に、原本画像データの各々について上記のようなレイアウト解析を行い、各々のレイアウト単位領域a1〜a7の位置、形状及びサイズを不揮発性記憶部12に記憶している。
そして、制御部11は、ステップS3において、抽出したレイアウト単位領域a1〜a7の位置、形状及びサイズと一致するようなレイアウト単位領域を有する原本画像データを探索する。例えば、図3のレイアウト構造R1と、レイアウト構造R2やレイアウト構造R3とは、その構造が一致していないが、レイアウト構造R1とレイアウト構造R1’とはその構造がほぼ一致する。ここで、レイアウト構造R1とレイアウト構造R1’が完全に一致していない理由は、追記文書のレイアウト構造R1には、追記画像そのものも1つのレイアウト単位領域として取り扱われているからである。図5に示す例では、レイアウト構造R1のレイアウト単位領域a7が追記画像に対応するレイアウト単位領域であるが、追記前の文書原本のレイアウト構造R1’には、当然、このレイアウト単位領域a7は存在していない。よって、制御部11は、不揮発性記憶部12に記憶されている原本画像データのうち、ステップS2で抽出したレイアウト構造の特徴に最も近い特徴を有する原本画像データを探索すればよい。
(1−3)文字認識処理によって得られた文字列を特徴として抽出する方法
図6は、文字認識処理によって得られた結果に基づいて原本画像データを探索する仕組みを説明する図である。画像処理装置の制御部11は、図2のステップS2において、図6のような内容の追記文書D1(入力画像データ)の文字認識を行い、その結果を入力画像データの特徴として抽出する。一方、図2の処理開始以前に、制御部11は、原本画像データの各々について予め文字認識を行っており、その結果を不揮発性記憶部12に記憶しているものとする。
そして、制御部11は、ステップS3において、ステップS2で得た文字認識の結果と一致するような文字認識結果の原本画像データを探索する。例えば、図6に示す追記文書D1の文字認識結果と、文書原本D1’の文字認識結果とでは、追記文書D1の「中村に修正」という文字列が文書原本D1’(領域T)に含まれていないという点を除けば、両者はほぼ一致している。つまり、両者の違いは、追記文書D1の文字認識結果には追記部分の文字列が含まれているという点のみである。これに対し、追記文書D1の文字認識結果と文書原本D2の文字認識結果とでは、追記文書D1の「中村に修正」という文字列が文書原本D2の文字認識結果(領域T)に含まれていないという点以外にも、文字列t1〜t5の内容が相違している。このように、制御部11は、追記文書(入力画像データ)の文字認識結果と、原本画像データの文字認識結果とを比較し、不揮発性記憶部12に記憶されている原本画像データのうち、ステップS2で抽出した文字認識結果に最も近い原本画像データを探索すればよい。
(1−4)レイアウト解析処理によって得られたレイアウト単位領域のうち、特定のレイアウト単位領域に対して文字認識を行って得られた文字列を特徴として抽出する方法
上述した(1−3)の方法のように文字認識処理を行う場合、その処理対象が全て文字領域であれば問題はないが、例えば写真領域や図形領域等が含まれている場合には、それらの領域に対しては文字認識ができないので、文字認識結果が一致する原本画像データを探索しようとしても、より正確な探索が困難な場合がある。特に追記部分は手書きであることが多いが、手書き文字の文字認識精度は活字に比べて著しく低下する。
そこで、制御部11は、図2のステップS2において、図7に示すように追記文書に対してレイアウト解析を行い、それぞれのレイアウト単位領域を文字領域とそれ以外の領域とに分類する。具体的には、制御部11は、文字認識処理を試みて精度よくその処理を実行できた領域を文字領域とみなすようにすればよい。そして、制御部11は、文字領域とみなした領域に対する文字認識結果を入力画像データの特徴として抽出する。そして、制御部11は、ステップS3において、ステップS2で得た文字認識の結果と一致するような文字認識結果の原本画像データを探索すればよい。
(1−5)画像を複数の領域に分割し、各々の領域に対して周波数解析を行って得られた周波数分布を特徴として抽出する方法
画像処理装置1の制御部11は、図2のステップS2において、入力画像データが表す画像を複数の領域に分割し、各々の領域に対して周波数解析を行う。そして、制御部11は、各々領域から得られた周波数を用いて画像全体の周波数分布を特徴として抽出する。また、制御部11は、原本画像データの各々について上記のような周波数分布を算出しておき、これを不揮発性記憶部12に記憶しておく。そして、制御部11は、ステップS3において、ステップS2で得た周波数分布とほぼ一致するような原本画像データを探索する。
(1−6)画像の投影分布を特徴として抽出する方法
画像処理装置1の制御部11は、図2のステップS2において、追記文書(入力画像データ)の画像を所定の方向に投影し、その投影分布を追記文書の特徴として抽出する。例えば、図8に示す追記文書D3をx方向(図面右方)に投影し、その方向に向かって画素の数をカウントすると、その投影分布は図示のとおりになる。一方、制御部11は、原本画像データの各々についても予め投影分布を算出し、その結果を不揮発性記憶部12に記憶しておく。そして、制御部11は、図2のステップS3において、ステップS2で得た投影分布の結果とほぼ一致するような投影分布の原本画像データを探索する。ただし、追記画像の部分については投影分布が異なることになるので、制御部11は、不揮発性記憶部12に記憶されている原本画像データのうち、ステップS2で抽出した投影分布に最も近い投影分布を持つ原本画像データを探索すればよい。
この第1実施形態によれば、制御部11は、入力画像データが表す画像の内容を解析し、その画像の特徴を抽出する。次いで、制御部11は、不揮発性記憶部12に記憶されている原本画像データの中から、抽出した特徴にほぼ一致するような特徴を有する原本画像データを探索する。次に、制御部11は、探索により得られた原本画像データと、入力画像データとを比較し、両者の差分を追記画像データとして抽出する。そして、制御部11は、抽出した追記画像データを、探索により得られた原本画像データに対応付けて不揮発性記憶部12に記憶させる。このようにすれば、画像処理装置1の操作者が原本画像をわざわざ指定するような手間が不要であり、使い勝手がよい。
なお、上述した(1−1)〜(1−6)の方法は、それぞれ単独で用いなくても、幾つかの方法を組み合わせてもよい。このようにすれば、原本画像データをより正確に見つけだすことができる。また、画像処理装置1は原本画像データの特徴を予め算出しておき、これを不揮発性記憶部に記憶しておいたが、必ずしもこれに限らず、原本画像データを探索しようとする度に、入力画像データと原本画像データのそれぞれの特徴を算出するようにしてもよい。
また、画像処理装置1はパーソナルコンピュータによって実現してもよいし、この画像処理装置1の機能を備えた複合機によって実現してもよい。また、画像処理装置1の機能の一部を画像読取装置2によって実現してもよい。また、画像処理装置1の制御部11は、抽出した被追記画像データを画像処理装置1に内蔵された不揮発性記憶部12に記憶するのではなく、フロッピー(登録商標)ディスクやその他の記録媒体に記憶するようにしてもよい。なお、画像処理プログラムPRGは、磁気ディスク、フロッピー(登録商標)ディスク、CD(Compact Disk),DVD(Digital Versatile Disk),RAM等の種々の記録媒体に記録した状態で提供することが可能である。
(2)第2実施形態
前述した第1実施形態では、原本画像データと入力画像データの特徴どうしを比較して入力画像データ(追記文書)の原本を探索する、という手順で処理を実行していた。以下に述べる第2実施形態では、原本画像データと入力画像データについてそれぞれ特徴を算出するのではなく、まず、原本画像データと入力画像データとを画素レベルで比較して両者の差分を抽出し、その差分に基づいて入力画像データ(追記文書)の原本を探索するという手順で処理を行う。この第2実施形態に係る画像処理装置1の構成は、画像処理プログラムPRGに記述された手順の一部を除いて同じであるから、詳細な説明は省略する。
図9は、第2実施形態に係る画像処理プログラムPRGに記述された手順を示すフローチャートである。
図9において、追記がなされた追記文書が画像読取装置2によって読み取られると、画像読取装置2は、読み取った画像を表す画像データを画像処理装置1の入力部13に入力する(ステップS11)。制御部11は、その入力画像データと、不揮発性記憶部12に記憶されている各々の原本画像データとを比較していき、その差分である差分画像を抽出していく(ステップS12)。そして、制御部11は、抽出した差分画像に基づいて、入力画像データの原本に相当する原本画像データを特定する(ステップS13)。制御部11は、ステップS12で抽出した差分画像をステップS13で特定した原本画像データの追記画像として、これらを対応付けて不揮発性記憶部12に記憶させる(ステップS14)。
ここで、差分を抽出し、その差分に基づいて原本を特定するための具体的なアルゴリズムについて説明する。
(2−1)入力画像データが表す前景画像の画素数に対する差分画像の画素数の比率に基づいて原本画像データを特定する方法
追記画像データが表す前景画像(背景画像の上に形成された画像)は、例えば図10の追記文書D1に示すような画像である。この場合、追記文書D1と図6に示す文書原本D1’との差分は差分画像d1’のようになり、追記文書D1と図6に示す文書原本D2との差分は差分画像d2のようになる。図10では簡単に図示しているが、更に詳細に説明すると、差分画像とは比較対象の画像どうしの差分の絶対値である。従って、例えば、原本文書D2の「5月30日」という画像と、追記文書D1の「3月29日」という画像との差分を抽出した場合、図11に示すように、まず、「5」と「3」の差分の絶対値は斜線部分mのような形状になる。同様に、「3」と「2」との差分、「0」と「9」との差分の絶対値も斜線部分mのような形状になる。なお、「月」や「日」という文字画像は、原本文書D2と追記文書D1とで、画像の形状や位置まで含めて完全に一致するから、差分画像として抽出されることはない。この図11に示したように、図10に示した差分画像d2−1〜d2−4も、実際には、文字として識別できるような画像ではなく、図11のように判読不可能な差分画像として表現されることになる。
制御部11は、このような差分画像を不揮発性記憶部12に記憶されている全ての原本画像データについて抽出する。そして、制御部11は、入力画像データが表す前景画像の画素数に対するそれぞれの差分画像の画素数の比率を算出し、算出した比率が最も小さい差分画像に対応する原本画像データを特定する。図10の例では、追記文書D1と文書原本D1’との差分画像は「中村に変更」という画像だけであるが、追記文書D1と文書原本D2との差分画像は、差分画像d2−1〜d2−4のようになる。よって、入力画像データが表す前景画像の画素数に対する差分画像の画素数の比率が小さい方の原本画像データ、すなわち、図6の文書原本D1’が特定されることになる。
(2−2)入力画像データが表す前景画像の画素数に対する差分画像の画素の分布に基づいて原本画像データを特定する方法
上述した方法(2−1)は、差分画像の画素数の比率を用いたものであったが、以下の方法では、差分画像の画素の分布を用いるものである。
図10に示したように、追記文書D1と文書原本D1’との差分画像d1’と、追記文書D1と文書原本D2との差分画像d2とでは、差分画像の画素分布が異なる。すなわち、差分画像d1’は追記画像に等しいので、その画素が特定の領域に偏る傾向がある。これに対し、差分画像d2は、その画素が特定の領域に偏ることはなく、画像全体に均等に分散する傾向がある。特に差分画像d2は、図6に示した追記文書D1と非常によく似た文書原本との差分であるから、差分画像の画素の分布は画像全体に均等に分散している、とまでは言えないが、追記文書D1と比較対象の文書原本とが全く異なる文書である場合には、差分画像の画素分布は画像全体に満遍なく分散するはずである。制御部11は、このような差分画像の画素分布を不揮発性記憶部12に記憶されている全ての原本画像データについて算出し、算出した画素分布が特定の領域に偏っている傾向が最も強い差分画像に対応する原本画像データを特定する。
(2−3)入力画像データと原本画像データとの差分画像のレイアウト構造に基づいて原本画像データを特定する方法
制御部11が追記画像データと原本画像データとの差分画像についてレイアウト解析を行い、レイアウト単位領域に分類すると、例えば図10に示したような差分画像d1’が存在するレイアウト単位領域と、差分画像d2−1〜d2−4がそれぞれ存在するレイアウト単位領域のようになる。制御部11は、レイアウト解析を行って得られたレイアウト単位領域のサイズ及び位置に基づいて入力画像データの原本に相当する原本画像データを特定する。具体的には、追記部分は比較的小さかったり或いは文書のページ端などの特定の領域に偏る傾向にあるので、制御部11は、差分画像の各レイアウト領域のサイズが小さいとか特定の領域に偏っている傾向が強いといったような差分画像に対応する原本画像データを特定すればよい。
なお、以上の第2実施形態においても、上述した第1実施形態と同様の変形が可能である。
1…画像処理装置、2…画像読取装置、11…制御部、111…CPU,112…ROM,113…RAM,12…不揮発性記憶部,13…入力部,14…表示部、15・・・操作部、PRG・・・画像処理プログラム。

Claims (6)

  1. 複数の原本画像データを記憶する記憶手段と、
    画像データが入力される入力手段と、
    前記記憶手段によって記憶されている複数の原本画像データと、前記入力手段に入力された入力画像データとの差分画像をそれぞれ抽出する抽出手段と、
    前記抽出手段によって抽出された各々の前記差分画像に基づいて各々の前記差分画像の画素の分布を求め、前記記憶手段によって記憶されている複数の原本画像データの中から、求めた画素分布が他の原本画像データよりも特定の領域に偏っている原本画像データを、前記入力画像データの原本に相当する原本画像データとして特定する特定手段と、
    前記特定手段によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御手段と
    を備える画像処理装置。
  2. 複数の原本画像データを記憶する記憶手段と、
    画像データが入力される入力手段と、
    前記記憶手段によって記憶されている複数の原本画像データと、前記入力手段に入力された入力画像データとの差分画像をそれぞれ抽出する抽出手段と、
    前記抽出手段によって抽出された各々の前記差分画像に対してレイアウト解析を行い、これによって得られたレイアウト単位領域のサイズまたは位置に基づいて、前記記憶手段によって記憶されている複数の原本画像データの中から、前記入力画像データの原本に相当する原本画像データを特定する特定手段と、
    前記特定手段によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御手段と
    を備える画像処理装置。
  3. 前記記憶制御手段は、前記追記画像データが複数ある場合には、前記入力画像データが表す画像において互いに近傍にある追記画像を表す追記画像データどうしをグルーピングし、これら追記画像データをグループ単位で前記記憶手段に記憶させる請求項1または2に記載の画像処理装置。
  4. 前記記憶制御手段は、前記入力画像データが表す画像における追記画像の位置を含む電子付箋データとして、前記追記画像データを前記記憶手段に記憶させる請求項3に記載の画像処理装置。
  5. コンピュータに、
    記憶手段によって記憶されている複数の原本画像データと、入力された入力画像データとを比較し、両者の差分画像をそれぞれ抽出する抽出機能と、
    前記抽出機能によって抽出された各々の前記差分画像に基づいて各々の前記差分画像の画素の分布を求め、前記記憶手段によって記憶されている複数の原本画像データの中から、求めた画素分布が他の原本画像データよりも特定の領域に偏っている原本画像データを、前記入力画像データの原本に相当する原本画像データとして特定する特定機能と、
    前記特定機能によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御機能と
    を実現させるためのプログラム。
  6. コンピュータに、
    記憶手段によって記憶されている各々の原本画像データと、入力された入力画像データとを比較し、両者の差分画像をそれぞれ抽出する抽出機能と、
    前記抽出機能によって抽出された各々の前記差分画像に対してレイアウト解析を行い、これによって得られたレイアウト単位領域のサイズまたは位置に基づいて、前記記憶手段によって記憶されている複数の原本画像データの中から、前記入力画像データの原本に相当する原本画像データとして特定する特定機能と、
    前記特定機能によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御機能と
    を実現させるためのプログラム。
JP2010003273A 2010-01-08 2010-01-08 画像処理装置及びプログラム Expired - Fee Related JP4518212B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010003273A JP4518212B2 (ja) 2010-01-08 2010-01-08 画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010003273A JP4518212B2 (ja) 2010-01-08 2010-01-08 画像処理装置及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004322463A Division JP4517822B2 (ja) 2004-11-05 2004-11-05 画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2010102734A JP2010102734A (ja) 2010-05-06
JP4518212B2 true JP4518212B2 (ja) 2010-08-04

Family

ID=42293262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010003273A Expired - Fee Related JP4518212B2 (ja) 2010-01-08 2010-01-08 画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4518212B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104796568A (zh) * 2014-01-17 2015-07-22 富士施乐株式会社 图像处理装置和方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6010318B2 (ja) * 2012-04-02 2016-10-19 株式会社バイステック 画像検査装置、画像検査方法、及びプログラム
JP6201780B2 (ja) * 2014-01-20 2017-09-27 富士ゼロックス株式会社 画像処理装置及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003018393A (ja) * 2001-07-03 2003-01-17 Ricoh Co Ltd 画像処理システム
JP2003046768A (ja) * 2001-07-30 2003-02-14 Ricoh Co Ltd 画像処理装置及び画像処理方法及びその方法を記録した情報記憶媒体
JP2004178438A (ja) * 2002-11-28 2004-06-24 Minolta Co Ltd 文書管理プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3436958B2 (ja) * 1993-12-08 2003-08-18 株式会社東芝 画像入力装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003018393A (ja) * 2001-07-03 2003-01-17 Ricoh Co Ltd 画像処理システム
JP2003046768A (ja) * 2001-07-30 2003-02-14 Ricoh Co Ltd 画像処理装置及び画像処理方法及びその方法を記録した情報記憶媒体
JP2004178438A (ja) * 2002-11-28 2004-06-24 Minolta Co Ltd 文書管理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104796568A (zh) * 2014-01-17 2015-07-22 富士施乐株式会社 图像处理装置和方法
CN104796568B (zh) * 2014-01-17 2018-06-05 富士施乐株式会社 图像处理装置和方法

Also Published As

Publication number Publication date
JP2010102734A (ja) 2010-05-06

Similar Documents

Publication Publication Date Title
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
US8295590B2 (en) Method and system for creating a form template for a form
JP4854491B2 (ja) 画像処理装置及びその制御方法
JPS61267177A (ja) 文書画像追加情報の蓄積方法
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
US8526744B2 (en) Document processing apparatus and computer readable medium
JP4518212B2 (ja) 画像処理装置及びプログラム
JP2012190434A (ja) 帳票定義装置、帳票定義方法、プログラム及び記録媒体
JP2006065477A (ja) 文字認識装置
JP2008108114A (ja) 文書処理装置および文書処理方法
JP2019057311A (ja) 帳票情報認識装置および帳票情報認識方法
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2008282094A (ja) 文字認識処理装置
JP2008310531A (ja) 帳票識別方法及び帳票識別プログラム並びに該帳票識別方法を用いた光学文字読取システム
JP7384603B2 (ja) 文書フォームの識別
JP2019057115A (ja) 帳票情報認識装置および帳票情報認識方法
JP2008257543A (ja) 画像処理システム及びプログラム
JP5724286B2 (ja) 帳票作成装置、帳票作成方法、プログラム
JP2021140831A (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
JP2021152696A (ja) 情報処理装置及びプログラム
JP2021157375A (ja) 情報処理装置及びプログラム
JP7377565B2 (ja) 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4518212

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140528

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees