JP4517822B2 - 画像処理装置及びプログラム - Google Patents
画像処理装置及びプログラム Download PDFInfo
- Publication number
- JP4517822B2 JP4517822B2 JP2004322463A JP2004322463A JP4517822B2 JP 4517822 B2 JP4517822 B2 JP 4517822B2 JP 2004322463 A JP2004322463 A JP 2004322463A JP 2004322463 A JP2004322463 A JP 2004322463A JP 4517822 B2 JP4517822 B2 JP 4517822B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- original
- input
- image
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
- Character Discrimination (AREA)
Description
「文書原本」とは、プリンタ等の画像形成装置によって画像が形成されてから追記者による追記が一切なされていない文書を意味している。「原本画像データ」とは、この文書原本の内容を表した画像データである。なお、ここでいう「原本画像データ」という用語の意味には、文書の内容が画像として表現された画像データの他にも、例えば、文書作成アプリケーションプログラムによって固有のコード情報を用いて表現された文書データも含むものとする。なぜならこのような文書データを画像データに適宜変換することは容易であるし、また、特に本発明では、画像データであろうが文書データであろうが、文書原本の内容を解析してその特徴を抽出するために用いることができるという点では、これらのデータは共通するからである。
これに対し、「追記文書」とは、文書原本に対して追記がなされた状態の文書を意味している。また、「追記画像」とは、追記部分の画像を意味している。例えば或る文字列についてペンでアンダーラインが施されている場合には、そのアンダーラインそのものが追記画像である。「追記画像データ」とは、追記画像の内容を表した画像データである。
図1は、第1実施形態に係る画像処理装置1の構成を示したブロック図である。画像処理装置1は、例えばパーソナルコンピュータであり、制御部11と、不揮発性記憶部12と、入力部13と、表示部14と、操作部15とを備えている。入力部13には通信ケーブルを介してスキャナ等の画像読取装置2が接続されている。
追記者は文書原本に追記を行う。追記がなされた追記文書は画像読取装置2によって読み取られる。画像読取装置2は、読み取った画像を表す画像データを画像処理装置1の入力部13に入力する。
以上が、制御部11の基本動作である。
(1−1)可視または不可視のコード画像を特徴として抽出する方法
(1−2)レイアウト解析処理によって得られた各々のレイアウト単位領域の位置、形状及びサイズを特徴として抽出する方法
(1−3)文字認識処理によって得られた文字列を特徴として抽出する方法
(1−4)レイアウト解析処理によって得られたレイアウト単位領域のうち、特定のレイアウト単位領域に対して文字認識処理を行って得られた文字列を特徴として抽出する方法
(1−5)画像を複数の領域に分割し、各々の領域に対して周波数解析を行って得られた周波数分布を特徴として抽出する方法
(1−6)画像の投影分布を特徴として抽出する方法
(1−1)可視または不可視のコード画像を特徴として抽出する方法
図3は追記文書の一例を示す図である。追記文書Dにおいては、図4に示すような文書原本Doに対し、「総務部田中宛」という文字列のうち「田中」の部分を「中村」に修正するような指示が追記者によって追記されている。これらの文書原本Do及び追記文書Dの所定箇所(図3,4では右上隅)には、それぞれの原本文書に対して一意に割り当てられた識別情報であるバーコードC(コード画像)が形成されている。このバーコードCは、文書原本の画像が形成されるべき記録紙に予め印刷されたものであってもよいし、プリンタ等の画像形成装置が記録紙に文書原本の画像を形成する際に同時に形成したものであってもよい。
図5は、レイアウト解析によって原本画像データを探索する仕組みを説明する図である。図5に示すレイアウト構造R1は、追記文書(入力画像データ)に対してレイアウト解析を行い、文字領域とか写真領域等のレイアウト単位領域a1〜a7に分割された例を示している。画像処理装置の制御部11は、図2のステップS2において、このようなレイアウト解析によって得られた各々のレイアウト単位領域a1〜a7の位置、形状及びサイズを特徴として抽出する。一方、制御部11は、処理の開始以前に、原本画像データの各々について上記のようなレイアウト解析を行い、各々のレイアウト単位領域a1〜a7の位置、形状及びサイズを不揮発性記憶部12に記憶している。
図6は、文字認識処理によって得られた結果に基づいて原本画像データを探索する仕組みを説明する図である。画像処理装置の制御部11は、図2のステップS2において、図6のような内容の追記文書D1(入力画像データ)の文字認識を行い、その結果を入力画像データの特徴として抽出する。一方、図2の処理開始以前に、制御部11は、原本画像データの各々について予め文字認識を行っており、その結果を不揮発性記憶部12に記憶しているものとする。
上述した(1−3)の方法のように文字認識処理を行う場合、その処理対象が全て文字領域であれば問題はないが、例えば写真領域や図形領域等が含まれている場合には、それらの領域に対しては文字認識ができないので、文字認識結果が一致する原本画像データを探索しようとしても、より正確な探索が困難な場合がある。特に追記部分は手書きであることが多いが、手書き文字の文字認識精度は活字に比べて著しく低下する。
画像処理装置1の制御部11は、図2のステップS2において、入力画像データが表す画像を複数の領域に分割し、各々の領域に対して周波数解析を行う。そして、制御部11は、各々領域から得られた周波数を用いて画像全体の周波数分布を特徴として抽出する。また、制御部11は、原本画像データの各々について上記のような周波数分布を算出しておき、これを不揮発性記憶部12に記憶しておく。そして、制御部11は、ステップS3において、ステップS2で得た周波数分布とほぼ一致するような原本画像データを探索する。
画像処理装置1の制御部11は、図2のステップS2において、追記文書(入力画像データ)の画像を所定の方向に投影し、その投影分布を追記文書の特徴として抽出する。例えば、図8に示す追記文書D3をx方向(図面右方)に投影し、その方向に向かって画素の数をカウントすると、その投影分布は図示のとおりになる。一方、制御部11は、原本画像データの各々についても予め投影分布を算出し、その結果を不揮発性記憶部12に記憶しておく。そして、制御部11は、図2のステップS3において、ステップS2で得た投影分布の結果とほぼ一致するような投影分布の原本画像データを探索する。ただし、追記画像の部分については投影分布が異なることになるので、制御部11は、不揮発性記憶部12に記憶されている原本画像データのうち、ステップS2で抽出した投影分布に最も近い投影分布を持つ原本画像データを探索すればよい。
前述した第1実施形態では、原本画像データと入力画像データの特徴どうしを比較して入力画像データ(追記文書)の原本を探索する、という手順で処理を実行していた。以下に述べる第2実施形態では、原本画像データと入力画像データについてそれぞれ特徴を算出するのではなく、まず、原本画像データと入力画像データとを画素レベルで比較して両者の差分を抽出し、その差分に基づいて入力画像データ(追記文書)の原本を探索するという手順で処理を行う。この第2実施形態に係る画像処理装置1の構成は、画像処理プログラムPRGに記述された手順の一部を除いて同じであるから、詳細な説明は省略する。
図9において、追記がなされた追記文書が画像読取装置2によって読み取られると、画像読取装置2は、読み取った画像を表す画像データを画像処理装置1の入力部13に入力する(ステップS11)。制御部11は、その入力画像データと、不揮発性記憶部12に記憶されている各々の原本画像データとを比較していき、その差分である差分画像を抽出していく(ステップS12)。そして、制御部11は、抽出した差分画像に基づいて、入力画像データの原本に相当する原本画像データを特定する(ステップS13)。制御部11は、ステップS12で抽出した差分画像をステップS13で特定した原本画像データの追記画像として、これらを対応付けて不揮発性記憶部12に記憶させる(ステップS14)。
(2−1)入力画像データが表す前景画像の画素数に対する差分画像の画素数の比率に基づいて原本画像データを特定する方法
追記画像データが表す前景画像(背景画像の上に形成された画像)は、例えば図10の追記文書D1に示すような画像である。この場合、追記文書D1と図6に示す文書原本D1’との差分は差分画像d1’のようになり、追記文書D1と図6に示す文書原本D2との差分は差分画像d2のようになる。図10では簡単に図示しているが、更に詳細に説明すると、差分画像とは比較対象の画像どうしの差分の絶対値である。従って、例えば、原本文書D2の「5月30日」という画像と、追記文書D1の「3月29日」という画像との差分を抽出した場合、図11に示すように、まず、「5」と「3」の差分の絶対値は斜線部分mのような形状になる。同様に、「3」と「2」との差分、「0」と「9」との差分の絶対値も斜線部分mのような形状になる。なお、「月」や「日」という文字画像は、原本文書D2と追記文書D1とで、画像の形状や位置まで含めて完全に一致するから、差分画像として抽出されることはない。この図11に示したように、図10に示した差分画像d2−1〜d2−4も、実際には、文字として識別できるような画像ではなく、図11のように判読不可能な差分画像として表現されることになる。
上述した方法(2−1)は、差分画像の画素数の比率を用いたものであったが、以下の方法では、差分画像の画素の分布を用いるものである。
図10に示したように、追記文書D1と文書原本D1’との差分画像d1’と、追記文書D1と文書原本D2との差分画像d2とでは、差分画像の画素分布が異なる。すなわち、差分画像d1’は追記画像に等しいので、その画素が特定の領域に偏る傾向がある。これに対し、差分画像d2は、その画素が特定の領域に偏ることはなく、画像全体に均等に分散する傾向がある。特に差分画像d2は、図6に示した追記文書D1と非常によく似た文書原本との差分であるから、差分画像の画素の分布は画像全体に均等に分散している、とまでは言えないが、追記文書D1と比較対象の文書原本とが全く異なる文書である場合には、差分画像の画素分布は画像全体に満遍なく分散するはずである。制御部11は、このような差分画像の画素分布を不揮発性記憶部12に記憶されている全ての原本画像データについて算出し、算出した画素分布が特定の領域に偏っている傾向が最も強い差分画像に対応する原本画像データを特定する。
制御部11が追記画像データと原本画像データとの差分画像についてレイアウト解析を行い、レイアウト単位領域に分類すると、例えば図10に示したような差分画像d1’が存在するレイアウト単位領域と、差分画像d2−1〜d2−4がそれぞれ存在するレイアウト単位領域のようになる。制御部11は、レイアウト解析を行って得られたレイアウト単位領域のサイズ及び位置に基づいて入力画像データの原本に相当する原本画像データを特定する。具体的には、追記部分は比較的小さかったり或いは文書のページ端などの特定の領域に偏る傾向にあるので、制御部11は、差分画像の各レイアウト領域のサイズが小さいとか特定の領域に偏っている傾向が強いといったような差分画像に対応する原本画像データを特定すればよい。
なお、以上の第2実施形態においても、上述した第1実施形態と同様の変形が可能である。
Claims (5)
- 複数の原本画像データを記憶する記憶手段と、
画像データが入力される入力手段と、
前記記憶手段によって記憶されている複数の原本画像データと、前記入力手段に入力された入力画像データとを比較し、両者の差分画像をそれぞれ抽出する抽出手段と、
前記抽出手段によって抽出された差分画像に基づいて、前記入力画像データが表す前景画像の画素数に対する前記差分画像の画素数の比率を算出し、算出した比率が他の原本画像データよりも小さい原本画像データを、前記記憶手段によって記憶されている複数の原本画像データの中から、前記入力画像データの原本に相当する原本画像データとして特定するとともに、各々の前記差分画像の画素の分布を求め、求めた画素分布が他の原本画像データよりも特定の領域に偏っている原本画像データを、前記入力画像データの原本に相当する原本画像データとして特定する特定手段と、
前記特定手段によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御手段と
を備える画像処理装置。 - 複数の原本画像データを記憶する記憶手段と、
画像データが入力される入力手段と、
前記記憶手段によって記憶されている複数の原本画像データと、前記入力手段に入力された入力画像データとを比較し、両者の差分画像をそれぞれ抽出する抽出手段と、
前記抽出手段によって抽出された差分画像に基づいて、前記入力画像データが表す前景画像の画素数に対する前記差分画像の画素数の比率を算出し、算出した比率が他の原本画像データよりも小さい原本画像データを、前記記憶手段によって記憶されている複数の原本画像データの中から、前記入力画像データの原本に相当する原本画像データとして特定するとともに、各々の前記差分画像に対してレイアウト解析を行い、これによって得られたレイアウト単位領域のサイズまたは位置に基づいて、前記入力画像データの原本に相当する原本画像データを特定する特定手段と、
前記特定手段によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御手段と
を備える画像処理装置。 - 前記記憶制御手段は、前記追記画像データが複数ある場合には、前記入力画像データが表す画像において互いに近傍にある追記画像を表す追記画像データどうしをグルーピングし、これら追記画像データをグループ単位で前記記憶手段に記憶させる請求項1または2に記載の画像処理装置。
- 前記記憶制御手段は、前記入力画像データが表す画像における追記画像の位置を含む電子付箋データとして、前記追記画像データを前記記憶手段に記憶させる請求項3に記載の画像処理装置。
- コンピュータに、
記憶手段によって記憶されている複数の原本画像データと、入力された入力画像データとを比較し、両者の差分画像をそれぞれ抽出する抽出機能と、
前記抽出機能によって抽出された差分画像に基づいて、前記入力画像データが表す前景画像の画素数に対する前記差分画像の画素数の比率を算出し、算出した比率が他の原本画像データよりも小さい原本画像データを、前記記憶手段によって記憶されている原本画像データの中から、前記入力画像データの原本に相当する原本画像データとして特定するとともに、各々の前記差分画像の画素の分布を求め、求めた画素分布が他の原本画像データよりも特定の領域に偏っている原本画像データを、前記入力画像データの原本に相当する原本画像データとして特定する特定機能と、
前記特定機能によって特定された原本画像データと前記入力画像データとの差分画像を、当該原本画像データに対する追記画像データとして前記記憶手段に記憶させる記憶制御機能と
を実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004322463A JP4517822B2 (ja) | 2004-11-05 | 2004-11-05 | 画像処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004322463A JP4517822B2 (ja) | 2004-11-05 | 2004-11-05 | 画像処理装置及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010003273A Division JP4518212B2 (ja) | 2010-01-08 | 2010-01-08 | 画像処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006134079A JP2006134079A (ja) | 2006-05-25 |
JP4517822B2 true JP4517822B2 (ja) | 2010-08-04 |
Family
ID=36727573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004322463A Expired - Fee Related JP4517822B2 (ja) | 2004-11-05 | 2004-11-05 | 画像処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4517822B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9384619B2 (en) * | 2006-07-31 | 2016-07-05 | Ricoh Co., Ltd. | Searching media content for objects specified using identifiers |
JP5262888B2 (ja) * | 2009-03-19 | 2013-08-14 | 富士ゼロックス株式会社 | 文書表示制御装置及びプログラム |
US8750624B2 (en) * | 2010-10-19 | 2014-06-10 | Doron Kletter | Detection of duplicate document content using two-dimensional visual fingerprinting |
JP7259468B2 (ja) * | 2019-03-25 | 2023-04-18 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP7287097B2 (ja) * | 2019-05-09 | 2023-06-06 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、画像処理プログラム及び画像処理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003018393A (ja) * | 2001-07-03 | 2003-01-17 | Ricoh Co Ltd | 画像処理システム |
JP2003046768A (ja) * | 2001-07-30 | 2003-02-14 | Ricoh Co Ltd | 画像処理装置及び画像処理方法及びその方法を記録した情報記憶媒体 |
JP2004178438A (ja) * | 2002-11-28 | 2004-06-24 | Minolta Co Ltd | 文書管理プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3436958B2 (ja) * | 1993-12-08 | 2003-08-18 | 株式会社東芝 | 画像入力装置 |
-
2004
- 2004-11-05 JP JP2004322463A patent/JP4517822B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003018393A (ja) * | 2001-07-03 | 2003-01-17 | Ricoh Co Ltd | 画像処理システム |
JP2003046768A (ja) * | 2001-07-30 | 2003-02-14 | Ricoh Co Ltd | 画像処理装置及び画像処理方法及びその方法を記録した情報記憶媒体 |
JP2004178438A (ja) * | 2002-11-28 | 2004-06-24 | Minolta Co Ltd | 文書管理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2006134079A (ja) | 2006-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US8295590B2 (en) | Method and system for creating a form template for a form | |
JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
US20070171473A1 (en) | Information processing apparatus, Information processing method, and computer program product | |
US20060045340A1 (en) | Character recognition apparatus and character recognition method | |
JP2005173730A (ja) | 帳票ocrプログラム、方法及び装置 | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
US8526744B2 (en) | Document processing apparatus and computer readable medium | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP6931168B2 (ja) | 情報処理装置、制御方法、プログラム | |
US20200311413A1 (en) | Document form identification | |
JP2008282094A (ja) | 文字認識処理装置 | |
JP2009031937A (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
Shweka et al. | Automatic extraction of catalog data from digital images of historical manuscripts | |
JP2005208977A (ja) | 文書ファイリング装置および文書ファイリング方法 | |
JP2008257543A (ja) | 画像処理システム及びプログラム | |
JPH11328306A (ja) | 文書画像の論理要素抽出方法、装置および記録媒体 | |
JP5724286B2 (ja) | 帳票作成装置、帳票作成方法、プログラム | |
JP2021140831A (ja) | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム | |
JP2021157375A (ja) | 情報処理装置及びプログラム | |
JP2009182530A (ja) | 業務処理遂行支援装置 | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100427 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100510 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130528 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4517822 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140528 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |