JP2004287682A - 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法 - Google Patents

加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法 Download PDF

Info

Publication number
JP2004287682A
JP2004287682A JP2003077178A JP2003077178A JP2004287682A JP 2004287682 A JP2004287682 A JP 2004287682A JP 2003077178 A JP2003077178 A JP 2003077178A JP 2003077178 A JP2003077178 A JP 2003077178A JP 2004287682 A JP2004287682 A JP 2004287682A
Authority
JP
Japan
Prior art keywords
image
area
retouched
character
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003077178A
Other languages
English (en)
Other versions
JP4275973B2 (ja
Inventor
Hirofumi Horikawa
裕文 堀川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003077178A priority Critical patent/JP4275973B2/ja
Publication of JP2004287682A publication Critical patent/JP2004287682A/ja
Application granted granted Critical
Publication of JP4275973B2 publication Critical patent/JP4275973B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】差分処理後における引き残しの発生を防止することができ、加筆画像の抽出精度を向上させることができる加筆画像抽出装置を提供する。
【解決手段】第一領域識別手段101により識別された電子文書の原稿画像の各々の領域と第二領域識別手段103により識別された加筆重畳画像の各々の領域とについてのそれぞれの位置ズレ量を画像位置検出手段105によって検出し、この検出した位置ズレ量に基づいて画像差分処理手段106で位置を補正して差分処理を行う。これにより、電子文書の原稿画像と加筆重畳画像との間でズレが発生した場合であっても、位置ズレを補正してから差分処理を行うことで、差分処理後における引き残しの発生を防止することができるので、加筆画像の抽出精度を向上させることができる。
【選択図】 図3

Description

【0001】
【発明の属する技術分野】
本発明は、加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法に関する。
【0002】
【従来の技術】
従来、電子的なファイル(電子ファイル文書)から紙へ印刷出力された文書(プリンタ出力文書)をスキャナで読み取って、文字認識を行うことで、再生された電子ファイル文書を効率的に取得するためのシステムが知られている(例えば、特許文献1参照)。
【0003】
この特許文献1に記載されているシステムによれば、電子ファイル文書の内容を紙に印刷出力する際に、その文書のレイアウトと内容とに基づいてその文書の内容の同定のための誤り訂正符号を含むマーカーを発生して同じ紙面に印刷しておき、その紙面上の文字をスキャナで読取り認識して電子ファイル文書を再生する場合に、マーカーに含まれている誤り訂正符号を用いて認識誤りの検出・訂正を行う。これにより、特許文献1に記載されているシステムは、電子ファイル文書の内容が印刷出力された紙面(プリンタ出力文書)から、電子化ファイルを正しく再生できる。
【0004】
しかしながら、特許文献1に記載されているシステムによれば、プリンタ出力文書に加筆修正を加えることは想定していないか、たとえ想定していたとしても、その修正内容を元の電子ファイル文書に反映する手段は存在しなかった。そのため、例えば、出張先、自宅、通勤途上などで、プリンタ出力文書の内容に関連して思いついたアイデア等を紙面上に加筆修正したとしても、その状態では元の電子ファイル文書には反映できないことから、後日、加筆修正内容を参照しながら利用者が改めてワープロソフトウェア等を用いて入力(例えばタイピングにより入力)しなければならないという問題があった。
【0005】
そこで、スキャナ等の画像入力手段によって入力された加筆重畳画像から、プリンタドライバが作成した加筆修正前のイメージを差分することで加筆修正内容を取得するようにした文書編集装置が提案されている(例えば、特許文献2参照)。
【0006】
【特許文献1】
特開平7−108912号公報
【特許文献2】
特開平11−272654号公報
【0007】
【発明が解決しようとする課題】
しかしながら、特許文献2の文書編集装置によれば、プリンタドライバが作成した電子原稿画像とスキャナ等のデバイスから入力された加筆重畳画像との間で単純な差分処理を行う事で加筆修正内容を抽出しているが、この方法では電子原稿と加筆重畳画像の間で全体的または局所的なズレが発生した場合に、そのズレの影響として差分処理後に引き残しが発生するという問題がある。また、印刷された枠や文字等の上に加筆があった場合、差分処理によって加筆した情報が失われてしまうという問題もある。
【0008】
本発明の目的は、差分処理後における引き残しの発生を防止することができ、加筆画像の抽出精度を向上させることができる加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法を提供することである。
【0009】
【課題を解決するための手段】
請求項1記載の発明の加筆画像抽出装置は、電子文書を紙へ出力した後に手書きの加筆が重畳した状態の加筆重畳画像から加筆画像を抽出する加筆画像抽出装置において、前記加筆重畳画像を入力する加筆重畳画像入力手段と、前記電子文書の原稿画像における文字画像領域と文字画像領域以外の領域とを黒画素の分布に応じて識別する第一領域識別手段と、この第一領域識別手段で識別した領域識別情報に基づき、前記加筆重畳画像入力手段から入力された加筆重畳画像における文字画像領域と文字画像領域以外の領域とを識別する第二領域識別手段と、この第二領域識別手段により識別された各々の領域と前記第一領域識別手段により識別された各々の領域とについてのそれぞれの位置ズレ量の検出を行う画像位置検出手段と、この画像位置検出手段によって検出した位置ズレ量に基づいて位置を補正して差分処理を行う画像差分処理手段と、を備える。
【0010】
したがって、電子文書の原稿画像と加筆重畳画像との間でズレが発生した場合であっても、位置ズレを補正してから差分処理が行われることにより、差分処理後における引き残しの発生を防止することが可能になるので、加筆画像の抽出精度を向上させることが可能になる。
【0011】
請求項2記載の発明は、請求項1記載の加筆画像抽出装置において、前記電子文書の原稿画像と前記加筆重畳画像とを、それぞれ格子状の小領域画像に分割する領域分割手段を更に備え、前記画像位置検出手段は、前記領域分割手段により分割された小領域画像間に生じる位置ズレ量の検出を行う。
【0012】
したがって、局所的な位置ズレを補正してから差分処理が行われることにより、加筆画像の抽出精度を更に向上させることが可能になる。
【0013】
請求項3記載の発明は、請求項2記載の加筆抽出装置において、前記第一領域識別手段は、識別した前記電子文書の原稿画像の各々の領域内の黒画素密度を算出し、前記領域分割手段は、前記第一領域識別手段が算出した前記電子文書の原稿画像の黒画素密度の大小に応じて分割する格子の大きさを変更する。
【0014】
したがって、黒画素密度が大きい場合には、周囲の白画素を多く含めて黒画素密度を下げるために分割格子のサイズを大きくし、黒画素密度が小さい場合には、周囲の白画素を排除して黒画素密度を上げるために分割格子のサイズを小さくすることで、加筆画像の抽出精度を更に向上させることが可能になる。
【0015】
請求項4記載の発明は、請求項1ないし3のいずれか一記載の加筆画像抽出装置において、前記第一領域識別手段及び前記第二領域識別手段は、画像中の文字行を検出し、検出した文字行中から文字画像を文字単位で切り出す文字認識手段を備え、前記文字認識手段を用いて文字画像領域と文字画像領域以外の領域とを識別し、文字画像の認識結果と確信度と外接矩形領域とを出力する。
【0016】
したがって、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域とを容易に識別することが可能になる。
【0017】
請求項5記載の発明は、請求項4記載の加筆画像抽出装置において、前記第一領域識別手段及び前記第二領域識別手段は、前記文字認識手段により切り出された文字画像を、黒画素密度が大きい文字画像領域として出力する。
【0018】
したがって、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域との識別を簡易に行うことが可能になる。
【0019】
請求項6記載の発明は、請求項1ないし5のいずれか一記載の加筆画像抽出装置において、前記画像差分処理手段は、相関計算によって位置合わせが行われた画像間の相関値が、所定の閾値Th以上の場合にのみ差分処理を行う。
【0020】
したがって、加筆があった領域のみに対して差分処理を行うことが可能になる。
【0021】
請求項7記載の発明は、請求項1ないし5のいずれか一記載の加筆画像抽出装置において、前記画像差分処理手段は、相関計算によって位置合わせが行われた位置から所定の画素分をずらした画像間の相関値が、所定の閾値Th以下であって、かつ、所定の閾値Th以上の場合にのみ差分処理を行う。
【0022】
したがって、加筆があった領域のみに対して差分処理を行うことが可能になる。また、加筆重畳画像は電子文書の原稿画像を一度紙に出力した後にスキャナ、デジタルカメラ等のデバイスで入力しているために2枚の画像間には線幅の相違が生じて差分処理に影響することになるが、画素ずらしで差分処理を行うことにより、この線幅の違いによる差分処理に対する影響を減らすことが可能になるので、加筆画像の抽出精度を更に向上させることが可能になる。
【0023】
請求項8記載の発明のコンピュータに読み取り可能なプログラムは、電子文書を紙へ出力した後に手書きの加筆が重畳した状態の加筆重畳画像から加筆画像を抽出する加筆画像抽出装置が有するコンピュータにインストールされるプログラムであって、前記コンピュータに、前記加筆重畳画像を入力する加筆重畳画像入力機能と、前記電子文書の原稿画像における文字画像領域と文字画像領域以外の領域とを黒画素の分布に応じて識別する第一領域識別機能と、この第一領域識別機能で識別した領域識別情報に基づき、前記加筆重畳画像入力機能から入力された加筆重畳画像における文字画像領域と文字画像領域以外の領域とを識別する第二領域識別機能と、この第二領域識別機能により識別された各々の領域と前記第一領域識別機能により識別された各々の領域とについてのそれぞれの位置ズレ量の検出を行う画像位置検出機能と、この画像位置検出機能によって検出した位置ズレ量に基づいて位置を補正して差分処理を行う画像差分処理機能と、を実行させる。
【0024】
したがって、電子文書の原稿画像と加筆重畳画像との間で全体的または局所的なズレが発生した場合であっても、位置ズレを補正してから差分処理が行われることにより、差分処理後における引き残しの発生を防止することが可能になるので、加筆画像の抽出精度を向上させることが可能になる。
【0025】
請求項9記載の発明は、請求項8記載のコンピュータに読み取り可能なプログラムにおいて、前記電子文書の原稿画像と前記加筆重畳画像とを、それぞれ格子状の小領域画像に分割する領域分割機能を更に前記コンピュータに実行させ、前記画像位置検出機能は、前記領域分割機能により分割された小領域画像間に生じる位置ズレ量の検出を行う。
【0026】
したがって、局所的な位置ズレを補正してから差分処理が行われることにより、加筆画像の抽出精度を更に向上させることが可能になる。
【0027】
請求項10記載の発明は、請求項9記載のコンピュータに読み取り可能なプログラムにおいて、前記第一領域識別機能は、識別した前記電子文書の原稿画像の各々の領域内の黒画素密度を算出し、前記領域分割機能は、前記第一領域識別機能が算出した前記電子文書の原稿画像の黒画素密度の大小に応じて分割する格子の大きさを変更する。
【0028】
したがって、黒画素密度が大きい場合には、周囲の白画素を多く含めて黒画素密度を下げるために分割格子のサイズを大きくし、黒画素密度が小さい場合には、周囲の白画素を排除して黒画素密度を上げるために分割格子のサイズを小さくすることで、加筆画像の抽出精度を更に向上させることが可能になる。
【0029】
請求項11記載の発明は、請求項8ないし10のいずれか一記載のコンピュータに読み取り可能なプログラムにおいて、前記第一領域識別機能及び前記第二領域識別機能は、画像中の文字行を検出し、検出した文字行中から文字画像を文字単位で切り出す文字認識機能を前記コンピュータに実行させ、前記文字認識機能を用いて文字画像領域と文字画像領域以外の領域とを識別し、文字画像の認識結果と確信度と外接矩形領域とを出力する。
【0030】
したがって、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域とを容易に識別することが可能になる。
【0031】
請求項12記載の発明は、請求項11記載のコンピュータに読み取り可能なプログラムにおいて、前記第一領域識別機能及び前記第二領域識別機能は、前記文字認識機能により切り出された文字画像を、黒画素密度が大きい文字画像領域として出力する。
【0032】
したがって、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域との識別を簡易に行うことが可能になる。
【0033】
請求項13記載の発明は、請求項8ないし12のいずれか一記載のコンピュータに読み取り可能なプログラムにおいて、前記画像差分処理機能は、相関計算によって位置合わせが行われた画像間の相関値が、所定の閾値Th以上の場合にのみ差分処理を行う。
【0034】
したがって、加筆があった領域のみに対して差分処理を行うことが可能になる。
【0035】
請求項14記載の発明は、請求項8ないし12のいずれか一記載のコンピュータに読み取り可能なプログラムにおいて、前記画像差分処理機能は、相関計算によって位置合わせが行われた位置から所定の画素分をずらした画像間の相関値が、所定の閾値Th以下であって、かつ、所定の閾値Th以上の場合にのみ差分処理を行う。
【0036】
したがって、加筆があった領域のみに対して差分処理を行うことが可能になる。また、加筆重畳画像は電子文書の原稿画像を一度紙に出力した後にスキャナ、デジタルカメラ等のデバイスで入力しているために2枚の画像間には線幅の相違が生じて差分処理に影響することになるが、画素ずらしで差分処理を行うことにより、この線幅の違いによる差分処理に対する影響を減らすことが可能になるので、加筆画像の抽出精度を更に向上させることが可能になる。
【0037】
請求項15記載の発明のコンピュータに読取り可能な記憶媒体は、請求項8ないし14のいずれか一記載のプログラムを記憶している。
【0038】
したがって、この記憶媒体に記憶されたプログラムをコンピュータに読み取らせることにより、請求項8ないし14のいずれか一記載の発明と同様の作用を得ることが可能になる。
【0039】
請求項16記載の発明の加筆画像抽出方法は、電子文書を紙へ出力した後に手書きの加筆が重畳した状態の加筆重畳画像からの加筆画像の抽出を、コンピュータの処理制御により行う加筆画像抽出方法であって、前記加筆重畳画像を入力する加筆重畳画像入力工程と、前記電子文書の原稿画像における文字画像領域と文字画像領域以外の領域とを黒画素の分布に応じて識別する第一領域識別工程と、この第一領域識別工程で識別した領域識別情報に基づき、前記加筆重畳画像入力工程から入力された加筆重畳画像における文字画像領域と文字画像領域以外の領域とを識別する第二領域識別工程と、この第二領域識別工程により識別された各々の領域と前記第一領域識別工程により識別された各々の領域とについてのそれぞれの位置ズレ量の検出を行う画像位置検出工程と、この画像位置検出工程によって検出した位置ズレ量に基づいて位置を補正して差分処理を行う画像差分処理工程と、を具備する。
【0040】
したがって、電子文書の原稿画像と加筆重畳画像との間で全体的または局所的なズレが発生した場合であっても、位置ズレを補正してから差分処理が行われることにより、差分処理後における引き残しの発生を防止することが可能になるので、加筆画像の抽出精度を向上させることが可能になる。
【0041】
請求項17記載の発明は、請求項16記載の加筆画像抽出方法において、前記電子文書の原稿画像と前記加筆重畳画像とを、それぞれ格子状の小領域画像に分割する領域分割工程を更に具備し、前記画像位置検出工程は、前記領域分割工程により分割された小領域画像間に生じる位置ズレ量の検出を行う。
【0042】
したがって、局所的な位置ズレを補正してから差分処理が行われることにより、加筆画像の抽出精度を更に向上させることが可能になる。
【0043】
請求項18記載の発明は、請求項17記載の加筆画像抽出方法において、前記第一領域識別工程は、識別した前記電子文書の原稿画像の各々の領域内の黒画素密度を算出し、前記領域分割工程は、前記第一領域識別工程が算出した前記電子文書の原稿画像の黒画素密度の大小に応じて分割する格子の大きさを変更する。
【0044】
したがって、黒画素密度が大きい場合には、周囲の白画素を多く含めて黒画素密度を下げるために分割格子のサイズを大きくし、黒画素密度が小さい場合には、周囲の白画素を排除して黒画素密度を上げるために分割格子のサイズを小さくすることで、加筆画像の抽出精度を更に向上させることが可能になる。
【0045】
請求項19記載の発明は、請求項16ないし18のいずれか一記載の加筆画像抽出方法において、前記第一領域識別工程及び前記第二領域識別工程は、画像中の文字行を検出し、検出した文字行中から文字画像を文字単位で切り出す文字認識工程を具備し、前記文字認識工程を用いて文字画像領域と文字画像領域以外の領域とを識別し、文字画像の認識結果と確信度と外接矩形領域とを出力する。
【0046】
したがって、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域とを容易に識別することが可能になる。
【0047】
請求項20記載の発明は、請求項19記載の加筆画像抽出方法において、前記第一領域識別工程及び前記第二領域識別工程は、前記文字認識工程により切り出された文字画像を、黒画素密度が大きい文字画像領域として出力する。
【0048】
したがって、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域との識別を簡易に行うことが可能になる。
【0049】
請求項21記載の発明は、請求項16ないし20のいずれか一記載の加筆画像抽出方法において、前記画像差分処理工程は、相関計算によって位置合わせが行われた画像間の相関値が、所定の閾値Th以上の場合にのみ差分処理を行う。
【0050】
したがって、加筆があった領域のみに対して差分処理を行うことが可能になる。
【0051】
請求項22記載の発明は、請求項16ないし20のいずれか一記載の加筆画像抽出方法において、前記画像差分処理工程は、相関計算によって位置合わせが行われた位置から所定の画素分をずらした画像間の相関値が、所定の閾値Th以下であって、かつ、所定の閾値Th以上の場合にのみ差分処理を行う。
【0052】
したがって、加筆があった領域のみに対して差分処理を行うことが可能になる。また、加筆重畳画像は電子文書の原稿画像を一度紙に出力した後にスキャナ、デジタルカメラ等のデバイスで入力しているために2枚の画像間には線幅の相違が生じて差分処理に影響することになるが、画素ずらしで差分処理を行うことにより、この線幅の違いによる差分処理に対する影響を減らすことが可能になるので、加筆画像の抽出精度を更に向上させることが可能になる。
【0053】
【発明の実施の形態】
本発明の第一の実施の形態を図1ないし図13に基づいて説明する。図1は、本実施の形態のデータ処理システムのシステム構築例を示す模式図である。
【0054】
本実施の形態のデータ処理システムでは、サーバコンピュータ2にLAN(Local Area Network)等のネットワーク3を介してクライアントコンピュータ4が複数台接続されたサーバクライアントシステム1を想定する。このサーバクライアントシステム1は、スキャナやデジタルカメラ等の画像入力装置5及びプリンタ等の画像出力装置6をネットワーク3上でシェアし得る環境が整えられている。また、ネットワーク3上には、マルチファンクションペリフェラルと称されるMFP7が接続され、このMFP7が画像入力装置5や画像出力装置6として機能するように環境が構築されていても良い。
【0055】
このようなサーバクライアントシステム1は、例えばイントラネット8を介して別のサーバクライアントシステム1とのデータ通信可能に構築され、インターネット通信網9を介して外部環境とデータ通信可能に構築されている。
【0056】
サーバコンピュータ2は、各種文書等の画像イメージを電子原稿画像として記憶する画像管理機能と、例えば画像データにOCR(Optical Character Reader)処理を施してテキストデータを抽出する等の文字認識機能と、後述する本発明の特長的な機能である加筆画像抽出機能を発揮するものである。
【0057】
以下においては、本発明の特長的な加筆画像抽出機能を発揮する加筆画像抽出装置であるサーバコンピュータ2について説明する。
【0058】
図2は、本実施の形態における加筆画像抽出装置としてのサーバコンピュータ2のモジュール構成図である。サーバコンピュータ2は、情報処理を行うCPU(Central Processing Unit)11、情報を格納するROM(Read Only Memory)12及びRAM(Random Access Memory)13等の一次記憶装置14、後述する圧縮符号を記憶する記憶部であるHDD(Hard Disk Drive)15等の二次記憶装置16、情報を保管したり外部に情報を配布したり外部から情報を入手するためのCD−ROMドライブ等のリムーバブルディスク装置17、ネットワーク3を介して画像入力装置5や外部の他のコンピュータと通信により情報を伝達するためのネットワークインターフェース18、処理経過や結果等を操作者に表示するCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等の表示装置19、並びに操作者がCPU11に命令や情報等を入力するためのキーボード20、マウス等のポインティングディバイス21等から構成されており、これらの各部間で送受信されるデータをバスコントローラ22が調停して動作する。
【0059】
このようなサーバコンピュータ2では、ユーザが電源を投入するとCPU11がROM12内のローダーというプログラムを起動させ、HDD15よりオペレーティングシステムというコンピュータのハードウェアとソフトウェアとを管理するプログラムをRAM13に読み込み、このオペレーティングシステムを起動させる。このようなオペレーティングシステムは、ユーザの操作に応じてプログラムを起動したり、情報を読み込んだり、保存を行ったりする。オペレーティングシステムのうち代表的なものとしては、Windows(登録商標)、UNIX(登録商標)等が知られている。これらのオペレーティングシステム上で走る動作プログラムをアプリケーションプログラムと呼んでいる。
【0060】
ここで、サーバコンピュータ2は、アプリケーションプログラムとして、加筆画像抽出処理プログラムをHDD15に記憶している。この意味で、HDD15は、加筆画像抽出処理プログラムを記憶する記憶媒体として機能する。
【0061】
また、一般的には、サーバコンピュータ2のHDD15等の二次記憶装置16にインストールされる動作プログラムは、CD−ROMやDVD−ROM等の光情報記録メディアやFD等の磁気メディア等に記録され、この記録された動作プログラムがHDD15等の二次記憶装置16にインストールされる。このため、CD−ROM等の光情報記録メディアやFD等の磁気メディア等の可搬性を有する記憶媒体も、加筆画像抽出処理プログラムを記憶する記憶媒体となり得る。さらには、画像加筆画像抽出処理プログラムは、例えばネットワークインターフェース18を介して外部から取り込まれ、HDD15等の二次記憶装置16にインストールされても良い。
【0062】
サーバコンピュータ2は、オペレーティングシステム上で動作する加筆画像抽出処理プログラムが起動すると、この加筆画像抽出処理プログラムに従い、CPU11が各種の演算処理を実行して各部を集中的に制御する。サーバコンピュータ2のCPU11が、加筆画像抽出処理プログラムに従って実行する本実施の形態の特長的な処理について以下に説明する。
【0063】
ここで、サーバコンピュータ2のCPU11が加筆画像抽出処理プログラムに従うことにより実現される機能について説明する。図3に示すように、加筆画像抽出装置であるサーバコンピュータ2においては、第一領域識別手段101、加筆重畳画像入力手段102、第二領域識別手段103、領域分割手段104、画像位置検出手段105、画像差分処理手段106、画像合成手段107の各機能が、CPU11が加筆画像抽出処理プログラムに従って動作することにより実現される。
【0064】
なお、以下においては、HDD15に記憶されている電子原稿画像の中から所定の電子原稿画像を選択し、プリンタ等の画像出力装置6やMFP7から当該電子原稿画像を紙文書として紙に印字出力した後に、この紙文書に対して手書きの加筆が重畳した場合における各種の処理について説明するものである。
【0065】
第一領域識別手段101は、印字出力されて加筆された紙文書の電子原稿画像と同一の電子原稿画像をHDD15から取得し、当該電子原稿画像における加筆抽出対象領域内の黒画素密度の分布情報や文字認識処理を施した場合における文字認識結果等の情報を得る。ここで得られた黒画素密度の分布情報や文字認識結果等の情報、及び電子原稿画像は、領域分割手段104へと出力される。また、第一領域識別手段101での文字認識結果等の情報を得る際の領域識別情報は、第二領域識別手段103へと出力される。
【0066】
ここで、第一領域識別手段101について詳細に説明する。図4は、第一領域識別手段101の機能構成を示すブロック図である。図4に示すように、第一領域識別手段101は、文字認識手段201と、黒画素探索/計数手段202とにより構成されている。
【0067】
文字認識手段201は、電子原稿画像の加筆抽出対象領域に対して文字認識処理を行い、加筆抽出対象領域中の文字画像領域を取得する。ここで、加筆抽出対象領域は、電子原稿画像を印字出力した紙文書に対して重畳された手書きの加筆事項の抽出を行う領域であって、予め規定された領域である。そして、文字画像領域、文字認識結果、文字認識確信度、文字画像領域内の黒画素密度を電子原稿画像と共に、黒画素探索/計数手段202へと出力する。
【0068】
なお、文字認識処理に含まれる畝検出と文字切り出し処理のみに文字認識手段201を使用し、切り出された領域を黒画素密度が大きい文字画像領域として出力するようにしても良い。
【0069】
黒画素探索/計数手段202は、文字認識手段201において取得した各々の文字画像領域内の黒画素値総和の計数と、文字画像領域以外の領域にある黒画素部分を探索しその総和の計数を行う。ここで、黒画素探索/計数手段202は、発見された黒画素とその近傍領域を黒画素密度の小さい一つの領域とし、文字認識手段201から入力される文字画像領域を黒画素密度の大きい複数の領域として、分割後の電子原稿画像と共に第二領域識別手段103へと出力する。
【0070】
図5は、第一領域識別手段101による領域識別結果の一例を示す説明図である。図5においては、枠aの中に“加筆の入力対照領域”という文字bが記載されている紙文書を想定している。なお、図5に示すZは、加筆抽出対象領域である。したがって、第一領域識別手段101により、右上がりの斜線で示す黒画素密度が大きい領域と、左上がりの斜線で示す黒画素密度が低い領域とに、加筆抽出対象領域Zの領域が識別されることになる。斜線で表現されていない部分は、電子原稿上に黒画素が存在しない場所なので、たとえ加筆重畳画像側に黒画素が存在しても加筆画像抽出処理そのものが必要ない部分である。
【0071】
加筆重畳画像入力手段102は、第一領域識別手段101において取得した電子原稿画像と同一の電子原稿画像を印字出力した紙文書に対して加筆された状態の紙文書を、スキャナやデジタルカメラ等の画像入力装置5で読み取って電子化した加筆重畳画像を取得する。ここで、取得された加筆重畳画像は、第二領域識別手段103へと出力される。
【0072】
第二領域識別手段103は、第一領域識別手段101から入力された領域識別情報に基づき、加筆重畳画像入力手段102から入力された加筆重畳画像に対して領域分割を施し、それぞれの領域に対して黒画素密度取得の処理を行い、その結果を加筆重畳画像と共に領域分割手段104へと出力する。
【0073】
ここで、第二領域識別手段103について詳細に説明する。図6は、第二領域識別手段103の機能構成を示すブロック図である。図6に示すように、第二領域識別手段103は、文字認識手段301と、黒画素計数手段302とにより構成されている。
【0074】
文字認識手段301は、第一領域識別手段101で行った電子原稿画像に対する領域分割の情報が第一領域識別手段101から入力され、その領域のうち文字画像領域に関しては加筆重畳画像内の同領域に対して文字認識処理を行い、各領域の認識結果・認識確信度を黒画素計数手段302に出力する。
【0075】
黒画素計数手段302は、第一領域識別手段101から文字認識手段301を経て入力される各領域内の黒画素値総和を計数する。
【0076】
上述したように、領域分割手段104に対しては、第一領域識別手段101からは電子原稿画像と電子原稿画像内の各領域情報が、第二領域識別手段103からは加筆重畳画像と加筆重畳画像内の各領域情報が入力される。そこで、領域分割手段104は、電子原稿画像内の各領域情報の黒画素密度の分布に基づき、電子原稿画像と加筆重畳画像の2画像の加筆抽出対象領域を格子状の小領域画像に分割する。領域分割手段104は、このようにして分割した電子原稿画像と加筆重畳画像を画像位置検出手段105へと出力する。また、領域分割手段104は、分割数、位置、分割サイズ等の分割情報と、後述する加筆画像抽出後に貼り合わせをする際に下地となる画像とを、画像合成手段107へと出力する。
【0077】
ここで、領域分割手段104について詳細に説明する。図7は、領域分割手段104の機能構成を示すブロック図である。図7に示すように、領域分割手段104は、一次加筆判定手段401と、黒画素密度算出/判定手段402と、格子分割手段403とにより構成されている。
【0078】
一次加筆判定手段401は、第一領域識別手段101での電子原稿画像の黒画素密度算出結果と第二領域識別手段103での加筆重畳画像の黒画素密度算出結果との各分割領域毎での比較や、文字情報を含んでいる場合は文字認識結果や認識確信度の比較により加筆の有無を判定する。ここで、加筆がないと判定された領域はその領域に対する加筆画像抽出処理を行う必要はない。
【0079】
黒画素密度算出/判定手段402は、第一領域識別手段101から入力される各分割領域の黒画素密度の大小を所定の閾値Dで判定する。
【0080】
格子分割手段403は、黒画素密度算出/判定手段402により判定された各領域の黒画素密度が大きい場合には、周囲の白画素を多く含めて黒画素密度を下げるために分割格子のサイズを大きくし、黒画素密度が小さい場合には、周囲の白画素を排除し黒画素密度を上げるために分割格子のサイズを小さくする。これにより、加筆画像の抽出精度を更に向上させることが可能になる。複数の小領域画像に分割された電子原稿画像と加筆重畳画像の2画像を画像位置検出手段105に出力し、分割数、位置、分割サイズ等の分割情報と、第一領域識別手段101によって識別された領域以外の画像に対し、一次加筆判定手段401で『加筆画像抽出の必要ナシ』と判定された領域を白埋めした画像を、加筆画像抽出後に貼り合わせをする際に下地となる画像として画像合成手段107へと出力する。
【0081】
画像位置検出手段105は、領域分割手段104で分割された電子原稿画像と加筆重畳画像の小領域画像間に生じる局所的なズレ量を算出し、画像差分処理手段106へと出力する。このように、局所的な位置ズレを補正してから差分処理を行うようにすることにより、加筆画像の抽出精度を更に向上させることが可能になる。
【0082】
ここで、画像位置検出手段105について図8を参照しつつ詳細に説明する。画像位置検出手段105では、図8に示すように、格子状に細分化され作成された電子原稿画像O(x,y)の小領域画像oml(x,y)が、加筆重畳画像A(x,y)上でどの位置に対応するかを決める。2画像間の対応位置を決定するためには、2画像間で相互相関を計算し相関分布が最大に達する位置を対応位置とする方法や、2画像間で画像差分処理を行い差分画像の黒画素値総和が最小になる位置を対応位置とする方法などが考えられる。ここでは、前者の画像相関計算による位置合わせに関して記述する。
【0083】
まず、電子原稿画像O(x,y)の各々の小領域oml(x,y)とA(x,y)との相関値の分布を計算する。ここで、“m”は第一領域識別手段101で識別した領域毎につけたインデックスで、“l”は領域分割手段104で分割された格子毎につけたインデックスである。この時に、加筆重畳画像の方も電子原稿画像と同様に、領域分割手段104で格子状に細分化し、それをaml(x,y)とすると、空間的に対応する両画像の小領域同士、oml(x,y)とaml(x,y)の近傍領域とで相関値計算を行う方が計算時間の観点からも効率的である。この相関値計算の結果、相関値が最も高い値を取る1つの画像の相対位置を『最も確からしい位置』とする。ここで、画像位置検出手段105において計算される相関値の分布は、下記の式(1)
【0084】
【数1】
Figure 2004287682
【0085】
に示すように定義しておくと、それぞれ小領域内の黒画素値総和や小領域の面積に関係なく、必ず−1.0から+1.0の間の値を取り、特に画素値が0または1しか取らない2値画像に関しては0から+1.0までの値を取る。ここで算出した相関値分布Cml(x,y)は、画像差分処理手段106に対してoml(x,y)とaml(x,y)と共に出力される。
【0086】
画像差分処理手段106は、画像位置検出手段105にて算出した電子原稿画像と加筆重畳画像の小領域画像間に生じる局所的なズレ量を補正するよう位置合わせを行い、電子原稿画像と加筆重畳画像の小領域画像の間で画像差分処理を行う。画像差分処理手段106は、その差分処理結果を画像合成手段107へと出力する。
【0087】
ここで、図9は画像差分処理手段106における各小領域画像毎の差分処理の流れを示すフローチャートである。図9に示すように、ステップS1では、相関値分布Cml(x,y)が最大になる座標(x,y)を検出する。
【0088】
続くステップS2では、第一領域識別手段101で決定する黒画素密度に応じて変化する閾値Thと、相関値分布における最大値Cml(x,y)とを比較する。
【0089】
閾値Thの方が小さい場合には(ステップS2のY)、電子原稿画像と加筆重畳画像に大きな違いが見られない、つまり加筆成分が存在していない可能性が高いので、原稿成分を消去するためにステップS3へ進み、電子原稿画像と加筆重畳画像の各小領域画像の位置関係を(x,y)に対応するズレ量で位置合わせをした後に差分処理を行う。
【0090】
一方、閾値Thの方が大きい場合には(ステップS2のN)、加筆成分が存在している可能性が高いので、加筆成分を残すために差分処理は行わずに、そのまま処理を終了する。
【0091】
画像合成手段107は、画像差分処理手段106で行った差分処理の結果の小領域画像を領域分割手段104から入力される分割情報に基づき、同じく領域分割手段104から入力される下地となる画像に貼り合わせる。全ての小領域画像に対して貼り合わせを行った後、加筆画像として出力する。
【0092】
次に、上述したような各種機能により実現される加筆画像抽出処理の一連の流れについて説明する。図10は、加筆画像抽出処理の流れを示すフローチャートである。図10に示すように、加筆画像抽出処理としては、まず、加筆画像抽出を行う領域の個数Nと、それぞれの抽出対象領域の位置、大きさを設定し、電子原稿画像とその画像を紙に出力した後に加筆されスキャナやデジタルカメラ等の画像入力装置5で取り込まれた加筆重畳画像を入力し(ステップS11)、領域数変数nを1に設定する(ステップS12)。
【0093】
続くステップS13では、加筆画像抽出の対象となる領域を加筆重畳画像から切り出し、同時に電子原稿画像からは、先に加筆重畳画像から抽出した領域に対応した領域を切り出す。
【0094】
その後、ステップS13で切り出された電子原稿画像内に対して領域識別を行い、M個の小領域に分割し各小領域の黒画素密度と各小領域が文字画像領域か否かの情報と、文字画像であれば文字認識結果、認識確信度、黒画素値総和とを出力し(ステップS14)、小領域数変数mを1に設定する(ステップS15)。
【0095】
ステップS16では、ステップS14で分割されたM個の領域のうち、m番目の領域に加筆があるか否かの一次判定を行う。
【0096】
ここで、ステップS16の処理を、図11を参照しつつ詳細に説明する。図11に示すように、ステップS31では、m番目の領域内の画像が文字画像か否かを判定する。m番目の領域内の画像が文字画像の場合には(ステップS31のY)、ステップS32へ進み、m番目の領域内の画像が文字画像でない場合には(ステップS31のN)、ステップS35へ進む。
【0097】
ステップS32では、加筆重畳画像側の同じ小領域に文字認識処理を施し、加筆重畳画像側の文字認識結果、文字認識確信度、領域内の黒画素値総和を算出する。
【0098】
続いて電子原稿画像と加筆重畳画像の文字認識結果を比較し(ステップS33)、結果が一致している場合には(ステップS33のY)、ステップS34へ進み、結果が一致していない場合には(ステップS33のN)、m番目の領域に加筆があったものとしてステップS17へ進む。
【0099】
ステップS34では、電子原稿画像と加筆重畳画像の文字認識確信度を比較し、結果に大きな差異がない場合には(ステップS34のY)、ステップS35へ進み、結果に大きな差異があった場合には(ステップS34のN)、m番目の領域に加筆があったものとしてステップS17へ進む。
【0100】
ステップS35では、電子原稿画像と加筆重畳画像の小領域中の黒画素値総和を比較し、大きな差異がない場合には(ステップS35のY)、m番目の領域に加筆がなかったものとしてステップS23へ進み、大きな差異があった場合があった場合には(ステップS35のN)、m番目の領域に加筆があったものとしてステップS17へ進む。
【0101】
すなわち、m番目の領域に加筆があった場合には(ステップS16のY)、ステップS17に進み、m番目の領域に加筆がなかった場合には(ステップS16のN)、後述するステップS17〜S22の分割差分処理を行わずに、白紙の画像を差分処理後の画像としてステップS23に進む。
【0102】
ステップS17では、ステップS14で分割された領域をL個の格子状に細分化する。また、ステップS18では、格子数変数“l”を1に設定する。
【0103】
次に、ステップS17で分割された加筆重畳画像と電子原稿画像の小領域画像に対して相関値の分布Cml(x,y)を計算し(ステップS19)、加筆重畳画像と電子原稿画像の小領域間の差分処理を行う(ステップS20)。
【0104】
その後、格子数変数“l”を1だけ増加させた後(ステップS21)、格子数変数“l”が上限Lを超えているか否かをの判定を行う(ステップS22)。ここで、格子数変数“l”が上限Lを超えていなければ(ステップS22のN)、ステップS19〜S22の処理を繰り返す。
【0105】
一方、格子数変数“l”が上限Lを超えていれば(ステップS22のY)、すべての格子状領域についての処理を終えたことになるので、小領域変数mを1だけ増加させた後(ステップS23)、小領域変数mが上限Mを超えているか否かを判定を行う(ステップS24)。ここで、小領域変数mが上限Mを超えていなければ(ステップS24のN)、ステップS16〜S24の処理を繰り返す。
【0106】
小領域変数mが上限Mを超えていれば(ステップS24のY)、すべての小領域についての処理を終えことになるので、差分処理後の小領域画像を、下地画像に貼り合わせることで加筆のみの画像を作成する(ステップS25)。
【0107】
さらに、領域数変数nを1だけ増加させた後(ステップS26)、領域数変数nが上限Nを超えているかどうかの判定を行う(ステップS27)。ここで、領域数変数nが上限Nを超えていなければ(ステップS27のN)、ステップS13〜S27の処理を繰り返す。また、領域数変数nが上限Nを超えていれば(ステップS27のY)、ステップS25で張り合わされた加筆画像を出力する(ステップS28)。
【0108】
[具体例]
ここで、上述したような加筆画像抽出処理について一例を挙げて具体的に説明する。図12は、加筆画像抽出処理についての具体例を模式的に示す説明図である。なお、図12中、電子原稿画像(a)と加筆重畳画像(b)とについては、加筆抽出対象領域のみを示したものである。電子原稿画像(a)は、枠の中に“加筆の入力対照領域”という文字が記載されている電子原稿画像を想定しており、加筆重畳画像(b)は、枠の中の“加筆の入力対照領域”という文字の“照”を“象”に書き込み訂正した紙文書を読み取った加筆重畳画像を想定している。
【0109】
▲1▼ 文字認識処理による領域識別
まず、第一領域識別手段101において、電子原稿画像(a)に対する文字認識処理を施し、電子原稿画像(a)に存在する文字領域画像(c)を検出する。図12においては、文字領域画像(c)を網掛けで表現している。さらに、電子原稿画像(a)から文字領域画像(c)を除くことにより、文字画像以外の黒画素領域である枠線領域画像(d)を検出することができる。以上が、第一領域識別手段101での処理である。図12では9つの文字画像と1つの枠線領域が得られるので、計10個の小領域情報が出力される。
【0110】
▲2▼ 文字領域画像(c)及び枠線領域画像(d)を用いた領域分離
次に、第二領域識別手段103において、文字領域画像(c)と枠線領域画像(d)の領域情報を用い、加筆重畳画像(b)から文字領域及び枠線領域を分離する。その結果、加筆重畳画像(b)は、文字領域画像(c)に対応する加筆重畳画像側の文字領域画像(e)、枠線領域画像(d)に対応する加筆重畳画像側の枠線領域画像(f)、文字領域画像(e)と枠線領域画像(f)のどちらでもない領域、つまり電子原稿画像側には黒画素が存在しないが加筆重畳画像側に加筆が存在する可能性のあるその他領域(g)の3つに分離される。
【0111】
▲3▼ 文字領域画像(c)の各領域に対する文字認識処理、黒画素計数処理
次に、文字領域画像(c)の各領域に対する文字認識処理、黒画素計数処理を行う。各領域が文字画像領域であるかどうかを判定し、文字画像領域であれば文字認識手段201による電子原稿画像(a)に対する文字認識処理を行い、黒画素探索/計数手段202による黒画素値総和の算出を行う。文字画像領域でなければ、各領域の黒画素値総和の算出のみを行う。
【0112】
▲4▼ 文字領域画像(e)の各領域に対する文字認識処理、黒画素計数処理
次に、文字領域画像(e)の各領域に対する文字認識処理、黒画素計数処理を行う。各領域が文字画像領域であるかどうかを判定し、文字画像領域であれば文字認識手段301による加筆重畳画像(b)に対する文字認識処理を行い、黒画素計数手段302による黒画素値総和の算出を行う。文字画像領域でなければ、黒画素計数手段302による各領域の黒画素値総和の算出のみを行う。
【0113】
▲5▼ 文字領域画像(c)と文字領域画像(e)を黒画素値、文字認識結果等で比較
加筆重畳画像側の文字領域画像(e)と電子原稿画像側の文字領域画像(c)とについて、それぞれの黒画素値総和、認識結果、認識確信度を比較し、加筆の有無を判定する。
【0114】
▲6▼ 枠線領域画像(d)と枠線領域画像(f)を黒画素値で比較
また、加筆重畳画像側の枠線領域画像(f)と電子原稿画像側の枠線領域画像(d)、つまり文字領域以外の領域に関しては黒画素値総和のみを用いて加筆の有無を判定する。
【0115】
ここで、図12中、加筆がある可能性があるのは、文字画像領域に関しては『照』の領域のみ(他の文字は文字認識結果、認識確信度、黒画素値総和の比較において両画像間で大差はない)であり、文字画像領域以外の領域については黒画素値総和が増加しているので、その結果、加筆画像抽出処理の対象となる領域は、加筆抽出対象領域画像(h)となる。
【0116】
また、図12中、下地画像(i)は、その他領域(g)に加筆画像抽出の対象領域とならなかった領域に対し白埋めした画像である。この下地画像(i)は、各文字領域又は枠線領域に対し差分処理を施した後の加筆成分を貼り合わせる下地として使用する。
【0117】
ここで、図13は一次加筆判定手段401において差分処理が必要と判定された領域に対する格子分割を示す説明図である。図13に示すように、加筆抽出対象領域画像(h)においては、文字領域1つと枠線領域1つ、計2つの領域のみが格子分割を行う対象になる。各領域は、黒画素密度算出/判定手段402によってその領域内の黒画素密度を判定するので、図13に示すように黒画素密度の高い文字画像領域は分割サイズを大きくし、黒画素密度の低いその他の領域では小さくする、というように分割格子の大きさが変えられている。
【0118】
ここに、電子文書の原稿画像と加筆重畳画像との間でズレが発生した場合であっても、位置ズレを補正してから差分処理が行われることにより、差分処理後における引き残しの発生を防止することが可能になるので、加筆画像の抽出精度を向上させることが可能になる。
【0119】
次に、本発明の第二の実施の形態を図14ないし図15に基づいて説明する。なお、第一の実施の形態において説明した部分と同一部分については同一符号を用い、説明も省略する。本実施の形態は、第一の実施の形態とは、第一領域識別手段101及び第二領域識別手段103の機能構成が異なるものである。
【0120】
まず、本実施の形態の第一領域識別手段101について詳細に説明する。図14は、本実施の形態の第一領域識別手段101の機能構成を示すブロック図である。図14に示すように、本実施の形態の第一領域識別手段101は、第一概分割手段501と、黒画素密度算出手段502とにより構成されている。
【0121】
第一概分割手段501は、電子原稿画像の加筆抽出対象領域を所定の大きさの格子に分割し、分割された電子原稿画像を黒画素探索/計数手段202へと出力する。
【0122】
黒画素探索/計数手段202は、第一概分割手段501で分割されたそれぞれの分割領域に対して、格子内における黒画素密度を算出し、それぞれの分割領域の位置、大きさを第二領域識別手段103と領域分割手段104へ、各領域の黒画素密度の大小と分割後の電子原稿画像を領域分割手段104へと出力する。また、計算効率を考えた場合では、格子に分割する大きさを一定にしておけば、『黒画素密度』を計算するよりも『黒画素量』を計算した方がよい。
【0123】
図15は、第一領域識別手段101による領域識別結果の一例を示す説明図である。図15においては、枠aの中に“加筆の入力対照領域”という文字bが記載されている紙文書を想定している。なお、図15に示すZは、加筆抽出対象領域である。したがって、第一領域識別手段101により、右上がりの斜線で示す黒画素密度が大きい領域と、左上がりの斜線で示す黒画素密度が低い領域とに、加筆抽出対象領域Zの領域が識別されることになる。斜線で表現されていない部分は、電子原稿上に黒画素が存在しない場所なので、たとえ加筆重畳画像側に黒画素が存在しても加筆画像抽出処理そのものが必要ない部分である。
【0124】
次に、本実施の形態の第二領域識別手段103について詳細に説明する。図16は、本実施の形態の第二領域識別手段103の機能構成を示すブロック図である。図16に示すように、本実施の形態の第二領域識別手段103は、第二概分割手段601と、黒画素密度算出手段602とにより構成されている。
【0125】
第二概分割手段601は、第一領域識別手段101で行った電子原稿画像に対する領域分割の情報が第一領域識別手段101から入力され、その情報に基づいて加筆重畳画像入力手段102から入力される加筆重畳画像を分割する。ただし、入力される領域情報の分割の形状は格子状とは限らない。
【0126】
黒画素密度算出手段602は、黒画素密度算出手段502と同等の機能を有する。ここで、算出される加筆重畳画像における各領域の黒画素密度と加筆重畳画像そのものが領域分割手段104へ出力される。
【0127】
ここに、電子文書の原稿画像と加筆重畳画像との間でズレが発生した場合であっても、位置ズレを補正してから差分処理が行われることにより、差分処理後における引き残しの発生を防止することが可能になるので、加筆画像の抽出精度を向上させることが可能になる。
【0128】
次に、本発明の第三の実施の形態を図17または図18に基づいて説明する。なお、第一の実施の形態において説明した部分と同一部分については同一符号を用い、説明も省略する。本実施の形態は、第一の実施の形態とは、画像差分処理手段106における各小領域画像毎の差分処理の流れが異なるものである。
【0129】
ここで、図17は画像差分処理手段106における各小領域画像毎の差分処理の流れを示すフローチャートである。図17に示すように、ステップS41では、相関値分布Cml(x,y)が最大になる座標(x,y)を検出する。
【0130】
続くステップS42では、第一領域識別手段101で決定する黒画素密度に応じて変化する閾値Thと相関値分布における最大値Cml(x,y)とを比較する。
【0131】
閾値Thの方が大きい場合には(ステップS42のN)、加筆成分が存在している可能性が高いので、加筆成分を残すために差分処理は行わずに、そのまま処理を終了する。
【0132】
一方、閾値Thの方が小さい場合には(ステップS42のY)、電子原稿画像と加筆重畳画像に大きな違いが見られない、つまり加筆成分が存在していない可能性が高いので、ステップS43以降へ進み、電子原稿画像と加筆重畳画像の各小領域画像の位置関係を(x,y)に対応するズレ量で位置合わせをした後にその位置の近傍で画素ずらし差分処理を行う。
【0133】
ステップS43〜S44及びステップS49〜S50は、(x,y)とその周囲の3×3の領域での繰り返し処理を示したものである。この領域の大きさを変える場合は、ステップS43〜S44での設定値、ステップS47及びステップS49での加算値、ステップS48及びステップS50での条件値を変更する。
【0134】
ステップS45では、ステップS43とステップS44において変更された位置(x+x,y+y)での相関値Cml(x+x,y+y)が、閾値Thと同様に第一領域識別手段101で決定する黒画素密度に応じて変化する閾値Th(Th<Th)を超えているかどうかの判定を行う。
【0135】
相関値Cml(x+x,y+y)が閾値Thを超えていない場合には(ステップS45のN)、ステップS47に進み、画素ずらし量を変化させる。
【0136】
相関値Cml(x+x,y+y)が閾値Thを超えている場合には(ステップS45のY)、ステップS46に進み、ここで加筆重畳画像と電子原稿画像、2枚の小領域画像の位置関係を(x+x,y+y)に対応する位置とし画像差分処理を行う。
【0137】
このような『画素ずらし』での差分処理を行う理由は、電子原稿画像と加筆重畳画像との間の線幅の違いにある。加筆重畳画像は電子原稿画像を一度紙に出力した後にスキャナ、デジタルカメラ等のデバイスで入力しているため、2枚の画像間には線幅の相違が生じる。この線幅の違いが差分処理に影響し加筆重畳画像の原稿成分の引き残しが発生するため、上記のような画素ずらしでの差分処理が単純な差分処理よりも有効となる。
【0138】
また、画像差分処理手段106で使う閾値Thは、黒画素密度が大きい領域と小さい領域で設定を変える。文字画像領域のように格子分割した際に電子原稿画像の格子内の黒画素密度が大きくなる領域の場合には、加筆成分が重畳している場合では相関の最大値が大きくなる傾向にあるので、枠線領域のように格子分割した際に電子原稿画像の格子内の黒画素密度が小さい領域よりも閾値Thを大きく設定しておくと加筆成分の欠落を防げる。閾値Thも閾値Thと同様である。
【0139】
例えば、図18に示すように、枠線領域には閾値Thまたは閾値Thを使用し、文字画像領域には閾値Th’または閾値Th’を使用する、というように使い分けることができる。
【0140】
ここに、加筆重畳画像は電子文書の原稿画像を一度紙に出力した後にスキャナ、デジタルカメラ等のデバイスで入力しているために2枚の画像間には線幅の相違が生じて差分処理に影響することになるが、画素ずらしで差分処理を行うことにより、この線幅の違いによる差分処理に対する影響を減らすことが可能になるので、加筆画像の抽出精度を更に向上させることが可能になる。
【0141】
【発明の効果】
請求項1記載の発明の加筆画像抽出装置によれば、電子文書を紙へ出力した後に手書きの加筆が重畳した状態の加筆重畳画像から加筆画像を抽出する加筆画像抽出装置において、前記加筆重畳画像を入力する加筆重畳画像入力手段と、前記電子文書の原稿画像における文字画像領域と文字画像領域以外の領域とを黒画素の分布に応じて識別する第一領域識別手段と、この第一領域識別手段で識別した領域識別情報に基づき、前記加筆重畳画像入力手段から入力された加筆重畳画像における文字画像領域と文字画像領域以外の領域とを識別する第二領域識別手段と、この第二領域識別手段により識別された各々の領域と前記第一領域識別手段により識別された各々の領域とについてのそれぞれの位置ズレ量の検出を行う画像位置検出手段と、この画像位置検出手段によって検出した位置ズレ量に基づいて位置を補正して差分処理を行う画像差分処理手段と、を備え、電子文書の原稿画像と加筆重畳画像との間でズレが発生した場合であっても、位置ズレを補正してから差分処理を行うことにより、差分処理後における引き残しの発生を防止することができるので、加筆画像の抽出精度を向上させることができる。
【0142】
請求項2記載の発明によれば、請求項1記載の加筆画像抽出装置において、前記電子文書の原稿画像と前記加筆重畳画像とを、それぞれ格子状の小領域画像に分割する領域分割手段を更に備え、前記画像位置検出手段は、前記領域分割手段により分割された小領域画像間に生じる位置ズレ量の検出を行うことにより、局所的な位置ズレを補正してから差分処理を行うことができるので、加筆画像の抽出精度を更に向上させることができる。
【0143】
請求項3記載の発明によれば、請求項2記載の加筆抽出装置において、前記第一領域識別手段は、識別した前記電子文書の原稿画像の各々の領域内の黒画素密度を算出し、前記領域分割手段は、前記第一領域識別手段が算出した前記電子文書の原稿画像の黒画素密度の大小に応じて分割する格子の大きさを変更することにより、黒画素密度が大きい場合には、周囲の白画素を多く含めて黒画素密度を下げるために分割格子のサイズを大きくし、黒画素密度が小さい場合には、周囲の白画素を排除して黒画素密度を上げるために分割格子のサイズを小さくすることで、加筆画像の抽出精度を更に向上させることができる。
【0144】
請求項4記載の発明によれば、請求項1ないし3のいずれか一記載の加筆画像抽出装置において、前記第一領域識別手段及び前記第二領域識別手段は、画像中の文字行を検出し、検出した文字行中から文字画像を文字単位で切り出す文字認識手段を備え、前記文字認識手段を用いて文字画像領域と文字画像領域以外の領域とを識別し、文字画像の認識結果と確信度と外接矩形領域とを出力することにより、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域とを容易に識別することができる。
【0145】
請求項5記載の発明によれば、請求項4記載の加筆画像抽出装置において、前記第一領域識別手段及び前記第二領域識別手段は、前記文字認識手段により切り出された文字画像を、黒画素密度が大きい文字画像領域として出力することにより、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域との識別を簡易に行うことができる。
【0146】
請求項6記載の発明によれば、請求項1ないし5のいずれか一記載の加筆画像抽出装置において、前記画像差分処理手段は、相関計算によって位置合わせが行われた画像間の相関値が、所定の閾値Th以上の場合にのみ差分処理を行うことにより、加筆があった領域のみに対して差分処理を行うことができる。
【0147】
請求項7記載の発明によれば、請求項1ないし5のいずれか一記載の加筆画像抽出装置において、前記画像差分処理手段は、相関計算によって位置合わせが行われた位置から所定の画素分をずらした画像間の相関値が、所定の閾値Th以下であって、かつ、所定の閾値Th以上の場合にのみ差分処理を行うことにより、加筆があった領域のみに対して差分処理を行うことができる。また、加筆重畳画像は電子文書の原稿画像を一度紙に出力した後にスキャナ、デジタルカメラ等のデバイスで入力しているために2枚の画像間には線幅の相違が生じて差分処理に影響することになるが、画素ずらしで差分処理を行うことにより、この線幅の違いによる差分処理に対する影響を減らすことができるので、加筆画像の抽出精度を更に向上させることができる。
【0148】
請求項8記載の発明のコンピュータに読み取り可能なプログラムによれば、電子文書を紙へ出力した後に手書きの加筆が重畳した状態の加筆重畳画像から加筆画像を抽出する加筆画像抽出装置が有するコンピュータにインストールされるプログラムであって、前記コンピュータに、前記加筆重畳画像を入力する加筆重畳画像入力機能と、前記電子文書の原稿画像における文字画像領域と文字画像領域以外の領域とを黒画素の分布に応じて識別する第一領域識別機能と、この第一領域識別機能で識別した領域識別情報に基づき、前記加筆重畳画像入力機能から入力された加筆重畳画像における文字画像領域と文字画像領域以外の領域とを識別する第二領域識別機能と、この第二領域識別機能により識別された各々の領域と前記第一領域識別機能により識別された各々の領域とについてのそれぞれの位置ズレ量の検出を行う画像位置検出機能と、この画像位置検出機能によって検出した位置ズレ量に基づいて位置を補正して差分処理を行う画像差分処理機能と、を実行させ、電子文書の原稿画像と加筆重畳画像との間でズレが発生した場合であっても、位置ズレを補正してから差分処理を行うことにより、差分処理後における引き残しの発生を防止することができるので、加筆画像の抽出精度を向上させることができる。
【0149】
請求項9記載の発明によれば、請求項8記載のコンピュータに読み取り可能なプログラムにおいて、前記電子文書の原稿画像と前記加筆重畳画像とを、それぞれ格子状の小領域画像に分割する領域分割機能を更に前記コンピュータに実行させ、前記画像位置検出機能は、前記領域分割機能により分割された小領域画像間に生じる位置ズレ量の検出を行うことにより、局所的な位置ズレを補正してから差分処理を行うことができるので、加筆画像の抽出精度を更に向上させることができる。
【0150】
請求項10記載の発明によれば、請求項9記載のコンピュータに読み取り可能なプログラムにおいて、前記第一領域識別機能は、識別した前記電子文書の原稿画像の各々の領域内の黒画素密度を算出し、前記領域分割機能は、前記第一領域識別機能が算出した前記電子文書の原稿画像の黒画素密度の大小に応じて分割する格子の大きさを変更することにより、黒画素密度が大きい場合には、周囲の白画素を多く含めて黒画素密度を下げるために分割格子のサイズを大きくし、黒画素密度が小さい場合には、周囲の白画素を排除して黒画素密度を上げるために分割格子のサイズを小さくすることで、加筆画像の抽出精度を更に向上させることができる。
【0151】
請求項11記載の発明によれば、請求項8ないし10のいずれか一記載のコンピュータに読み取り可能なプログラムにおいて、前記第一領域識別機能及び前記第二領域識別機能は、画像中の文字行を検出し、検出した文字行中から文字画像を文字単位で切り出す文字認識機能を前記コンピュータに実行させ、前記文字認識機能を用いて文字画像領域と文字画像領域以外の領域とを識別し、文字画像の認識結果と確信度と外接矩形領域とを出力することにより、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域とを容易に識別することができる。
【0152】
請求項12記載の発明によれば、請求項11記載のコンピュータに読み取り可能なプログラムにおいて、前記第一領域識別機能及び前記第二領域識別機能は、前記文字認識機能により切り出された文字画像を、黒画素密度が大きい文字画像領域として出力することにより、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域との識別を簡易に行うことができる。
【0153】
請求項13記載の発明によれば、請求項8ないし12のいずれか一記載のコンピュータに読み取り可能なプログラムにおいて、前記画像差分処理機能は、相関計算によって位置合わせが行われた画像間の相関値が、所定の閾値Th以上の場合にのみ差分処理を行うことにより、加筆があった領域のみに対して差分処理を行うことができる。
【0154】
請求項14記載の発明によれば、請求項8ないし12のいずれか一記載のコンピュータに読み取り可能なプログラムにおいて、前記画像差分処理機能は、相関計算によって位置合わせが行われた位置から所定の画素分をずらした画像間の相関値が、所定の閾値Th以下であって、かつ、所定の閾値Th以上の場合にのみ差分処理を行うことにより、加筆があった領域のみに対して差分処理を行うことができる。また、加筆重畳画像は電子文書の原稿画像を一度紙に出力した後にスキャナ、デジタルカメラ等のデバイスで入力しているために2枚の画像間には線幅の相違が生じて差分処理に影響することになるが、画素ずらしで差分処理を行うことにより、この線幅の違いによる差分処理に対する影響を減らすことができるので、加筆画像の抽出精度を更に向上させることができる。
【0155】
請求項15記載の発明のコンピュータに読取り可能な記憶媒体によれば、請求項8ないし14のいずれか一記載のプログラムを記憶していることにより、この記憶媒体に記憶されたプログラムをコンピュータに読み取らせることで、請求項8ないし14のいずれか一記載の発明と同様の作用効果を得ることができる。
【0156】
請求項16記載の発明の加筆画像抽出方法によれば、電子文書を紙へ出力した後に手書きの加筆が重畳した状態の加筆重畳画像からの加筆画像の抽出を、コンピュータの処理制御により行う加筆画像抽出方法であって、前記加筆重畳画像を入力する加筆重畳画像入力工程と、前記電子文書の原稿画像における文字画像領域と文字画像領域以外の領域とを黒画素の分布に応じて識別する第一領域識別工程と、この第一領域識別工程で識別した領域識別情報に基づき、前記加筆重畳画像入力工程から入力された加筆重畳画像における文字画像領域と文字画像領域以外の領域とを識別する第二領域識別工程と、この第二領域識別工程により識別された各々の領域と前記第一領域識別工程により識別された各々の領域とについてのそれぞれの位置ズレ量の検出を行う画像位置検出工程と、この画像位置検出工程によって検出した位置ズレ量に基づいて位置を補正して差分処理を行う画像差分処理工程と、を具備し、電子文書の原稿画像と加筆重畳画像との間でズレが発生した場合であっても、位置ズレを補正してから差分処理を行うことにより、差分処理後における引き残しの発生を防止することができるので、加筆画像の抽出精度を向上させることができる。
【0157】
請求項17記載の発明によれば、請求項16記載の加筆画像抽出方法において、前記電子文書の原稿画像と前記加筆重畳画像とを、それぞれ格子状の小領域画像に分割する領域分割工程を更に具備し、前記画像位置検出工程は、前記領域分割工程により分割された小領域画像間に生じる位置ズレ量の検出を行うことにより、局所的な位置ズレを補正してから差分処理を行うことができるので、加筆画像の抽出精度を更に向上させることができる。
【0158】
請求項18記載の発明によれば、請求項17記載の加筆画像抽出方法において、前記第一領域識別工程は、識別した前記電子文書の原稿画像の各々の領域内の黒画素密度を算出し、前記領域分割工程は、前記第一領域識別工程が算出した前記電子文書の原稿画像の黒画素密度の大小に応じて分割する格子の大きさを変更することにより、黒画素密度が大きい場合には、周囲の白画素を多く含めて黒画素密度を下げるために分割格子のサイズを大きくし、黒画素密度が小さい場合には、周囲の白画素を排除して黒画素密度を上げるために分割格子のサイズを小さくすることで、加筆画像の抽出精度を更に向上させることができる。
【0159】
請求項19記載の発明によれば、請求項16ないし18のいずれか一記載の加筆画像抽出方法において、前記第一領域識別工程及び前記第二領域識別工程は、画像中の文字行を検出し、検出した文字行中から文字画像を文字単位で切り出す文字認識工程を具備し、前記文字認識工程を用いて文字画像領域と文字画像領域以外の領域とを識別し、文字画像の認識結果と確信度と外接矩形領域とを出力することにより、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域とを容易に識別することができる。
【0160】
請求項20記載の発明によれば、請求項19記載の加筆画像抽出方法において、前記第一領域識別工程及び前記第二領域識別工程は、前記文字認識工程により切り出された文字画像を、黒画素密度が大きい文字画像領域として出力することにより、加筆抽出対象領域中の文字画像領域と文字画像領域以外の領域との識別を簡易に行うことができる。
【0161】
請求項21記載の発明によれば、請求項16ないし20のいずれか一記載の加筆画像抽出方法において、前記画像差分処理工程は、相関計算によって位置合わせが行われた画像間の相関値が、所定の閾値Th以上の場合にのみ差分処理を行うことにより、加筆があった領域のみに対して差分処理を行うことができる。
【0162】
請求項22記載の発明によれば、請求項16ないし20のいずれか一記載の加筆画像抽出方法において、前記画像差分処理工程は、相関計算によって位置合わせが行われた位置から所定の画素分をずらした画像間の相関値が、所定の閾値Th以下であって、かつ、所定の閾値Th以上の場合にのみ差分処理を行うことにより、加筆があった領域のみに対して差分処理を行うことができる。また、加筆重畳画像は電子文書の原稿画像を一度紙に出力した後にスキャナ、デジタルカメラ等のデバイスで入力しているために2枚の画像間には線幅の相違が生じて差分処理に影響することになるが、画素ずらしで差分処理を行うことにより、この線幅の違いによる差分処理に対する影響を減らすことができるので、加筆画像の抽出精度を更に向上させることができる。
【図面の簡単な説明】
【図1】本発明の第一の実施の形態のデータ処理システムのシステム構築例を示す模式図である。
【図2】加筆画像抽出装置としてのサーバコンピュータのモジュール構成図である。
【図3】CPUが加筆画像抽出処理プログラムに従うことにより実現される機能を示すブロック図である。
【図4】第一領域識別手段の機能構成を示すブロック図である。
【図5】第一領域識別手段による領域識別結果の一例を示す説明図である。
【図6】第二領域識別手段の機能構成を示すブロック図である。
【図7】領域分割手段の機能構成を示すブロック図である。
【図8】画像位置検出手段による電子原稿画像と加筆重畳画像の小領域画像間に生じるに局所的なズレ量の算出手法を示す説明図である。
【図9】画像差分処理手段における各小領域画像毎の差分処理の流れを示すフローチャートである。
【図10】加筆画像抽出処理の流れを示すフローチャートである。
【図11】加筆画像抽出処理のステップS16における処理の流れを示すフローチャートである。
【図12】加筆画像抽出処理についての具体例を模式的に示す説明図である。
【図13】一次加筆判定手段において差分処理が必要と判定された領域に対する格子分割を示す説明図である。
【図14】本発明の第二の実施の形態の第一領域識別手段の機能構成を示すブロック図である。
【図15】第一領域識別手段による領域識別結果の一例を示す説明図である。
【図16】第二領域識別手段の機能構成を示すブロック図である。
【図17】本発明の第三の実施の形態の画像差分処理手段における各小領域画像毎の差分処理の流れを示すフローチャートである。
【図18】閾値の設定を示す説明図である。
【符号の説明】
2 加筆画像抽出装置
15 記憶媒体
101 第一領域識別手段
102 加筆重畳画像入力手段
103 第二領域識別手段
104 領域分割手段
105 画像位置検出手段
106 画像差分処理手段
201,301 文字認識手段

Claims (22)

  1. 電子文書を紙へ出力した後に手書きの加筆が重畳した状態の加筆重畳画像から加筆画像を抽出する加筆画像抽出装置において、
    前記加筆重畳画像を入力する加筆重畳画像入力手段と、
    前記電子文書の原稿画像における文字画像領域と文字画像領域以外の領域とを黒画素の分布に応じて識別する第一領域識別手段と、
    この第一領域識別手段で識別した領域識別情報に基づき、前記加筆重畳画像入力手段から入力された加筆重畳画像における文字画像領域と文字画像領域以外の領域とを識別する第二領域識別手段と、
    この第二領域識別手段により識別された各々の領域と前記第一領域識別手段により識別された各々の領域とについてのそれぞれの位置ズレ量の検出を行う画像位置検出手段と、
    この画像位置検出手段によって検出した位置ズレ量に基づいて位置を補正して差分処理を行う画像差分処理手段と、
    を備えることを特徴とする加筆画像抽出装置。
  2. 前記電子文書の原稿画像と前記加筆重畳画像とを、それぞれ格子状の小領域画像に分割する領域分割手段を更に備え、
    前記画像位置検出手段は、前記領域分割手段により分割された小領域画像間に生じる位置ズレ量の検出を行う、
    ことを特徴とする請求項1記載の加筆画像抽出装置。
  3. 前記第一領域識別手段は、識別した前記電子文書の原稿画像の各々の領域内の黒画素密度を算出し、
    前記領域分割手段は、前記第一領域識別手段が算出した前記電子文書の原稿画像の黒画素密度の大小に応じて分割する格子の大きさを変更する、
    ことを特徴とする請求項2記載の加筆抽出装置。
  4. 前記第一領域識別手段及び前記第二領域識別手段は、画像中の文字行を検出し、検出した文字行中から文字画像を文字単位で切り出す文字認識手段を備え、
    前記文字認識手段を用いて文字画像領域と文字画像領域以外の領域とを識別し、文字画像の認識結果と確信度と外接矩形領域とを出力する、
    ことを特徴とする請求項1ないし3のいずれか一記載の加筆画像抽出装置。
  5. 前記第一領域識別手段及び前記第二領域識別手段は、前記文字認識手段により切り出された文字画像を、黒画素密度が大きい文字画像領域として出力する、
    ことを特徴とする請求項4記載の加筆画像抽出装置。
  6. 前記画像差分処理手段は、
    相関計算によって位置合わせが行われた画像間の相関値が、所定の閾値Th以上の場合にのみ差分処理を行う、
    ことを特徴とする請求項1ないし5のいずれか一記載の加筆画像抽出装置。
  7. 前記画像差分処理手段は、
    相関計算によって位置合わせが行われた位置から所定の画素分をずらした画像間の相関値が、所定の閾値Th以下であって、かつ、所定の閾値Th以上の場合にのみ差分処理を行う、
    ことを特徴とする請求項1ないし5のいずれか一記載の加筆画像抽出装置。
  8. 電子文書を紙へ出力した後に手書きの加筆が重畳した状態の加筆重畳画像から加筆画像を抽出する加筆画像抽出装置が有するコンピュータにインストールされるプログラムであって、前記コンピュータに、
    前記加筆重畳画像を入力する加筆重畳画像入力機能と、
    前記電子文書の原稿画像における文字画像領域と文字画像領域以外の領域とを黒画素の分布に応じて識別する第一領域識別機能と、
    この第一領域識別機能で識別した領域識別情報に基づき、前記加筆重畳画像入力機能から入力された加筆重畳画像における文字画像領域と文字画像領域以外の領域とを識別する第二領域識別機能と、
    この第二領域識別機能により識別された各々の領域と前記第一領域識別機能により識別された各々の領域とについてのそれぞれの位置ズレ量の検出を行う画像位置検出機能と、
    この画像位置検出機能によって検出した位置ズレ量に基づいて位置を補正して差分処理を行う画像差分処理機能と、
    を実行させることを特徴とするコンピュータに読み取り可能なプログラム。
  9. 前記電子文書の原稿画像と前記加筆重畳画像とを、それぞれ格子状の小領域画像に分割する領域分割機能を更に前記コンピュータに実行させ、
    前記画像位置検出機能は、前記領域分割機能により分割された小領域画像間に生じる位置ズレ量の検出を行う、
    ことを特徴とする請求項8記載のコンピュータに読み取り可能なプログラム。
  10. 前記第一領域識別機能は、識別した前記電子文書の原稿画像の各々の領域内の黒画素密度を算出し、
    前記領域分割機能は、前記第一領域識別機能が算出した前記電子文書の原稿画像の黒画素密度の大小に応じて分割する格子の大きさを変更する、
    ことを特徴とする請求項9記載のコンピュータに読み取り可能なプログラム。
  11. 前記第一領域識別機能及び前記第二領域識別機能は、画像中の文字行を検出し、検出した文字行中から文字画像を文字単位で切り出す文字認識機能を前記コンピュータに実行させ、
    前記文字認識機能を用いて文字画像領域と文字画像領域以外の領域とを識別し、文字画像の認識結果と確信度と外接矩形領域とを出力する、
    ことを特徴とする請求項8ないし10のいずれか一記載のコンピュータに読み取り可能なプログラム。
  12. 前記第一領域識別機能及び前記第二領域識別機能は、前記文字認識機能により切り出された文字画像を、黒画素密度が大きい文字画像領域として出力する、
    ことを特徴とする請求項11記載のコンピュータに読み取り可能なプログラム。
  13. 前記画像差分処理機能は、
    相関計算によって位置合わせが行われた画像間の相関値が、所定の閾値Th以上の場合にのみ差分処理を行う、
    ことを特徴とする請求項8ないし12のいずれか一記載のコンピュータに読み取り可能なプログラム。
  14. 前記画像差分処理機能は、
    相関計算によって位置合わせが行われた位置から所定の画素分をずらした画像間の相関値が、所定の閾値Th以下であって、かつ、所定の閾値Th以上の場合にのみ差分処理を行う、
    ことを特徴とする請求項8ないし12のいずれか一記載のコンピュータに読み取り可能なプログラム。
  15. 請求項8ないし14のいずれか一記載のプログラムを記憶していることを特徴とするコンピュータに読取り可能な記憶媒体。
  16. 電子文書を紙へ出力した後に手書きの加筆が重畳した状態の加筆重畳画像からの加筆画像の抽出を、コンピュータの処理制御により行う加筆画像抽出方法であって、
    前記加筆重畳画像を入力する加筆重畳画像入力工程と、
    前記電子文書の原稿画像における文字画像領域と文字画像領域以外の領域とを黒画素の分布に応じて識別する第一領域識別工程と、
    この第一領域識別工程で識別した領域識別情報に基づき、前記加筆重畳画像入力工程から入力された加筆重畳画像における文字画像領域と文字画像領域以外の領域とを識別する第二領域識別工程と、
    この第二領域識別工程により識別された各々の領域と前記第一領域識別工程により識別された各々の領域とについてのそれぞれの位置ズレ量の検出を行う画像位置検出工程と、
    この画像位置検出工程によって検出した位置ズレ量に基づいて位置を補正して差分処理を行う画像差分処理工程と、
    を具備することを特徴とする加筆画像抽出方法。
  17. 前記電子文書の原稿画像と前記加筆重畳画像とを、それぞれ格子状の小領域画像に分割する領域分割工程を更に具備し、
    前記画像位置検出工程は、前記領域分割工程により分割された小領域画像間に生じる位置ズレ量の検出を行う、
    ことを特徴とする請求項16記載の加筆画像抽出方法。
  18. 前記第一領域識別工程は、識別した前記電子文書の原稿画像の各々の領域内の黒画素密度を算出し、
    前記領域分割工程は、前記第一領域識別工程が算出した前記電子文書の原稿画像の黒画素密度の大小に応じて分割する格子の大きさを変更する、
    ことを特徴とする請求項17記載の加筆画像抽出方法。
  19. 前記第一領域識別工程及び前記第二領域識別工程は、画像中の文字行を検出し、検出した文字行中から文字画像を文字単位で切り出す文字認識工程を具備し、
    前記文字認識工程を用いて文字画像領域と文字画像領域以外の領域とを識別し、文字画像の認識結果と確信度と外接矩形領域とを出力する、
    ことを特徴とする請求項16ないし18のいずれか一記載の加筆画像抽出方法。
  20. 前記第一領域識別工程及び前記第二領域識別工程は、前記文字認識工程により切り出された文字画像を、黒画素密度が大きい文字画像領域として出力する、
    ことを特徴とする請求項19記載の加筆画像抽出方法。
  21. 前記画像差分処理工程は、
    相関計算によって位置合わせが行われた画像間の相関値が、所定の閾値Th以上の場合にのみ差分処理を行う、
    ことを特徴とする請求項16ないし20のいずれか一記載の加筆画像抽出方法。
  22. 前記画像差分処理工程は、
    相関計算によって位置合わせが行われた位置から所定の画素分をずらした画像間の相関値が、所定の閾値Th以下であって、かつ、所定の閾値Th以上の場合にのみ差分処理を行う、
    ことを特徴とする請求項16ないし20のいずれか一記載の加筆画像抽出方法。
JP2003077178A 2003-03-20 2003-03-20 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法 Expired - Fee Related JP4275973B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003077178A JP4275973B2 (ja) 2003-03-20 2003-03-20 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003077178A JP4275973B2 (ja) 2003-03-20 2003-03-20 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法

Publications (2)

Publication Number Publication Date
JP2004287682A true JP2004287682A (ja) 2004-10-14
JP4275973B2 JP4275973B2 (ja) 2009-06-10

Family

ID=33291996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003077178A Expired - Fee Related JP4275973B2 (ja) 2003-03-20 2003-03-20 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法

Country Status (1)

Country Link
JP (1) JP4275973B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241356A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
JP2008219800A (ja) * 2007-03-07 2008-09-18 Osaka Prefecture Univ 書込み抽出方法、書込み抽出装置および書込み抽出プログラム
JP2009258815A (ja) * 2008-04-14 2009-11-05 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
EP2169613A1 (en) 2008-09-25 2010-03-31 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and image processing program
JP2012083990A (ja) * 2010-10-13 2012-04-26 Fuji Xerox Co Ltd 差異検出装置、差異出力装置及びプログラム
JP2012208729A (ja) * 2011-03-30 2012-10-25 Fujitsu Ltd 帳票管理システム、帳票画像管理方法、及びプログラム
JP2013140410A (ja) * 2011-12-28 2013-07-18 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8570609B2 (en) 2009-07-16 2013-10-29 Fuji Xerox Co., Ltd. Image processing device with image dilation processing, image processing system, image processing method and computer readable medium
US8634659B2 (en) 2011-03-23 2014-01-21 Fuji Xerox Co., Ltd. Image processing apparatus, computer readable medium storing program, and image processing method
US8705871B2 (en) 2010-10-28 2014-04-22 Fujitsu Limited Form image managing system and method
CN112784825A (zh) * 2019-11-01 2021-05-11 株式会社理光 图片中文字的识别方法、关键字检索方法、装置及设备

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241356A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
JP2008219800A (ja) * 2007-03-07 2008-09-18 Osaka Prefecture Univ 書込み抽出方法、書込み抽出装置および書込み抽出プログラム
JP4539756B2 (ja) * 2008-04-14 2010-09-08 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2009258815A (ja) * 2008-04-14 2009-11-05 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8391607B2 (en) 2008-04-14 2013-03-05 Fuji Xerox Co., Ltd. Image processor and computer readable medium
US8311322B2 (en) 2008-09-25 2012-11-13 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and computer readable medium
JP2010079507A (ja) * 2008-09-25 2010-04-08 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
EP2169613A1 (en) 2008-09-25 2010-03-31 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and image processing program
US8570609B2 (en) 2009-07-16 2013-10-29 Fuji Xerox Co., Ltd. Image processing device with image dilation processing, image processing system, image processing method and computer readable medium
JP2012083990A (ja) * 2010-10-13 2012-04-26 Fuji Xerox Co Ltd 差異検出装置、差異出力装置及びプログラム
US8712166B2 (en) 2010-10-13 2014-04-29 Fuji Xerox Co., Ltd. Difference detecting apparatus, difference output apparatus, and medium
US8705871B2 (en) 2010-10-28 2014-04-22 Fujitsu Limited Form image managing system and method
US8634659B2 (en) 2011-03-23 2014-01-21 Fuji Xerox Co., Ltd. Image processing apparatus, computer readable medium storing program, and image processing method
JP2012208729A (ja) * 2011-03-30 2012-10-25 Fujitsu Ltd 帳票管理システム、帳票画像管理方法、及びプログラム
US8687889B2 (en) 2011-03-30 2014-04-01 Fujitsu Limited Form image managing system and form image managing method
JP2013140410A (ja) * 2011-12-28 2013-07-18 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
CN112784825A (zh) * 2019-11-01 2021-05-11 株式会社理光 图片中文字的识别方法、关键字检索方法、装置及设备
CN112784825B (zh) * 2019-11-01 2024-04-30 株式会社理光 图片中文字的识别方法、关键字检索方法、装置及设备

Also Published As

Publication number Publication date
JP4275973B2 (ja) 2009-06-10

Similar Documents

Publication Publication Date Title
JP7013182B2 (ja) 情報処理装置、情報処理方法およびプログラム
US7640269B2 (en) Image processing system and image processing method
US20060008113A1 (en) Image processing system and image processing method
US7596271B2 (en) Image processing system and image processing method
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
AU2008246275A1 (en) Image processor, image processing method and image processing program
JP4275973B2 (ja) 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法
JP2007241356A (ja) 画像処理装置および画像処理プログラム
US7453594B2 (en) Document filing apparatus for storing information added to a document file
CN115828874A (zh) 基于图像识别技术的行业表格数字化处理方法
US8023735B2 (en) Image processing apparatus for extracting representative characteristic from image data and storing image data to be associated with representative characteristic
US8848984B2 (en) Dynamic thresholds for document tamper detection
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
CN111079709B (zh) 一种电子单据的生成方法、装置、计算机设备和存储介质
JP2010079507A (ja) 画像処理装置及び画像処理プログラム
JP2006253842A (ja) 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法
US8045229B2 (en) Image processing apparatus, image processing method and medium
JP2012095231A (ja) 帳票画像管理システム、帳票画像管理方法、及びプログラム
JP2010102734A (ja) 画像処理装置及びプログラム
JP4793429B2 (ja) 画像処理装置及び画像処理プログラム
JP2007328652A (ja) 画像処理装置および画像処理プログラム
JP5146199B2 (ja) 差分抽出装置及び差分抽出プログラム
JP2008123446A (ja) ログ情報管理システム、ログ情報管理装置、ログ情報管理方法及びログ情報管理プログラム
JP4974794B2 (ja) 文書認識装置、文書認識方法、コンピュータプログラム
JP2005056010A (ja) 帳票定義装置、帳票定義方法及び帳票定義プログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041008

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051116

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090303

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090305

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120313

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130313

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140313

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees