JP2004213230A - 加筆抽出装置及び加筆抽出方法 - Google Patents

加筆抽出装置及び加筆抽出方法 Download PDF

Info

Publication number
JP2004213230A
JP2004213230A JP2002380609A JP2002380609A JP2004213230A JP 2004213230 A JP2004213230 A JP 2004213230A JP 2002380609 A JP2002380609 A JP 2002380609A JP 2002380609 A JP2002380609 A JP 2002380609A JP 2004213230 A JP2004213230 A JP 2004213230A
Authority
JP
Japan
Prior art keywords
image
character
area
difference
retouching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002380609A
Other languages
English (en)
Other versions
JP4120795B2 (ja
JP2004213230A5 (ja
Inventor
Hirofumi Horikawa
裕文 堀川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002380609A priority Critical patent/JP4120795B2/ja
Publication of JP2004213230A publication Critical patent/JP2004213230A/ja
Publication of JP2004213230A5 publication Critical patent/JP2004213230A5/ja
Application granted granted Critical
Publication of JP4120795B2 publication Critical patent/JP4120795B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

【課題】電子文書と加筆重畳画像とからの加筆抽出の際に、加筆情報が存在しない領域での引き残しの発生を抑制でき、かつ、より精度の高い加筆抽出を行うことができる加筆抽出装置及び加筆抽出方法を提供する。
【解決手段】加筆抽出装置900は、電子文書の原稿画像と電子文書を紙へ出力した後に手書きの加筆が重畳した状態でスキャナ等の画像読取装置で再び電子化された画像とから、文字認識を用いて所望の領域を小領域に分割して小領域毎に加筆抽出操作の必要性の有無を判定する領域分割部902と、これによって分割され差分計算が必要と判定された小領域に対して差分計算を行う画像差分部903と、これによって差分処理された画像に対して補間処理を行う画像補間部904と、を有する。これにより、加筆抽出の精度が向上する。
【選択図】 図9

Description

【0001】
【発明の属する技術分野】
本発明は加筆抽出装置及び加筆抽出方法に関するものであり、特に、手書き入力システムに対する加筆抽出精度を向上させるための画像差分による加筆抽出装置及び加筆抽出方法に関する。
【0002】
【従来の技術】
従来、ユーザがプリンタ出力文書の内容に関連して思いついたアイデア等を紙面上に加筆修正したとしても、それを元の電子ファイル文書には反映するためには、後日加筆修正内容をユーザが改めてワープロソフトウエア等を用いて入力する必要があった。
【0003】
このような不便を解決するために、スキャナ等の画像入力手段によって入力された加筆重畳画像から、プリンタドライバが作成した加筆修正前のイメージを差分することで紙文書に対する加筆修正内容を画像情報として抽出するする技術が開発された(例えば、特許文献1参照)。
【0004】
しかし、このような技術によっても、例えば、定型フォーマットですでに確定している情報が誤って訂正されたり、更には、文書自体の内容を故意に改ざんされる等の問題があった。
【0005】
そこで、画像の中の、外枠の隅などの特徴的な四点を検出し、それぞれの点が電子画像中の対応する点に移動する様に補間処理を行う方法や、一点を対応点へ平行移動しその点を中心に回転させ伸縮補正などを行うアフィン変換式により補正処理を行う方法などで、位置合わせを行った後に差分処理を行っているものもある(例えば、特許文献2参照)。
【0006】
さらには、ハイパーテキストを作成する手段と、関連情報ファイルを記憶する手段と、ハイパーテキストから媒体用紙情報を作成する手段と、媒体用紙を出力する手段と、選択情報を付与する手段と、媒体用紙から選択情報および連結情報を読み取る手段と、該当する関連情報ファイルを検索する手段と、検索された関連情報ファイルを出力する手段とを備えた文書情報管理システムもある(例えば、特許文献3参照)。この技術は、コンピューター等のデジタルの世界と紙の文書との間に情報の連続性・関連性を構築することにより、紙の文書をデジタルの世界の文書情報管理システム内に組み込むと共に、紙の文書を媒体としてデジタルの世界に直接アクセス可能とし、さらに紙の文書を用いたハイパーテキスト(紙ハイパーテキスト)を実現することを目的としている。
【0007】
【特許文献1】
特開平11−272654号公報
【特許文献2】
特開2001−283231号公報
【特許文献3】
特開平10−228468号公報
【0008】
【発明が解決しようとする課題】
しかし、特許文献1記載の発明等では、加筆修正内容をイメージ抽出する際に、プリンタドライバが作成した電子原稿画像と、スキャナ等のデバイスから入力された加筆重畳画像との間で、単純な差分処理を行うことで抽出しているが、この方法では電子原稿と加筆重畳画像の間で全体的、または局所的なズレが発生した場合に、そのズレの影響として差分処理後に引き残しが発生する。また、印刷された枠、文字等の上に加筆があった場合、差分処理によって、加筆した情報が失われてしまう可能性もある。
【0009】
また、特許文献2記載の発明等では、プリンタ時の紙送りムラ、ドラムの回転ムラ、スキャン時における光学系の速度ムラなどによる加筆した画像の局所的な倍率変動に対応できない。また、この従来技術においても、差分処理時の過除去による加筆情報の消失に対して何ら対策がなされていない。
【0010】
そこで、本発明では、原稿上の文字に対する加筆を対象とし、さらに文字認識処理を利用することによって処理対象範囲を絞ることで加筆情報が存在しない領域での引き残しの発生を抑制し、また、差分処理によって一部を損失した加筆画像に対して補間操作を実行することにより、より精度の高い加筆抽出を行うことを目的としている。すなわち、本発明は、電子文書と加筆重畳画像からの加筆抽出装置において、抽出精度の向上を目的とする。
【0011】
【課題を解決するための手段】
上記の目的を達成するために、請求項1記載の発明によれば、加筆抽出装置は、電子文書の原稿画像と電子文書を紙へ出力した後に手書きの加筆が重畳した状態でスキャナ等の画像読取装置で再び電子化された画像とから文字認識を用いて所望の領域を小領域に分割し、小領域毎に加筆抽出操作の必要性の有無を判定する領域分割手段と、領域分割手段によって分割され差分計算が必要と判定された小領域に対して差分計算を行う画像差分手段と、画像差分手段によって差分処理された画像に対して補間処理を行う画像補間手段と、を有することを特徴とするものである。
【0012】
請求項2記載の発明によれば、加筆抽出装置は、画像補間手段は、差分処理後の画像の輪郭画像を作成する輪郭抽出手段と、輪郭抽出手段によって作成された輪郭画像から電子原稿画像を差分することで補間すべき端点の座標と補間方向を検出する端点検出手段と、端点検出手段によって検出された端点の情報から端点同士を接続し閉曲線を構成する端点接続手段と、端点接続手段によって作成された閉曲線の内部を着色する画像着色手段と、を有する請求項1記載の加筆抽出装置であることを特徴とするものである。
【0013】
請求項3記載の発明によれば、加筆抽出装置は、領域分割手段は、電子原稿画像の与えられた領域に文字認識処理を行い、領域内における一文字毎の文字画像の認識結果と認識結果における文字の確信度と文字の領域情報とを出力する文字認識手段と、文字認識手段から得られた文字画像の領域情報から文字画像に対応する加筆重畳画像内での領域を検出する位置検出手段と、位置検出手段によって検出された文字画像の加筆重畳画像内での領域に対する文字認識結果および認識結果文字の確信度と、文字認識手段によって得られる認識結果および認識結果文字の確信度とを比較することで加筆抽出操作の必要性の有無を判定する認識結果比較手段と、を有する請求項1記載の加筆抽出装置であることを特徴とするものである。
【0014】
請求項4記載の発明によれば、加筆抽出装置は、領域分割手段は、電子原稿画像の与えられた領域に文字認識処理を行い領域内における一文字毎の文字画像の領域情報を出力する文字認識手段と、文字認識手段から得られた文字画像の領域情報から文字画像に対応する加筆重畳画像内での領域を検出する位置検出手段と、位置検出手段によって検出された文字画像の加筆重畳画像内での領域内における黒画素の総和と電子原稿画像内での文字画像の黒画素の総和を計数し比較することで加筆抽出操作の必要性の有無を判定する画素計数手段と、を有する請求項1記載の加筆抽出装置であることを特徴とするものである。
【0015】
請求項5記載の発明によれば、加筆抽出装置は、位置検出手段は、電子原稿画像の領域と加筆重畳画像の画像相関関数を計算し相関関数が最大値に達する2枚の画像の位置関係を検出結果とする相関位置検出手段、を有する請求項3または4記載の加筆抽出装置であることを特徴とするものである。
【0016】
請求項6記載の発明によれば、加筆抽出装置は、位置検出手段は、電子原稿画像の領域と加筆重畳画像の差分後の黒画素の総和を計算し該総和値が最小値に達する2枚の画像の位置関係を検出結果とする差分位置検出手段、を有する請求項3または4記載の加筆抽出装置であることを特徴とするものである。
【0017】
請求項7記載の発明によれば、加筆抽出装置は、画像差分手段は、電子原稿画像と加筆重畳画像の両者の対応する位置からわずかにずらす画素ずらし処理手段と、画素ずらし処理手段によりわずかにずらされた2枚の画像間での差分処理を行う差分処理手段と、を有する請求項1記載の加筆抽出装置であることを特徴とするものである。
【0018】
請求項8記載の発明によれば、加筆抽出装置は、画像差分手段は、電子原稿画像を太化する画像太化処理手段と、画像太化処理手段により太化された電子原稿画像と加筆重畳画像間での差分処理を行う差分処理手段と、を有する請求項1記載の加筆抽出装置であることを特徴とするものである。
【0019】
請求項9記載の発明によれば、加筆抽出方法は、電子文書の原稿画像と電子文書を紙へ出力した後に手書きの加筆が重畳した状態でスキャナ等の画像読取装置で再び電子化された画像とから文字認識を用いて所望の領域を小領域に分割し、該小領域毎に加筆抽出操作の必要性の有無を判定する領域分割ステップと、領域分割ステップによって分割され差分計算が必要と判定された小領域に対して差分計算を行う画像差分ステップと、画像差分ステップによって差分処理された画像に対して補間処理を行う画像補間ステップと、を有することを特徴とするものである。
【0020】
請求項10記載の発明によれば、加筆抽出方法は、画像補間ステップは、差分処理後の画像の輪郭画像を作成する輪郭抽出ステップと、輪郭抽出ステップによって作成された輪郭画像から電子原稿画像を差分することで補間すべき端点の座標と補間方向を検出する端点検出ステップと、端点検出ステップによって検出された端点の情報から端点同士を接続し閉曲線を構成する端点接続ステップと、端点接続ステップによって作成された閉曲線の内部を着色する画像着色ステップと、を有する請求項9記載の加筆抽出方法であることを特徴とするものである。
【0021】
請求項11記載の発明によれば、加筆抽出方法は、領域分割ステップは、電子原稿画像の与えられた領域に文字認識処理を行い領域内における一文字毎の文字画像の認識結果と認識結果における文字の確信度と文字の領域情報とを出力する文字認識ステップと、文字認識ステップから得られた文字画像の領域情報から文字画像に対応する加筆重畳画像内での領域を検出する位置検出ステップと、位置検出ステップによって検出された文字画像の加筆重畳画像内での領域に対する文字認識結果および認識結果文字の確信度と、文字認識ステップによって得られる認識結果および認識結果文字の確信度とを比較することで加筆抽出操作の必要性の有無を判定する認識結果比較ステップと、を有することを特徴とするものである。
【0022】
請求項12記載の発明によれば、加筆抽出方法は、領域分割ステップは、電子原稿画像の与えられた領域に文字認識処理を行い領域内における一文字毎の文字画像の領域情報を出力する文字認識ステップと、文字認識ステップから得られた文字画像の領域情報から文字画像に対応する加筆重畳画像内での領域を検出する位置検出ステップと、位置検出ステップによって検出された文字画像の加筆重畳画像内での領域内における黒画素の総和と電子原稿画像内での文字画像の黒画素の総和を計数し比較することで加筆抽出操作の必要性の有無を判定する画素計数ステップと、を有する請求項9記載の加筆抽出方法であることを特徴とするものである。
【0023】
請求項13記載の発明によれば、加筆抽出方法は、位置検出ステップは、電子原稿画像の領域と加筆重畳画像の画像相関関数を計算し相関関数が最大値に達する2枚の画像の位置関係を検出結果とする相関位置検出ステップ、を有する請求11または12記載の加筆抽出方法であることを特徴とするものである。
【0024】
請求項14記載の発明によれば、加筆抽出方法は、位置検出ステップは、電子原稿画像の領域と加筆重畳画像の差分後の黒画素の総和を計算し総和値が最小値に達する2枚の画像の位置関係を検出結果とする差分位置検出ステップ、を有する請求項11または12記載の加筆抽出方法であることを特徴とするものである。
【0025】
請求項15記載の発明によれば、加筆抽出方法は、画像差分ステップは、電子原稿画像と加筆重畳画像の両者の対応する位置からわずかにずらす画素ずらし処理ステップと、画素ずらし処理ステップによりわずかにずらされた2枚の画像間での差分処理を行う差分処理ステップと、を有する請求項9記載の加筆抽出方法であることを特徴とするものである。
【0026】
請求項16記載の発明によれば、加筆抽出方法は、画像差分ステップは、電子原稿画像を太化する画像太化処理ステップと、画像太化処理ステップにより太化された電子原稿画像と加筆重畳画像間での差分処理を行う差分処理ステップと、を有する請求項9記載の加筆抽出方法であることを特徴とするものである。
【0027】
【発明の実施の形態】
次に、添付図面を参照して、本発明による加筆抽出装置及び加筆抽出方法の実施の形態を詳細に説明する。
【0028】
図1には、本発明に係る画像差分による加筆抽出装置及び加筆抽出方法の一実施における加筆抽出の処理手順が示されている。
【0029】
ステップS101で、加筆抽出を行う領域の個数Nと、それぞれの抽出対象領域の位置、大きさを設定し、電子原稿画像とその画像を紙に出力した後に加筆されスキャナなどの画像読取装置で取り込まれた加筆重畳画像を入力する。
【0030】
ステップS102では、領域数変数nを1に設定する。
ステップS103では、加筆抽出の対象となる領域を加筆重畳画像から切り出し、同時に電子原稿画像からは、先に加筆重畳画像から抽出した領域に対応した領域を切り出す。
ステップS104では、ステップS103で切り出された電子原稿画像をM個の小領域に分割する。
【0031】
その分割処理ステップS104を示したのが図2である。
【0032】
図2において、ステップS201では、分割数を計数するために分割数変数mを0に設定する。
ステップS202では、ステップS103で切り出された電子原稿画像の領域に対して文字認識処理を行う。これは、例えば、特開平10−171927「文字認識装置、文字認識方法および…」に記載されている方法を利用することができる。
【0033】
電子原稿画像の領域に文字領域が含まれていれば、ステップS202の処理により電子原稿画像の領域中の文字数Lとそれぞれの文字の認識結果{Rrl}、認識確信度{Rcl}、そして文字領域{Crl}が得られる。
【0034】
ステップS203では文字数変数lを1に設定する。
ステップS204では電子原稿画像中の文字領域Crlに対応する加筆重畳画像中の領域Crl’を検出する。
【0035】
この対応する領域を検出する手段としては、電子原稿画像中の文字領域Crlの文字画像と加筆重畳画像との相関関数をCrlの近傍で計算し相関関数が最大値を示すところを「最も確からしい位置」としてCrl’に代入する。
【0036】
また、ステップS204の別の手段として、加筆重畳画像中のCrlの近傍でCrlと同じ大きさの領域を切り出し、その領域から電子原稿画像中の文字領域Crlを差分処理して残黒画素の総和を計算する。
【0037】
この残黒画素総和計算を加筆重畳画像からCrl領域を切り出す際にわずかにずらしながら複数回実行し、残黒画素の総和が最小値を示したところを「最も確からしい位置」としてCrl’に代入する。
【0038】
ステップS205では、ステップS204で得られた加筆重畳画像側のCrl’に対して文字認識処理を行う。これはステップS202で行った文字認識方法と同じものを用いる必要がある。よって、ステップS202と同じく、領域{Crl’}の認識結果{Rrl’}、認識確信度{Rcl’}が得られる。
【0039】
ステップS206では、それぞれの文字認識の結果RrlとRrl’を比較する。文字認識の結果RrlとRrl’が異なっていれば(No)、領域Crl’には何らかの加筆が加わっている可能性があるので、ステップS208に進み、分割数変数mを1増加させ、RamにCrlを、Ramに対応する領域Ram’にCrl’を代入した後、ステップS209へ進む。
【0040】
文字認識の結果RrlとRrl’が同じであれば(ステップS206でYes)、ステップS207へ進む。ここではRclに1以下の定数αを乗算しRcl’と比較し、Rcl’の方が小さい(No)、つまり認識確信度に著しい低下が見られた場合、領域Crl’には何らかの加筆が加わっている可能性があるので、ステップS208に進み、分割数変数mを1増加させ、RamにCrlを、Ramに対応する領域Ram’にCrl’を代入した後、ステップS209へ進む。Rcl’の方が大きければ(ステップS207でYes)、加筆の可能性は低いので、ステップS208へ行くことなくステップS209に進む。
【0041】
ステップS209では、文字数変数lを1だけ増加させ、ステップS210で文字数Lと比較し、文字数変数lが文字数Lを超えていれば(Yes)、ステップS211で分割領域数mを分割数Mに代入し、{Ram}と{Ram’}をステップS105へ出力する。
超えていなければ(ステップS210でNo)、ステップS204からの処理を繰り返す。
【0042】
図3は、分割処理ステップS104の別の手段である。
【0043】
ステップS301では、分割数を計数するためにmを0に設定する。
ステップS302では、ステップS103で切り出された電子原稿画像の領域に対して文字認識処理を行う。これには、図2のステップS202と同じものが利用できる。
【0044】
電子原稿画像の領域に文字領域が含まれていれば、ステップS302の処理により電子原稿画像の領域中の文字数Lとそれぞれの文字の認識結果{Rrl}、認識確信度{Rcl}、そして文字領域{Crl}が得られる。
【0045】
ステップS303では、文字数変数lを1に設定する。
ステップS304では、電子原稿画像中の文字領域Crlに対応する加筆重畳画像中の領域Crl’を検出する。この対応する領域を検出する手段としては、図2のステップS204と同じものが利用できる。
【0046】
ステップS305では、電子原稿画像側のCrlとステップS304で得られた加筆重畳画像側のCrl’に対して黒画素計数処理を行う。それぞれの黒画素数をNbl、Nbl’とする。
【0047】
ステップS306では、ステップS305で得られた黒画素数Nbl、Nbl’を比較する。
【0048】
Nbl’に1以下の定数βを乗算してNblと比較し、Nblの方が小さい (ステップS306でNo)、つまり加筆重畳画像側に著しい黒画素の増加が見られた場合、領域Crl’には何らかの加筆が加わっている可能性があるので、ステップS307に進み、割数変数mを1増加させ、RamにCrlを、Ramに対応する領域Ram’にCrl’を代入した後、ステップS308へ進む。
【0049】
Nblの方が大きければ(ステップS306でYes)、加筆の可能性は低いので、ステップS307へ行くことなくステップS308に進む。
【0050】
ステップS308では、文字数変数lを1だけ増加させ、ステップS309で文字数Lと比較し、文字数変数lが文字数Lを超えていれば(Yes)、ステップS310で分割領域数mを分割数Mに代入し、{Ram}と{Ram’}をステップS105へ出力する。超えていなければ(ステップS309でNo)、ステップS304からの処理を繰り返す。
【0051】
また、ステップS202、ステップS302で文字として認識されなかった部分は、後に記す加筆画像の貼り付け先として保存しておく。
【0052】
図1のステップS105では、分割数変数mを1に設定する。
ステップS106では、ステップS104で加筆の可能性があると判定された領域RamとRam’に対して画像差分処理を行い、結果の差分処理画像をステップS107へ出力する。
【0053】
画像差分処理ステップS106を示したのが図4である。
【0054】
ステップS401では、縦座標変数yを−aに設定する。
ステップS402では、横座標変数xを−aに設定する。
【0055】
ステップS403では、電子原稿側の領域Ramから(x、 y)だけ画素をずらした画像を抽出し、ステップS404では、ステップS403において画素ずらしで抽出したRamとRam’との差分を行う。
【0056】
ステップS405では、xを1だけ増加させ、ステップS406で横座標変数xがaを超えていれば(Yes)、ステップS407へ進む。超えていなければ(ステップS406でNo)、ステップS403からの処理を繰り返す。
【0057】
ステップS407では、yを1だけ増加させ、ステップS408で横座標変数yがaを超えていれば(Yes)、ステップS404での差分処理結果をステップS107へ出力する。超えていなければ(ステップS408でNo)、ステップS402からの処理を繰り返す。aの値は1〜2を用いる。
【0058】
図5は、分割処理ステップS106の別の手段である。
【0059】
ステップS501では、Ramに対して画像太化処理を行う。
ステップS502では、Ram’と画像太化処理されたRamとを用いて差分処理を行い、その差分処理結果をステップS107へ出力する。
【0060】
図4または図5の処理をせずに直接差分処理を行うと、加筆重畳画像側の原稿成分の引き残しが発生する可能性がある。これは電子原稿画像は電子原稿を計算機内部で直接画像化したものに対し加筆重畳画像は電子原稿が一度紙に出力されスキャナなどのデバイスで画像化したものであるから、画像の質が大きく変化する可能性があるからである。
【0061】
図1のステップS107では、ステップS106から入力される差分処理画像に対して画像補間処理を行う。
【0062】
画像補間処理ステップS107を示したのが図6である。
【0063】
ステップS601では、ステップS106から入力される差分処理画像に対して輪郭抽出処理を行い差分輪郭画像を生成する。
【0064】
ステップS602では、ステップS601で生成された差分輪郭画像に対し、電子原稿画像を用いて図4または図5で示された差分処理を再び行い、端点画像を作成する。
【0065】
ステップS603では、ステップS602で作成された端点画像中の線分の端点を検出し、 その座標と端点付近における線分のベクトルを計算する。
【0066】
ステップS604では、ステップS603で検出された端点同士を接続する。端点接続のルールとしては、未接続の2つの端点を選び、 一方の端点の座標がもう一方の端点がある線分の延長上にあるか否かを判定し、延長上にあるとみなせる場合は2点間を直線で結ぶ。延長上にあるとはみなせない場合は一方の端点を未接続の別の端点に置き換え同様の判定を行う。
【0067】
ステップS605では、全ての端点が接続されたかどうかを判定し、未接続の端点がある場合はステップS604の操作を繰り返すことで推定輪郭画像を作成する。全ての端点が接続された場合はステップS606に進む。
【0068】
ステップS606では、ステップS604、ステップS605での処理で作成された推定輪郭画像に対して輪郭内部の着色を行う。輪郭の「内部」また「外部」の判定には差分処理画像を用いる。差分処理画像のおいて黒画素の部分は推定輪郭画像においては輪郭内部なので、輪郭の内外の判定が可能である。こうして作成された加筆小領域画像をステップS108に出力する。
【0069】
図1のステップS108では、ステップS107で作成された加筆画像をステップS104から得られた領域情報と下地画像を元に合成する。
【0070】
ステップS109では、分割数変数mを1だけ増加させ、ステップS110で分割領域数Mを超えているか否かを判定し、超えていなければ(No)、ステップS106から繰り返す。超えた場合は(ステップS110でYes)、ステップS111で、白紙の画像に対してステップS103で抽出した位置に領域情報を元にステップS108で合成された加筆画像を合成する。
【0071】
ステップS112で,領域数変数nを1だけ増加させ、ステップS113で、領域数Nを超えているか否かを判定し、超えていなければ(No)、ステップS103から繰り返し、超えていれば(ステップS113でYes)、ステップS114加筆画像を出力する。
【0072】
図7、図8は前述した一連の処理を画像を用いて模式的に説明したものである。
【0073】
図7では、前述のステップS101によって電子原稿と加筆重畳画像の二つの画像が与えられる。
【0074】
まず、図7▲1▼でこの2つの画像から加筆抽出を行う領域を抽出する(ステップS103参照)。
次に、抽出した領域の電子原稿画像側に対して、図7▲2▼で文字認識処理を行い、領域中の文字画像情報を得る。
加筆重畳画像側に対して先ほど電子原稿画像から得た文字画像の領域情報を適用し(図7▲3▼)、文字画像毎に文字認識、または黒画素計数を行い電子原稿画像側と比較する(図7▲4▼)。その際に文字認識処理によって『文字画像』として認識されなかった領域を、加筆画像を合成する際の下地として保存しておく(図7▲5▼)。
【0075】
以上の操作で加筆重畳画像に対して、図7下のように加筆抽出操作が必要な領域を絞ることができる。これらの処理は前述のステップS104に対応する。
【0076】
図8では、前述のステップS106以降の処理が表わされている。ステップS104で得られた分割画像領域情報から図8左上の文字単位の電子原稿画像と加筆重畳画像が得られる。
【0077】
この2枚の画像間で図8▲1▼の差分処理を行い(ステップS106参照)、差分画像を得る。ここで得られた差分画像に対して図8▲2▼のように輪郭抽出を行うことで(ステップS601参照)、差分輪郭画像が得られる。
【0078】
この画像に対して図8▲4▼の差分処理(ステップS602参照)を行うことで、端点画像を得るのだが、この図8では、あらかじめ電子原稿画像側の文字画像を太化したものを準備し(図8▲3▼)、それとの差分処理を行っている。つまり、画像差分処理に前述のステップS501、ステップS502の方法を採用している。
【0079】
こうして得られた端点画像に対して端点検出処理を行い、それぞれの端点の座標、端点を含む線分の端点上でのベクトルを算出する(ステップS603参照)。
【0080】
この端点同士を図8▲5▼で接続し(ステップS604参照)、全ての端点を接続し終わり輪郭推定画像が生成されると図8▲6▼において着色処理を行う。
【0081】
着色操作は、輪郭推定画像の輪郭を境界に着色する部分、しない部分に分けられるが、この判断には図8▲6▼’のように図8▲1▼で作成された差分画像を参照画像とし、この参照画像と相関が高い着色パターンを採用する。
以上の操作で図8右下の加筆画像が得られる。
【0082】
図9には、本発明による加筆抽出装置及び加筆抽出方法の一実施形態における加筆抽出器の構成例が示されている。
【0083】
図9において、加筆抽出器900は、領域抽出部901と、領域分割部902と、画像差分部903と、画像補間部904と、画像合成部905と、から構成される。
【0084】
領域抽出部901は、図1のステップS101で設定される電子原稿画像と加筆重畳画像、加筆抽出を行いたい領域の個数、それぞれの領域の位置と大きさを使用することで、図1のステップS103での所望の領域切り出しを両画像から行う。
【0085】
領域分割部902は、領域抽出部901で抽出された領域に対してステップS104のさらなる領域分割を行う。
【0086】
図10には、本発明による加筆抽出装置及び加筆抽出方法の一実施形態における領域分割器の構成例が示されている。
【0087】
図10において、領域分割器1000は、図9の領域分割部902の一実施例であり、文字認識部1001と、位置検出部1002と、認識結果比較部1003とから構成される。
【0088】
文字認識部1001において、図9の領域抽出部901で抽出された電子原稿側の領域に対して図2のステップS202の文字認識処理を行う。
【0089】
電子原稿画像に文字画像が含まれていれば、その認識結果と確信度、そしてそれぞれの文字の領域情報(位置と大きさ)が一文字毎に得られる。
【0090】
次に、位置検出部1002において、先の文字認識部1001より出力された電子原稿画像の文字毎の画像領域に対応する加筆重畳画像上における領域を検出し、両領域のずれ量を得る。ここでは図2のステップS204の動作を行う。
【0091】
認識結果比較部1003において、加筆重畳画像に対して、先の位置検出部1002で得られたそれぞれの電子原稿画像の文字の領域情報を用いて、図2のステップS205の文字認識処理を行い、ここで得られる文字認識処理結果とその結果に対する確信度と、文字認識部1001で得られた文字認識結果とその結果に対する確信度とを比較する。これは図2のステップS206とステップS207の動作に対応する。
【0092】
もし、ここで考えている文字領域に加筆が行われていなければ、加筆重畳画像に対して行った文字認識処理結果と、電子原稿画像に対して行った文字認識処理結果は一致し、確信度も同程度のものが得られる。文字領域に何らかの加筆成分があった場合、一文字あるいは複数の文字の両画像の文字認識処理結果の間に結果の相違、または結果が同じであっても確信度の変化が起こる。
【0093】
こうして得られた加筆成分が重畳している可能性がある領域情報と位置検出部1002から得られる加筆重畳画像上における領域情報を図2のステップS208の代入操作で保存しておき、最終的に図9の画像差分部903へ出力する。
【0094】
図11には、本発明による加筆抽出装置及び加筆抽出方法の他の実施形態における領域分割器の構成例が示されている。
【0095】
図11において、領域分割器1100は、図9の領域分割部902の他の実施例であり、文字認識部1101と、位置検出部1102と、画素形成部1103とから構成される。
【0096】
文字認識部1101は、図10の文字認識部1001と同等の機能を有するので、図9の領域抽出部901で抽出された領域に含まれる文字画像の位置情報が得られる。これは図3のステップS302の動作に対応する。
【0097】
次に、位置検出部1102において、先の文字認識部1101より出力された電子原稿画像の文字毎の文字画像領域に対応する加筆重畳画像上における領域を検出し、両領域のずれ量を得る。これは図3のステップS304の動作に対応する。
【0098】
次に、画素計数部1103において、先の位置検出部1102で得られた文字画像の位置に対応する部分を電子原稿画像と加筆重畳画像から抽出し、図3のステップS305に対応する領域内の黒画素数計数を2つの画像に対して行いステップS306の比較を行う。
【0099】
もし、ここで考えている文字領域に加筆が行われていなければ、加筆重畳画像側の文字領域抽出画像の黒画素数と電子原稿画像の文字領域抽出画像の黒画素数は、ほぼ一致する。
【0100】
文字領域に何らかの加筆成分があった場合、加筆重畳画像側の文字領域抽出画像の黒画素数は電子原稿画像の文字領域抽出画像の黒画素数を大きく上回る。
【0101】
こうして得られた加筆成分が重畳している可能性がある領域情報と位置検出部1102から得られる加筆重畳画像上における領域情報を図3のステップS307の代入操作で保存しておき、最終的に903へ出力する。
【0102】
図10、図11の領域分割器において、文字画像として判定されなかった領域は、後述する補間処理後の貼り付け先として保存する。
【0103】
図12には、本発明による加筆抽出装置及び加筆抽出方法の一実施形態における位置検出器の構成例が示されている。
【0104】
図12において、位置検出器1200は、図10、図11における位置検出部1002と、1102との一実施例であり、相関計算部1201と、最大相関検出部1202とから構成される。
【0105】
相関計算部1201は、図10、図11における文字認識部1001と、1101とから入力される一文字毎の画像領域情報をもとに、電子原稿画像から画像切り出すことで参照画像を作成し、参照画像と加筆重畳画像との相関関数を計算する。
【0106】
次に、最大相関検出部1202において、相関計算部1201で計算した相関関数で最大値に達する座標を検出し、その座標を参照画像と加筆重畳画像との相対位置として図10の認識結果比較部1003、図11の画素計数部1103へ出力する。
【0107】
図13には、本発明による加筆抽出装置及び加筆抽出方法の他の実施形態における位置検出器の構成例が示されている。
【0108】
図13において、位置検出器1300は、図10、図11における位置検出部1002と、1102の他の実施例であり、差分処理部1301と、最小残黒画素検出部1302とから構成される。
【0109】
差分処理部1301は、図10、図11における文字認識部1001と、1101とから入力される一文字毎の画像領域情報をもとに電子原稿画像から画像切り出すことで参照画像を作成し、加筆重畳画像から参照画像を差分することで得られる残黒画素の総和値を計算する。
【0110】
この差分計算と残黒画素の総和計算を、参照画像と加筆重畳画像との位置関係をずらしながら複数回実行し、残黒画素の総和を参照画像のずらし量の関数とする。
【0111】
次に、最小残黒画素検出部1302において、差分処理部1301で計算した残黒画素関数で最小値に達する座標を検出し、その座標を参照画像と加筆重畳画像との相対位置として図10、図11における認識結果比較部1003と、画素計数部1103とへ出力する。
【0112】
図9の画像差分部903は、領域分割部902より入力される加筆成分が重畳している可能性がある領域に対して、図1のステップS106の差分処理を行い、処理結果の画像を画像補間部904に出力する。
【0113】
図14には、本発明による加筆抽出装置及び加筆抽出方法の一実施形態における画像差分器の構成例が示されている。
【0114】
図14において、画像差分器1400は、図9の画像差分部903の一実施例であり、画素ずらし処理部1401と、差分処理部1402とから構成される。
【0115】
画素ずらし処理部1401は、図9の領域分割部902から入力される加筆成分が重畳している可能性がある電子原稿画像の領域情報とその領域に対応する加筆重畳画像上における領域情報から、電子原稿画像と加筆重畳画像の両画像から画像切り出しを行う。
【0116】
この電子原稿画像から画像切り出しを行う際に、切り出す領域を数画素ずらしながらを切り出す。これは図4のステップS401〜ステップS403、およびステップS405〜ステップS408の処理に対応する。
【0117】
次に、差分処理部1402において、画素ずらし処理部1401で切り出された加筆重畳画像の小領域と同じく画素ずらし処理部1401で切り出された電子原稿画像の小領域との間でステップS404の差分処理を実行し、処理結果を図9の画像補間部904へ出力する。
【0118】
図15には、本発明による加筆抽出装置及び加筆抽出方法の他の実施形態における画像差分器の構成例が示されている。
【0119】
図15において、画像差分器1500は、図9の画像差分部903の他の実施例であり、画像太化処理部1501と、差分処理部1502とから構成される。
【0120】
画像太化処理部1501は、図9の領域分割部902から入力される加筆成分が重畳している可能性がある電子原稿画像の領域情報とその領域に対応する加筆重畳画像上における領域情報から、電子原稿画像と加筆重畳画像の両画像から画像切り出しを行い、電子原稿画像から切り出した画像に対して画像の太化処理を行う。この画像切り出しと太化処理は図5のステップS501に対応する。
【0121】
次に、差分処理部1502において、画像太化処理部1501で切り出された加筆重畳画像の小領域と同じく画像太化処理部1501で切り出された電子原稿画像の小領域との間で図5のステップS502の差分処理を実行し、処理結果を図9の画像補間部904へ出力する。
【0122】
図9の画像補間部904は、画像差分部903より入力される差分画像に対し図1のステップS107の画像補間処理を実行し、処理結果を画像合成部905へ出力する。
【0123】
図16には、本発明による加筆抽出装置及び加筆抽出方法の一実施形態における画像補間器の構成例が示されている。
【0124】
図16において、画像補間器1600は、図9の画像補間部904の一実施例であり、輪郭抽出部1601と、端点検出部1602と、端点接続部1603と、画像着色部1604と、領域合成部1605とから構成される。
【0125】
輪郭抽出部1601は、図9の画像差分部903から入力される差分処理後の画像に対して図6のステップS601の輪郭強調処理を行い、差分輪郭画像を作成する。
【0126】
次に、端点検出部1602において、輪郭抽出部1601で作成された差分輪郭画像と電子原稿画像の間で図6のステップS602の差分処理を行い、端点画像を作成し、画像中の端点の座標を抽出する。これは図6のステップS603に対応する。
【0127】
次に、端点接続部1603において、端点検出部1602において作成した端点画像と端点の情報から、線分の延長上にある端点同士に対して図6のステップS604の端点接続を行い、推定輪郭画像を作成する。
【0128】
次に、画像着色部1604において、推定輪郭画像の内部に対し図6のステップS606の着色処理を行う。
【0129】
最後に、領域合成部1605において、図9の領域分割部902で貼り付け先画像として保存された画像に対して貼り付け処理を行い、画像合成部905へ出力する。
【0130】
図9の画像合成部905は、領域抽出部901から入力される抽出領域情報に基づいて、画像補間部904から入力される画像補間処理後の画像、つまり図1のステップS111の加筆画像の張り合わせ処理を白紙の画像に対して実行し、その結果一枚の加筆画像が完成する。
【0131】
【発明の効果】
請求項1の記載の発明によれば、加筆抽出装置は、電子文書の原稿画像と前記電子文書を紙へ出力した後に手書きの加筆が重畳した状態でスキャナ等の画像読取装置で再び電子化された画像とから文字認識を用いて所望の領域を小領域に分割し、小領域毎に加筆抽出操作の必要性の有無を判定する領域分割手段と、前記領域分割手段によって分割され差分計算が必要と判定された小領域に対して差分計算を行う画像差分手段と、前記画像差分手段によって差分処理された画像に対して補間処理を行う画像補間手段と、を有しているので、加筆抽出の精度が向上する。
【0132】
請求項2記載の発明によれば、加筆抽出装置は、請求項1記載の加筆抽出装置において、前記画像補間手段は、差分処理後の画像の輪郭画像を作成する輪郭抽出手段と、前記輪郭抽出手段によって作成された輪郭画像から電子原稿画像を差分することで補間すべき端点の座標と補間方向を検出する端点検出手段と、前記端点検出手段によって検出された端点の情報から端点同士を接続し閉曲線を構成する端点接続手段と、前記端点接続手段によって作成された閉曲線の内部を着色する画像着色手段、を有しているので、加筆成分の過除去後の補間が可能となり、加筆抽出の精度が向上する。
【0133】
請求項3記載の発明によれば、加筆抽出装置は、請求項1記載の加筆抽出装置において、前記領域分割手段は、電子原稿画像の与えられた領域に文字認識処理を行い領域内における一文字毎の文字画像の領域情報と認識結果、認識結果文字の確信度を出力する文字認識手段と、前記文字認識手段から得られた文字画像の領域情報から該文字画像に対応する加筆重畳画像内での領域を検出する位置検出手段と、前記位置検出手段によって検出された該文字画像の加筆重畳画像内での領域に対する文字認識結果および認識結果文字の確信度と、前記文字認識手段によって得られる認識結果および認識結果文字の確信度とを比較することで加筆抽出操作の必要性の有無を判定する認識結果比較手段、を有しているので計算効率が向上する。
【0134】
請求項4記載の発明によれば、加筆抽出装置は、請求項1記載の加筆抽出装置において、前記領域分割手段は、前記領域分割手段は、電子原稿画像の与えられた領域に文字認識処理を行い領域内における一文字毎の文字画像の領域情報を出力する文字認識手段と、前記文字認識手段から得られた文字画像の領域情報から該文字画像に対応する加筆重畳画像内での領域を検出する位置検出手段と、前記位置検出手段によって検出された該文字画像の加筆重畳画像内での領域内における黒画素の総和と電子原稿画像内での文字画像の黒画素の総和を計数し比較することで加筆抽出操作の必要性の有無を判定する画素計数手段、を有しているので計算効率が向上する。
【0135】
請求項5記載の発明によれば、加筆抽出装置は、請求項3、 4記載の加筆抽出装置において、前記位置検出手段は、電子原稿画像の領域と加筆重畳画像の画像相関関数を計算し相関関数が最大値に達する2枚の画像の位置関係を検出結果とする相関位置検出手段、を有しているので加筆抽出の精度が向上する。
【0136】
請求項6記載の発明によれば、加筆抽出装置は、請求項3、 4記載の加筆抽出装置において、前記位置検出手段は、電子原稿画像の領域と加筆重畳画像の差分後の黒画素の総和を計算し該総和値が最小値に達する2枚の画像の位置関係を検出結果とする差分位置検出手段、を有しているので加筆抽出の精度が向上する。
【0137】
請求項7記載の発明によれば、加筆抽出装置は、請求項1記載の加筆抽出装置において、前記画像差分手段は、電子原稿画像と加筆重畳画像の両者の対応する位置からわずかにずらす画素ずらし処理手段と、前記画素ずらし処理手段によりわずかにずらされた2枚の画像間での差分処理を行う差分処理手段、を有しているので、加筆重畳画像の画質低下によるひき残しを防ぐことが可能となり、加筆抽出の精度が向上する。
【0138】
請求項8記載の発明によれば、加筆抽出装置は、請求項1記載の加筆抽出装置において、前記画像差分手段は、電子原稿画像を太化する画像太化処理手段と、前記画像太化処理手段により太化された電子原稿画像と加筆重畳画像間での差分処理を行う差分処理手段、を有しているので、加筆重畳画像の画質低下によるひき残しを防ぐことが可能となり、加筆抽出の精度が向上する。
【0139】
請求項9記載の発明によれば、加筆抽出方法は、電子文書の原稿画像と前記電子文書を紙へ出力した後に手書きの加筆が重畳した状態でスキャナ等の画像読取装置で再び電子化された画像とから文字認識を用いて所望の領域を小領域に分割し、小領域毎に加筆抽出操作の必要性の有無を判定する領域分割ステップと、前記領域分割ステップによって分割され差分計算が必要と判定された小領域に対して差分計算を行う画像差分ステップと、前記画像差分ステップによって差分処理された画像に対して補間処理を行う画像補間ステップと、を有しているので、加筆抽出の精度が向上する。
【0140】
請求項10記載の発明によれば、加筆抽出方法は、請求項9記載の加筆抽出方法において、前記画像補間ステップは、差分処理後の画像の輪郭画像を作成する輪郭抽出ステップと、前記輪郭抽出ステップによって作成された輪郭画像から電子原稿画像を差分することで補間すべき端点の座標と補間方向を検出する端点検出ステップと、前記端点検出ステップによって検出された端点の情報から端点同士を接続し閉曲線を構成する端点接続ステップと、前記端点接続ステップによって作成された閉曲線の内部を着色する画像着色ステップ、を有しているので、加筆成分の過除去後の補間が可能となり、加筆抽出の精度が向上する。
【0141】
請求項11記載の発明によれば、加筆抽出方法は、請求項9記載の加筆抽出方法において、前記領域分割ステップは、電子原稿画像の与えられた領域に文字認識処理を行い領域内における一文字毎の文字画像の領域情報と認識結果、認識結果文字の確信度を出力する文字認識ステップと、前記文字認識ステップから得られた文字画像の領域情報から該文字画像に対応する加筆重畳画像内での領域を検出する位置検出ステップと、前記位置検出ステップによって検出された該文字画像の加筆重畳画像内での領域に対する文字認識結果および認識結果文字の確信度と、前記文字認識ステップによって得られる認識結果および認識結果文字の確信度とを比較することで加筆抽出操作の必要性の有無を判定する認識結果比較ステップ、を有しているので計算効率が向上する。
【0142】
請求項12記載の発明によれば、加筆抽出方法は、請求項9記載の加筆抽出方法において、前記領域分割ステップは、前記領域分割ステップは、電子原稿画像の与えられた領域に文字認識処理を行い領域内における一文字毎の文字画像の領域情報を出力する文字認識ステップと、前記文字認識ステップから得られた文字画像の領域情報から該文字画像に対応する加筆重畳画像内での領域を検出する位置検出ステップと、前記位置検出ステップによって検出された該文字画像の加筆重畳画像内での領域内における黒画素の総和と電子原稿画像内での文字画像の黒画素の総和を計数し比較することで加筆抽出操作の必要性の有無を判定する画素計数ステップ、を有しているので計算効率が向上する。
【0143】
請求項13記載の発明によれば、加筆抽出方法は、請求項11、 12記載の加筆抽出方法において、前記位置検出ステップは、電子原稿画像の領域と加筆重畳画像の画像相関関数を計算し相関関数が最大値に達する2枚の画像の位置関係を検出結果とする相関位置検出ステップ、を有しているので加筆抽出の精度が向上する。
【0144】
請求項14記載の発明によれば、加筆抽出方法は、請求項11、 12記載の加筆抽出方法において、前記位置検出ステップは、電子原稿画像の領域と加筆重畳画像の差分後の黒画素の総和を計算し該総和値が最小値に達する2枚の画像の位置関係を検出結果とする差分位置検出ステップと、を有しているので加筆抽出の精度が向上する。
【0145】
請求項15記載の発明によれば、加筆抽出方法は、請求項9記載の加筆抽出方法において、前記画像差分ステップは、電子原稿画像と加筆重畳画像の両者の対応する位置からわずかにずらす画素ずらし処理ステップと、前記画素ずらし処理ステップによりわずかにずらされた2枚の画像間での差分処理を行う差分処理ステップ、を有しているので、加筆重畳画像の画質低下によるひき残しを防ぐことが可能となり、加筆抽出の精度が向上する。
【0146】
請求項16記載の発明によれば、加筆抽出方法は、請求項9記載の加筆抽出方法において、前記画像差分ステップは、電子原稿画像を太化する画像太化処理ステップと、前記画像太化処理ステップにより太化された電子原稿画像と加筆重畳画像間での差分処理を行う差分処理ステップ、を有しているので、加筆重畳画像の画質低下によるひき残しを防ぐことが可能となり、加筆抽出の精度が向上する。
【図面の簡単な説明】
【図1】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における加筆抽出のフローチャートである。
【図2】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における領域分割ステップのフローチャートである。
【図3】本発明による加筆抽出装置及び加筆抽出方法の他の実施形態における領域分割ステップのフローチャートである。
【図4】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における画像太化差分のフローチャートである。
【図5】本発明による加筆抽出装置及び加筆抽出方法の他の実施形態における画像太化差分のフローチャートである。
【図6】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における画像補間ステップのフローチャートである。
【図7】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における領域抽出・領域分割の説明図である。
【図8】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における画像差分等の説明図である。
【図9】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における加筆抽出器の構成例である。
【図10】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における領域分割器の構成例である。
【図11】本発明による加筆抽出装置及び加筆抽出方法の他の実施形態における領域分割器の構成例である。
【図12】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における位置検出器の構成例である。
【図13】本発明による加筆抽出装置及び加筆抽出方法の他の実施形態における位置検出器の構成例である。
【図14】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における画像差分器の構成例である。
【図15】本発明による加筆抽出装置及び加筆抽出方法の他の実施形態における画像差分器の構成例である。
【図16】本発明による加筆抽出装置及び加筆抽出方法の一実施形態における画像補間器の構成例である。
【符号の説明】
900 加筆抽出器
901 領域抽出部
902 領域分割部
903 画像差分部
904 画像補間部
905 画像合成部
1000、1100 領域分割器
1001、1101 文字認識部
1002、1102 位置検出部
1003 認識結果比較部
1103 画素計数部
1200、1300 位置検出器
1201 相関計算部
1202 最大相関検出部
1301、1402、1502 差分処理部
1302 最小残黒画素検出部
1400、1500 画像差分器
1401 画素ずらし処理部
1501 画像太化処理部
1600 画像補間器
1601 輪郭抽出部
1602 端点検出部
1603 端点接続部
1604 画像着色部
1605 領域合成部

Claims (16)

  1. 電子文書の原稿画像と前記電子文書を紙へ出力した後に手書きの加筆が重畳した状態でスキャナ等の画像読取装置で再び電子化された画像とから文字認識を用いて所望の領域を小領域に分割し、該小領域毎に加筆抽出操作の必要性の有無を判定する領域分割手段と、
    前記領域分割手段によって分割され差分計算が必要と判定された前記小領域に対して差分計算を行う画像差分手段と、
    前記画像差分手段によって差分処理された画像に対して補間処理を行う画像補間手段と、
    を有することを特徴とする加筆抽出装置。
  2. 前記画像補間手段は、
    前記差分処理後の画像の輪郭画像を作成する輪郭抽出手段と、
    前記輪郭抽出手段によって作成された輪郭画像から電子原稿画像を差分することで補間すべき端点の座標と補間方向を検出する端点検出手段と、
    前記端点検出手段によって検出された端点の情報から端点同士を接続し閉曲線を構成する端点接続手段と、
    前記端点接続手段によって作成された閉曲線の内部を着色する画像着色手段と、
    を有することを特徴とする請求項1記載の加筆抽出装置。
  3. 前記領域分割手段は、
    電子原稿画像の与えられた領域に文字認識処理を行い、該領域内における一文字毎の文字画像の認識結果と該認識結果における前記文字の確信度と前記文字の領域情報とを出力する文字認識手段と、
    前記文字認識手段から得られた文字画像の領域情報から該文字画像に対応する加筆重畳画像内での領域を検出する位置検出手段と、
    前記位置検出手段によって検出された該文字画像の加筆重畳画像内での領域に対する文字認識結果および認識結果文字の確信度と、前記文字認識手段によって得られる認識結果および認識結果文字の確信度とを比較することで加筆抽出操作の必要性の有無を判定する認識結果比較手段と、
    を有することを特徴とする請求項1記載の加筆抽出装置。
  4. 前記領域分割手段は、
    電子原稿画像の与えられた領域に文字認識処理を行い領域内における一文字毎の文字画像の領域情報を出力する文字認識手段と、
    前記文字認識手段から得られた文字画像の領域情報から該文字画像に対応する加筆重畳画像内での領域を検出する位置検出手段と、
    前記位置検出手段によって検出された該文字画像の加筆重畳画像内での領域内における黒画素の総和と電子原稿画像内での文字画像の黒画素の総和を計数し比較することで加筆抽出操作の必要性の有無を判定する画素計数手段と、
    を有することを特徴とする請求項1記載の加筆抽出装置。
  5. 前記位置検出手段は、
    電子原稿画像の領域と加筆重畳画像の画像相関関数を計算し相関関数が最大値に達する2枚の画像の位置関係を検出結果とする相関位置検出手段、
    を有することを特徴とする請求項3または4記載の加筆抽出装置。
  6. 前記位置検出手段は、
    電子原稿画像の領域と加筆重畳画像の差分後の黒画素の総和を計算し該総和値が最小値に達する2枚の画像の位置関係を検出結果とする差分位置検出手段、
    を有することを特徴とする請求項3または4記載の加筆抽出装置。
  7. 前記画像差分手段は、
    電子原稿画像と加筆重畳画像の両者の対応する位置からわずかにずらす画素ずらし処理手段と、
    前記画素ずらし処理手段によりわずかにずらされた2枚の画像間での差分処理を行う差分処理手段と、
    を有することを特徴とする請求項1記載の加筆抽出装置。
  8. 前記画像差分手段は、
    電子原稿画像を太化する画像太化処理手段と、
    前記画像太化処理手段により太化された電子原稿画像と加筆重畳画像間での差分処理を行う差分処理手段と、
    を有することを特徴とする請求項1記載の加筆抽出装置。
  9. 電子文書の原稿画像と前記電子文書を紙へ出力した後に手書きの加筆が重畳した状態でスキャナ等の画像読取装置で再び電子化された画像とから文字認識を用いて所望の領域を小領域に分割し、該小領域毎に加筆抽出操作の必要性の有無を判定する領域分割ステップと、
    前記領域分割ステップによって分割され差分計算が必要と判定された前記小領域に対して差分計算を行う画像差分ステップと、
    前記画像差分ステップによって差分処理された画像に対して補間処理を行う画像補間ステップと、
    を有することを特徴とする加筆抽出方法。
  10. 前記画像補間ステップは、
    前記差分処理後の画像の輪郭画像を作成する輪郭抽出ステップと、
    前記輪郭抽出ステップによって作成された輪郭画像から電子原稿画像を差分することで補間すべき端点の座標と補間方向を検出する端点検出ステップと、
    前記端点検出ステップによって検出された端点の情報から端点同士を接続し閉曲線を構成する端点接続ステップと、
    前記端点接続ステップによって作成された閉曲線の内部を着色する画像着色ステップと、
    を有することを特徴とする請求項9記載の加筆抽出方法。
  11. 前記領域分割ステップは、
    電子原稿画像の与えられた領域に文字認識処理を行い該領域内における一文字毎の文字画像の認識結果と該認識結果における前記文字の確信度と前記文字の領域情報とを出力する文字認識ステップと、
    前記文字認識ステップから得られた文字画像の領域情報から該文字画像に対応する加筆重畳画像内での領域を検出する位置検出ステップと、
    前期位置検出ステップによって検出された該文字画像の加筆重畳画像内での領域に対する文字認識結果および認識結果文字の確信度と、前記文字認識ステップによって得られる認識結果および認識結果文字の確信度とを比較することで加筆抽出操作の必要性の有無を判定する認識結果比較ステップと、
    を有することを特徴とする請求項9記載の加筆抽出方法。
  12. 前記領域分割ステップは、
    電子原稿画像の与えられた領域に文字認識処理を行い領域内における一文字毎の文字画像の領域情報を出力する文字認識ステップと、
    前記文字認識ステップから得られた文字画像の領域情報から該文字画像に対応する加筆重畳画像内での領域を検出する位置検出ステップと、
    前期位置検出ステップによって検出された該文字画像の加筆重畳画像内での領域内における黒画素の総和と電子原稿画像内での文字画像の黒画素の総和を計数し比較することで加筆抽出操作の必要性の有無を判定する画素計数ステップと、
    を有することを特徴とする請求項9記載の加筆抽出方法。
  13. 前記位置検出ステップは、
    電子原稿画像の領域と加筆重畳画像の画像相関関数を計算し相関関数が最大値に達する2枚の画像の位置関係を検出結果とする相関位置検出ステップ、
    を有することを特徴とする請求11または12記載の加筆抽出方法。
  14. 前記位置検出ステップは、
    電子原稿画像の領域と加筆重畳画像の差分後の黒画素の総和を計算し該総和値が最小値に達する2枚の画像の位置関係を検出結果とする差分位置検出ステップ、
    を有することを特徴とする請求項11または12記載の加筆抽出方法。
  15. 前記画像差分ステップは、
    電子原稿画像と加筆重畳画像の両者の対応する位置からわずかにずらす画素ずらし処理ステップと、
    前記画素ずらし処理ステップによりわずかにずらされた2枚の画像間での差分処理を行う差分処理ステップと、
    を有することを特徴とする請求項9記載の加筆抽出方法。
  16. 前記画像差分ステップは、
    電子原稿画像を太化する画像太化処理ステップと、
    前記画像太化処理ステップにより太化された電子原稿画像と加筆重畳画像間での差分処理を行う差分処理ステップと、
    を有することを特徴とする請求項9記載の加筆抽出方法。
JP2002380609A 2002-12-27 2002-12-27 加筆抽出装置及び加筆抽出方法 Expired - Fee Related JP4120795B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002380609A JP4120795B2 (ja) 2002-12-27 2002-12-27 加筆抽出装置及び加筆抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002380609A JP4120795B2 (ja) 2002-12-27 2002-12-27 加筆抽出装置及び加筆抽出方法

Publications (3)

Publication Number Publication Date
JP2004213230A true JP2004213230A (ja) 2004-07-29
JP2004213230A5 JP2004213230A5 (ja) 2006-02-23
JP4120795B2 JP4120795B2 (ja) 2008-07-16

Family

ID=32816776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002380609A Expired - Fee Related JP4120795B2 (ja) 2002-12-27 2002-12-27 加筆抽出装置及び加筆抽出方法

Country Status (1)

Country Link
JP (1) JP4120795B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007172336A (ja) * 2005-12-22 2007-07-05 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2007174038A (ja) * 2005-12-20 2007-07-05 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
US7630572B2 (en) 2005-06-16 2009-12-08 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and computer program
JP2010066865A (ja) * 2008-09-09 2010-03-25 Fuji Xerox Co Ltd 差分抽出装置及び差分抽出プログラム
EP2169613A1 (en) 2008-09-25 2010-03-31 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and image processing program
US7738703B2 (en) 2006-03-01 2010-06-15 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer readable medium storing image processing program
JP2011154713A (ja) * 2011-04-06 2011-08-11 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
US8391607B2 (en) 2008-04-14 2013-03-05 Fuji Xerox Co., Ltd. Image processor and computer readable medium
US8570609B2 (en) 2009-07-16 2013-10-29 Fuji Xerox Co., Ltd. Image processing device with image dilation processing, image processing system, image processing method and computer readable medium
KR20170087357A (ko) * 2016-01-20 2017-07-28 엘지전자 주식회사 이동 단말기 및 그 제어 방법

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630572B2 (en) 2005-06-16 2009-12-08 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and computer program
JP2007174038A (ja) * 2005-12-20 2007-07-05 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP4631696B2 (ja) * 2005-12-20 2011-02-16 富士ゼロックス株式会社 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2007172336A (ja) * 2005-12-22 2007-07-05 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
US7738703B2 (en) 2006-03-01 2010-06-15 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method and computer readable medium storing image processing program
US8391607B2 (en) 2008-04-14 2013-03-05 Fuji Xerox Co., Ltd. Image processor and computer readable medium
JP2010066865A (ja) * 2008-09-09 2010-03-25 Fuji Xerox Co Ltd 差分抽出装置及び差分抽出プログラム
JP2010079507A (ja) * 2008-09-25 2010-04-08 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8311322B2 (en) 2008-09-25 2012-11-13 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and computer readable medium
EP2169613A1 (en) 2008-09-25 2010-03-31 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, and image processing program
US8570609B2 (en) 2009-07-16 2013-10-29 Fuji Xerox Co., Ltd. Image processing device with image dilation processing, image processing system, image processing method and computer readable medium
JP2011154713A (ja) * 2011-04-06 2011-08-11 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
KR20170087357A (ko) * 2016-01-20 2017-07-28 엘지전자 주식회사 이동 단말기 및 그 제어 방법
KR102574900B1 (ko) 2016-01-20 2023-09-06 엘지전자 주식회사 이동 단말기 및 그 제어 방법

Also Published As

Publication number Publication date
JP4120795B2 (ja) 2008-07-16

Similar Documents

Publication Publication Date Title
JP4358193B2 (ja) 画像対象の自動切抜き方法
JP7013182B2 (ja) 情報処理装置、情報処理方法およびプログラム
EP1139272A2 (en) Method and apparatus for identification of documents, and computer product
WO2004051575A1 (ja) 特徴領域抽出装置、特徴領域抽出方法および特徴領域抽出プログラム
JP2007335920A (ja) 画像処理装置および画像処理プログラム
JP4630777B2 (ja) デジタル文書を変更する方法、装置、コンピュータプログラム及び記憶媒体
JP2007116469A (ja) 媒体処理方法、複写装置、及びデータファイリング装置
JP4120795B2 (ja) 加筆抽出装置及び加筆抽出方法
JP4275973B2 (ja) 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法
JP5200786B2 (ja) 差分抽出装置及び差分抽出プログラム
JP2007164513A (ja) 画像処理装置
JP6413542B2 (ja) 画像処理装置及び画像処理プログラム
JP2003259110A (ja) 画像結合装置、その方法、プログラム
JP6163868B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP2010079507A (ja) 画像処理装置及び画像処理プログラム
CN105025188B (zh) 图像形成装置、图像处理装置和图像处理方法
JP2008259172A (ja) 画像処理装置、画像処理方法およびプログラム
US20130114898A1 (en) Template matching processing device and template matching processing program
JP3600380B2 (ja) 画像処理方法及びファクス文字認識装置
JP5821994B2 (ja) 画像処理装置、画像形成装置およびプログラム
JP4651876B2 (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP2005182098A (ja) 合成画像を生成・表示する装置及び方法
JP5923981B2 (ja) 画像処理装置及び画像処理プログラム
JP3625245B2 (ja) 画像処理方法及び画像処理装置
JP3986059B2 (ja) 画像補正装置、プログラム、記憶媒体及びページ外形の直線部分と曲線部分の境界点の検出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080408

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080415

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110509

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120509

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120509

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130509

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130509

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees