JP2011259055A

JP2011259055A - 原稿読取装置

Info

Publication number: JP2011259055A
Application number: JP2010129658A
Authority: JP
Inventors: Osamu Kimoto; 修木元
Original assignee: Murata Machinery Ltd
Current assignee: Murata Machinery Ltd
Priority date: 2010-06-07
Filing date: 2010-06-07
Publication date: 2011-12-22

Abstract

【課題】読取画像の中から、ユーザが元原稿に書き込んだ書込情報を含む読取画像を自動抽出させることができ、元原稿の内容を編集する際の作業効率を向上させた原稿読取装置を提供する。
【解決手段】複数の原稿を光学的に読み取り、読取画像をそれぞれ生成する光学読取部と、読取画像に対し、有彩色の書込画像を含むか否かを判定する画像判定部と、画像判定部により書込画像を含むと判定された読取画像を文字認識処理し、文字列からなる文書データを生成する文字認識部と、書込画像を含む読取画像及び当該読取画像から得られた文書データからなる画像ファイルを生成する画像ファイル生成部により構成される。
【選択図】図３

Description

本発明は、原稿読取装置に係り、さらに詳しくは、複数の原稿を光学的に読み取り、読取画像をそれぞれ生成する原稿読取装置の改良に関する。

従来、元原稿に対し、色付きのペンを用いて文字などが書き込まれた書込原稿を複数の原稿の中から抜き出す作業は、手作業により行われていた。また、色付きのペンを用いて書き込まれた書込情報を参照して元原稿の内容を編集する場合、元原稿を構成する文字列からなる文書データがあれば、編集作業を効率的に行うことができる。

そこで、スキャナ装置を用いて原稿から読み取った読取画像に対し、マーキングペンを用いてマーキングされた一部の画像領域を輝度又は濃度に基づいて抽出する。そして、サムネイル化して元の読取画像に添付し、或いは、文字認識してキーワードを元の読取画像に添付する技術が提案されている（例えば、特許文献１）。この特許文献１に記載の画像処理装置では、複数の読取画像の中から所望の読取画像を抽出する際の読取画像の特定を容易化することができる。しかし、上述した画像処理装置では、マーキングされた一部の画像領域に記載された内容をキーワードにより容易に認識できたとしても、元原稿の内容を編集する場合に、元原稿を構成する文字列を入力し直さなければならなかった。

特開２０００−３１６０８２号公報

本発明は、上記事情に鑑みてなされたものであり、読取画像の中から、ユーザが元原稿に書き込んだ書込情報を含む読取画像を自動抽出させることができ、元原稿の内容を編集する際の作業効率を向上させた原稿読取装置を提供することを目的とする。

第１の本発明による原稿読取装置は、２以上の原稿を光学的に読み取り、読取画像をそれぞれ生成する光学読取部と、上記読取画像に対し、有彩色の書込画像を含むか否かを判定する画像判定部と、上記画像判定部により上記書込画像を含むと判定された読取画像を文字認識処理し、文字列からなる文書データを生成する文字認識部と、上記書込画像を含む上記読取画像及び当該読取画像から得られた上記文書データからなる画像ファイルを生成する画像ファイル生成部とを備えて構成される。

この原稿読取装置では、複数の原稿の読取画像のうち、有彩色の書込画像を含む読取画像に対し、読取画像と、当該読取画像を文字認識処理して得られる文書データとから画像ファイルが生成される。この様な構成によれば、複数の原稿から読み取った読取画像の中から、ユーザが元原稿に書込情報として書き込んだ有彩色の書込画像を含む読取画像を自動抽出させることができる。さらに、読取画像を文字認識処理して得られる文書データを含む画像ファイルが生成されるので、文書データを利用して元原稿の内容を編集することができる。

第２の本発明による原稿読取装置は、上記構成に加え、上記読取画像を圧縮し、解像度を低下させた低解像度画像を生成する画像圧縮部を備え、上記画像ファイル生成部が、上記書込画像を含む上記読取画像に対し、当該読取画像及び上記文書データからなる上記画像ファイルを生成し、上記書込画像を含まない上記読取画像に対し、当該読取画像から得られた上記低解像度画像からなる画像ファイルを生成するように構成される。

この様な構成によれば、有彩色の書込画像を含む読取画像に対し、元原稿の内容を編集する際の作業効率を向上させつつ、書込画像を含まない読取画像に対して画像ファイルのデータサイズを小さくすることができる。

第３の本発明による原稿読取装置は、上記構成に加え、上記画像ファイル生成部が、上記読取画像が上記書込画像を含むか否かを示す属性情報をヘッダ情報として含む画像ファイルを生成するように構成される。

この様な構成によれば、ヘッダ情報として含まれる属性情報を参照することにより、画像ファイルの中の読取画像が書込画像を含むものであるか否かを容易に識別することができる。

第４の本発明による原稿読取装置は、上記構成に加え、上記画像ファイル生成部が、上記書込画像を含む上記読取画像から得られた画像ファイルと、上記書込画像を含まない上記読取画像から得られた画像ファイルとからなる出力ファイルを生成するように構成される。

この様な構成によれば、ユーザにより書き込まれた書込画像を含む読取画像が正しく抽出されなかった場合であっても、出力ファイルに含まれる読取画像により、対応する元原稿の内容を確認することができる。

本発明による原稿読取装置によれば、複数の原稿から読み取った読取画像の中から、ユーザが元原稿に書込情報として書き込んだ有彩色の書込画像を含む読取画像を自動抽出させることができる。さらに、読取画像を文字認識処理して得られる文書データを含む画像ファイルが生成されるので、文書データを利用して元原稿の内容を編集することができる。従って、ユーザによる書込情報を参照しながら元原稿の内容を編集する際の作業効率を向上させることができる。

本発明の実施の形態１による原稿読取装置の動作の一例を模式的に示した説明図であり、原稿読取装置の一例としてＭＦＰ１００が示されている。図１のＭＦＰ１００における動作の一例を示した図であり、元原稿、書込原稿及び書込原稿の読取画像から得られた文書データ１１が示されている。図１のＭＦＰ１００の構成例を示したブロック図であり、ＭＦＰ１００内の機能構成の一例が示されている。図３のＭＦＰ１００における書込ページの抽出時の動作の一例を示したフローチャートである。本発明の実施の形態２による原稿読取装置の動作の一例を示した図であり、書込ページ及び非書込ページの画像ファイル２がそれぞれ示されている。図５のＭＦＰ１００の構成例を示したブロック図である。

実施の形態１．
＜書込ページの抽出＞
図１は、本発明の実施の形態１による原稿読取装置の動作の一例を模式的に示した説明図であり、原稿読取装置の一例としてＭＦＰ１００が示されている。ＭＦＰ（Multifunction Peripheral：複合機）１００は、スキャナ機能、プリンタ機能、ＦＡＸ（ファクシミリ）機能、複写機能を有し、これらの機能を選択的に実行させることができる画像処理装置である。

このＭＦＰ１００では、複数の原稿を光学的に読み取り、各原稿の読取画像の中から、ユーザが元原稿に書き込んだ書込情報を含む読取画像１２が抽出される。そして、抽出した読取画像１２と、当該読取画像１２を文字認識処理し、文字列からなる文書データ１１とから画像ファイル２が生成される。

具体的には、「原稿１」、「原稿２」、「原稿３」、・・・が抽出対象原稿１として順次に読み取られ、読取画像がそれぞれ生成される。各抽出対象原稿１は、地色が無彩色であり、文字、記号、図形などの無彩色画像が形成された紙媒体である。また、各抽出対象原稿１は、所定の原稿収容部内に収容され、原稿収容部から１枚ずつ取り出して光学読取部へ給送され、抽出対象原稿１から読取画像が読み取られる。

次に、各抽出対象原稿１の読取画像の中から、無彩色画像の一部に有彩色の書込画像が付加された読取画像１２が書込ページとして抽出される。例えば、有彩色のペンを用いて書き込まれた文字、記号、図形などの書込画像を書込情報として含む読取画像１２が抽出される。

書込ページとして抽出された読取画像１２は、ＯＣＲ（Optical Character Reader：光学式文字読取）処理され、文字認識により得られた文字列からなる文書データ１１が作成される。ＯＣＲ処理は、書込ページの読取画像全体に対する画像解析処理であり、画像データを所定の文字パターンと照合することにより行われる。文書データ１１は、一連の文字コードからなるテキスト情報であり、書込ページごとに生成される。

そして、書込ページとして抽出された読取画像１２と、当該読取画像１２から得られた文書データ１１とは、ファイル化され、１つの画像ファイル２が作成される。例えば、ＪＰＥＧ（Joint Photographic Experts Group）フォーマットのＪＰＥＧファイルとして、画像ファイル２が作成される。

文書データ１１は、この様な画像ファイル２のヘッダ情報として付加される。例えば、文書データ１１は、画像ファイル２のヘッダ部分にコメントとして埋め込まれる。出力ファイル３は、書込ページごとの画像ファイル２からなり、所定の文書フォーマットで管理される。

この様に構成することにより、有彩色の書込画像を含む読取画像１２を書込ページとして自動抽出させることができる。また、読取画像１２から得られた文書データ１１が、画像ファイル２のヘッダ情報として読取画像１２に関連付けて保持されるので、ヘッダ情報の文書データ１１を参照することにより、出力ファイル３の中から所望の書込ページを容易に抽出することができる。

また、出力ファイル３が、ユーザによる書込情報を含む読取画像１２からなるので、抽出対象原稿１から読み取った全ての読取画像からなる場合に比べて、データサイズを小さくすることができる。

＜書込ページの文字認識＞
図２は、図１のＭＦＰ１００における動作の一例を示した図であり、元原稿、書込原稿及び書込原稿の読取画像から得られた文書データ１１が示されている。元原稿は、ユーザにより文字などが書き込まれる前の原稿であり、地色が無彩色である紙媒体に、文字などを表す無彩色画像４が形成されている。例えば、地色が白色である記録紙に、黒色の文字、記号、図形が無彩色画像４として形成されている。

書込原稿は、ユーザにより文字などが書き込まれた原稿であり、元原稿に対し、ユーザが有彩色のペンを用いて書き込んだ文字などを表す有彩色の書込画像５が無彩色画像４の一部に付加されている。例えば、赤色の文字、記号、図形が書込画像５として形成されている。この例では、文章中の取消線、文字列「共有フォルダ」、「直接」などが書込画像５である。

ＭＦＰ１００では、この様な元原稿及び書込原稿からなる複数の抽出対象原稿１が読み取られ、書込原稿から得られた読取画像が、ユーザによる書込情報を含む書込ページとして抽出される。文書データ１１は、書込ページの読取画像をＯＣＲ処理することにより得られ、無彩色画像４及び書込画像５により表される文字列によって構成される。この例では、元原稿に記載された文章、ユーザが元原稿に書き込んだ文字列「共有フォルダ」、「直接」によって、文書データ１１が構成されている。

この様な文書データ１１を書込ページとして抽出された読取画像１２に関連付けて保持することにより、書込原稿の内容を入力し直さなくて良いので、書込ページを編集する際の作業効率を向上させることができる。

＜ＭＦＰ＞
図３は、図１のＭＦＰ１００の構成例を示したブロック図であり、ＭＦＰ１００内の機能構成の一例が示されている。このＭＦＰ１００は、光学読取部２１、画像判定部２２、文字認識部２３及び画像ファイル生成部２４により構成される。光学読取部２１は、複数の抽出対象原稿１を光学的に読み取り、読取画像をそれぞれ生成し、画像判定部２２へ出力する。

画像判定部２２は、光学読取部２１により生成された読取画像に対し、有彩色の書込画像を含むか否かを判定し、その判定結果を文字認識部２３及び画像ファイル生成部２４へ出力する。この画像判定部２２では、無彩色画像４の一部に有彩色の書込画像５が付加されているか否かが判定される。

具体的には、光学読取部２１により生成されるＲＧＢデータからなる読取画像を色変換することにより、輝度成分、色相成分及び彩度成分からなるデータが生成される。有彩色の書込画像５が付加されているか否かは、読取画像の彩度成分を所定の閾値と比較し、彩度成分が閾値を越えている有彩色画素が一定数以上存在するか否かに応じて判定される。

文字認識部２３は、画像判定部２２により書込画像５を含むと判定された読取画像１２を文字認識処理し、文字列からなる文書データ１１を生成し、画像ファイル生成部２４へ出力する。

画像ファイル生成部２４は、画像判定部２２により書込画像５を含むと判定された読取画像１２と、当該読取画像１２から得られた文書データ１１とからなる画像ファイル２を生成する。文書データ１１は、画像ファイル２のヘッダ部分にコメントとして埋め込まれる。画像ファイル生成部２４では、ユーザによる書込情報を含む書込ページの画像ファイル２のみからなる出力ファイル３が生成される。

図４のステップＳ１０１〜Ｓ１１０は、図３のＭＦＰ１００における書込ページの抽出時の動作の一例を示したフローチャートである。まず、光学読取部２１は、抽出対象原稿１をスキャンし、読取画像を生成する（ステップＳ１０１，Ｓ１０２）。画像判定部２２は、光学読取部２１からの画像データを色変換し、その彩度成分を所定の閾値と比較することにより、有彩色の書込画像５が読取画像に含まれているか否かを判定する（ステップＳ１０３〜Ｓ１０５）。

このとき、画像判定部２２は、書込画像５を含む読取画像１２を書込ページとして抽出し、文字認識部２３及び画像ファイル生成部２４へ出力する（ステップＳ１０６）。文字認識部２３では、書込ページの読取画像１２をＯＣＲ処理し、文字列からなる文書データ１１を生成する。画像ファイル生成部２４では、書込ページに対し、文書データ１１をヘッダ部分にコメントとして埋め込んだ画像ファイル２を生成する（ステップＳ１０７，Ｓ１０８）。

ステップＳ１０１からステップＳ１０８までの処理手順は、抽出対象原稿１のスキャンが終了するまで繰り返され（ステップＳ１０９）、スキャンが終了すれば、画像ファイル生成部２４により、書込ページごとの画像ファイル２からなる出力ファイル３が作成される（ステップＳ１１０）。

本実施の形態によれば、複数の抽出対象原稿１から読み取った読取画像の中から、ユーザが元原稿に書込情報として書き込んだ有彩色の書込画像５を含む読取画像１２を自動抽出させることができる。その際、画像データの彩度成分を所定の閾値と比較することにより、無彩色画像４の一部に書込画像５が付加された読取画像１２が、ユーザにより元原稿に書き込まれた書込情報を含む書込ページとして抽出される。従って、有彩色であればどのような色の書込画像５であっても、書込画像５を含む書込ページを正しく抽出させることができる。さらに、読取画像１２を文字認識処理して得られる文書データ１１をヘッダ情報として含む画像ファイル２が生成されるので、文書データ１１を利用して元原稿の内容を編集することができる。

なお、本実施の形態では、無彩色画像４の一部に有彩色の書込画像５が付加された読取画像を書込ページとして抽出する場合の例について説明したが、本発明はこれに限られるものではない。例えば、予め指定された色の書込画像を含む読取画像を書込ページとして抽出するような構成であっても良い。書込ページとして抽出させる書込画像の色の指定は、例えば、操作キーを操作して予め定められた複数の指定色の中から選択することにより行われる。

或いは、原稿内に所定の色指定領域を設け、色指定領域に書込ページとして抽出させたい色のペンでマーキングさせる。そして、マーキングされた原稿の読取画像から色指定領域を抽出することにより、書込画像の色の指定が行われる。この様に構成すれば、元原稿が有彩色画像からなる場合であっても、書込画像を含む読取画像を書込ページとして正しく抽出させることができる。

実施の形態２．
実施の形態１では、書込ページごとの画像ファイル２から出力ファイル３が作成される場合の例について説明した。これに対し、本実施の形態では、書込ページの画像ファイル２と非書込ページの画像ファイル２とから出力ファイル３が作成される場合について説明する。

図５は、本発明の実施の形態２による原稿読取装置の動作の一例を示した図であり、ＭＦＰ１００により生成される書込ページ及び非書込ページの画像ファイル２がそれぞれ示されている。書込ページの画像ファイル２は、書込画像５を含む読取画像１２と、当該読取画像１２から得られた文書データ１１により構成される。文書データ１１は、ヘッダ部分にコメントとして埋め込まれる。

一方、非書込ページの画像ファイル２は、書込画像５を含まない読取画像により構成される。これらの画像ファイル２には、読取画像が書込画像５を含むか否かを示す属性情報１３がヘッダ情報として含まれている。つまり、画像ファイルの属性情報１３を参照すれば、文書データ１１がコメントとしてヘッダ部分に埋め込まれているか否かを判別することができる。

出力ファイル３は、この様な書込ページの画像ファイル２と、非書込ページの画像ファイル２により構成される。属性情報１３を参照することにより、書込ページの画像ファイル２のみを容易に抜き出すことができる。

非書込ページの画像ファイル２には、光学読取部２１により生成された読取画像をそのまま書き込んでも良いが、ここでは、書込ページの読取画像１２に比べて圧縮された低解像度画像が書き込まれる。

図６は、図５のＭＦＰ１００の構成例を示したブロック図である。このＭＦＰ１００は、図３のＭＦＰ１００と比較すれば、画像圧縮部２５を備えている点で異なる。画像圧縮部２５は、光学読取部２１からの読取画像を圧縮し、解像度を低下させた低解像度画像を生成し、画像ファイル生成部２４へ出力する。読取画像の圧縮は、例えば、画素の間引き処理又は画素値の丸め込みにより行われる。

画像ファイル生成部２４では、書込画像５を含む読取画像１２に対し、当該読取画像１２と文書データ１１とからなる画像ファイル２を生成する。一方、書込画像５を含まない読取画像に対し、当該読取画像から得られた低解像度画像からなる画像ファイル２が生成される。そして、書込画像５を含む読取画像１２から得られた画像ファイル２と、書込画像５を含まない読取画像から得られた画像ファイル２とから出力ファイル３が作成される。

本実施の形態によれば、有彩色の書込画像５を含む読取画像１２に対し、元原稿の内容を編集する際の作業効率を向上させつつ、書込画像５を含まない読取画像に対して画像ファイル２のデータサイズを小さくすることができる。また、ヘッダ情報として含まれる属性情報１３を参照することにより、画像ファイル２の中の読取画像が書込画像５を含むものであるか否かを容易に識別することができる。さらに、ユーザにより書き込まれた書込画像５を含む読取画像１２が正しく抽出されなかった場合であっても、出力ファイル３に含まれる読取画像により、対応する元原稿の内容を確認することができる。

なお、本実施の形態では、画像ファイル２がヘッダ情報として属性情報１３及び文書データ１１を含む場合の例について説明したが、本発明はこれに限られるものではない。例えば、画像ファイル２が、読取画像を縮小したサムネイル画像をヘッダ情報として含むものであっても良い。

また、本実施の形態では、出力ファイル３が、書込ページの画像ファイル２と非書込ページの画像ファイル２とからなる場合の例について説明したが、本発明はこれに限られるものではない。例えば、出力ファイル３として、書込ページの画像ファイル２のみを出力する動作モードと、書込ページの画像ファイル２と非書込ページの画像ファイル２とを出力する動作モードとが切り替え可能な構成であっても良い。これらの動作モードは、例えば、ユーザによる操作キーの操作に基づいて切り替えられ、或いは、読取ページ数に応じて切り替えられる。

１抽出対象原稿
２画像ファイル
３出力ファイル
４無彩色画像
５有彩色画像
１１文書データ
１２書込ページの読取画像
１３属性情報
２１光学読取部
２２画像判定部
２３文字認識部
２４画像ファイル生成部
２５画像圧縮部
１００ＭＦＰ

Claims

２以上の原稿を光学的に読み取り、読取画像をそれぞれ生成する光学読取部と、
上記読取画像に対し、有彩色の書込画像を含むか否かを判定する画像判定部と、
上記画像判定部により上記書込画像を含むと判定された読取画像を文字認識処理し、文字列からなる文書データを生成する文字認識部と、
上記書込画像を含む上記読取画像及び当該読取画像から得られた上記文書データからなる画像ファイルを生成する画像ファイル生成部とを備えたことを特徴とする原稿読取装置。
上記読取画像を圧縮し、解像度を低下させた低解像度画像を生成する画像圧縮部を備え、
上記画像ファイル生成部は、上記書込画像を含む上記読取画像に対し、当該読取画像及び上記文書データからなる上記画像ファイルを生成し、上記書込画像を含まない上記読取画像に対し、当該読取画像から得られた上記低解像度画像からなる画像ファイルを生成することを特徴とする請求項１に記載の原稿読取装置。
上記画像ファイル生成部は、上記読取画像が上記書込画像を含むか否かを示す属性情報をヘッダ情報として含む画像ファイルを生成することを特徴とする請求項２に記載の原稿読取装置。
上記画像ファイル生成部は、上記書込画像を含む上記読取画像から得られた画像ファイルと、上記書込画像を含まない上記読取画像から得られた画像ファイルとからなる出力ファイルを生成することを特徴とする請求項３に記載の原稿読取装置。