JP2004288015A - 文書ファイリング装置および文書区切り方法 - Google Patents
文書ファイリング装置および文書区切り方法 Download PDFInfo
- Publication number
- JP2004288015A JP2004288015A JP2003081129A JP2003081129A JP2004288015A JP 2004288015 A JP2004288015 A JP 2004288015A JP 2003081129 A JP2003081129 A JP 2003081129A JP 2003081129 A JP2003081129 A JP 2003081129A JP 2004288015 A JP2004288015 A JP 2004288015A
- Authority
- JP
- Japan
- Prior art keywords
- document
- image data
- page
- user
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
【課題】一括して読み込まれたページ画像データを文書単位毎に区切る際に、ユーザに掛かる負担を軽減させること。
【解決手段】1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する文書ファイリング装置に、取得したページ画像データから該ページ画像データの特徴を表す特徴量を抽出させる。次いで、この文書ファイリング装置に、取得したページ画像データを文書単位に区切る際の区切りを上記特徴量に基づいて特定させる。このようにして特定された区切りと、ユーザの入力した区切りとを文書ファイリング装置に比較させ、両者が異なる場合には、その旨ユーザへ報知させる。
【選択図】 図1
【解決手段】1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する文書ファイリング装置に、取得したページ画像データから該ページ画像データの特徴を表す特徴量を抽出させる。次いで、この文書ファイリング装置に、取得したページ画像データを文書単位に区切る際の区切りを上記特徴量に基づいて特定させる。このようにして特定された区切りと、ユーザの入力した区切りとを文書ファイリング装置に比較させ、両者が異なる場合には、その旨ユーザへ報知させる。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、紙文書を電子化する技術に関する。
【0002】
【従来の技術】
紙文書は、情報の伝達や記録を行うための媒体として優れたものであるが、これを保存するためのスペースを必要とする。また、情報を紙文書に記録して保存する場合、後にその紙文書が必要になったときには、例えば書庫に収納された多くの紙文書のなかから目的とする紙文書を探さなければならない。したがって、紙文書に記録して保存するという形態は、業務の効率化の観点からも好ましくない。このような背景の下、紙文書を電子化して保存することが行われるようになってきている。具体的には、ユーザは1ページずつ紙文書をスキャナ装置にセットし、このスキャナ装置により、紙文書の各ページを読み込み、画像データとして電子ファイルに格納する。
【0003】
このような方法は、電子ファイル化すべき紙文書のページ数が多い場合には非効率的である。このため、紙文書のページ数が多い場合には、オートドキュメントフィーダ(Auto Document Feeder:以下、「ADF」という)と呼ばれる自動給紙機構を備えたスキャナ装置を用いて、紙文書の各ページを連続して自動的に読み取る処理が広く行われている。
【0004】
ところで、状況によっては、電子化すべき紙文書が一度に多数発生する場合がある。このような場合に、各紙文書を一文書ずつADFにセットして読み取り処理を行わせれば、文書単位で紙文書を電子ファイル化することが可能である。しかし、この方法を採った場合、一文書毎に、紙文書をADFにセットし、読み取り処理を行わせるための操作を行わなければならないので、ユーザにとって煩雑である。一方、複数種類の紙文書を全部まとめてADFにセットし、読み取り処理を行わせれば、複数種類の紙文書を一括して電子ファイル化することができる。しかし、この方法を採った場合、1つの電子化ファイルに複数種類の紙文書の画像データがまとめて格納されるので、後に個々の紙文書を検索し閲覧するのに不便である。そこで、複数種類の紙文書を一括して読み取り、かつ、紙文書の画像データを文書毎に電子ファイル化する技術が求められている。このようなニーズに対し、従来から幾つかの技術が提案されている(例えば、特許文献1、2、3および4)。
【0005】
特許文献1には、次のような電子ファイリング装置が開示されている。まず、該装置のユーザは、電子化したい文書が複数ある場合に、それらの複数の文書間に予め特定の文書区切り用原稿を挿入しておく。そして、この文書区切り用原稿を挿入した複数文書からなる原稿をADFにセットし、該装置に画像読み取り処理を行わせる。該装置では、この画像読み取り処理により得られた全ページのページ画像データのなかから、文書区切り用原稿に相当する画像データを認識し、ページ画像データを文書単位に電子ファイル化する。
【0006】
また、特許文献2には、次のような電子ファイリング装置が開示されている。すなわち、該装置のユーザは、電子ファイル化したい文書が複数ある場合に、各文書において文書区切りとなるページの裏面に文書区切りマークを予め付加しておく。該装置では、複数文書からなる原稿の各ページの裏表両面をスキャナ装置で読み取り、この文書区切りマークを認識して各文書のページ画像データを文書単位に電子ファイル化する。
【0007】
また、特許文献3には、次のような電子ファイリング装置が開示されている。すなわち、該装置は、スキャナ装置で読み取った画像データから予め設定しておいた文字認識エリア部分を切り出し、文字認識処理を行い、この文字認識結果に基づき文書の区切りを判定する。
【0008】
さらに、特許文献4には、ADFを持つスキャナ装置により複数の文書を一括して読み取り、読み取った画像の特徴量を算出し、この特徴量に基づいて文書単位の区切りを判定する技術が開示されている。
【0009】
【特許文献1】
特開平1−162474号公報
【特許文献2】
特開平7−287747号公報
【特許文献3】
特開平10−21380号公報
【特許文献4】
特開2002−24258号公報
【0010】
【発明が解決しようとする課題】
以上に説明した従来技術のなかでも、特に、特許文献4に開示された技術によれば、予め文書区切り用原稿を各文書間に挿入したり、文書区切りマークを付加するなど原稿に手を加えることなく文書区切りを電子ファイリング装置に検出させることができるので、ユーザに掛かる負担が大幅に軽減される。
【0011】
しかしながら、特許文献4に開示されている技術では、読み取った画像の特徴に基づいて文書が区切られるので、電子ファイリング装置によって検出された区切りと実際の文書の区切りとが常に一致するとは限らない。このため、ユーザは、電子ファイリング装置によって為された区切りを全て目視で確認し、電子ファイリング装置によって為された区切りが適切ではない場合には、手動で区切りを修正しなければならない。
【0012】
その一方、特許文献4に開示されている技術を利用せず、ユーザが、全ての画像データを目視で確認しながら文書単位の区切りを全て手動で入力するとしたならば、効率が悪いことは言うまでもない。加えて、ユーザ自身が区切り位置を間違える可能性も低くない。
【0013】
本発明は、上記課題に鑑みて為されたものであり、一括して読み込まれたページ画像データを文書単位毎に区切る際に、ユーザに掛かる負担を軽減させる技術を提供することを目的としている。
【0014】
【課題を解決するための手段】
上記課題を解決するために、本発明は、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、前記画像入力手段によって取得されたページ画像データを文書単位に区切る際の区切りを前記特徴量に基づいて特定する特定手段と、前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、前記区切り入力手段によって入力された区切りと、前記特定手段によって特定された区切りとを比較し、両者が異なる場合には、前記ユーザへその旨報知する報知手段とを有する文書ファイリング装置を提供する。
【0015】
また、上記課題を解決するために、本発明は、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、前記区切り入力手段によって入力された区切りに基づいて前記ページ画像データを文書単位に分割した場合に、ある文書単位に含まれているページ画像データの特徴量と該文書単位に含まれている他のページ画像データの特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する報知手段とを有する文書ファイリング装置を提供する。
【0016】
また、上記課題を解決するために、本発明は、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、前記区切り入力手段によって入力された区切りに基づいて前記ページ画像データを文書単位に分割した場合に、ある文書単位に対応する文書画像データの特徴量と他の文書単位に対応する文書画像データの特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する報知手段とを有する文書ファイリング装置を提供する。
【0017】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第2のステップにて提供したユーザインタフェイスを介して取得する第3のステップと、前記文書ファイリング装置が、前記第3のステップにて取得した区切りと前記ページ画像データの特徴を表す特徴量に基づいて特定された区切りとが異なる場合には、前記ユーザへその旨報知する第4のステップとを有する文書区切り方法を提供する。
【0018】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第2のステップにて提供したユーザインタフェイスを介して取得する第3のステップと、前記文書ファイリング装置が、前記第3のステップにて取得した区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に含まれているページ画像データの特徴を表す特徴量と該文書単位に含まれている他のページ画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第4のステップとを有する文書区切り方法を提供する。
【0019】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第2のステップにて提供したユーザインタフェイスを介して取得する第3のステップと、前記文書ファイリング装置が、前記第3のステップにて取得した区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に対応する文書画像データの特徴を表す特徴量と他の文書単位に対応する文書画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第4のステップとを有する文書区切り方法を提供する。
【0020】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記第2のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取り、前記ページ画像データの特徴を表す特徴量に基づいて特定された区切りとが異なる場合には、前記ユーザへその旨報知する第3のステップとを有する文書区切り方法を提供する。
【0021】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記第2のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取るとともに、該区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に含まれているページ画像データの特徴を表す特徴量と該文書単位に含まれている他のページ画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第3のステップとを有する文書区切り方法を提供する。
【0022】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記第2のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取るとともに、該区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に対応する文書画像データの特徴を表す特徴量と他の文書単位に対応する文書画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第3のステップとを有する文書区切り方法を提供する。
【0023】
このような文書ファイリング装置、文書区切り方法、該文書区切り方法の各ステップに係る処理をコンピュータ装置に実現させるためのプログラムおよびコンピュータ装置読み取り可能な記録媒体であって、該プログラムを記録した記録媒体によれば、ユーザによって入力された文書単位の区切りと、その文書単位に属するページ画像データの特徴とが矛盾する場合には、ユーザへその旨報知される。なお、以下の説明においては、ある文書の1ページ分の画像データを「ページ画像データ」とよぶ。また、ある文書の各ページの画像データからなるページ画像データの集合、すなわち、1文書分のページ画像データの集合を「文書画像データ」とよぶ。
【0024】
【発明の実施の形態】
以下、本発明の実施形態について図面を参照しつつ説明する。
【0025】
[1.第1実施形態]
(A:構成)
図1は、本発明の一実施形態に係る文書ファイリング装置の構成例を示す図である。図1に示されているように、本実施形態に係る文書ファイリング装置は、画像入力手段10と、特徴量抽出手段20と、画像格納手段30と、類似度評価手段40と、ユーザインタフェイス手段50と、区切り評価手段60と、これら各構成要素を接続するバス70とを備えている。本実施形態においては、特徴量抽出手段20、類似度評価手段40および区切り評価手段60は、例えばCPU(Central Processing Unit)などの制御手段が所定のプログラムを実行することによって実現されるソフトウェアモジュールである。なお、係るプログラムを一般的なコンピュータ装置にインストールし実行させることによって、係るコンピュータ装置に本発明に係る文書ファイリング装置と同一の機能を付与するとしても良いことは勿論である。このようなことは、例えば、CD−ROM(Compact Disk −Read Only Memory)などのコンピュータ装置読み取り可能な記録媒体に係るプログラムを記録しておき、この記録媒体に記録されているプログラムをコンピュータ装置に読み取らせ、実行させることによって実現される。
【0026】
画像入力手段10は、例えばADFを備えたスキャナ装置である。ユーザによってADFに原稿がセットされると、画像入力手段10においては、この原稿が1ページずつスキャナ装置へ送られて画像読み取り処理が行われる。この画像読み取り処理によって、原稿の各ページに対応するページ画像データが取得される。このようにして取得されたページ画像データは、画像格納手段30へ文書単位で格納される。なお、本実施形態においては、画像入力手段10が文書ファイリング装置のバス70に直結されている場合について説明するが、この画像入力手段10は、例えばLAN(Local Area Network)などのネットワークを介して文書ファイリング装置に接続されていても良いことは勿論である。また、この画像入力手段10として、スキャナ装置に替えて、例えばICカードやスマートメディアなどのメモリカードに格納されているページ画像データを連続して読み出すメモリリーダ装置を用いても良いことは勿論である。
【0027】
特徴量抽出手段20は、画像入力手段10を用いて入力中のページ画像データ、あるいは、画像格納手段30に格納されているページ画像データから、そのページ画像データの特徴を表す特徴量を抽出するためのものである。この特徴量抽出手段20によって抽出される特徴量としては、そのページ画像データの色調、縦横比、輝度、色分布、エッジの分布状態および平坦なエリアの分布状態などを表す情報が挙げられる。以下、特徴量抽出手段20がページ画像データから特徴量を抽出する過程について図2を参照しつつ説明する。
【0028】
特徴量抽出手段20は、まず、ページ画像データを縦方向にX分割、横方向にY分割する。すなわち、特徴量抽出手段20は、ページ画像データをX*Y個の小領域に分割する(図2左参照)。なお、図2の左側の部分では、ページ画像データを縦方向に6分割、横方向に4分割し、6*4=24個の小領域に分割する場合について例示されている。次に、特徴量抽出手段20は、分割した各小領域に対して画像解析処理を行い各領域毎に特徴量を算出する。特徴量としては、上述したように様々な情報を採用することができるが、ここでは、一例として階調度を採用する場合について説明する。特徴量抽出手段20は、まず、1つの領域の色のR、G、Bの各成分を求める。そして、特徴量抽出手段20は、このR、G、Bの各成分をL*a*b空間(特徴色空間)での色成分を表す3個の量に変換する。その結果、全24領域から、合計24*3=72個の値が抽出される(図2中央参照)。特徴量抽出手段20は、このようにして抽出された72個の値を成分とする72次元ベクトルを特徴量として抽出する(図2右参照)。なお、ページ画像データから算出する特徴量は、画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、平坦なエリアの分布状態のどれか一つでもよいし、複数であってもよい。例えば、ページ画像データに表される画像の領域を24分割した場合、一つの領域から色調、エッジ状態を抽出し、特徴量を144次元のベクトルとして表してもよい。また、主成分解析等の手法を用いて、できるだけページ画像データの特徴を損なうことなく算出した特徴量の数を減らしてもよい。これにより、類似度評価手段40によって行われる計算量を減少することができる。従って、算出すべき特徴量の種類数は問われない。また、分割する領域の数は問われない。
【0029】
画像格納手段30は、例えば、ハードディスクドライブやDVD−RAM(Digital Video Disc−Random Access Memory)ドライブ等の大容量記憶装置であり、画像入力手段10によって入力されたページ画像データを文書単位で格納するものである。なお、ページ画像データを文書単位で格納する具体的な態様としては、例えば、文書単位にファイルフォルダを作成して、その文書単位に含まれるページ画像データに入力順の一連番号を含んだファイル名を付与してそのファイルフォルダへ格納する態様や、複数ページを保持できるマルチページTIFFのような画像ファイルフォーマットで格納する態様が挙げられる。
【0030】
類似度評価手段40は、2つのページ画像データが類似しているか否かを、それらページ画像データの特徴量に基づいて評価するためのものである。以下では、各ページ画像データの特徴を表す特徴量として、上述したベクトル表現の特徴量(以下、このような特徴量を「特徴ベクトル」という)が抽出されている場合について説明する。類似度評価手段40は、まず、2つの特徴ベクトル間の距離(すなわち、2つの特徴ベクトルの差の大きさ:具体的には、ユークリッド距離やマハラノビス距離)を算出する。そして、類似度評価手段40は、算出された距離に基づいて、それら特徴ベクトルで特徴を表されているページ画像データが類似しているか否かを判定する。具体的には、類似度評価手段40は、2つの特徴ベクトル間の距離が所定の閾値よりも小さい場合(図3左側参照)には、それら特徴ベクトルで特徴を表されているページ画像データが類似していると判定する。逆に、類似度評価手段40は、2つの特徴ベクトル間の距離が所定の閾値以上である場合(図3右側参照)には、それら特徴ベクトルで特徴を表されているページ画像データが類似していないと判定する。
【0031】
ユーザインタフェイス手段50は、画像入力手段10により読み込まれた複数のページ画像データをユーザの主観に基づいて文書単位に区切らせ、文書単位毎に画像格納手段30に格納させるためのものである。このユーザインタフェイス手段50は、表示手段と区切り入力手段とを含んでいる。表示手段は、例えば、CRT(Cathode Ray Tube)や液晶ディスプレイなどの画像表示装置であり、図4に示す操作画面を表示する。図4に示されるように、この操作画面には、上記画像入力手段10によって入力されたページ画像データの各々を表すアイコンの一覧(以下、「サムネイル」という)が表示される。また、この表示手段は、画像入力手段10によって入力されたページ画像データに応じた画像や、画像格納手段30に格納されているページ画像データに応じた画像を表示する画像出力手段としても機能する。なお、本実施形態では、上記表示手段を画像出力手段として用いる場合について説明するが、ユーザの所望する画像を所定の形式で出力するための画像出力手段を上記表示手段の他に設けても良いことは言うまでもない。このような画像出力手段としては、例えば、プリンタ装置や、磁気ディスクやメモリカードなどのリード/ライト装置、ネットワークなどを介してデータの授受を行うデータ転送装置などが挙げられる。このような画像出力手段からは、紙に印刷された文書や、HTML(Hyper Text Mark up Language)などにより整形されたファイルが出力結果として出力される。区切り入力手段は、例えば、マウスやタブレットなどのポインティングデバイスであり、ユーザに文書単位の区切りを入力させるためのものである。本実施形態では、図4に示す操作画面を視認したユーザは、各ページ画像データに対応するアイコンの間の領域をポインティングデバイスにより指定することにより、文書単位の区切りを入力することができる。
【0032】
区切り評価手段60は、上記ユーザインタフェイス手段50を介してユーザによって入力された区切りの妥当性を各ページ画像データの特徴量に基づいて評価するためのものである。より詳細に説明すると、本実施形態に係る区切り評価手段60は、全ての区切りが入力された後に、ユーザによって入力された区切りと、ページ画像データの特徴量に基づいて特定される区切りとを比較し、両者が一致している場合にのみ、ユーザの入力した区切りは妥当であると判定する(図5参照)。なお、区切り評価手段60に、画像入力手段10によって読み込まれた複数のページ画像データを、その特徴量に基づいて文書単位に区切らせる方法としては、特許文献4に開示されている技術を用いることが挙げられる。そして、区切り評価手段60は、ユーザの入力した区切りが妥当であると判定した場合には、その区切りに基づいてページ画像データを文書単位で画像格納手段30へ格納し、逆に、妥当ではないと判定した場合には、その旨ユーザへ報知するものである。
【0033】
(B:動作)
次に、上述した第1実施形態に係る文書ファイリング装置の動作について図6を参照しつつ説明する。ユーザは、まず、電子化を所望する1又は複数の文書からなる原稿を画像入力手段10のADFへセットし、例えば、スキャナ装置に設けられているスタートボタンを押下するなどして、原稿の読み込みを開始することを指示する。すると、文書ファイリング装置は、画像入力手段10によって、ADFにセットされている原稿を1ページずつ連続して読み取り、読み取った画像に対応するページ画像データを取得する(ステップSA1)。
【0034】
次いで、文書ファイリング装置は、ADFにセットされている原稿を全て読み取ると、読み取ったページ画像データを文書単位に区切るための操作画面(図4参照)をユーザインタフェイス手段50に表示させる。この操作画面を視認したユーザは、各自の主観に基づいて文書単位の区切りをユーザインタフェイス手段50を用いて入力することができる。文書ファイリング装置は、このようにして入力された文書単位の区切りをユーザインタフェイス手段50を介して取得する(ステップSA2)。
【0035】
次いで、文書ファイリング装置の区切り評価手段60は、全ての区切りを入力されたか否かを判定する(ステップSA3)。そして、区切り評価手段60は、ステップSA3の判定結果が“Yes”である場合には、ユーザによって入力された区切りを評価し(ステップSA4)、逆に、ステップSA3の判定結果が“No”である場合には、上記ステップSA2の処理を繰り返し実行する。本第1実施形態に係る文書ファイリング装置は、このようにして、全ての区切りが入力された後に、それらの区切りの妥当性を評価している。次に、上述したステップSA4において、区切り評価手段60が行う区切り評価処理について図7を参照しつつ説明する。
【0036】
図7は、区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。図7に示されるように、区切り評価手段60は、まず、上述したステップSA1にて入力された原稿に含まれている文書の区切りを各ページ画像データの特徴に基づいて特定する(ステップSB1)。具体的には、区切り評価手段60は、ステップSA1にて読み取ったページ画像データに対して、前述した特許文献4に開示されている技術を適用することにより、文書単位の区切りを特定する。そして、区切り評価手段60は、上述したステップSA2にユーザによって入力された区切りと、ステップSB1にて特定した区切りとを比較し、両者が一致しているか否かを判定する(ステップSB2)。
【0037】
ステップSB2の判定結果が“Yes”である場合には、区切り評価手段60は、ステップSA2にてユーザにより入力された区切りに基づいて、ステップSA1にて読み取ったページ画像データを文書単位に分割し、文書単位毎に画像格納手段30へ格納する(ステップSB3)。逆に、ステップSB2の判定結果が“No”である場合には、アラートメッセージをユーザインタフェイス手段50に表示させる(ステップSB4)。なお、このアラートメッセージの内容としては、入力した区切りが誤っていないかをユーザに確認するものや、区切りを入力し忘れていないかをユーザに確認するものなどが挙げられる。このアラートメッセージを視認したユーザは、各自の入力した区切り結果を再確認し、必要があればユーザインタフェイス手段50を用いて区切りを修正し、文書単位の区切りを確定する。すると、区切り評価手段60は、このようにして確定された区切りに基づいて、ステップSA1にて読み取ったページ画像データを文書単位に分割し、文書単位毎に画像格納手段30へ格納する(ステップSB5)。
【0038】
[2.第2実施形態]
次いで、本発明の第2実施形態に係る文書ファイリング装置について説明する。第2実施形態に係る文書ファイリング装置が第1実施形態に係る文書ファインリング装置と異なっている点は、ユーザが区切りを入力する度に、その区切りを逐次評価する点のみである。本第2実施形態に係る文書ファイリング装置の構成は、上述した第1実施形態に係る文書ファイリング装置の構成(図1参照)と同一であるため、詳細な説明は省略する。以下、本第2実施形態に係る文書ファイリング装置の動作について図8を参照しつつ説明する。以下では、本第2実施形態に係る文書ファイリング装置のADFには、1又は複数の文書からなる原稿がユーザによってセットされ、原稿の読み取りを開始する旨の操作がユーザによって行われたものとする。
【0039】
図8に示されるように、本第2実施形態に係る文書ファイリング装置は、まず、ADFにセットされている原稿を1ページつ連続して読み取り(ステップSC1)、ADFにセットされている原稿を全て読み取ると、ユーザインタフェイス手段50に操作画面(図4参照)を表示させる。そして、文書ファイリング装置は、ユーザによって入力された区切りをユーザインタフェイス手段50を介して取得し(ステップSC2)、その区切りを区切り評価手段60を用いて評価する(ステップSC3)。なお、ステップSC3にて区切り評価手段60が行う区切り評価処理については、上述した第1実施形態に係る文書ファイリング装置の区切り評価手段60が行う区切り評価処理(図7参照)と同一であるため、説明を省略する。以降、文書ファイリング装置は、全ての区切りを入力されたか否かを判定し(ステップSC4)、ステップSC4の判定結果が“Yes”になるまで、上述したステップSC2およびSC3の処理を繰り返し実行する。このようにして、本第2実施携帯に係る文書ファイリング装置は、ユーザによって区切りを入力される度に、その区切りを評価することができる。
【0040】
[3.変形例]
以上、本発明の実施形態について説明したが、本発明は係る実施形態に限定されるものではなく、その技術思想の範囲内で様々な変形が可能である。なお、変形例としては、例えば、以下のようなものが考えられる。
【0041】
(変形例1)上述した第1および第2実施形態においては、ページ画像データの特徴を表す特徴量として、画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、又は平坦なエリアの分布状態等を抽出した。このような情報は、プレゼンテーション用資料等のように文書の全部又はほとんどを画像が占めている場合には非常に有効である。しかしながら、契約書等のように大部分が文字からなるような文書である場合には、あまり有効ではないこともある。したがって、本変形例においては、ページ画像データから色調や輝度といった情報を抽出するのではなく、文字の高さ、字間、行間、縦書き・横書き等の文書フォーマットの特徴を示す情報(以下、フォーマット特徴量という)を抽出し、このフォーマット特徴量に基づいて2つの文書の類非を判定する場合について説明する。
【0042】
契約書などの文書においては、1つの文書ではその体裁を統一することが一般的である。したがって、上述したようなフォーマットの特徴が同様なページ画像データは、同一の文書に属すると推定することができる。反対に、異なる文書に属するページ画像データ間では、意図的に同一のフォーマットで作成された文書でない限り、フォーマット特徴量が等しくなることは極めて稀である。このように、ほとんど文字によって構成される文書に対しては、上記フォーマット特徴量を用いることによって、そのページ画像データの類似性を正確に判定することができる。
【0043】
スキャナ装置から入力したページ画像データに対して、文字の高さ、字間、行間などのフォーマット特徴量を求めるには、従来から様々な技術が提案されている。その一例が、特開平5−108793号公報に開示されている技術である(段落0009から0012参照)。当該技術においては、横書きであることを前提としてbを行間、dを字間としている。しかし、通常は行間の方が字間より大きいので、bとdを比較して大きい方を行間、小さい方を字間とし、bの方が大きい場合は横書き、dの方が大きい場合は縦書きと、縦書き・横書きの別も判断しても良い。
【0044】
一般に、同一文書に属するページであっても、タイトル行、要約部、本文など、文書を構成する部位によってフォントの大きさや行間隔などが多少異なる場合もある。例えば、表題の文字は、本文よりも大きいフォントに設定される場合がある。したがって、上述したフォーマット特徴量を抽出しても、文書を構成する部位によってその値は異なり、ページ全体で一貫しないのが普通である。フォーマット特徴量の値が一貫しないと、フォーマット特徴量を用いて各々のページの文書画像が同一文書に属するのか否かを判定するのが困難になる。この問題については以下のようにして対処することができる。
【0045】
まず、図2を参照して説明した方法と同様、入力されたページ画像データを複数の領域に分割する。次に分割された領域の各々について、文字の高さ、字間、行間、縦書き・横書きなど情報を含むフォーマット特徴量を算出する。以下では、文字の高さ「10pt」、字間「15pt」、行間「10.5pt」、縦書き・横書き「0」という値が得られたものとする。なお、本変形例においては、縦書きの場合には「0」を、横書きの場合は「1」を対応付けるものとする。
【0046】
次に、算出された全ての領域に係る特徴量のなかで最も頻繁に出現する値を決定し、これをそのページの特徴量とする。例えば、全24個の領域のうち、20個の領域において文字の高さが「10pt」であり、3個の領域において「12pt」、1つの領域では「16pt」であった場合は、当該ページの文字の高さにかかる特徴量として「10pt」が算出される。字間、行間、縦書き・横書きについても同様である。
【0047】
一般的に言えば、表題や見出しがページ全体に占める割合は、文書を特徴付けている本文に比べて小さい。したがって、最頻出の値は、本文の特徴を表した量であるとみなすことができる。これによって、文書に表題や見出し部が存在したとしても、ページ画像データから的確に特徴量を得ることができる。
【0048】
このようにして、1ページ分のページ画像データから、当該ページの文書フォーマットの特徴を表す特徴ベクトル(以下、フォーマット特徴ベクトルという)が求められる。下にフォーマット特徴ベクトルのfの一例を示す。以下、上述した第1および第2実施形態の場合と同様に、2つの特徴ベクトルの間の距離を類似度評価手段40に算出させ、算出された距離に基づいて、これら2つの特徴ベクトルで特徴を表されているページ画像データの類非を類似度評価手段40に評価させることができる。
【0049】
【数1】
f=(文字の高さ、字間、行間、[縦書き:0,横書き:1])
【0050】
(変形例2)上述した第1および第2実施形態では、区切り評価手段60が、特許文献4に開示されている技術を適用することによって得られる区切りと一致しているか否かに基づいて、ユーザによって入力された区切りを評価する場合について説明した(図5参照)。しかしながら、ユーザによって入力された区切りを区切り評価手段60に評価させる際の評価基準は、係る評価基準に限定されるものではない。例えば、図9に示されるように、原稿に含まれている一連の文書の各々が、各文書単位内で類似した特徴を有している場合には、図7に示される区切り評価処理に替えて、図10に示される区切り評価処理を区切り評価手段60に行わせるとしても良い。
【0051】
図10は、本変形例1に係る文書ファイリング装置の区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。図10に示されるように、区切り評価手段60は、まず、前述したステップSA2(図6参照)にて、ユーザによって入力された区切りに基づいて、ステップSA1(図6参照)にて入力されたページ画像データを文書単位に分割する(ステップSD1)。
【0052】
そして、区切り評価手段60は、ステップSD1にて分割された文書単位毎に特徴量抽出手段20を用いて特徴量を抽出する(ステップSD2)。具体的には、区切り評価手段60は、図9に示されるように、以下の3つの特徴量を文書単位毎に抽出する。第1の特徴量は、文書単位の先頭に位置するページ画像データの特徴量である。第2の特徴量は、文書単位の中央に位置するページ画像データの特徴量である。第3の特徴量は、文書単位の末尾に位置するページ画像データの特徴量である。
【0053】
次に、区切り評価手段60は、各文書単位毎に、ステップSD2にて抽出した3つの特徴量が類似しているか否かを類似度評価手段40によって評価する(ステップSD3)。以下、区切り評価手段60は、ステップSD3の判定結果が“Yes”である場合には、前述したステップSB3の処理を行い、逆に、ステップSD3の判定結果が“No”である場合には、ステップSB4およびステップSB5の処理を行う。以上に説明したように、文書ファイリング装置に入力される原稿に含まれている一連の文書の各々が、各文書単位内で類似した特徴を有している場合には、図10に示される区切り評価処理を区切り評価手段60に行わせることにより、ユーザによって入力された文書単位の区切りの妥当性を評価することが可能になる。
【0054】
また、図11に示されるように、原稿に含まれている一連の文書の各々の特徴が互いに類似している場合には、図7に示される区切り評価処理に替えて、図12に示される区切り評価処理を区切り評価手段60に行わせるとしても良い。
【0055】
図12は、本変形例1に係る文書ファイリング装置の区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。図12に示される区切り評価処理が、図10に示される区切り評価処理と異なっている点は、ステップSD3に替えてステップSE3を設けた点のみである。以下、このステップSE3において、区切り評価手段60が行う処理について詳細に説明する。なお、以下に説明する動作の前提として、N−1個(N:自然数)の区切りがユーザによって入力されており、画像入力手段10によって入力されたページ画像データが、N個の文書単位に区切られているものとする。このような状況下で、さらに、N個目の区切りがユーザによって入力されたものとする。
【0056】
図12のステップSE3において、区切り評価手段60は、N+1番目の文書単位の上記3つの特徴量(以下、文書単位に属するページ画像データの特徴を表す特徴量の集合を「文書画像データの特徴量」という)と、1番目からN番目の各々の文書単位の文書画像データの特徴量とが類似しているか否かを比較する。なお、文書画像データの特徴量同士を比較する場合には、例えば、そのれら文書画像データの特徴量を構成しているページ画像データの特徴量の重心を代表として比較することによって実現される。なお、複数の特徴量の代表は、それら特徴量の重心に限定されるものではない。また、前述した第2実施形態に係る文書ファイリング装置へ本変形例を適用する場合には、ユーザが最初に入力した区切りに対しては、上記評価を行わない。その理由は、比較対象となる文書単位がないからである。
【0057】
そして、区切り評価手段60は、ステップSE3の判定結果が“Yes” である場合には、前述したステップSB3の処理を行い、逆に、ステップSE3の判定結果が“No”である場合には、ステップSB4およびステップSB5の処理を行う。以上に説明したように、原稿に含まれている一連の文書の各々の特徴が互いに類似している場合には、図12に示される区切り評価処理を区切り評価手段60に行わせることにより、ユーザによって入力された文書単位の区切りの妥当性を評価することが可能になる。
【0058】
(変形例3)上述した第1および第2実施形態では、ユーザの入力した区切りが妥当ではないと判定した場合に、アラートメッセージを表示することによって、その旨ユーザへ報知する態様について説明した。しかしながら、ユーザによって入力された区切りが妥当ではない旨ユーザへ報知する態様は、アラートメッセージの表示による態様に限定されるものではない。例えば、妥当ではないと判定された区切り付近を強調表示する態様であっても良い。このようにすると、妥当ではない区切りをわかり易くユーザへ報知することが可能になるといった効果を奏する。
【0059】
(変形例4)上述した第1および第2実施形態では、ユーザの入力した区切りが妥当であるか否かをページ画像データの特徴量に基づいて判定する場合について説明した。しかしながら、入力されたページ画像データに対して特許文献4に開示されている技術を適用することによって特定された区切りを予め強調表示したユーザインタフェイス手段50に表示させるとしても良い。このようにすると、ユーザは次に入力すべき区切りを事前に把握することができるといった効果を奏する。
【0060】
【発明の効果】
本発明によれば、手動による区切り作業におけるユーザの負担を軽減しつつ、一括して読み込まれた複数のページ画像データを効率的に文書単位に区切ることが可能になるといった効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1実施形態に係る文書ファイリング装置の機能構成の一例を示す図である。
【図2】同文書ファイリング装置の特徴量抽出手段20が抽出する特徴量を説明するための図である。
【図3】同文書ファイリング装置の特徴量の類似関係を説明するための図である。
【図4】同文書ファイリング装置のユーザインタフェイス手段50に表示される操作画面の一例を示す図である。
【図5】手動区切り結果の妥当性判定基準を説明するための図である。
【図6】同文書ファイリング装置が行う動作の流れを示すフローチャートである。
【図7】同文書ファイリング装置の区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。
【図8】本発明の第2実施形態に係る文書ファイリング装置が行う動作の流れを示すフローチャートである。
【図9】変形例2に係る妥当性判定基準を説明するための図である。
【図10】変形例2に係る文書ファイリング装置の区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。
【図11】変形例2に係る妥当性判定基準を説明するための図である。
【図12】変形例2に係る文書ファイリング装置の区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。
【符号の説明】
10…画像入力手段、20…特徴量抽出手段、30…画像格納手段、40…類似度評価手段、50…ユーザインタフェイス手段、60…区切り評価手段、70…バス。
【発明の属する技術分野】
本発明は、紙文書を電子化する技術に関する。
【0002】
【従来の技術】
紙文書は、情報の伝達や記録を行うための媒体として優れたものであるが、これを保存するためのスペースを必要とする。また、情報を紙文書に記録して保存する場合、後にその紙文書が必要になったときには、例えば書庫に収納された多くの紙文書のなかから目的とする紙文書を探さなければならない。したがって、紙文書に記録して保存するという形態は、業務の効率化の観点からも好ましくない。このような背景の下、紙文書を電子化して保存することが行われるようになってきている。具体的には、ユーザは1ページずつ紙文書をスキャナ装置にセットし、このスキャナ装置により、紙文書の各ページを読み込み、画像データとして電子ファイルに格納する。
【0003】
このような方法は、電子ファイル化すべき紙文書のページ数が多い場合には非効率的である。このため、紙文書のページ数が多い場合には、オートドキュメントフィーダ(Auto Document Feeder:以下、「ADF」という)と呼ばれる自動給紙機構を備えたスキャナ装置を用いて、紙文書の各ページを連続して自動的に読み取る処理が広く行われている。
【0004】
ところで、状況によっては、電子化すべき紙文書が一度に多数発生する場合がある。このような場合に、各紙文書を一文書ずつADFにセットして読み取り処理を行わせれば、文書単位で紙文書を電子ファイル化することが可能である。しかし、この方法を採った場合、一文書毎に、紙文書をADFにセットし、読み取り処理を行わせるための操作を行わなければならないので、ユーザにとって煩雑である。一方、複数種類の紙文書を全部まとめてADFにセットし、読み取り処理を行わせれば、複数種類の紙文書を一括して電子ファイル化することができる。しかし、この方法を採った場合、1つの電子化ファイルに複数種類の紙文書の画像データがまとめて格納されるので、後に個々の紙文書を検索し閲覧するのに不便である。そこで、複数種類の紙文書を一括して読み取り、かつ、紙文書の画像データを文書毎に電子ファイル化する技術が求められている。このようなニーズに対し、従来から幾つかの技術が提案されている(例えば、特許文献1、2、3および4)。
【0005】
特許文献1には、次のような電子ファイリング装置が開示されている。まず、該装置のユーザは、電子化したい文書が複数ある場合に、それらの複数の文書間に予め特定の文書区切り用原稿を挿入しておく。そして、この文書区切り用原稿を挿入した複数文書からなる原稿をADFにセットし、該装置に画像読み取り処理を行わせる。該装置では、この画像読み取り処理により得られた全ページのページ画像データのなかから、文書区切り用原稿に相当する画像データを認識し、ページ画像データを文書単位に電子ファイル化する。
【0006】
また、特許文献2には、次のような電子ファイリング装置が開示されている。すなわち、該装置のユーザは、電子ファイル化したい文書が複数ある場合に、各文書において文書区切りとなるページの裏面に文書区切りマークを予め付加しておく。該装置では、複数文書からなる原稿の各ページの裏表両面をスキャナ装置で読み取り、この文書区切りマークを認識して各文書のページ画像データを文書単位に電子ファイル化する。
【0007】
また、特許文献3には、次のような電子ファイリング装置が開示されている。すなわち、該装置は、スキャナ装置で読み取った画像データから予め設定しておいた文字認識エリア部分を切り出し、文字認識処理を行い、この文字認識結果に基づき文書の区切りを判定する。
【0008】
さらに、特許文献4には、ADFを持つスキャナ装置により複数の文書を一括して読み取り、読み取った画像の特徴量を算出し、この特徴量に基づいて文書単位の区切りを判定する技術が開示されている。
【0009】
【特許文献1】
特開平1−162474号公報
【特許文献2】
特開平7−287747号公報
【特許文献3】
特開平10−21380号公報
【特許文献4】
特開2002−24258号公報
【0010】
【発明が解決しようとする課題】
以上に説明した従来技術のなかでも、特に、特許文献4に開示された技術によれば、予め文書区切り用原稿を各文書間に挿入したり、文書区切りマークを付加するなど原稿に手を加えることなく文書区切りを電子ファイリング装置に検出させることができるので、ユーザに掛かる負担が大幅に軽減される。
【0011】
しかしながら、特許文献4に開示されている技術では、読み取った画像の特徴に基づいて文書が区切られるので、電子ファイリング装置によって検出された区切りと実際の文書の区切りとが常に一致するとは限らない。このため、ユーザは、電子ファイリング装置によって為された区切りを全て目視で確認し、電子ファイリング装置によって為された区切りが適切ではない場合には、手動で区切りを修正しなければならない。
【0012】
その一方、特許文献4に開示されている技術を利用せず、ユーザが、全ての画像データを目視で確認しながら文書単位の区切りを全て手動で入力するとしたならば、効率が悪いことは言うまでもない。加えて、ユーザ自身が区切り位置を間違える可能性も低くない。
【0013】
本発明は、上記課題に鑑みて為されたものであり、一括して読み込まれたページ画像データを文書単位毎に区切る際に、ユーザに掛かる負担を軽減させる技術を提供することを目的としている。
【0014】
【課題を解決するための手段】
上記課題を解決するために、本発明は、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、前記画像入力手段によって取得されたページ画像データを文書単位に区切る際の区切りを前記特徴量に基づいて特定する特定手段と、前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、前記区切り入力手段によって入力された区切りと、前記特定手段によって特定された区切りとを比較し、両者が異なる場合には、前記ユーザへその旨報知する報知手段とを有する文書ファイリング装置を提供する。
【0015】
また、上記課題を解決するために、本発明は、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、前記区切り入力手段によって入力された区切りに基づいて前記ページ画像データを文書単位に分割した場合に、ある文書単位に含まれているページ画像データの特徴量と該文書単位に含まれている他のページ画像データの特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する報知手段とを有する文書ファイリング装置を提供する。
【0016】
また、上記課題を解決するために、本発明は、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、前記区切り入力手段によって入力された区切りに基づいて前記ページ画像データを文書単位に分割した場合に、ある文書単位に対応する文書画像データの特徴量と他の文書単位に対応する文書画像データの特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する報知手段とを有する文書ファイリング装置を提供する。
【0017】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第2のステップにて提供したユーザインタフェイスを介して取得する第3のステップと、前記文書ファイリング装置が、前記第3のステップにて取得した区切りと前記ページ画像データの特徴を表す特徴量に基づいて特定された区切りとが異なる場合には、前記ユーザへその旨報知する第4のステップとを有する文書区切り方法を提供する。
【0018】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第2のステップにて提供したユーザインタフェイスを介して取得する第3のステップと、前記文書ファイリング装置が、前記第3のステップにて取得した区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に含まれているページ画像データの特徴を表す特徴量と該文書単位に含まれている他のページ画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第4のステップとを有する文書区切り方法を提供する。
【0019】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第2のステップにて提供したユーザインタフェイスを介して取得する第3のステップと、前記文書ファイリング装置が、前記第3のステップにて取得した区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に対応する文書画像データの特徴を表す特徴量と他の文書単位に対応する文書画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第4のステップとを有する文書区切り方法を提供する。
【0020】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記第2のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取り、前記ページ画像データの特徴を表す特徴量に基づいて特定された区切りとが異なる場合には、前記ユーザへその旨報知する第3のステップとを有する文書区切り方法を提供する。
【0021】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記第2のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取るとともに、該区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に含まれているページ画像データの特徴を表す特徴量と該文書単位に含まれている他のページ画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第3のステップとを有する文書区切り方法を提供する。
【0022】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、前記第1のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、前記文書ファイリング装置が、前記第2のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取るとともに、該区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に対応する文書画像データの特徴を表す特徴量と他の文書単位に対応する文書画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第3のステップとを有する文書区切り方法を提供する。
【0023】
このような文書ファイリング装置、文書区切り方法、該文書区切り方法の各ステップに係る処理をコンピュータ装置に実現させるためのプログラムおよびコンピュータ装置読み取り可能な記録媒体であって、該プログラムを記録した記録媒体によれば、ユーザによって入力された文書単位の区切りと、その文書単位に属するページ画像データの特徴とが矛盾する場合には、ユーザへその旨報知される。なお、以下の説明においては、ある文書の1ページ分の画像データを「ページ画像データ」とよぶ。また、ある文書の各ページの画像データからなるページ画像データの集合、すなわち、1文書分のページ画像データの集合を「文書画像データ」とよぶ。
【0024】
【発明の実施の形態】
以下、本発明の実施形態について図面を参照しつつ説明する。
【0025】
[1.第1実施形態]
(A:構成)
図1は、本発明の一実施形態に係る文書ファイリング装置の構成例を示す図である。図1に示されているように、本実施形態に係る文書ファイリング装置は、画像入力手段10と、特徴量抽出手段20と、画像格納手段30と、類似度評価手段40と、ユーザインタフェイス手段50と、区切り評価手段60と、これら各構成要素を接続するバス70とを備えている。本実施形態においては、特徴量抽出手段20、類似度評価手段40および区切り評価手段60は、例えばCPU(Central Processing Unit)などの制御手段が所定のプログラムを実行することによって実現されるソフトウェアモジュールである。なお、係るプログラムを一般的なコンピュータ装置にインストールし実行させることによって、係るコンピュータ装置に本発明に係る文書ファイリング装置と同一の機能を付与するとしても良いことは勿論である。このようなことは、例えば、CD−ROM(Compact Disk −Read Only Memory)などのコンピュータ装置読み取り可能な記録媒体に係るプログラムを記録しておき、この記録媒体に記録されているプログラムをコンピュータ装置に読み取らせ、実行させることによって実現される。
【0026】
画像入力手段10は、例えばADFを備えたスキャナ装置である。ユーザによってADFに原稿がセットされると、画像入力手段10においては、この原稿が1ページずつスキャナ装置へ送られて画像読み取り処理が行われる。この画像読み取り処理によって、原稿の各ページに対応するページ画像データが取得される。このようにして取得されたページ画像データは、画像格納手段30へ文書単位で格納される。なお、本実施形態においては、画像入力手段10が文書ファイリング装置のバス70に直結されている場合について説明するが、この画像入力手段10は、例えばLAN(Local Area Network)などのネットワークを介して文書ファイリング装置に接続されていても良いことは勿論である。また、この画像入力手段10として、スキャナ装置に替えて、例えばICカードやスマートメディアなどのメモリカードに格納されているページ画像データを連続して読み出すメモリリーダ装置を用いても良いことは勿論である。
【0027】
特徴量抽出手段20は、画像入力手段10を用いて入力中のページ画像データ、あるいは、画像格納手段30に格納されているページ画像データから、そのページ画像データの特徴を表す特徴量を抽出するためのものである。この特徴量抽出手段20によって抽出される特徴量としては、そのページ画像データの色調、縦横比、輝度、色分布、エッジの分布状態および平坦なエリアの分布状態などを表す情報が挙げられる。以下、特徴量抽出手段20がページ画像データから特徴量を抽出する過程について図2を参照しつつ説明する。
【0028】
特徴量抽出手段20は、まず、ページ画像データを縦方向にX分割、横方向にY分割する。すなわち、特徴量抽出手段20は、ページ画像データをX*Y個の小領域に分割する(図2左参照)。なお、図2の左側の部分では、ページ画像データを縦方向に6分割、横方向に4分割し、6*4=24個の小領域に分割する場合について例示されている。次に、特徴量抽出手段20は、分割した各小領域に対して画像解析処理を行い各領域毎に特徴量を算出する。特徴量としては、上述したように様々な情報を採用することができるが、ここでは、一例として階調度を採用する場合について説明する。特徴量抽出手段20は、まず、1つの領域の色のR、G、Bの各成分を求める。そして、特徴量抽出手段20は、このR、G、Bの各成分をL*a*b空間(特徴色空間)での色成分を表す3個の量に変換する。その結果、全24領域から、合計24*3=72個の値が抽出される(図2中央参照)。特徴量抽出手段20は、このようにして抽出された72個の値を成分とする72次元ベクトルを特徴量として抽出する(図2右参照)。なお、ページ画像データから算出する特徴量は、画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、平坦なエリアの分布状態のどれか一つでもよいし、複数であってもよい。例えば、ページ画像データに表される画像の領域を24分割した場合、一つの領域から色調、エッジ状態を抽出し、特徴量を144次元のベクトルとして表してもよい。また、主成分解析等の手法を用いて、できるだけページ画像データの特徴を損なうことなく算出した特徴量の数を減らしてもよい。これにより、類似度評価手段40によって行われる計算量を減少することができる。従って、算出すべき特徴量の種類数は問われない。また、分割する領域の数は問われない。
【0029】
画像格納手段30は、例えば、ハードディスクドライブやDVD−RAM(Digital Video Disc−Random Access Memory)ドライブ等の大容量記憶装置であり、画像入力手段10によって入力されたページ画像データを文書単位で格納するものである。なお、ページ画像データを文書単位で格納する具体的な態様としては、例えば、文書単位にファイルフォルダを作成して、その文書単位に含まれるページ画像データに入力順の一連番号を含んだファイル名を付与してそのファイルフォルダへ格納する態様や、複数ページを保持できるマルチページTIFFのような画像ファイルフォーマットで格納する態様が挙げられる。
【0030】
類似度評価手段40は、2つのページ画像データが類似しているか否かを、それらページ画像データの特徴量に基づいて評価するためのものである。以下では、各ページ画像データの特徴を表す特徴量として、上述したベクトル表現の特徴量(以下、このような特徴量を「特徴ベクトル」という)が抽出されている場合について説明する。類似度評価手段40は、まず、2つの特徴ベクトル間の距離(すなわち、2つの特徴ベクトルの差の大きさ:具体的には、ユークリッド距離やマハラノビス距離)を算出する。そして、類似度評価手段40は、算出された距離に基づいて、それら特徴ベクトルで特徴を表されているページ画像データが類似しているか否かを判定する。具体的には、類似度評価手段40は、2つの特徴ベクトル間の距離が所定の閾値よりも小さい場合(図3左側参照)には、それら特徴ベクトルで特徴を表されているページ画像データが類似していると判定する。逆に、類似度評価手段40は、2つの特徴ベクトル間の距離が所定の閾値以上である場合(図3右側参照)には、それら特徴ベクトルで特徴を表されているページ画像データが類似していないと判定する。
【0031】
ユーザインタフェイス手段50は、画像入力手段10により読み込まれた複数のページ画像データをユーザの主観に基づいて文書単位に区切らせ、文書単位毎に画像格納手段30に格納させるためのものである。このユーザインタフェイス手段50は、表示手段と区切り入力手段とを含んでいる。表示手段は、例えば、CRT(Cathode Ray Tube)や液晶ディスプレイなどの画像表示装置であり、図4に示す操作画面を表示する。図4に示されるように、この操作画面には、上記画像入力手段10によって入力されたページ画像データの各々を表すアイコンの一覧(以下、「サムネイル」という)が表示される。また、この表示手段は、画像入力手段10によって入力されたページ画像データに応じた画像や、画像格納手段30に格納されているページ画像データに応じた画像を表示する画像出力手段としても機能する。なお、本実施形態では、上記表示手段を画像出力手段として用いる場合について説明するが、ユーザの所望する画像を所定の形式で出力するための画像出力手段を上記表示手段の他に設けても良いことは言うまでもない。このような画像出力手段としては、例えば、プリンタ装置や、磁気ディスクやメモリカードなどのリード/ライト装置、ネットワークなどを介してデータの授受を行うデータ転送装置などが挙げられる。このような画像出力手段からは、紙に印刷された文書や、HTML(Hyper Text Mark up Language)などにより整形されたファイルが出力結果として出力される。区切り入力手段は、例えば、マウスやタブレットなどのポインティングデバイスであり、ユーザに文書単位の区切りを入力させるためのものである。本実施形態では、図4に示す操作画面を視認したユーザは、各ページ画像データに対応するアイコンの間の領域をポインティングデバイスにより指定することにより、文書単位の区切りを入力することができる。
【0032】
区切り評価手段60は、上記ユーザインタフェイス手段50を介してユーザによって入力された区切りの妥当性を各ページ画像データの特徴量に基づいて評価するためのものである。より詳細に説明すると、本実施形態に係る区切り評価手段60は、全ての区切りが入力された後に、ユーザによって入力された区切りと、ページ画像データの特徴量に基づいて特定される区切りとを比較し、両者が一致している場合にのみ、ユーザの入力した区切りは妥当であると判定する(図5参照)。なお、区切り評価手段60に、画像入力手段10によって読み込まれた複数のページ画像データを、その特徴量に基づいて文書単位に区切らせる方法としては、特許文献4に開示されている技術を用いることが挙げられる。そして、区切り評価手段60は、ユーザの入力した区切りが妥当であると判定した場合には、その区切りに基づいてページ画像データを文書単位で画像格納手段30へ格納し、逆に、妥当ではないと判定した場合には、その旨ユーザへ報知するものである。
【0033】
(B:動作)
次に、上述した第1実施形態に係る文書ファイリング装置の動作について図6を参照しつつ説明する。ユーザは、まず、電子化を所望する1又は複数の文書からなる原稿を画像入力手段10のADFへセットし、例えば、スキャナ装置に設けられているスタートボタンを押下するなどして、原稿の読み込みを開始することを指示する。すると、文書ファイリング装置は、画像入力手段10によって、ADFにセットされている原稿を1ページずつ連続して読み取り、読み取った画像に対応するページ画像データを取得する(ステップSA1)。
【0034】
次いで、文書ファイリング装置は、ADFにセットされている原稿を全て読み取ると、読み取ったページ画像データを文書単位に区切るための操作画面(図4参照)をユーザインタフェイス手段50に表示させる。この操作画面を視認したユーザは、各自の主観に基づいて文書単位の区切りをユーザインタフェイス手段50を用いて入力することができる。文書ファイリング装置は、このようにして入力された文書単位の区切りをユーザインタフェイス手段50を介して取得する(ステップSA2)。
【0035】
次いで、文書ファイリング装置の区切り評価手段60は、全ての区切りを入力されたか否かを判定する(ステップSA3)。そして、区切り評価手段60は、ステップSA3の判定結果が“Yes”である場合には、ユーザによって入力された区切りを評価し(ステップSA4)、逆に、ステップSA3の判定結果が“No”である場合には、上記ステップSA2の処理を繰り返し実行する。本第1実施形態に係る文書ファイリング装置は、このようにして、全ての区切りが入力された後に、それらの区切りの妥当性を評価している。次に、上述したステップSA4において、区切り評価手段60が行う区切り評価処理について図7を参照しつつ説明する。
【0036】
図7は、区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。図7に示されるように、区切り評価手段60は、まず、上述したステップSA1にて入力された原稿に含まれている文書の区切りを各ページ画像データの特徴に基づいて特定する(ステップSB1)。具体的には、区切り評価手段60は、ステップSA1にて読み取ったページ画像データに対して、前述した特許文献4に開示されている技術を適用することにより、文書単位の区切りを特定する。そして、区切り評価手段60は、上述したステップSA2にユーザによって入力された区切りと、ステップSB1にて特定した区切りとを比較し、両者が一致しているか否かを判定する(ステップSB2)。
【0037】
ステップSB2の判定結果が“Yes”である場合には、区切り評価手段60は、ステップSA2にてユーザにより入力された区切りに基づいて、ステップSA1にて読み取ったページ画像データを文書単位に分割し、文書単位毎に画像格納手段30へ格納する(ステップSB3)。逆に、ステップSB2の判定結果が“No”である場合には、アラートメッセージをユーザインタフェイス手段50に表示させる(ステップSB4)。なお、このアラートメッセージの内容としては、入力した区切りが誤っていないかをユーザに確認するものや、区切りを入力し忘れていないかをユーザに確認するものなどが挙げられる。このアラートメッセージを視認したユーザは、各自の入力した区切り結果を再確認し、必要があればユーザインタフェイス手段50を用いて区切りを修正し、文書単位の区切りを確定する。すると、区切り評価手段60は、このようにして確定された区切りに基づいて、ステップSA1にて読み取ったページ画像データを文書単位に分割し、文書単位毎に画像格納手段30へ格納する(ステップSB5)。
【0038】
[2.第2実施形態]
次いで、本発明の第2実施形態に係る文書ファイリング装置について説明する。第2実施形態に係る文書ファイリング装置が第1実施形態に係る文書ファインリング装置と異なっている点は、ユーザが区切りを入力する度に、その区切りを逐次評価する点のみである。本第2実施形態に係る文書ファイリング装置の構成は、上述した第1実施形態に係る文書ファイリング装置の構成(図1参照)と同一であるため、詳細な説明は省略する。以下、本第2実施形態に係る文書ファイリング装置の動作について図8を参照しつつ説明する。以下では、本第2実施形態に係る文書ファイリング装置のADFには、1又は複数の文書からなる原稿がユーザによってセットされ、原稿の読み取りを開始する旨の操作がユーザによって行われたものとする。
【0039】
図8に示されるように、本第2実施形態に係る文書ファイリング装置は、まず、ADFにセットされている原稿を1ページつ連続して読み取り(ステップSC1)、ADFにセットされている原稿を全て読み取ると、ユーザインタフェイス手段50に操作画面(図4参照)を表示させる。そして、文書ファイリング装置は、ユーザによって入力された区切りをユーザインタフェイス手段50を介して取得し(ステップSC2)、その区切りを区切り評価手段60を用いて評価する(ステップSC3)。なお、ステップSC3にて区切り評価手段60が行う区切り評価処理については、上述した第1実施形態に係る文書ファイリング装置の区切り評価手段60が行う区切り評価処理(図7参照)と同一であるため、説明を省略する。以降、文書ファイリング装置は、全ての区切りを入力されたか否かを判定し(ステップSC4)、ステップSC4の判定結果が“Yes”になるまで、上述したステップSC2およびSC3の処理を繰り返し実行する。このようにして、本第2実施携帯に係る文書ファイリング装置は、ユーザによって区切りを入力される度に、その区切りを評価することができる。
【0040】
[3.変形例]
以上、本発明の実施形態について説明したが、本発明は係る実施形態に限定されるものではなく、その技術思想の範囲内で様々な変形が可能である。なお、変形例としては、例えば、以下のようなものが考えられる。
【0041】
(変形例1)上述した第1および第2実施形態においては、ページ画像データの特徴を表す特徴量として、画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、又は平坦なエリアの分布状態等を抽出した。このような情報は、プレゼンテーション用資料等のように文書の全部又はほとんどを画像が占めている場合には非常に有効である。しかしながら、契約書等のように大部分が文字からなるような文書である場合には、あまり有効ではないこともある。したがって、本変形例においては、ページ画像データから色調や輝度といった情報を抽出するのではなく、文字の高さ、字間、行間、縦書き・横書き等の文書フォーマットの特徴を示す情報(以下、フォーマット特徴量という)を抽出し、このフォーマット特徴量に基づいて2つの文書の類非を判定する場合について説明する。
【0042】
契約書などの文書においては、1つの文書ではその体裁を統一することが一般的である。したがって、上述したようなフォーマットの特徴が同様なページ画像データは、同一の文書に属すると推定することができる。反対に、異なる文書に属するページ画像データ間では、意図的に同一のフォーマットで作成された文書でない限り、フォーマット特徴量が等しくなることは極めて稀である。このように、ほとんど文字によって構成される文書に対しては、上記フォーマット特徴量を用いることによって、そのページ画像データの類似性を正確に判定することができる。
【0043】
スキャナ装置から入力したページ画像データに対して、文字の高さ、字間、行間などのフォーマット特徴量を求めるには、従来から様々な技術が提案されている。その一例が、特開平5−108793号公報に開示されている技術である(段落0009から0012参照)。当該技術においては、横書きであることを前提としてbを行間、dを字間としている。しかし、通常は行間の方が字間より大きいので、bとdを比較して大きい方を行間、小さい方を字間とし、bの方が大きい場合は横書き、dの方が大きい場合は縦書きと、縦書き・横書きの別も判断しても良い。
【0044】
一般に、同一文書に属するページであっても、タイトル行、要約部、本文など、文書を構成する部位によってフォントの大きさや行間隔などが多少異なる場合もある。例えば、表題の文字は、本文よりも大きいフォントに設定される場合がある。したがって、上述したフォーマット特徴量を抽出しても、文書を構成する部位によってその値は異なり、ページ全体で一貫しないのが普通である。フォーマット特徴量の値が一貫しないと、フォーマット特徴量を用いて各々のページの文書画像が同一文書に属するのか否かを判定するのが困難になる。この問題については以下のようにして対処することができる。
【0045】
まず、図2を参照して説明した方法と同様、入力されたページ画像データを複数の領域に分割する。次に分割された領域の各々について、文字の高さ、字間、行間、縦書き・横書きなど情報を含むフォーマット特徴量を算出する。以下では、文字の高さ「10pt」、字間「15pt」、行間「10.5pt」、縦書き・横書き「0」という値が得られたものとする。なお、本変形例においては、縦書きの場合には「0」を、横書きの場合は「1」を対応付けるものとする。
【0046】
次に、算出された全ての領域に係る特徴量のなかで最も頻繁に出現する値を決定し、これをそのページの特徴量とする。例えば、全24個の領域のうち、20個の領域において文字の高さが「10pt」であり、3個の領域において「12pt」、1つの領域では「16pt」であった場合は、当該ページの文字の高さにかかる特徴量として「10pt」が算出される。字間、行間、縦書き・横書きについても同様である。
【0047】
一般的に言えば、表題や見出しがページ全体に占める割合は、文書を特徴付けている本文に比べて小さい。したがって、最頻出の値は、本文の特徴を表した量であるとみなすことができる。これによって、文書に表題や見出し部が存在したとしても、ページ画像データから的確に特徴量を得ることができる。
【0048】
このようにして、1ページ分のページ画像データから、当該ページの文書フォーマットの特徴を表す特徴ベクトル(以下、フォーマット特徴ベクトルという)が求められる。下にフォーマット特徴ベクトルのfの一例を示す。以下、上述した第1および第2実施形態の場合と同様に、2つの特徴ベクトルの間の距離を類似度評価手段40に算出させ、算出された距離に基づいて、これら2つの特徴ベクトルで特徴を表されているページ画像データの類非を類似度評価手段40に評価させることができる。
【0049】
【数1】
f=(文字の高さ、字間、行間、[縦書き:0,横書き:1])
【0050】
(変形例2)上述した第1および第2実施形態では、区切り評価手段60が、特許文献4に開示されている技術を適用することによって得られる区切りと一致しているか否かに基づいて、ユーザによって入力された区切りを評価する場合について説明した(図5参照)。しかしながら、ユーザによって入力された区切りを区切り評価手段60に評価させる際の評価基準は、係る評価基準に限定されるものではない。例えば、図9に示されるように、原稿に含まれている一連の文書の各々が、各文書単位内で類似した特徴を有している場合には、図7に示される区切り評価処理に替えて、図10に示される区切り評価処理を区切り評価手段60に行わせるとしても良い。
【0051】
図10は、本変形例1に係る文書ファイリング装置の区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。図10に示されるように、区切り評価手段60は、まず、前述したステップSA2(図6参照)にて、ユーザによって入力された区切りに基づいて、ステップSA1(図6参照)にて入力されたページ画像データを文書単位に分割する(ステップSD1)。
【0052】
そして、区切り評価手段60は、ステップSD1にて分割された文書単位毎に特徴量抽出手段20を用いて特徴量を抽出する(ステップSD2)。具体的には、区切り評価手段60は、図9に示されるように、以下の3つの特徴量を文書単位毎に抽出する。第1の特徴量は、文書単位の先頭に位置するページ画像データの特徴量である。第2の特徴量は、文書単位の中央に位置するページ画像データの特徴量である。第3の特徴量は、文書単位の末尾に位置するページ画像データの特徴量である。
【0053】
次に、区切り評価手段60は、各文書単位毎に、ステップSD2にて抽出した3つの特徴量が類似しているか否かを類似度評価手段40によって評価する(ステップSD3)。以下、区切り評価手段60は、ステップSD3の判定結果が“Yes”である場合には、前述したステップSB3の処理を行い、逆に、ステップSD3の判定結果が“No”である場合には、ステップSB4およびステップSB5の処理を行う。以上に説明したように、文書ファイリング装置に入力される原稿に含まれている一連の文書の各々が、各文書単位内で類似した特徴を有している場合には、図10に示される区切り評価処理を区切り評価手段60に行わせることにより、ユーザによって入力された文書単位の区切りの妥当性を評価することが可能になる。
【0054】
また、図11に示されるように、原稿に含まれている一連の文書の各々の特徴が互いに類似している場合には、図7に示される区切り評価処理に替えて、図12に示される区切り評価処理を区切り評価手段60に行わせるとしても良い。
【0055】
図12は、本変形例1に係る文書ファイリング装置の区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。図12に示される区切り評価処理が、図10に示される区切り評価処理と異なっている点は、ステップSD3に替えてステップSE3を設けた点のみである。以下、このステップSE3において、区切り評価手段60が行う処理について詳細に説明する。なお、以下に説明する動作の前提として、N−1個(N:自然数)の区切りがユーザによって入力されており、画像入力手段10によって入力されたページ画像データが、N個の文書単位に区切られているものとする。このような状況下で、さらに、N個目の区切りがユーザによって入力されたものとする。
【0056】
図12のステップSE3において、区切り評価手段60は、N+1番目の文書単位の上記3つの特徴量(以下、文書単位に属するページ画像データの特徴を表す特徴量の集合を「文書画像データの特徴量」という)と、1番目からN番目の各々の文書単位の文書画像データの特徴量とが類似しているか否かを比較する。なお、文書画像データの特徴量同士を比較する場合には、例えば、そのれら文書画像データの特徴量を構成しているページ画像データの特徴量の重心を代表として比較することによって実現される。なお、複数の特徴量の代表は、それら特徴量の重心に限定されるものではない。また、前述した第2実施形態に係る文書ファイリング装置へ本変形例を適用する場合には、ユーザが最初に入力した区切りに対しては、上記評価を行わない。その理由は、比較対象となる文書単位がないからである。
【0057】
そして、区切り評価手段60は、ステップSE3の判定結果が“Yes” である場合には、前述したステップSB3の処理を行い、逆に、ステップSE3の判定結果が“No”である場合には、ステップSB4およびステップSB5の処理を行う。以上に説明したように、原稿に含まれている一連の文書の各々の特徴が互いに類似している場合には、図12に示される区切り評価処理を区切り評価手段60に行わせることにより、ユーザによって入力された文書単位の区切りの妥当性を評価することが可能になる。
【0058】
(変形例3)上述した第1および第2実施形態では、ユーザの入力した区切りが妥当ではないと判定した場合に、アラートメッセージを表示することによって、その旨ユーザへ報知する態様について説明した。しかしながら、ユーザによって入力された区切りが妥当ではない旨ユーザへ報知する態様は、アラートメッセージの表示による態様に限定されるものではない。例えば、妥当ではないと判定された区切り付近を強調表示する態様であっても良い。このようにすると、妥当ではない区切りをわかり易くユーザへ報知することが可能になるといった効果を奏する。
【0059】
(変形例4)上述した第1および第2実施形態では、ユーザの入力した区切りが妥当であるか否かをページ画像データの特徴量に基づいて判定する場合について説明した。しかしながら、入力されたページ画像データに対して特許文献4に開示されている技術を適用することによって特定された区切りを予め強調表示したユーザインタフェイス手段50に表示させるとしても良い。このようにすると、ユーザは次に入力すべき区切りを事前に把握することができるといった効果を奏する。
【0060】
【発明の効果】
本発明によれば、手動による区切り作業におけるユーザの負担を軽減しつつ、一括して読み込まれた複数のページ画像データを効率的に文書単位に区切ることが可能になるといった効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1実施形態に係る文書ファイリング装置の機能構成の一例を示す図である。
【図2】同文書ファイリング装置の特徴量抽出手段20が抽出する特徴量を説明するための図である。
【図3】同文書ファイリング装置の特徴量の類似関係を説明するための図である。
【図4】同文書ファイリング装置のユーザインタフェイス手段50に表示される操作画面の一例を示す図である。
【図5】手動区切り結果の妥当性判定基準を説明するための図である。
【図6】同文書ファイリング装置が行う動作の流れを示すフローチャートである。
【図7】同文書ファイリング装置の区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。
【図8】本発明の第2実施形態に係る文書ファイリング装置が行う動作の流れを示すフローチャートである。
【図9】変形例2に係る妥当性判定基準を説明するための図である。
【図10】変形例2に係る文書ファイリング装置の区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。
【図11】変形例2に係る妥当性判定基準を説明するための図である。
【図12】変形例2に係る文書ファイリング装置の区切り評価手段60が行う区切り評価処理の流れを示すフローチャートである。
【符号の説明】
10…画像入力手段、20…特徴量抽出手段、30…画像格納手段、40…類似度評価手段、50…ユーザインタフェイス手段、60…区切り評価手段、70…バス。
Claims (9)
- 1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、
前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、
前記画像入力手段によって取得されたページ画像データを文書単位に区切る際の区切りを前記特徴量に基づいて特定する特定手段と、
前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、
前記区切り入力手段によって入力された区切りと、前記特定手段によって特定された区切りとを比較し、両者が異なる場合には、前記ユーザへその旨報知する報知手段と
を有する文書ファイリング装置。 - 1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、
前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、
前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、
前記区切り入力手段によって入力された区切りに基づいて前記ページ画像データを文書単位に分割した場合に、ある文書単位に含まれているページ画像データの特徴量と該文書単位に含まれている他のページ画像データの特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する報知手段と
を有する文書ファイリング装置。 - 1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、
前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、
前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、
前記区切り入力手段によって入力された区切りに基づいて前記ページ画像データを文書単位に分割した場合に、ある文書単位に対応する文書画像データの特徴量と他の文書単位に対応する文書画像データの特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する報知手段と
を有する文書ファイリング装置。 - 文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、
前記第1のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、
前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第2のステップにて提供したユーザインタフェイスを介して取得する第3のステップと、
前記文書ファイリング装置が、前記第3のステップにて取得した区切りと前記ページ画像データの特徴を表す特徴量に基づいて特定された区切りとが異なる場合には、前記ユーザへその旨報知する第4のステップと
を有する文書区切り方法。 - 文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、
前記第1のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、
前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第2のステップにて提供したユーザインタフェイスを介して取得する第3のステップと、
前記文書ファイリング装置が、前記第3のステップにて取得した区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に含まれているページ画像データの特徴を表す特徴量と該文書単位に含まれている他のページ画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第4のステップと
を有する文書区切り方法。 - 文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、
前記第1のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、
前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第2のステップにて提供したユーザインタフェイスを介して取得する第3のステップと、
前記文書ファイリング装置が、前記第3のステップにて取得した区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に対応する文書画像データの特徴を表す特徴量と他の文書単位に対応する文書画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第4のステップと
を有する文書区切り方法。 - 文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、
前記第1のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、
前記文書ファイリング装置が、前記第2のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取り、前記ページ画像データの特徴を表す特徴量に基づいて特定された区切りとが異なる場合には、前記ユーザへその旨報知する第3のステップと
を有する文書区切り方法。 - 文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、
前記第1のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、
前記文書ファイリング装置が、前記第2のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取るとともに、該区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に含まれているページ画像データの特徴を表す特徴量と該文書単位に含まれている他のページ画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第3のステップと
を有する文書区切り方法。 - 文書ファイリング装置が、1又は複数の文書からなる原稿を1ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第1のステップと、
前記第1のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第2のステップと、
前記文書ファイリング装置が、前記第2のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取るとともに、該区切りに基づいて前記第1のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に対応する文書画像データの特徴を表す特徴量と他の文書単位に対応する文書画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第3のステップと
を有する文書区切り方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003081129A JP2004288015A (ja) | 2003-03-24 | 2003-03-24 | 文書ファイリング装置および文書区切り方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003081129A JP2004288015A (ja) | 2003-03-24 | 2003-03-24 | 文書ファイリング装置および文書区切り方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004288015A true JP2004288015A (ja) | 2004-10-14 |
Family
ID=33294795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003081129A Pending JP2004288015A (ja) | 2003-03-24 | 2003-03-24 | 文書ファイリング装置および文書区切り方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004288015A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009110360A (ja) * | 2007-10-31 | 2009-05-21 | Ricoh Co Ltd | 画像処理装置及び画像処理方法 |
JP2011258215A (ja) * | 2005-01-11 | 2011-12-22 | Xerox Corp | 自動的ドキュメント選択方法 |
CN110532448A (zh) * | 2019-07-04 | 2019-12-03 | 平安科技(深圳)有限公司 | 基于神经网络的文档分类方法、装置、设备及存储介质 |
-
2003
- 2003-03-24 JP JP2003081129A patent/JP2004288015A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011258215A (ja) * | 2005-01-11 | 2011-12-22 | Xerox Corp | 自動的ドキュメント選択方法 |
JP2009110360A (ja) * | 2007-10-31 | 2009-05-21 | Ricoh Co Ltd | 画像処理装置及び画像処理方法 |
CN110532448A (zh) * | 2019-07-04 | 2019-12-03 | 平安科技(深圳)有限公司 | 基于神经网络的文档分类方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US11182604B1 (en) | Computerized recognition and extraction of tables in digitized documents | |
US20040218838A1 (en) | Image processing apparatus and method therefor | |
US7712028B2 (en) | Using annotations for summarizing a document image and itemizing the summary based on similar annotations | |
US20040234169A1 (en) | Image processing apparatus, control method therefor, and program | |
US10142499B2 (en) | Document distribution system, document distribution apparatus, information processing method, and storage medium | |
JP2010510563A (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
US20130259377A1 (en) | Conversion of a document of captured images into a format for optimized display on a mobile device | |
WO2000052645A1 (fr) | Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document | |
US8144988B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
US20070133907A1 (en) | Image processing apparatus | |
JP2002183166A (ja) | ドキュメントファイリングシステムおよび方法 | |
JP4983464B2 (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
JPH1166196A (ja) | 文書画像認識装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2004288015A (ja) | 文書ファイリング装置および文書区切り方法 | |
JP4241115B2 (ja) | 文書ファイリング装置 | |
US6996293B1 (en) | Reduced image forming method and apparatus | |
JP2008158777A (ja) | 画像処理装置及び方法、コンピュータプログラム及び記憶媒体 | |
JP2005208977A (ja) | 文書ファイリング装置および文書ファイリング方法 | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JPH11238072A (ja) | 文書保管装置 | |
JPH08153110A (ja) | 文書ファイリング装置及び方法 | |
JP4569162B2 (ja) | 画像処理方法、画像処理プログラムおよび画像処理装置 | |
JP5407700B2 (ja) | 画像処理システム、情報処理装置、画像処理装置、及びプログラム | |
JP4501731B2 (ja) | 画像処理装置 |