JP2004288015A

JP2004288015A - 文書ファイリング装置および文書区切り方法

Info

Publication number: JP2004288015A
Application number: JP2003081129A
Authority: JP
Inventors: Hitoshi Okamoto; 仁岡本; Kagenori Nagao; 景則長尾; Masayuki Hisatake; 真之久武; Shinichi Yada; 伸一矢田
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2003-03-24
Filing date: 2003-03-24
Publication date: 2004-10-14

Abstract

【課題】一括して読み込まれたページ画像データを文書単位毎に区切る際に、ユーザに掛かる負担を軽減させること。
【解決手段】１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する文書ファイリング装置に、取得したページ画像データから該ページ画像データの特徴を表す特徴量を抽出させる。次いで、この文書ファイリング装置に、取得したページ画像データを文書単位に区切る際の区切りを上記特徴量に基づいて特定させる。このようにして特定された区切りと、ユーザの入力した区切りとを文書ファイリング装置に比較させ、両者が異なる場合には、その旨ユーザへ報知させる。
【選択図】図１

Description

【０００１】
【発明の属する技術分野】
本発明は、紙文書を電子化する技術に関する。
【０００２】
【従来の技術】
紙文書は、情報の伝達や記録を行うための媒体として優れたものであるが、これを保存するためのスペースを必要とする。また、情報を紙文書に記録して保存する場合、後にその紙文書が必要になったときには、例えば書庫に収納された多くの紙文書のなかから目的とする紙文書を探さなければならない。したがって、紙文書に記録して保存するという形態は、業務の効率化の観点からも好ましくない。このような背景の下、紙文書を電子化して保存することが行われるようになってきている。具体的には、ユーザは１ページずつ紙文書をスキャナ装置にセットし、このスキャナ装置により、紙文書の各ページを読み込み、画像データとして電子ファイルに格納する。
【０００３】
このような方法は、電子ファイル化すべき紙文書のページ数が多い場合には非効率的である。このため、紙文書のページ数が多い場合には、オートドキュメントフィーダ（ＡｕｔｏＤｏｃｕｍｅｎｔＦｅｅｄｅｒ：以下、「ＡＤＦ」という）と呼ばれる自動給紙機構を備えたスキャナ装置を用いて、紙文書の各ページを連続して自動的に読み取る処理が広く行われている。
【０００４】
ところで、状況によっては、電子化すべき紙文書が一度に多数発生する場合がある。このような場合に、各紙文書を一文書ずつＡＤＦにセットして読み取り処理を行わせれば、文書単位で紙文書を電子ファイル化することが可能である。しかし、この方法を採った場合、一文書毎に、紙文書をＡＤＦにセットし、読み取り処理を行わせるための操作を行わなければならないので、ユーザにとって煩雑である。一方、複数種類の紙文書を全部まとめてＡＤＦにセットし、読み取り処理を行わせれば、複数種類の紙文書を一括して電子ファイル化することができる。しかし、この方法を採った場合、１つの電子化ファイルに複数種類の紙文書の画像データがまとめて格納されるので、後に個々の紙文書を検索し閲覧するのに不便である。そこで、複数種類の紙文書を一括して読み取り、かつ、紙文書の画像データを文書毎に電子ファイル化する技術が求められている。このようなニーズに対し、従来から幾つかの技術が提案されている（例えば、特許文献１、２、３および４）。
【０００５】
特許文献１には、次のような電子ファイリング装置が開示されている。まず、該装置のユーザは、電子化したい文書が複数ある場合に、それらの複数の文書間に予め特定の文書区切り用原稿を挿入しておく。そして、この文書区切り用原稿を挿入した複数文書からなる原稿をＡＤＦにセットし、該装置に画像読み取り処理を行わせる。該装置では、この画像読み取り処理により得られた全ページのページ画像データのなかから、文書区切り用原稿に相当する画像データを認識し、ページ画像データを文書単位に電子ファイル化する。
【０００６】
また、特許文献２には、次のような電子ファイリング装置が開示されている。すなわち、該装置のユーザは、電子ファイル化したい文書が複数ある場合に、各文書において文書区切りとなるページの裏面に文書区切りマークを予め付加しておく。該装置では、複数文書からなる原稿の各ページの裏表両面をスキャナ装置で読み取り、この文書区切りマークを認識して各文書のページ画像データを文書単位に電子ファイル化する。
【０００７】
また、特許文献３には、次のような電子ファイリング装置が開示されている。すなわち、該装置は、スキャナ装置で読み取った画像データから予め設定しておいた文字認識エリア部分を切り出し、文字認識処理を行い、この文字認識結果に基づき文書の区切りを判定する。
【０００８】
さらに、特許文献４には、ＡＤＦを持つスキャナ装置により複数の文書を一括して読み取り、読み取った画像の特徴量を算出し、この特徴量に基づいて文書単位の区切りを判定する技術が開示されている。
【０００９】
【特許文献１】
特開平１−１６２４７４号公報
【特許文献２】
特開平７−２８７７４７号公報
【特許文献３】
特開平１０−２１３８０号公報
【特許文献４】
特開２００２−２４２５８号公報
【００１０】
【発明が解決しようとする課題】
以上に説明した従来技術のなかでも、特に、特許文献４に開示された技術によれば、予め文書区切り用原稿を各文書間に挿入したり、文書区切りマークを付加するなど原稿に手を加えることなく文書区切りを電子ファイリング装置に検出させることができるので、ユーザに掛かる負担が大幅に軽減される。
【００１１】
しかしながら、特許文献４に開示されている技術では、読み取った画像の特徴に基づいて文書が区切られるので、電子ファイリング装置によって検出された区切りと実際の文書の区切りとが常に一致するとは限らない。このため、ユーザは、電子ファイリング装置によって為された区切りを全て目視で確認し、電子ファイリング装置によって為された区切りが適切ではない場合には、手動で区切りを修正しなければならない。
【００１２】
その一方、特許文献４に開示されている技術を利用せず、ユーザが、全ての画像データを目視で確認しながら文書単位の区切りを全て手動で入力するとしたならば、効率が悪いことは言うまでもない。加えて、ユーザ自身が区切り位置を間違える可能性も低くない。
【００１３】
本発明は、上記課題に鑑みて為されたものであり、一括して読み込まれたページ画像データを文書単位毎に区切る際に、ユーザに掛かる負担を軽減させる技術を提供することを目的としている。
【００１４】
【課題を解決するための手段】
上記課題を解決するために、本発明は、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、前記画像入力手段によって取得されたページ画像データを文書単位に区切る際の区切りを前記特徴量に基づいて特定する特定手段と、前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、前記区切り入力手段によって入力された区切りと、前記特定手段によって特定された区切りとを比較し、両者が異なる場合には、前記ユーザへその旨報知する報知手段とを有する文書ファイリング装置を提供する。
【００１５】
また、上記課題を解決するために、本発明は、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、前記区切り入力手段によって入力された区切りに基づいて前記ページ画像データを文書単位に分割した場合に、ある文書単位に含まれているページ画像データの特徴量と該文書単位に含まれている他のページ画像データの特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する報知手段とを有する文書ファイリング装置を提供する。
【００１６】
また、上記課題を解決するために、本発明は、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、前記区切り入力手段によって入力された区切りに基づいて前記ページ画像データを文書単位に分割した場合に、ある文書単位に対応する文書画像データの特徴量と他の文書単位に対応する文書画像データの特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する報知手段とを有する文書ファイリング装置を提供する。
【００１７】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、前記第１のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第２のステップにて提供したユーザインタフェイスを介して取得する第３のステップと、前記文書ファイリング装置が、前記第３のステップにて取得した区切りと前記ページ画像データの特徴を表す特徴量に基づいて特定された区切りとが異なる場合には、前記ユーザへその旨報知する第４のステップとを有する文書区切り方法を提供する。
【００１８】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、前記第１のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第２のステップにて提供したユーザインタフェイスを介して取得する第３のステップと、前記文書ファイリング装置が、前記第３のステップにて取得した区切りに基づいて前記第１のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に含まれているページ画像データの特徴を表す特徴量と該文書単位に含まれている他のページ画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第４のステップとを有する文書区切り方法を提供する。
【００１９】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、前記第１のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第２のステップにて提供したユーザインタフェイスを介して取得する第３のステップと、前記文書ファイリング装置が、前記第３のステップにて取得した区切りに基づいて前記第１のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に対応する文書画像データの特徴を表す特徴量と他の文書単位に対応する文書画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第４のステップとを有する文書区切り方法を提供する。
【００２０】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、前記第１のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、前記文書ファイリング装置が、前記第２のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取り、前記ページ画像データの特徴を表す特徴量に基づいて特定された区切りとが異なる場合には、前記ユーザへその旨報知する第３のステップとを有する文書区切り方法を提供する。
【００２１】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、前記第１のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、前記文書ファイリング装置が、前記第２のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取るとともに、該区切りに基づいて前記第１のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に含まれているページ画像データの特徴を表す特徴量と該文書単位に含まれている他のページ画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第３のステップとを有する文書区切り方法を提供する。
【００２２】
また、上記課題を解決するために、本発明は、文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、前記第１のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、前記文書ファイリング装置が、前記第２のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取るとともに、該区切りに基づいて前記第１のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に対応する文書画像データの特徴を表す特徴量と他の文書単位に対応する文書画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第３のステップとを有する文書区切り方法を提供する。
【００２３】
このような文書ファイリング装置、文書区切り方法、該文書区切り方法の各ステップに係る処理をコンピュータ装置に実現させるためのプログラムおよびコンピュータ装置読み取り可能な記録媒体であって、該プログラムを記録した記録媒体によれば、ユーザによって入力された文書単位の区切りと、その文書単位に属するページ画像データの特徴とが矛盾する場合には、ユーザへその旨報知される。なお、以下の説明においては、ある文書の１ページ分の画像データを「ページ画像データ」とよぶ。また、ある文書の各ページの画像データからなるページ画像データの集合、すなわち、１文書分のページ画像データの集合を「文書画像データ」とよぶ。
【００２４】
【発明の実施の形態】
以下、本発明の実施形態について図面を参照しつつ説明する。
【００２５】
［１．第１実施形態］
（Ａ：構成）
図１は、本発明の一実施形態に係る文書ファイリング装置の構成例を示す図である。図１に示されているように、本実施形態に係る文書ファイリング装置は、画像入力手段１０と、特徴量抽出手段２０と、画像格納手段３０と、類似度評価手段４０と、ユーザインタフェイス手段５０と、区切り評価手段６０と、これら各構成要素を接続するバス７０とを備えている。本実施形態においては、特徴量抽出手段２０、類似度評価手段４０および区切り評価手段６０は、例えばＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）などの制御手段が所定のプログラムを実行することによって実現されるソフトウェアモジュールである。なお、係るプログラムを一般的なコンピュータ装置にインストールし実行させることによって、係るコンピュータ装置に本発明に係る文書ファイリング装置と同一の機能を付与するとしても良いことは勿論である。このようなことは、例えば、ＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｋ −ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）などのコンピュータ装置読み取り可能な記録媒体に係るプログラムを記録しておき、この記録媒体に記録されているプログラムをコンピュータ装置に読み取らせ、実行させることによって実現される。
【００２６】
画像入力手段１０は、例えばＡＤＦを備えたスキャナ装置である。ユーザによってＡＤＦに原稿がセットされると、画像入力手段１０においては、この原稿が１ページずつスキャナ装置へ送られて画像読み取り処理が行われる。この画像読み取り処理によって、原稿の各ページに対応するページ画像データが取得される。このようにして取得されたページ画像データは、画像格納手段３０へ文書単位で格納される。なお、本実施形態においては、画像入力手段１０が文書ファイリング装置のバス７０に直結されている場合について説明するが、この画像入力手段１０は、例えばＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）などのネットワークを介して文書ファイリング装置に接続されていても良いことは勿論である。また、この画像入力手段１０として、スキャナ装置に替えて、例えばＩＣカードやスマートメディアなどのメモリカードに格納されているページ画像データを連続して読み出すメモリリーダ装置を用いても良いことは勿論である。
【００２７】
特徴量抽出手段２０は、画像入力手段１０を用いて入力中のページ画像データ、あるいは、画像格納手段３０に格納されているページ画像データから、そのページ画像データの特徴を表す特徴量を抽出するためのものである。この特徴量抽出手段２０によって抽出される特徴量としては、そのページ画像データの色調、縦横比、輝度、色分布、エッジの分布状態および平坦なエリアの分布状態などを表す情報が挙げられる。以下、特徴量抽出手段２０がページ画像データから特徴量を抽出する過程について図２を参照しつつ説明する。
【００２８】
特徴量抽出手段２０は、まず、ページ画像データを縦方向にＸ分割、横方向にＹ分割する。すなわち、特徴量抽出手段２０は、ページ画像データをＸ＊Ｙ個の小領域に分割する（図２左参照）。なお、図２の左側の部分では、ページ画像データを縦方向に６分割、横方向に４分割し、６＊４＝２４個の小領域に分割する場合について例示されている。次に、特徴量抽出手段２０は、分割した各小領域に対して画像解析処理を行い各領域毎に特徴量を算出する。特徴量としては、上述したように様々な情報を採用することができるが、ここでは、一例として階調度を採用する場合について説明する。特徴量抽出手段２０は、まず、１つの領域の色のＲ、Ｇ、Ｂの各成分を求める。そして、特徴量抽出手段２０は、このＲ、Ｇ、Ｂの各成分をＬ＊ａ＊ｂ空間（特徴色空間）での色成分を表す３個の量に変換する。その結果、全２４領域から、合計２４＊３＝７２個の値が抽出される（図２中央参照）。特徴量抽出手段２０は、このようにして抽出された７２個の値を成分とする７２次元ベクトルを特徴量として抽出する（図２右参照）。なお、ページ画像データから算出する特徴量は、画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、平坦なエリアの分布状態のどれか一つでもよいし、複数であってもよい。例えば、ページ画像データに表される画像の領域を２４分割した場合、一つの領域から色調、エッジ状態を抽出し、特徴量を１４４次元のベクトルとして表してもよい。また、主成分解析等の手法を用いて、できるだけページ画像データの特徴を損なうことなく算出した特徴量の数を減らしてもよい。これにより、類似度評価手段４０によって行われる計算量を減少することができる。従って、算出すべき特徴量の種類数は問われない。また、分割する領域の数は問われない。
【００２９】
画像格納手段３０は、例えば、ハードディスクドライブやＤＶＤ−ＲＡＭ（ＤｉｇｉｔａｌＶｉｄｅｏＤｉｓｃ−ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）ドライブ等の大容量記憶装置であり、画像入力手段１０によって入力されたページ画像データを文書単位で格納するものである。なお、ページ画像データを文書単位で格納する具体的な態様としては、例えば、文書単位にファイルフォルダを作成して、その文書単位に含まれるページ画像データに入力順の一連番号を含んだファイル名を付与してそのファイルフォルダへ格納する態様や、複数ページを保持できるマルチページＴＩＦＦのような画像ファイルフォーマットで格納する態様が挙げられる。
【００３０】
類似度評価手段４０は、２つのページ画像データが類似しているか否かを、それらページ画像データの特徴量に基づいて評価するためのものである。以下では、各ページ画像データの特徴を表す特徴量として、上述したベクトル表現の特徴量（以下、このような特徴量を「特徴ベクトル」という）が抽出されている場合について説明する。類似度評価手段４０は、まず、２つの特徴ベクトル間の距離（すなわち、２つの特徴ベクトルの差の大きさ：具体的には、ユークリッド距離やマハラノビス距離）を算出する。そして、類似度評価手段４０は、算出された距離に基づいて、それら特徴ベクトルで特徴を表されているページ画像データが類似しているか否かを判定する。具体的には、類似度評価手段４０は、２つの特徴ベクトル間の距離が所定の閾値よりも小さい場合（図３左側参照）には、それら特徴ベクトルで特徴を表されているページ画像データが類似していると判定する。逆に、類似度評価手段４０は、２つの特徴ベクトル間の距離が所定の閾値以上である場合（図３右側参照）には、それら特徴ベクトルで特徴を表されているページ画像データが類似していないと判定する。
【００３１】
ユーザインタフェイス手段５０は、画像入力手段１０により読み込まれた複数のページ画像データをユーザの主観に基づいて文書単位に区切らせ、文書単位毎に画像格納手段３０に格納させるためのものである。このユーザインタフェイス手段５０は、表示手段と区切り入力手段とを含んでいる。表示手段は、例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）や液晶ディスプレイなどの画像表示装置であり、図４に示す操作画面を表示する。図４に示されるように、この操作画面には、上記画像入力手段１０によって入力されたページ画像データの各々を表すアイコンの一覧（以下、「サムネイル」という）が表示される。また、この表示手段は、画像入力手段１０によって入力されたページ画像データに応じた画像や、画像格納手段３０に格納されているページ画像データに応じた画像を表示する画像出力手段としても機能する。なお、本実施形態では、上記表示手段を画像出力手段として用いる場合について説明するが、ユーザの所望する画像を所定の形式で出力するための画像出力手段を上記表示手段の他に設けても良いことは言うまでもない。このような画像出力手段としては、例えば、プリンタ装置や、磁気ディスクやメモリカードなどのリード／ライト装置、ネットワークなどを介してデータの授受を行うデータ転送装置などが挙げられる。このような画像出力手段からは、紙に印刷された文書や、ＨＴＭＬ（ＨｙｐｅｒＴｅｘｔＭａｒｋｕｐＬａｎｇｕａｇｅ）などにより整形されたファイルが出力結果として出力される。区切り入力手段は、例えば、マウスやタブレットなどのポインティングデバイスであり、ユーザに文書単位の区切りを入力させるためのものである。本実施形態では、図４に示す操作画面を視認したユーザは、各ページ画像データに対応するアイコンの間の領域をポインティングデバイスにより指定することにより、文書単位の区切りを入力することができる。
【００３２】
区切り評価手段６０は、上記ユーザインタフェイス手段５０を介してユーザによって入力された区切りの妥当性を各ページ画像データの特徴量に基づいて評価するためのものである。より詳細に説明すると、本実施形態に係る区切り評価手段６０は、全ての区切りが入力された後に、ユーザによって入力された区切りと、ページ画像データの特徴量に基づいて特定される区切りとを比較し、両者が一致している場合にのみ、ユーザの入力した区切りは妥当であると判定する（図５参照）。なお、区切り評価手段６０に、画像入力手段１０によって読み込まれた複数のページ画像データを、その特徴量に基づいて文書単位に区切らせる方法としては、特許文献４に開示されている技術を用いることが挙げられる。そして、区切り評価手段６０は、ユーザの入力した区切りが妥当であると判定した場合には、その区切りに基づいてページ画像データを文書単位で画像格納手段３０へ格納し、逆に、妥当ではないと判定した場合には、その旨ユーザへ報知するものである。
【００３３】
（Ｂ：動作）
次に、上述した第１実施形態に係る文書ファイリング装置の動作について図６を参照しつつ説明する。ユーザは、まず、電子化を所望する１又は複数の文書からなる原稿を画像入力手段１０のＡＤＦへセットし、例えば、スキャナ装置に設けられているスタートボタンを押下するなどして、原稿の読み込みを開始することを指示する。すると、文書ファイリング装置は、画像入力手段１０によって、ＡＤＦにセットされている原稿を１ページずつ連続して読み取り、読み取った画像に対応するページ画像データを取得する（ステップＳＡ１）。
【００３４】
次いで、文書ファイリング装置は、ＡＤＦにセットされている原稿を全て読み取ると、読み取ったページ画像データを文書単位に区切るための操作画面（図４参照）をユーザインタフェイス手段５０に表示させる。この操作画面を視認したユーザは、各自の主観に基づいて文書単位の区切りをユーザインタフェイス手段５０を用いて入力することができる。文書ファイリング装置は、このようにして入力された文書単位の区切りをユーザインタフェイス手段５０を介して取得する（ステップＳＡ２）。
【００３５】
次いで、文書ファイリング装置の区切り評価手段６０は、全ての区切りを入力されたか否かを判定する（ステップＳＡ３）。そして、区切り評価手段６０は、ステップＳＡ３の判定結果が“Ｙｅｓ”である場合には、ユーザによって入力された区切りを評価し（ステップＳＡ４）、逆に、ステップＳＡ３の判定結果が“Ｎｏ”である場合には、上記ステップＳＡ２の処理を繰り返し実行する。本第１実施形態に係る文書ファイリング装置は、このようにして、全ての区切りが入力された後に、それらの区切りの妥当性を評価している。次に、上述したステップＳＡ４において、区切り評価手段６０が行う区切り評価処理について図７を参照しつつ説明する。
【００３６】
図７は、区切り評価手段６０が行う区切り評価処理の流れを示すフローチャートである。図７に示されるように、区切り評価手段６０は、まず、上述したステップＳＡ１にて入力された原稿に含まれている文書の区切りを各ページ画像データの特徴に基づいて特定する（ステップＳＢ１）。具体的には、区切り評価手段６０は、ステップＳＡ１にて読み取ったページ画像データに対して、前述した特許文献４に開示されている技術を適用することにより、文書単位の区切りを特定する。そして、区切り評価手段６０は、上述したステップＳＡ２にユーザによって入力された区切りと、ステップＳＢ１にて特定した区切りとを比較し、両者が一致しているか否かを判定する（ステップＳＢ２）。
【００３７】
ステップＳＢ２の判定結果が“Ｙｅｓ”である場合には、区切り評価手段６０は、ステップＳＡ２にてユーザにより入力された区切りに基づいて、ステップＳＡ１にて読み取ったページ画像データを文書単位に分割し、文書単位毎に画像格納手段３０へ格納する（ステップＳＢ３）。逆に、ステップＳＢ２の判定結果が“Ｎｏ”である場合には、アラートメッセージをユーザインタフェイス手段５０に表示させる（ステップＳＢ４）。なお、このアラートメッセージの内容としては、入力した区切りが誤っていないかをユーザに確認するものや、区切りを入力し忘れていないかをユーザに確認するものなどが挙げられる。このアラートメッセージを視認したユーザは、各自の入力した区切り結果を再確認し、必要があればユーザインタフェイス手段５０を用いて区切りを修正し、文書単位の区切りを確定する。すると、区切り評価手段６０は、このようにして確定された区切りに基づいて、ステップＳＡ１にて読み取ったページ画像データを文書単位に分割し、文書単位毎に画像格納手段３０へ格納する（ステップＳＢ５）。
【００３８】
［２．第２実施形態］
次いで、本発明の第２実施形態に係る文書ファイリング装置について説明する。第２実施形態に係る文書ファイリング装置が第１実施形態に係る文書ファインリング装置と異なっている点は、ユーザが区切りを入力する度に、その区切りを逐次評価する点のみである。本第２実施形態に係る文書ファイリング装置の構成は、上述した第１実施形態に係る文書ファイリング装置の構成（図１参照）と同一であるため、詳細な説明は省略する。以下、本第２実施形態に係る文書ファイリング装置の動作について図８を参照しつつ説明する。以下では、本第２実施形態に係る文書ファイリング装置のＡＤＦには、１又は複数の文書からなる原稿がユーザによってセットされ、原稿の読み取りを開始する旨の操作がユーザによって行われたものとする。
【００３９】
図８に示されるように、本第２実施形態に係る文書ファイリング装置は、まず、ＡＤＦにセットされている原稿を１ページつ連続して読み取り（ステップＳＣ１）、ＡＤＦにセットされている原稿を全て読み取ると、ユーザインタフェイス手段５０に操作画面（図４参照）を表示させる。そして、文書ファイリング装置は、ユーザによって入力された区切りをユーザインタフェイス手段５０を介して取得し（ステップＳＣ２）、その区切りを区切り評価手段６０を用いて評価する（ステップＳＣ３）。なお、ステップＳＣ３にて区切り評価手段６０が行う区切り評価処理については、上述した第１実施形態に係る文書ファイリング装置の区切り評価手段６０が行う区切り評価処理（図７参照）と同一であるため、説明を省略する。以降、文書ファイリング装置は、全ての区切りを入力されたか否かを判定し（ステップＳＣ４）、ステップＳＣ４の判定結果が“Ｙｅｓ”になるまで、上述したステップＳＣ２およびＳＣ３の処理を繰り返し実行する。このようにして、本第２実施携帯に係る文書ファイリング装置は、ユーザによって区切りを入力される度に、その区切りを評価することができる。
【００４０】
［３．変形例］
以上、本発明の実施形態について説明したが、本発明は係る実施形態に限定されるものではなく、その技術思想の範囲内で様々な変形が可能である。なお、変形例としては、例えば、以下のようなものが考えられる。
【００４１】
（変形例１）上述した第１および第２実施形態においては、ページ画像データの特徴を表す特徴量として、画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、又は平坦なエリアの分布状態等を抽出した。このような情報は、プレゼンテーション用資料等のように文書の全部又はほとんどを画像が占めている場合には非常に有効である。しかしながら、契約書等のように大部分が文字からなるような文書である場合には、あまり有効ではないこともある。したがって、本変形例においては、ページ画像データから色調や輝度といった情報を抽出するのではなく、文字の高さ、字間、行間、縦書き・横書き等の文書フォーマットの特徴を示す情報（以下、フォーマット特徴量という）を抽出し、このフォーマット特徴量に基づいて２つの文書の類非を判定する場合について説明する。
【００４２】
契約書などの文書においては、１つの文書ではその体裁を統一することが一般的である。したがって、上述したようなフォーマットの特徴が同様なページ画像データは、同一の文書に属すると推定することができる。反対に、異なる文書に属するページ画像データ間では、意図的に同一のフォーマットで作成された文書でない限り、フォーマット特徴量が等しくなることは極めて稀である。このように、ほとんど文字によって構成される文書に対しては、上記フォーマット特徴量を用いることによって、そのページ画像データの類似性を正確に判定することができる。
【００４３】
スキャナ装置から入力したページ画像データに対して、文字の高さ、字間、行間などのフォーマット特徴量を求めるには、従来から様々な技術が提案されている。その一例が、特開平５−１０８７９３号公報に開示されている技術である（段落０００９から００１２参照）。当該技術においては、横書きであることを前提としてｂを行間、ｄを字間としている。しかし、通常は行間の方が字間より大きいので、ｂとｄを比較して大きい方を行間、小さい方を字間とし、ｂの方が大きい場合は横書き、ｄの方が大きい場合は縦書きと、縦書き・横書きの別も判断しても良い。
【００４４】
一般に、同一文書に属するページであっても、タイトル行、要約部、本文など、文書を構成する部位によってフォントの大きさや行間隔などが多少異なる場合もある。例えば、表題の文字は、本文よりも大きいフォントに設定される場合がある。したがって、上述したフォーマット特徴量を抽出しても、文書を構成する部位によってその値は異なり、ページ全体で一貫しないのが普通である。フォーマット特徴量の値が一貫しないと、フォーマット特徴量を用いて各々のページの文書画像が同一文書に属するのか否かを判定するのが困難になる。この問題については以下のようにして対処することができる。
【００４５】
まず、図２を参照して説明した方法と同様、入力されたページ画像データを複数の領域に分割する。次に分割された領域の各々について、文字の高さ、字間、行間、縦書き・横書きなど情報を含むフォーマット特徴量を算出する。以下では、文字の高さ「１０ｐｔ」、字間「１５ｐｔ」、行間「１０．５ｐｔ」、縦書き・横書き「０」という値が得られたものとする。なお、本変形例においては、縦書きの場合には「０」を、横書きの場合は「１」を対応付けるものとする。
【００４６】
次に、算出された全ての領域に係る特徴量のなかで最も頻繁に出現する値を決定し、これをそのページの特徴量とする。例えば、全２４個の領域のうち、２０個の領域において文字の高さが「１０ｐｔ」であり、３個の領域において「１２ｐｔ」、１つの領域では「１６ｐｔ」であった場合は、当該ページの文字の高さにかかる特徴量として「１０ｐｔ」が算出される。字間、行間、縦書き・横書きについても同様である。
【００４７】
一般的に言えば、表題や見出しがページ全体に占める割合は、文書を特徴付けている本文に比べて小さい。したがって、最頻出の値は、本文の特徴を表した量であるとみなすことができる。これによって、文書に表題や見出し部が存在したとしても、ページ画像データから的確に特徴量を得ることができる。
【００４８】
このようにして、１ページ分のページ画像データから、当該ページの文書フォーマットの特徴を表す特徴ベクトル（以下、フォーマット特徴ベクトルという）が求められる。下にフォーマット特徴ベクトルのｆの一例を示す。以下、上述した第１および第２実施形態の場合と同様に、２つの特徴ベクトルの間の距離を類似度評価手段４０に算出させ、算出された距離に基づいて、これら２つの特徴ベクトルで特徴を表されているページ画像データの類非を類似度評価手段４０に評価させることができる。
【００４９】
【数１】
ｆ＝（文字の高さ、字間、行間、［縦書き：０，横書き：１］）
【００５０】
（変形例２）上述した第１および第２実施形態では、区切り評価手段６０が、特許文献４に開示されている技術を適用することによって得られる区切りと一致しているか否かに基づいて、ユーザによって入力された区切りを評価する場合について説明した（図５参照）。しかしながら、ユーザによって入力された区切りを区切り評価手段６０に評価させる際の評価基準は、係る評価基準に限定されるものではない。例えば、図９に示されるように、原稿に含まれている一連の文書の各々が、各文書単位内で類似した特徴を有している場合には、図７に示される区切り評価処理に替えて、図１０に示される区切り評価処理を区切り評価手段６０に行わせるとしても良い。
【００５１】
図１０は、本変形例１に係る文書ファイリング装置の区切り評価手段６０が行う区切り評価処理の流れを示すフローチャートである。図１０に示されるように、区切り評価手段６０は、まず、前述したステップＳＡ２（図６参照）にて、ユーザによって入力された区切りに基づいて、ステップＳＡ１（図６参照）にて入力されたページ画像データを文書単位に分割する（ステップＳＤ１）。
【００５２】
そして、区切り評価手段６０は、ステップＳＤ１にて分割された文書単位毎に特徴量抽出手段２０を用いて特徴量を抽出する（ステップＳＤ２）。具体的には、区切り評価手段６０は、図９に示されるように、以下の３つの特徴量を文書単位毎に抽出する。第１の特徴量は、文書単位の先頭に位置するページ画像データの特徴量である。第２の特徴量は、文書単位の中央に位置するページ画像データの特徴量である。第３の特徴量は、文書単位の末尾に位置するページ画像データの特徴量である。
【００５３】
次に、区切り評価手段６０は、各文書単位毎に、ステップＳＤ２にて抽出した３つの特徴量が類似しているか否かを類似度評価手段４０によって評価する（ステップＳＤ３）。以下、区切り評価手段６０は、ステップＳＤ３の判定結果が“Ｙｅｓ”である場合には、前述したステップＳＢ３の処理を行い、逆に、ステップＳＤ３の判定結果が“Ｎｏ”である場合には、ステップＳＢ４およびステップＳＢ５の処理を行う。以上に説明したように、文書ファイリング装置に入力される原稿に含まれている一連の文書の各々が、各文書単位内で類似した特徴を有している場合には、図１０に示される区切り評価処理を区切り評価手段６０に行わせることにより、ユーザによって入力された文書単位の区切りの妥当性を評価することが可能になる。
【００５４】
また、図１１に示されるように、原稿に含まれている一連の文書の各々の特徴が互いに類似している場合には、図７に示される区切り評価処理に替えて、図１２に示される区切り評価処理を区切り評価手段６０に行わせるとしても良い。
【００５５】
図１２は、本変形例１に係る文書ファイリング装置の区切り評価手段６０が行う区切り評価処理の流れを示すフローチャートである。図１２に示される区切り評価処理が、図１０に示される区切り評価処理と異なっている点は、ステップＳＤ３に替えてステップＳＥ３を設けた点のみである。以下、このステップＳＥ３において、区切り評価手段６０が行う処理について詳細に説明する。なお、以下に説明する動作の前提として、Ｎ−１個（Ｎ：自然数）の区切りがユーザによって入力されており、画像入力手段１０によって入力されたページ画像データが、Ｎ個の文書単位に区切られているものとする。このような状況下で、さらに、Ｎ個目の区切りがユーザによって入力されたものとする。
【００５６】
図１２のステップＳＥ３において、区切り評価手段６０は、Ｎ＋１番目の文書単位の上記３つの特徴量（以下、文書単位に属するページ画像データの特徴を表す特徴量の集合を「文書画像データの特徴量」という）と、１番目からＮ番目の各々の文書単位の文書画像データの特徴量とが類似しているか否かを比較する。なお、文書画像データの特徴量同士を比較する場合には、例えば、そのれら文書画像データの特徴量を構成しているページ画像データの特徴量の重心を代表として比較することによって実現される。なお、複数の特徴量の代表は、それら特徴量の重心に限定されるものではない。また、前述した第２実施形態に係る文書ファイリング装置へ本変形例を適用する場合には、ユーザが最初に入力した区切りに対しては、上記評価を行わない。その理由は、比較対象となる文書単位がないからである。
【００５７】
そして、区切り評価手段６０は、ステップＳＥ３の判定結果が“Ｙｅｓ” である場合には、前述したステップＳＢ３の処理を行い、逆に、ステップＳＥ３の判定結果が“Ｎｏ”である場合には、ステップＳＢ４およびステップＳＢ５の処理を行う。以上に説明したように、原稿に含まれている一連の文書の各々の特徴が互いに類似している場合には、図１２に示される区切り評価処理を区切り評価手段６０に行わせることにより、ユーザによって入力された文書単位の区切りの妥当性を評価することが可能になる。
【００５８】
（変形例３）上述した第１および第２実施形態では、ユーザの入力した区切りが妥当ではないと判定した場合に、アラートメッセージを表示することによって、その旨ユーザへ報知する態様について説明した。しかしながら、ユーザによって入力された区切りが妥当ではない旨ユーザへ報知する態様は、アラートメッセージの表示による態様に限定されるものではない。例えば、妥当ではないと判定された区切り付近を強調表示する態様であっても良い。このようにすると、妥当ではない区切りをわかり易くユーザへ報知することが可能になるといった効果を奏する。
【００５９】
（変形例４）上述した第１および第２実施形態では、ユーザの入力した区切りが妥当であるか否かをページ画像データの特徴量に基づいて判定する場合について説明した。しかしながら、入力されたページ画像データに対して特許文献４に開示されている技術を適用することによって特定された区切りを予め強調表示したユーザインタフェイス手段５０に表示させるとしても良い。このようにすると、ユーザは次に入力すべき区切りを事前に把握することができるといった効果を奏する。
【００６０】
【発明の効果】
本発明によれば、手動による区切り作業におけるユーザの負担を軽減しつつ、一括して読み込まれた複数のページ画像データを効率的に文書単位に区切ることが可能になるといった効果を奏する。
【図面の簡単な説明】
【図１】本発明の第１実施形態に係る文書ファイリング装置の機能構成の一例を示す図である。
【図２】同文書ファイリング装置の特徴量抽出手段２０が抽出する特徴量を説明するための図である。
【図３】同文書ファイリング装置の特徴量の類似関係を説明するための図である。
【図４】同文書ファイリング装置のユーザインタフェイス手段５０に表示される操作画面の一例を示す図である。
【図５】手動区切り結果の妥当性判定基準を説明するための図である。
【図６】同文書ファイリング装置が行う動作の流れを示すフローチャートである。
【図７】同文書ファイリング装置の区切り評価手段６０が行う区切り評価処理の流れを示すフローチャートである。
【図８】本発明の第２実施形態に係る文書ファイリング装置が行う動作の流れを示すフローチャートである。
【図９】変形例２に係る妥当性判定基準を説明するための図である。
【図１０】変形例２に係る文書ファイリング装置の区切り評価手段６０が行う区切り評価処理の流れを示すフローチャートである。
【図１１】変形例２に係る妥当性判定基準を説明するための図である。
【図１２】変形例２に係る文書ファイリング装置の区切り評価手段６０が行う区切り評価処理の流れを示すフローチャートである。
【符号の説明】
１０…画像入力手段、２０…特徴量抽出手段、３０…画像格納手段、４０…類似度評価手段、５０…ユーザインタフェイス手段、６０…区切り評価手段、７０…バス。

Claims

１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、
前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、
前記画像入力手段によって取得されたページ画像データを文書単位に区切る際の区切りを前記特徴量に基づいて特定する特定手段と、
前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、
前記区切り入力手段によって入力された区切りと、前記特定手段によって特定された区切りとを比較し、両者が異なる場合には、前記ユーザへその旨報知する報知手段と
を有する文書ファイリング装置。
１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、
前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、
前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、
前記区切り入力手段によって入力された区切りに基づいて前記ページ画像データを文書単位に分割した場合に、ある文書単位に含まれているページ画像データの特徴量と該文書単位に含まれている他のページ画像データの特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する報知手段と
を有する文書ファイリング装置。
１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する画像入力手段と、
前記画像入力手段により取得されたページ画像データから該ページ画像データの特徴を表す特徴量を抽出する特徴量抽出手段と、
前記画像入力手段により取得されたページ画像データを文書単位に区切る際の区切りをユーザに入力させる区切り入力手段と、
前記区切り入力手段によって入力された区切りに基づいて前記ページ画像データを文書単位に分割した場合に、ある文書単位に対応する文書画像データの特徴量と他の文書単位に対応する文書画像データの特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する報知手段と
を有する文書ファイリング装置。
文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、
前記第１のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、
前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第２のステップにて提供したユーザインタフェイスを介して取得する第３のステップと、
前記文書ファイリング装置が、前記第３のステップにて取得した区切りと前記ページ画像データの特徴を表す特徴量に基づいて特定された区切りとが異なる場合には、前記ユーザへその旨報知する第４のステップと
を有する文書区切り方法。
文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、
前記第１のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、
前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第２のステップにて提供したユーザインタフェイスを介して取得する第３のステップと、
前記文書ファイリング装置が、前記第３のステップにて取得した区切りに基づいて前記第１のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に含まれているページ画像データの特徴を表す特徴量と該文書単位に含まれている他のページ画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第４のステップと
を有する文書区切り方法。
文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、
前記第１のステップにて読み取ったページ画像データを文書単位に区切るための全ての区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、
前記文書ファイリング装置が、前記ユーザによって入力された区切りを前記第２のステップにて提供したユーザインタフェイスを介して取得する第３のステップと、
前記文書ファイリング装置が、前記第３のステップにて取得した区切りに基づいて前記第１のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に対応する文書画像データの特徴を表す特徴量と他の文書単位に対応する文書画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第４のステップと
を有する文書区切り方法。
文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、
前記第１のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、
前記文書ファイリング装置が、前記第２のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取り、前記ページ画像データの特徴を表す特徴量に基づいて特定された区切りとが異なる場合には、前記ユーザへその旨報知する第３のステップと
を有する文書区切り方法。
文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、
前記第１のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、
前記文書ファイリング装置が、前記第２のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取るとともに、該区切りに基づいて前記第１のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に含まれているページ画像データの特徴を表す特徴量と該文書単位に含まれている他のページ画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第３のステップと
を有する文書区切り方法。
文書ファイリング装置が、１又は複数の文書からなる原稿を１ページずつ読み取り、読み取ったページの画像に対応するページ画像データを取得する第１のステップと、
前記第１のステップにて読み取ったページ画像データを文書単位に区切るため区切りをユーザに入力させるためのユーザインタフェイスを前記文書画像ファイリング装置が提供する第２のステップと、
前記文書ファイリング装置が、前記第２のステップにて提供したユーザインタフェイスを介してユーザにより入力された区切りを受け取るとともに、該区切りに基づいて前記第１のステップにて取得したページ画像データを文書単位に分割し、ある文書単位に対応する文書画像データの特徴を表す特徴量と他の文書単位に対応する文書画像データの特徴を表す特徴量との差の大きさが所定の閾値よりも大きい場合には、前記ユーザへその旨報知する第３のステップと
を有する文書区切り方法。