JP2005322081A - 文書管理装置および方法 - Google Patents

文書管理装置および方法 Download PDF

Info

Publication number
JP2005322081A
JP2005322081A JP2004140379A JP2004140379A JP2005322081A JP 2005322081 A JP2005322081 A JP 2005322081A JP 2004140379 A JP2004140379 A JP 2004140379A JP 2004140379 A JP2004140379 A JP 2004140379A JP 2005322081 A JP2005322081 A JP 2005322081A
Authority
JP
Japan
Prior art keywords
data
page
character recognition
document
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004140379A
Other languages
English (en)
Inventor
Shoichi Tateno
昌一 舘野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004140379A priority Critical patent/JP2005322081A/ja
Publication of JP2005322081A publication Critical patent/JP2005322081A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】 文書の各ページの画像データと文字認識結果とを対応づけた上でページ間、文書間を随意に移動して閲覧できるようにする。
【解決手段】 文書管理部50は、データ管理情報を管理する。データ管理情報は、画像データまたは文字認識結果データのページIDごとに、前ページID(直前のページのID)、次ページID(直後のページのID)、文書区切りフラグ、次文書のトップページID、前文書のトップページID等を保持する。各ページのレコードを参照することにより、前ページ、次ページ、前文書のトップページ、次文書のトップページのページIDを取得してそれぞれのページを記憶装置60から取りだして表示することができる。また画像データ、文字認識結果データの種別を指定することにより表示タイプを切り替えることができる。
【選択図】 図1

Description

この発明は、文書の画像データとその画像データの文字認識結果とを関連付けて管理する文書管理技術に関し、とくに、複数の文書についてその各ページの画像データと文字認識結果との間を自在に行き来しながら参照できるようにしたものである。
オフィス空間を有効に利用するために紙文書を遠隔地の比較的コストが低廉な倉庫に保管し、あるいは、破棄し、その内容を電子化して利用することが提案されている。紙文書の電子化は、オフィスコストを抑制するとともに情報の共有化の上でも好ましい。紙文書の電子化は、文書を各葉にばらばらにし、サイズの統一、両面ページの片面化等の前処理を行なった後、画像読取装置(スキャナ)で画像を読み取り、適宜、文字認識処理等の後処理を行い、文書単位で管理するようにしていた。膨大な数の文書を電子化した後、作業者が各文書に重要事項すなわち文書の属性を付与し、文書管理の用に供したり、電子化した文書に対して検索等を行なえるようにする。
ところで、作業者が文書に属性を付与する際には、文書から文書へ、ページからページへ随意に移動して内容を閲覧することが重要であり、また、画像データと文字認識結果とを対応づけて表示することが肝要である。例えば、ある文書に属性を付与する際に、表紙画像の文字認識結果を閲覧していたときに重要な部分に誤認識らしい箇所があった場合には即座に元の画像を参照して正しい内容を把握して属性の付与に反映させる必要がある。
なお、この発明と関連する特許文献としては、紙文書を電子化してサービス享受者に提供する際に、基本的には画像データを閲覧させ、目次(見出し項目と該当ページ)および各ページのページ番号とを文字認識したうえで、各ページの画像データを目次に対応させて表示できるようにすることを開示するものがある(特許文献1)。しかしながら、この特許文献には、各ページの画像データとその文字認識結果とを対応づけることについては何ら記載がない。
特開2002−24796公報
この発明は、以上の事情を考慮してなされたものであり、文書の各ページの画像データと文字認識結果とを対応づけた上でページ間、文書間を随意に移動して閲覧できる文書管理技術を提供することを目的としている。
この発明によれば、上述の目的を達成するために、特許請求の範囲に記載のとおりの構成を採用している。ここでは、発明を詳細に説明するのに先だって、特許請求の範囲の記載について補充的に説明を行なっておく。
すなわち、この発明の一側面によれば、上述の目的を達成するために、文書管理装置に:文書の所定量単位ごとの画像データと、上記所定量単位ごとの画像データを文字認識して得た所定量単位ごとの文字認識結果データとを関連付けて記憶するデータ記憶手段と;所定量単位で文書の部分を指定する文書部分指定手段と;上記文書部分指定手段で指定された文書の部分に対応する画像データおよび文字認識結果データを表示するデータ表示手段とを設けるようにしている。
この構成においては、文書の各所定量単位(例えば各ページ)の画像データと文字認識結果データとを対応づけて、各所定単位の画像データと文字認識結果データとの間を随意に移動して閲覧できる。
この構成において、画像データおよび文字認識結果のいずれかを指定するデータ種類指定手段を更に設け、データ種類指定手段の指定に応じて上記文書部分指定手段で指定された文書の部分に対応する画像データおよび文字認識結果データの一方を表示するようにしてもよい。もちろん画像データおよび文字認識結果データの双方を同時に表示しても良い。
上記所定量単位はページ、段落、章、節等である。複数種類の所定量単位をユーザが指定できるようにしても良い。
この発明の他の側面によれば、上述の目的を達成するために、文書管理装置に:文書のページごとの画像データに対して、当該画像データ自体を識別する本体データ識別子、当該ページの直前のページの画像データを識別する前ページデータ識別子および当該ページの直後のページの画像データを識別する次ページデータ識別子を記憶する画像データ管理情報記憶手段と;上記画像データと対応する文字認識結果データを上記画像データのデータ識別子と所定の対応関係により対応するデータ識別子の下で管理し、さらに、文書のページごとの文字認識結果データに対して、当該文字認識結果データ自体を識別する本体データ識別子、当該ページの直前のページの文字認識結果データを識別する前ページデータ識別子および当該ページの直後のページの文字認識結果を識別する次ページデータ識別子を記憶する文字認識結果データ管理情報記憶手段と;上記画像データのデータ識別子に基づいて文書のページごとの画像データを読み出し可能に記憶する画像データ記憶手段と;上記文字認識結果のデータ識別子に基づいて文書のページごとの文字認識結果データを読み出し可能に記憶する画像データ記憶手段と;現在の画像データの表示を直前のページの画像データおよび直後のページの画像データの表示にそれぞれ切り替える指示に応答して、上記画像データ管理情報記憶手段を参照して該当するデータ識別子を決定し、決定したデータ識別子により上記画像データ記憶手段から該当する画像データを読み出す第1のデータ読み出し手段と;現在の文字認識結果データの表示を直前のページの文字認識結果データおよび直後のページの文字認識結果データの表示にそれぞれ切り替える指示に応答して、上記文字認識結果データ管理情報記憶手段を参照して該当するデータ識別子を決定し、決定したデータ識別子により上記文字認識結果データ記憶手段から該当する文字認識結果データを読み出す第2のデータ読み出し手段と;現在の画像データの表示を対応する文字認識結果データの表示に切り替える指示に応答して現在の画像データのデータ識別子に対応する文字認識結果データのデータ識別子を上記所定の対応関係から決定し、決定した文字認識結果データのデータ識別子により上記文字認識結果データ記憶手段から該当する文字認識結果データを読み出す第3のデータ読み出し手段と;現在の文字認識結果データの表示を対応する画像データの表示に切り替える指示に応答して現在の文字認識結果のデータ識別子に対応する画像データのデータ識別子を上記所定の対応関係から決定し、決定した画像データのデータ識別子により上記画像データ記憶手段から該当する画像データを読み出す第4のデータ読み出し手段と;上記第1のデータ読み出し手段、上記第2のデータ読み出し手段、上記第3のデータ読み出し手段、および上記第4のデータ読み出し手段から読み出した画像データまたは文字認識結果データを表示する表示手段とを設けるようにしている。
この構成においては、文書の各ページの画像データと文字認識結果とを対応づけた上でページ間、文書間を随意に移動して閲覧できる。
この発明の文書管理装置は、単一の筐体に収容された単一の機器でもよいし、個別の筐体に収容された個別の機器を組み合わせて構成したものでも良い。例えばクライアント・サーバ・システムでこの発明の文書管理装置を構成できる。
画像データは、文字コードによりコード化されていないデータであり、種々のフォーマットを採用でき、種々の画像データ閲覧ソフトウェアを用いて表示できる。文字認識結果データは、文字コードからなるファイルであり、種々のフォーマットで記憶される。例えばテキストやHTML文書の形態で保持される。
画像データと文字認識結果データの対応づけは任意のものを採用できる。同一の文書IDを用い、バージョンを異ならせても良いし、ファイル名や、パス名の一部を同一にしても良い。テーブルを用いて個々の画像データファイルと文字認識結果データファイルとを対応づけても良いし、リンク情報を用いても良い。
この構成においては、上記画像データ管理情報記憶手段は、文書のページごとの画像データに対して、さらに当該ページが文書区切りに隣接しているかどうかを示す文書区切り情報を記憶し、上記文字認識結果データ管理情報記憶手段は、文書のページごとの文字認識結果データに対して、さらに、当該ページが文書区切りに隣接しているかどうかを示す文書区切り情報を記憶するようにしてもよい。
文書区切り情報を用いて文書ごとの管理が可能になる。
画像データ管理情報は種々のフォーマットで保持されてよく、例えば、データベースのレコード(タプル)やCSV(コンマ・セパレイテッド・バリュー)ファイル等を採用できる。
上記データ識別子は典型的にはファイル管理システムのパス名であり、上記画像データのデータ識別子と、当該画像データに対応する文字認識結果データのデータ識別子とは一部が共通であり、相違部分で画像データか文字認識結果データかを判別するようにしてもよい。
画像データと文字認識結果データとを対応する別々のフォルダに保持するようにしてもよい。
画像データと文字認識結果データとを拡張子により区別するようにしてもよい。
上記画像データ管理情報記憶手段および上記文字認識結果データ管理情報記憶手段のうちの一方を他方で兼用するようにしてもよい。
なお、この発明は装置またはシステムとして実現できるのみでなく、方法としても実現可能である。また、そのような発明の一部をソフトウェアとして構成することができることはもちろんである。またそのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品もこの発明の技術的な範囲に含まれることも当然である。
この発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。
この発明によれば、文書の各ページの画像データと文字認識結果とを対応づけた上でページ間、文書間を随意に移動して閲覧できる。
以下、この発明の実施例について説明する。
図1は、この発明の実施例1を模式的に示している。この実施例は、この発明の文書管理技術を文書属性入力装置に適用したものである。この実施例では、複数の紙文書を電子化して各文書の各ページの画像データを取得し、さらに各ページの文字認識結果データ(この例では固有表現をマークアップしてハイライトしたHTML、コードデータ、テキストデータでもよい)を取得してハイライト情報等を参照しながら文書に属性を付与する。この例では説明の便宜上、3つの文書の画像を読み取る場合を前提とするが、文書数等はこれに限らないことはもちろんである。
図1において、実施例1の文書属性入力装置は、紙送り装置20、画像読取装置30、文字認識装置31、用紙判別部40、文書管理部50、記憶装置60、表示制御部70、表示装置80、ポインティング装置90等を含んで構成されている。
紙送り装置20および画像読取装置30は紙文書の電子化を行なう。まず、文書D1、D2、D3がバラバラにされて用紙束d1、d2、d3とされ、それぞれの用紙束d1、d2、d3の上に管理用用紙(バナーシートともいう)c1、c2、c3が挿入される。これら一群の用紙はバッチ処理される対象として(以下ではバッチ用紙束ともいい、符号10で示す)紙送り装置20に載置される。紙送り装置20はバッチ用紙束10の用紙を上から、または下から順次に送り出して画像読取装置30に供給する。画像読取装置30は、典型的には、通常のスキャナであり、送られてくる用紙の印刷面を光学的に走査して印刷面の電子画像データを取得する。
文字認識装置31は、電子画像データに対して周知の文字認識処理を実行する。
用紙判別部40は、バッチ用紙束10から管理用用紙c1、c2、c3を検出する。管理用用紙c1、c2、c3は、他の用紙と区別するために、例えば、特別な色の用紙(一部の特定領域が特別の色でも良い)を用いる。あるいは、図12に示すように、区別用の文字列100、例えば「BANNER」とそれに続く連続数字(例えば「0001」から徐々に大きくなる数字)を印刷しても良いし、一次元または二次元バーコードやRFIDタグを設けて文書区切りの用紙としても良い。用紙の色は、画像読取装置30で読み取った電子画像データの属性から判別できる。紙送り装置20等に色判別機構(例えば、所定の色の光を検出する検出器。図示しない)を設けても良い。管理用用紙c1、c2、c3の記述内容を利用する場合には、その光学画像を文字認識装置31により文字コードに変換して記述内容、例えば「BANNER」の文字や連続番号に連続性等に基づいて検出する。バーコードやRFIDタグを用いる場合には専用の読取機が必要である。RFIDタグの読取機は、用紙が重なって複数のRFIDタグが相互に近傍に配置されている状態では、誤動作を招来するので、紙送り装置20の搬送路等、用紙が重ならない状態が保証されている場所に設けることが好ましい。また、電磁遮蔽部を設けて外来ノイズへの耐性を強化することが好ましい。
文書管理部50は、図4に示すように、管理用用紙からつぎの管理用用紙の間の用紙の画像(一番下の用紙束の場合、管理用用紙の次の用紙の画像から最後の用紙の画像まで)を1つの管理単位で管理する。さらに、図4の例では、文書を構成する各ページの画像データと、その画像データを文字認識して取得したテキストとを、1つの管理単位50aの下で管理している。より具体的には、文書ごとに各ページの画像データにページ順の連続番号を持つ識別子(ID)を付与する。さらに文書ごとの各ページの文字認識結果データにページ順に連続番号を付す。対応する画像データの識別子と文字認識結果データの識別子とは主たる部分が同一であり、データ種別を表す部分が異なる。例えば、画像データを「0001−001img」で表し、文字認識結果を「0001−001html」で表す。データ種別は拡張子で表示しても良い。データ識別子はパス名であってもよいし、パス名とは独立した別の識別子であってもよい。さらに具体的な例では、1文書の画像データを1つのフォルダに配置し、各画像データを1つのファイルとして連続したファイル名を割り当てる。同様に文字認識結果についても各文書について1つのフォルダを用意し、各ページの文字認識結果のデータを1つのファイルとして連続したファイル名を割り当てる。相互に対応する画像データのファイルと文字認識結果データのファイルとは、対応するファイル名を有し、相互に関連付けられ、一方から他方を容易に決定できる。例えばフォルダ名を適宜に変更し、拡張子も適宜に変更すればよい。図4の破線は画像データとテキストデータとが異なるフォルダ50b、50cで管理されていることを示す。図4の例では、複数の文書の画像データを1つのフォルダ50bに配置し、対応する複数の文書の文字認識結果データを他の1つのフォルダ50cに配置している。もちろん、画像データや文字認識結果データがどの文書に属するかは、個別のフォルダ50b、50cを用いずに、例えば、データ識別子(ファイル名でもよい)の一部にどの文書かを示す文字列を含ませても良い。
上述した画像データおよび文字認識結果データは記憶装置60(図2の画像データ記憶部61および文字認識結果データ記憶部62)に記憶される。
文書管理部50は、さらに、データ管理情報を管理する。図5はデータ管理情報の一例を示しており、この図に示されるように、画像データまたは文字認識結果データのページIDごとに、前ページID(直前のページのID)、次ページID(直後のページのID)、文書区切りフラグ、次文書のトップページID、前文書のトップページID等が割り当てられている。該当するページがない場合には「null」が割り当てられる。文書区切りフラグが「TRUE」のときには、そのページの次が他の文書のページであること、すなわち文書区切りであるを示し、文書区切りフラグが「FALSE」のときには、その次のページも同一の文書のページであること、すなわち文書区切りでないことを示す。文書区切りフラグを用いて個々の文書を区切って管理できる。
例えば、当ページIDが「0001−001」(この例では文書0001の001ページを示す)のときには次ページIDは「0001−002」であり、前ページIDは「null」である(文書001は最初の文書)。文書区切りフラグは「FALSE」であり、次文書のトップページIDは「0002−001」である。前文書のトップページIDは「null」である。
同様に、当ページIDが「0001−005」の場合、前ページIDは「0001−004」であり、次ページIDは「0002−001」であり、文書区切りフラグが「TRUE」であり、次文書のトップページIDが「0003−001」であり、前文書のトップページIDが「0001−001」である。
各ページのレコード(タプル)を参照することにより、前ページ、次ページ、前文書のトップページ、次文書のトップページのページIDを取得してそれぞれのページを記憶装置60から取りだして表示することができる。
なお、この例では、画像データのフォルダとページIDとを指定して画像データを取り出し、文字認識結果データのフォルダとページIDとを指定して文字認識結果データを取り出すようにしている。すなわち、フォルダを指定することにより画像データと文字認識結果データを区別するようにしている。もちろん、拡張子により画像データおよび文字認識結果データの区別を行なったり、付加的な区別用の文字列をページIDに加えて画像データまたは文字認識結果データを区別して取り出すようにしても良い。
また図5のデータ管理情報は種々のフォーマットを採用でき、例えば、データベースのレコードとして管理されていも良いし、CSVファイルとして管理されても良いし、その他任意のフォーマットで管理されて良い。
文書管理部50は、さらに、利用者に対して、図3に示すような属性入力用のユーザインタフェースを提示して利用者から属性入力を受け付ける。すなわち、文書管理部50は、図3に示すような属性入力用のユーザインタフェースを表示するためのデータを表示制御部70に送り、表示制御部70はCRTや液晶表示装置等の表示装置80の画面上に図3に示すようなユーザインタフェースを表示する。ポインティング装置90は、例えばマウス装置であり、表示装置80の表示画面上の座標を指示するものである。
図3に示す表示例では、左側のフレームF1に文字認識結果データ(HTML文書)151を表示している。紙文書をスキャンインして取得したオリジナルの画像文書(画像データ)を文字認識処理し、そののち固有表現を抽出し当該固有表現をタグによりハイライトしたものである。この例では、「あいうえ男」(人名)、「H16/05/10」(日付)、「東京都」(地名)、「日本株式会社」(組織名)等の固有表現をハイライトして示している。
フレームF1には、文字認識結果データ151に代えてオリジナルの画像データを表示することができる。例えば図3の例では、上部にコマンドバーCに種々の[画像文書](オリジナルの画像データ)、[HTML文書](文字認識結果データ)、[前ページ]、[次ページ]、[前文書]、[次文書]のコマンドボタンが設けられ、[画像文書]、[HTML文書]をクリック操作等することにより文書の切替を行なえる。
また、[前ページ]、[次ページ]、[前文書]、[次文書]をクリックすることにより前ページのデータ(画像データまたは文字認識結果データ)、次ページのデータ、前文書のトップページにデータ、次文書のトップページのデータをフレームF1に表示できる。
図3の例では、フレームF2、F3に属性入力テーブル152およびお定型語句テーブル153が表示されている。文書管理部50は、文字認識結果データ(HTML文書)のハイライト部分がクリックされ、属性入力テーブル152のフィールドがクリックされたことに基づいて、ハイライト部分の語句を属性入力テーブル152のフィールドに転記する。同様に、文書管理部50は、定型語句テーブル153の所定の定型語句がクリックがクリックされ、属性入力テーブル152のフィールドがクリックされたことに基づいて、定型語句を属性入力テーブル152のフィールドに転記する。
このようにして、文字認識結果データ(HTML文書)のハイライト部または定型語句のフィールドをクリックした後、属性入力テーブルのフィールドをクリックすることにより簡易に属性値を入力できる。
文字認識結果には誤認識もあるので、文字認識結果データから属性入力テーブルに転記を行なう際には、オリジナルの画像データを閲覧してそれが正しいかどうかを検証しなけらえばならない場合もある。また、文書の属性を判別するために前後のページを閲覧しなければならない場合もある。また、今まで属性を付与した文書やこれから属性を付与しようとしている文書を閲覧して全体的な見地から属性を判別する必要がある場合がある。
この実施例では、[画像文書](オリジナルの画像データ)、[HTML文書](文字認識結果データ)、[前ページ]、[次ページ]、[前文書]、[次文書]のコマンドボタンをクリック操作することにより、任意の種類のデータの任意のページに即座に移動して表示が可能である。
図2は、図1の文書管理部50の要部の構成例を説明するものである。図2の要部構成例は画像データまたは文字認識結果データを取りだして表示するためのものである。図2において、文書管理部50には、第1読み出し部51、第2読み出し部52、第3読み出し部53、第4読み出し部54、イベント受信部55等が設けられている。また記憶装置60には、画像データ記憶部61、文字認識結果データ記憶部62、画像データ管理情報記憶部63、文字認識結果データ管理情報記憶部64等が設けられている。画像データ記憶部61は各ページの画像データ(図2のフォルダ50bの画像データ)を記憶するものである。文字認識結果データ記憶部62は各ページの文字認識結果データ(図2のフォルダ50cの文字認識結果データ)を記憶するものである。画像データ管理情報記憶部63は、図3に示すようなデータ管理情報を画像データに関して記憶するものである。文字認識結果データ管理情報記憶部64は、図5に示すようなデータ管理情報を、文字認識結果データに関して記憶するものである。図5に示すようにページIDを画像データおよび文字認識結果データの双方のアドレッシングに検証する場合には、データ管理情報を画像データと文字認識結果データとで兼用することもできる。画像データ記憶部61、文字認識結果データ記憶部62、画像データ管理情報記憶部63、文字認識結果データ管理情報記憶部64は、図2においては個別に表示されているが、1つの記憶機器に配置しても良いし、複数の記憶機器に配置しても良い。
ポインティング装置90を用いて[画像文書]、[HTML文書]、[前ページ]、[次ページ]、[前文書]、[次文書]のコマンドボタンがクリック操作されると、イベント受信部55が対応するイベントを受け取って第1読み出し部51、第2読み出し部52、第3読み出し部53、第4読み出し部54のいずれかが画像データ管理情報記憶部63や文字認識結果データ管理情報記憶部64を適宜参照して画像データ記憶部61や文字認識結果データ記憶部62から画像データや文字認識結果データを読み出して表示制御部70に供給し表示装置80に画像データまたは文字認識結果データを表示する。
つぎに[画像文書]、[HTML文書]、[前ページ]、[次ページ]、[前文書]、[次文書]の各コマンドボタンがクリック操作されたときの動作を説明する。
図6は、[前ページ]のコマンドボタンがクリックされたときの動作例を示している。ここでは、便宜上、現時点において画像データが表示されているものとするが、文字認識結果データ(HTML文書)が表示されている場合も同様である。図6において、イベント受信部55が当該イベントを判別して、画像データ管理情報記憶部63を参照して現時点の画像データのページIDを当ページIDとするレコード(タプル)を取り出す。例えば、現在の画像データのページIDが「0001−002」であれば、図5の上から2番めのレコード(0001−001,0001−001,0001−003,FALSE,0002−001,null)を取り出し、このレコードから前ページID「0001−001」を取得する(S10)。こののちこのページIDを用いて画像データ記憶部61から該当する画像データを取り出し、表示装置80を用いて図3のフレームF1に表示する(S11、S12)。
図7は、[次ページ]のコマンドボタンがクリックされたときの動作例を示している。ここでも、便宜上、現時点において画像データが表示されているものとするが、文字認識結果データ(HTML文書)が表示されている場合も同様である。図7において、イベント受信部55が当該イベントを判別して、画像データ管理情報記憶部63を参照して現時点の画像データのページIDを当ページIDとするレコード(タプル)を取り出す。例えば、現在の画像データのページIDが「0001−002」であれば、図5の上から2番めのレコード(0001−001,0001−001,0001−003,FALSE,0002−001,null)を取り出し、次ページID「0001−003」を取得する(S20)。こののちこのページIDを用いて画像データ記憶部61から該当する画像データを取り出し、これを表示装置80を用いて図3のフレームF1に表示する(S21、S22)。
図8は、[前文書]のコマンドボタンがクリックされたときの動作例を示している。ここでも、便宜上、現時点において画像データが表示されているものとするが、文字認識結果データ(HTML文書)が表示されている場合も同様である。図8において、イベント受信部55が当該イベントを判別して、画像データ管理情報記憶部63を参照して現時点の画像データのページIDを当ページIDとするレコード(タプル)を取り出す。例えば、現在の画像データのページIDが「0002−001」であれば、図5の上から6番めのレコード(0002−001,0001−005,0002−002,FALSE,0003−001,0001−001)を取り出し、このレコードから前文書のトップページID「0001−001」を取得する(S30)。こののちこのページIDを用いて画像データ記憶部61から該当する画像データを取り出し、表示装置80を用いて図3のフレームF1に表示する(S31、S32)。
図9は、[次文書]のコマンドボタンがクリックされたときの動作例を示している。ここでも、便宜上、現時点において画像データが表示されているものとするが、文字認識結果データ(HTML文書)が表示されている場合も同様である。図9において、イベント受信部55が当該イベントを判別して、画像データ管理情報記憶部63を参照して現時点の画像データのページIDを当ページIDとするレコード(タプル)を取り出す。例えば、現在の画像データのページIDが「0002−001」であれば、図5の上から6番めのレコード(0002−001,0001−005,0002−002,FALSE,0003−001,0001−001)を取り出し、このレコードから次文書のトップページID「0003−001」を取得する(S40)。こののちこのページIDを用いて画像データ記憶部61から該当する画像データを取り出し、表示装置80を用いて図3のフレームF1に表示する(S41、S42)。
図10は、[画像文書]のコマンドボタンがクリックされたときの動作例を示している。便宜上、現時点において文字認識結果データ(HTML文書)が表示されているものとする。図10において、イベント受信部55が当該イベントを判別して、現時点の文字認識結果データのページIDを用いて画像データ記憶部61を参照して対応する画像データを取り出し、表示装置80を用いて図3のフレームF1に表示する(S50、S51、S52)。
図11は、[HTML文書]のコマンドボタンがクリックされたときの動作例を示している。便宜上、現時点において画像データが表示されているものとする。図11において、イベント受信部55が当該イベントを判別して、現時点の画像データのページIDを用いて文字認識結果データ記憶部62を参照して対応する文字認識結果データ(HTML文書)を取り出し、表示装置80を用いて図3のフレームF1に表示する(S60、S61、S62)。
以上で実施例1の説明を終了する。
この実施例によれば、画像データと文字認識結果データとを対応づけながら前ページ、次ページ、前文書、次文書に移動しながら閲覧を行なえ、文字認識結果を画像データで検証しながら文書の属性を入力していくことができる。この例では文書の属性を入力する場合を例に挙げたが、広く文字認識結果とオリジナルの画像データとを対応づけて閲覧できるようにして文書の内容を把握する場合等に広く利用できる。また文字認識結果に対してキーワード検索等を行い、該当するページのオリジナルの画像データを閲覧する等してもよい。
つぎに複写機を用いた実施例2について説明する。
図13は、実施例2の構成を全体として示しており、この図において、図1と対応する箇所には対応する符号を付した。
図6において、複写機200は、紙送り装置20、画像読取装置30、文字認識装置31、用紙判別部40、文書データ転送部2010等を含んで構成されている。紙送り装置20は図1のバッチ用紙束10を一枚一枚画像読取装置30に送り出し、画像読取装置30は各用紙の光学画像を電子データに変換する。用紙判別部40は管理用用紙を判別する。文字認識装置31は、画像読取装置30が生成した電子画像から文字認識を行なう。この文字認識結果は例えばテキストファイルやHTMLファイル等とされ図4に示したように管理される。複写機200の操作部200aは、画像読取開始指示等、種々の操作を指示するものである。
複写機200の文書データ転送部201は、FTPプロトコル等により文書の電子データをサーバ装置300に転送する。サーバ装置300は文書管理部50および記憶装置60を具備して、クライアント装置400に対して文書データの閲覧サービス等を提供する。この実施例においても文書管理部50が表示データの管理を行い、クライアント装置400の表示画面において[画像文書]、[HTML文書]、[前ページ]、[次ページ]、[前文書]、[次文書]の各コマンドボタンがクリックされたことに基づいて画像データや文字認識結果データをクライアント装置400に転送して表示内容を更新する。
この実施例においても、画像データと文字認識結果データとを対応づけながら前ページ、次ページ、前文書、次文書に移動しながら閲覧を行なえる。
なお、この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。例えば、実施例2では、文字認識、用紙判別を複写機200側で行なったが、読み取った画像データを文書データ転送部201でサーバ装置300に送り、サーバ装置300で文字認識、用紙判別を行なうようにしても良い。
また、上述実施例では文字認識結果データをHTML文書で表示するようにしたが、他のマークアップ言語例えばXMLやXHTML等で表示しても良いし、テキストや他のコードデータで表示しても良い。
この発明の実施例1の文書属性入力装置を模式的に示す図である。 実施例1の文書管理部50の要部構成例を説明するブロック図である。 実施例1の属性入力画面の例を説明する図である。 実施例1の画像データおよび文字認識結果データの管理態様を説明する図である。 実施例1のデータ管理情報を説明する図である。 実施例1の動作例(その1)を説明するフローチャートである。 実施例1の動作例(その2)を説明するフローチャートである。 実施例1の動作例(その3)を説明するフローチャートである。 実施例1の動作例(その4)を説明するフローチャートである。 実施例1の動作例(その5)を説明するフローチャートである。 実施例1の動作例(その6)を説明するフローチャートである。 実施例1の管理用用紙の例を説明する図である。 この発明の実施例2の構成を説明する図である。
符号の説明
10 バッチ用紙束
20 紙送り装置
30 画像読取装置
31 文字認識装置
40 用紙判別部
50a 管理単位
50b フォルダ
50c フォルダ
50 文書管理部
51 第1読み出し部
52 第2読み出し部
53 第3読み出し部
54 第4読み出し部
55 イベント受信部
60 記憶装置
61 画像データ記憶部
62 文字認識結果データ記憶部
63 画像データ管理情報記憶部
64 文字認識結果データ管理情報記憶部
70 表示制御部
80 表示装置
90 ポインティング装置
100 文字列
151 文字認識結果データ
152 属性入力テーブル
153 定型語句テーブル
200 複写機
200a 操作部
201 文書データ転送部
300 サーバ装置
400 クライアント装置

Claims (14)

  1. 文書の所定量単位ごとの画像データと、上記所定量単位ごとの画像データを文字認識して得た所定量単位ごとの文字認識結果データとを関連付けて記憶するデータ記憶手段と、
    所定量単位で文書の部分を指定する文書部分指定手段と、
    上記文書部分指定手段で指定された文書の部分に対応する画像データおよび文字認識結果データを表示するデータ表示手段とを有することを特徴とする文書管理装置。
  2. 画像データおよび文字認識結果のいずれかを指定するデータ種類指定手段を更に有し、データ種類指定手段の指定に応じて上記文書部分指定手段で指定された文書の部分に対応する画像データおよび文字認識結果データの一方を表示する請求項1記載の文書管理装置。
  3. 上記所定量単位はページである請求項1または2記載の文書管理装置。
  4. 上記所定量単位は、文書のセクションである請求項1または2記載の文書管理装置。
  5. 上記文書のセクションは段落である請求項4記載の文書管理装置。
  6. 上記所定量単位をユーザが指定できる請求項1または2記載の文書管理装置。
  7. 文書のページごとの画像データに対して、当該画像データ自体を識別する本体データ識別子、当該ページの直前のページの画像データを識別する前ページデータ識別子および当該ページの直後のページの画像データを識別する次ページデータ識別子を記憶する画像データ管理情報記憶手段と、
    上記画像データと対応する文字認識結果データを上記画像データのデータ識別子と所定の対応関係により対応するデータ識別子の下で管理し、さらに、文書のページごとの文字認識結果データに対して、当該文字認識結果データ自体を識別する本体データ識別子、当該ページの直前のページの文字認識結果データを識別する前ページデータ識別子および当該ページの直後のページの文字認識結果を識別する次ページデータ識別子を記憶する文字認識結果データ管理情報記憶手段と、
    上記画像データのデータ識別子に基づいて文書のページごとの画像データを読み出し可能に記憶する画像データ記憶手段と、
    上記文字認識結果のデータ識別子に基づいて文書のページごとの文字認識結果データを読み出し可能に記憶する画像データ記憶手段と、
    現在の画像データの表示を直前のページの画像データおよび直後のページの画像データの表示にそれぞれ切り替える指示に応答して、上記画像データ管理情報記憶手段を参照して該当するデータ識別子を決定し、決定したデータ識別子により上記画像データ記憶手段から該当する画像データを読み出す第1のデータ読み出し手段と、
    現在の文字認識結果データの表示を直前のページの文字認識結果データおよび直後のページの文字認識結果データの表示にそれぞれ切り替える指示に応答して、上記文字認識結果データ管理情報記憶手段を参照して該当するデータ識別子を決定し、決定したデータ識別子により上記文字認識結果データ記憶手段から該当する文字認識結果データを読み出す第2のデータ読み出し手段と、
    現在の画像データの表示を対応する文字認識結果データの表示に切り替える指示に応答して現在の画像データのデータ識別子に対応する文字認識結果データのデータ識別子を上記所定の対応関係から決定し、決定した文字認識結果データのデータ識別子により上記文字認識結果データ記憶手段から該当する文字認識結果データを読み出す第3のデータ読み出し手段と、
    現在の文字認識結果データの表示を対応する画像データの表示に切り替える指示に応答して現在の文字認識結果のデータ識別子に対応する画像データのデータ識別子を上記所定の対応関係から決定し、決定した画像データのデータ識別子により上記画像データ記憶手段から該当する画像データを読み出す第4のデータ読み出し手段と、
    上記第1のデータ読み出し手段、上記第2のデータ読み出し手段、上記第3のデータ読み出し手段、および上記第4のデータ読み出し手段から読み出した画像データまたは文字認識結果データを表示する表示手段とを有することを特徴とする文書管理装置。
  8. 上記画像データ管理情報記憶手段は、文書のページごとの画像データに対して、さらに当該ページが文書区切りに隣接しているかどうかを示す文書区切り情報を記憶し、上記文字認識結果データ管理情報記憶手段は、文書のページごとの文字認識結果データに対して、さらに、当該ページが文書区切りに隣接しているかどうかを示す文書区切り情報を記憶する請求項1記載の文書管理装置。
  9. 上記データ識別子はファイル管理システムのパス名であり、上記画像データのデータ識別子と、当該画像データに対応する文字認識結果データのデータ識別子とは一部が共通であり、相違部分で画像データか文字認識結果データかを判別する請求項7または8記載の文書管理装置。
  10. 画像データと文字認識結果データとを対応する別々のフォルダに保持する請求項9記載の文書管理装置。
  11. 画像データと文字認識結果データとを拡張子により区別する請求項9または10記載の文書管理装置。
  12. 上記画像データ管理情報記憶手段および上記文字認識結果データ管理情報記憶手段のうちの一方を他方で兼用する請求項7〜11のいずれかに記載の文書管理装置。
  13. 文書のページごとの画像データに対して、当該画像データ自体を識別する本体データ識別子、当該ページの直前のページの画像データを識別する前ページデータ識別子、当該ページの直後のページの画像データを識別する次ページデータ識別子、当該文書の直前の文書の所定ページの画像データを識別する前文書データ所定ページ識別子および当該文書の直後の文書の所定ページの画像データを識別する次文書データ所定ページ識別子を記憶する画像データ管理情報記憶手段と、
    上記画像データと対応する文字認識結果データを上記画像データのデータ識別子と所定の対応関係により対応するデータ識別子の下で管理し、さらに、文書のページごとの文字認識結果データに対して、当該文字認識結果データ自体を識別する本体データ識別子、当該ページの直前のページの文字認識結果データを識別する前ページデータ識別子、当該ページの直後のページの文字認識結果を識別する次ページデータ識別子、当該文書の直前の文書の所定ページの文字認識結果を識別する前文書データ所定ページ識別子および当該文書の直後の文書の所定ページの文字認識結果データを識別する次文書データ所定ページ識別子を記憶する文字認識結果データ管理情報記憶手段と、
    上記画像データのデータ識別子に基づいて文書のページごとの画像データを読み出し可能に記憶する画像データ記憶手段と、
    上記文字認識結果データのデータ識別子に基づいて文書のページごとの文字認識結果データを読み出し可能に記憶する画像データ記憶手段とを準備し、
    第1のデータ読み出し手段により、現在の画像データの表示を直前のページの画像データ、直後のページの画像データ、直前の文書の所定のページの画像データおよび直後の文書の所定のページの画像データの表示にそれぞれ切り替える指示に応答して、上記画像データ管理情報記憶手段を参照して該当するデータ識別子を決定し、決定したデータ識別子により上記画像データ記憶手段から該当する画像データを読み出すステップと、
    第2のデータ読み出し手段により、現在の文字認識結果データの表示を直前のページの文字認識結果データ、直後のページの文字認識結果データ、直前の文書の所定のページの文字認識結果データおよび直後の文書の所定のページの文字認識結果データの表示にそれぞれ切り替える指示に応答して、上記文字認識結果データ管理情報記憶手段を参照して該当するデータ識別子を決定し、決定したデータ識別子により上記文字認識結果データ記憶手段から該当する文字認識結果データを読み出すステップと、
    第3のデータ読み出し手段により、現在の画像データの表示を対応する文字認識結果データの表示に切り替える指示に応答して現在の画像データのデータ識別子に対応する文字認識結果データのデータ識別子を上記所定の対応関係から決定し、決定した文字認識結果データのデータ識別子により上記文字認識結果データ記憶手段から該当する文字認識結果データを読み出すステップと、
    第4のデータ読み出し手段により、現在の文字認識結果データの表示を対応する画像データの表示に切り替える指示に応答して現在の文字認識結果のデータ識別子に対応する画像データのデータ識別子を上記所定の対応関係から決定し、決定した画像データのデータ識別子により上記画像データ記憶手段から該当する画像データを読み出すステップと、
    表示手段により、上記第1のデータ読み出し手段、上記第2のデータ読み出し手段、上記第3のデータ読み出し手段、および上記第4のデータ読み出し手段から読み出した画像データまたは文字認識結果データを表示するステップとを有することを特徴とする文書管理方法。
  14. 画像データ管理情報記憶手段により、文書のページごとの画像データに対して、当該画像データ自体を識別する本体データ識別子、当該ページの直前のページの画像データを識別する前ページデータ識別子、当該ページの直後のページの画像データを識別する次ページデータ識別子、当該文書の直前の文書の所定ページの画像データを識別する前文書データ所定ページ識別子および当該文書の直後の文書の所定ページの画像データを識別する次文書データ所定ページ識別子を記憶するステップと、
    文字認識結果データ管理情報記憶手段により、上記画像データと対応する文字認識結果データを上記画像データのデータ識別子と所定の対応関係により対応するデータ識別子の下で管理し、さらに、文書のページごとの文字認識結果データに対して、当該文字認識結果データ自体を識別する本体データ識別子、当該ページの直前のページの文字認識結果データを識別する前ページデータ識別子、当該ページの直後のページの文字認識結果を識別する次ページデータ識別子、当該文書の直前の文書の所定ページの文字認識結果を識別する前文書データ所定ページ識別子および当該文書の直後の文書の所定ページの文字認識結果データを識別する次文書データ所定ページ識別子を記憶するステップと、
    画像データ記憶手段により、上記画像データのデータ識別子に基づいて文書のページごとの画像データを読み出し可能に記憶するステップと、
    画像データ記憶手段により、上記文字認識結果のデータ識別子に基づいて文書のページごとの文字認識結果データを読み出し可能に記憶するステップと、
    第1のデータ読み出し手段により、現在の画像データの表示を直前のページの画像データ、直後のページの画像データ、直前の文書の所定のページの画像データおよび直後の文書の所定のページの画像データの表示にそれぞれ切り替える指示に応答して、上記画像データ管理情報記憶手段を参照して該当するデータ識別子を決定し、決定したデータ識別子により上記画像データ記憶手段から該当する画像データを読み出すステップと、
    第2のデータ読み出し手段により、現在の文字認識結果データの表示を直前のページの文字認識結果データ、直後のページの文字認識結果データ、直前の文書の所定のページの文字認識結果データおよび直後の文書の所定のページの文字認識結果データの表示にそれぞれ切り替える指示に応答して、上記文字認識結果データ管理情報記憶手段を参照して該当するデータ識別子を決定し、決定したデータ識別子により上記文字認識結果データ記憶手段から該当する文字認識結果データを読み出すステップと、
    第3のデータ読み出し手段により、現在の画像データの表示を対応する文字認識結果データの表示に切り替える指示に応答して現在の画像データのデータ識別子に対応する文字認識結果データのデータ識別子を上記所定の対応関係から決定し、決定した文字認識結果データのデータ識別子により上記文字認識結果データ記憶手段から該当する文字認識結果データを読み出すステップと、
    第4のデータ読み出し手段により、現在の文字認識結果データの表示を対応する画像データの表示に切り替える指示に応答して現在の文字認識結果のデータ識別子に対応する画像データのデータ識別子を上記所定の対応関係から決定し、決定した画像データのデータ識別子により上記画像データ記憶手段から該当する画像データを読み出すステップと、
    表示手段により、上記第1のデータ読み出し手段、上記第2のデータ読み出し手段、上記第3のデータ読み出し手段、および上記第4のデータ読み出し手段から読み出した画像データまたは文字認識結果データを表示するステップとをコンピュータに実行させるために用いられることを特徴とする文書管理用コンピュータプログラム。
JP2004140379A 2004-05-10 2004-05-10 文書管理装置および方法 Pending JP2005322081A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004140379A JP2005322081A (ja) 2004-05-10 2004-05-10 文書管理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004140379A JP2005322081A (ja) 2004-05-10 2004-05-10 文書管理装置および方法

Publications (1)

Publication Number Publication Date
JP2005322081A true JP2005322081A (ja) 2005-11-17

Family

ID=35469314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004140379A Pending JP2005322081A (ja) 2004-05-10 2004-05-10 文書管理装置および方法

Country Status (1)

Country Link
JP (1) JP2005322081A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012093811A1 (ko) * 2011-01-04 2012-07-12 (주)올라웍스 입력 이미지에 포함된 객체에 대한 콜렉션을 수행할 수 있도록 지원하기 위한 방법, 단말 장치 및 컴퓨터 판독 가능한 기록 매체
JP2014044534A (ja) * 2012-08-24 2014-03-13 Brother Ind Ltd 画像処理システム、画像処理方法、画像処理装置、および画像処理プログラム
JP2015204015A (ja) * 2014-04-15 2015-11-16 コニカミノルタ株式会社 電子文書生成システム、画像形成装置、通信端末およびプログラム
JP2016177364A (ja) * 2015-03-18 2016-10-06 京セラドキュメントソリューションズ株式会社 情報処理装置、および紙媒体への撮像で得られるデータのデータ構造
JP2016177363A (ja) * 2015-03-18 2016-10-06 京セラドキュメントソリューションズ株式会社 情報処理装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012093811A1 (ko) * 2011-01-04 2012-07-12 (주)올라웍스 입력 이미지에 포함된 객체에 대한 콜렉션을 수행할 수 있도록 지원하기 위한 방법, 단말 장치 및 컴퓨터 판독 가능한 기록 매체
US8467577B2 (en) 2011-01-04 2013-06-18 Intel Corporation Method, terminal, and computer-readable recording medium for supporting collection of object included in inputted image
JP2014044534A (ja) * 2012-08-24 2014-03-13 Brother Ind Ltd 画像処理システム、画像処理方法、画像処理装置、および画像処理プログラム
JP2015204015A (ja) * 2014-04-15 2015-11-16 コニカミノルタ株式会社 電子文書生成システム、画像形成装置、通信端末およびプログラム
JP2016177364A (ja) * 2015-03-18 2016-10-06 京セラドキュメントソリューションズ株式会社 情報処理装置、および紙媒体への撮像で得られるデータのデータ構造
JP2016177363A (ja) * 2015-03-18 2016-10-06 京セラドキュメントソリューションズ株式会社 情報処理装置

Similar Documents

Publication Publication Date Title
US7552381B2 (en) Check boxes for identifying and processing stored documents
CN101178725B (zh) 用于信息检索的设备和方法
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
US7739583B2 (en) Multimedia document sharing method and apparatus
US7703002B2 (en) Method and apparatus for composing multimedia documents
JP5167821B2 (ja) 文書検索装置、文書検索方法及び文書検索プログラム
JP4260790B2 (ja) ファイリング・検索装置およびファイリング・検索方法
US11616884B2 (en) Image processing system for computerizing document, control method thereof, and storage medium
US20060085442A1 (en) Document image information management apparatus and document image information management program
EP1675376A1 (en) Document separator pages
JP2000222394A (ja) 文書管理装置及びその文書管理方法並びにその制御プログラムを記録した記録媒体
CN107710176B (zh) 信息处理装置、方法、程序、系统和记录介质
US20230188654A1 (en) Image processing apparatus for inputting characters using touch panel, control method thereof and storage medium
CN102694940B (zh) 信息处理装置及其控制方法
JP2006244071A (ja) 情報提供方法、ポータルサイトシステム、及びプログラム
US20200336611A1 (en) Image processing apparatus that displays guidance for user operation, control method thereof and storage medium
JP5742979B1 (ja) 画像処理装置、画像読取装置及びプログラム
US20090316202A1 (en) Data processing apparatus which downloads data via network, data processing method, and data processing program embodied on computer readable medium
JP2005322081A (ja) 文書管理装置および方法
US7483160B2 (en) Communication system, communication terminal, system control program product and terminal control program product
JP2009093389A (ja) 情報処理装置、情報処理方法、およびプログラム
US7844138B2 (en) History control apparatus
JP7154982B2 (ja) 情報処理装置、制御方法、及びプログラム
JP2005322083A (ja) 文書属性入力装置および方法
JP4431318B2 (ja) 文書管理プログラム