JP2006285581A - 文書管理装置 - Google Patents

文書管理装置 Download PDF

Info

Publication number
JP2006285581A
JP2006285581A JP2005103858A JP2005103858A JP2006285581A JP 2006285581 A JP2006285581 A JP 2006285581A JP 2005103858 A JP2005103858 A JP 2005103858A JP 2005103858 A JP2005103858 A JP 2005103858A JP 2006285581 A JP2006285581 A JP 2006285581A
Authority
JP
Japan
Prior art keywords
document
image data
information
electronic document
management apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005103858A
Other languages
English (en)
Inventor
Tomoyuki Okamoto
知幸 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2005103858A priority Critical patent/JP2006285581A/ja
Publication of JP2006285581A publication Critical patent/JP2006285581A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ユーザがわざわざキーワードなどを入力して検索しなくても、関連する電子文書の存在を容易に知ることができる使い勝手のよい文書管理装置を提供する。
【解決手段】 取得した電子文書に対して文字認識を行って(S104)、その原稿の内容を特徴付ける要約文を作成し(S105)、当該電子文書とその要約文を関連付けて記憶すると共に(S106)、すでに記憶している電子文書の要約文と比較して関連する電子文書を検索し(S107)、関連する電子文書が検索された場合に(S108:YES)、今取得した電子文書に検索された電子文書を関連付けて記憶する(S109)。操作パネル部の表示部に当該検索された電子文書に関する情報が表示される(S110)。
【選択図】 図2

Description

本発明は、文字を含む原稿の画像データを管理する文書管理装置に関する。
近年、書類をペーパーで管理するのではなく、画像読取装置で当該書類の画像を読み込んで、その書類を画像データ(イメージデータ)として管理する装置(以下、「文書管理装置」という。)が普及しつつある。このような文書管理装置によれば、ペーパー上で書類を管理する必要がないので、収納スペースの低減や省資源化に資する(以下、このように画像データとして保存され管理されている文書を「電子文書」という。)。
このような文書管理装置は、大量の文書を管理するために利用される場合が多く、格納されている電子文書のうち、自己が入力した電子文書に関連するものを参照したいと思っても、該当する電子文書を見つけ出すことが大変困難であった。
もし、このような関連する電子文書を探そうとすれば、例えば、電子文書に対して文字認識を行ってテキストデータを取得し、このテキストデータからキーワードを抽出して当該電子文書に関連付けて格納しておき、ユーザが自分の参考にしたい電子文書に含まれていると考えるキーワードを入力して検索することが考えられる。
特開平11−55448号公報 特開平11−184924号公報
しかしながら、上述のようにキーワードを電子文書に関連付ける構成を採ったとしても、関連する電子文書を検索するため、ユーザがわざわざ適当なキーワードを考えて入力しなければならず、大変手間である。また、そのように適当に考えたキーワードが目的の電子文書に必ず関連付けられている保障もないので、検索効率が良いとは言えない。
本発明は、係る事情に鑑みてなされたものであって、ユーザがわざわざキーワードなどを入力しなくても関連する電子文書の存在を容易に知ることができ、使い勝手のよい文書管理装置を提供することを目的とする。
上記目的を達成するために、本発明に係る文書管理装置は、文字を含む原稿の画像データを管理する文書管理装置であって、原稿の画像データを取得する画像データ取得手段と、取得した原稿の画像データに対して文字認識を行ってテキストデータを取得し、このテキストデータに基づき当該原稿の内容を特徴付ける文書情報を作成する文書情報作成手段と、原稿の画像データとその文書情報とを関連付けて記憶する記憶手段と、原稿の画像データを新たに取得した場合に、その画像データの文書情報と、前記記憶手段に記憶されている画像データの文書情報とから、当該新たに取得された画像データと関連する画像データを検索する検索手段と、前記新たに取得された画像データと、前記検索された画像データを関連付ける関連付け手段と、前記新たに取得された画像データに関連付けされた画像データに関する情報を表示する表示手段とを備えたことを特徴とする。
ここで、画像データは、原稿をスキャンして得られた画像データのみならず、当該文書管理装置に接続された外部端末から送信されてきた画像データも含まれるものである。
また、ここで、前記文書情報作成手段は、取得したテキストデータの意味を解析して、その要約文を作成する要約文作成手段を有し、前記文書情報は、当該要約文作成手段により作成された要約文であることが望ましい。
また、本発明は、前記検索手段が、新たに取得された画像データの文書情報と、記憶手段に記憶されている画像データの文書情報とを比較して、一致する単語が所定数ある場合に、双方の画像データが関連していると判断することを特徴とする。
ここで、前記関連付けられた画像データに関する情報とは、当該画像データのファイル名もしくは格納場所の情報を含む。ここで格納場所とは、フォルダーやディレクトリ、もしくは後述する「ボックス」を意味する。
また、本発明は、原稿の画像データの入力者に関する情報を取得する入力者特定情報取得手段と、第1と第2の原稿の画像データが関連付けられている場合において、前記第1の原稿の画像データが消去された場合に、当該第1の原稿の画像データが消去された旨とその原稿の画像データの入力者に関する情報を原稿消去情報として、前記第2の原稿の画像データに関連付ける消去情報関連付手段とを備え、
前記表示手段は、前記第2の原稿の画像データに関する情報を表示する際に、前記第1の原稿の画像データの原稿消去情報も表示することを特徴とする。
また、本発明は、各画像データに関連付けられた文書情報の論理的な構成にしたがって、当該原稿の画像データを仮想的なボックスに分類する分類手段を備え、 前記表示手段は、当該分類されたボックスを表示することを特徴とする。
ここで、前記表示手段は、前記分類された画像データの物理的な格納場所に関する情報を表示するようにしてもよい。
また、本発明は、画像データの取得形態の指定を受け付ける受付手段を備え、前記分類手段は、受け付けた取得形態の画像データについてのみ分類を実行することを特徴とする。
さらに、本発明は、原稿の画像を読み取る画像読取手段と、接続された外部端末から受信した印刷データに基づき画像を形成する画像形成手段とを備え、前記画像データの取得形態は、前記画像読取手段により原稿を読み取って得た画像データであるか、外部端末から受信した印刷データであるか、あるいはその双方のデータであるかを意味する。
このように原稿の画像データに対して文字認識を行って、その原稿の内容を特徴付ける文字情報を作成し、当該画像データとその文書情報を関連付けて記憶していくと共に、新たに原稿の画像データを取得したときに当該新たな画像データについて作成された文書情報と、すでに保存している画像データの文書情報を比較して関連する画像データを検索し、関連する画像データが検索された場合にその画像データと関連付け、当該検索された画像データに関する情報が表示手段に表示されるので、入力者は、わざわざキーワードなどを入力して検索操作を行うことなしに自己の入力した画像データに関連する画像データの存在を知ることができ、大変使い勝手がよくなる。
以下、本発明に係る文書管理装置が、ネットワーク接続可能であって、コピー機能のほかネットワーク上の端末のプリンターとしても機能することができる多機能複写機(以下、「MFP」という。)に適用されている場合について、図面を参照しながら説明する。
(1)文書管理装置(MFP)及びネットワークシステムの構成
図1は、本発明の実施の形態に係るMFP100、及び当該MFP100を含むネットワークシステムの一例を示すブロック図である。
MFP100は、通信制御部110、中央制御部120、記憶部130、画像形成部140、画像読取部150、操作パネル部160を備えている。
通信制御部110は、LAN500を介してPC端末200、300およびファイルサーバ400と接続されており、これらの端末との通信を制御する。具体的にはネットワークIF(インタフェース)カード等を用いることができる。
LAN500には、不図示のインターネットを介してメールサーバ(不図示)が接続されており、各PC端末200、300とMFP100から電子メールの送受信が可能となっている。
中央制御部120は、CPUやRAM、ROMなどにより構成され、各部の制御を担当すると共に、記憶部130に格納される電子文書を管理する。
記憶部130は、ハードディスク記憶装置からなり、取得された原稿の画像データは、この記憶部130内の所定の記憶領域(以下、「ボックス」という。)に分けて格納される(以下では、取得した原稿の画像データを電子文書として所定のボックスに分けて格納する処理を「ファイリング処理」という。)。
ここで画像データとしては、画像読取部150で原稿画像を読み取って得た画像データのみならず、外部のPC端末等から送信されたプリントデータを展開したものも含む。
画像形成部140としては、画像形成を行う一般的な各種プリントエンジンを用いることができ、また、画像読取部150としては、例えばイメージスキャナを備えることができる。これらについては公知の技術であるから詳細な説明は省略する。
また、操作パネル部160には、コピー枚数などを入力するためのテンキーやコピー開始を指示するためのスタートボタンのほか、液晶パネルからなり各種の入力画面が表示できる表示部があり、その画面の表面にはタッチパネルが実装され、入力画面に表示された所定のボタンにタッチすることにより、当該ボタンに関係付けられた入力が可能なように構成されている。
以下、中央制御部120で実行されるファイリング処理の内容について説明する。
(2)ファイリング処理の内容
図2は、本実施例に係るファイリング処理について説明するためのフローチャートである。この処理は、例えばユーザが操作パネル部160からファイリング処理を始めるための所定の操作をしたときに実行されるものである。
まず、ファイリングされる文書の作成者に関する情報(作成者特定情報)を取得する(ステップS101)。これは、主に操作パネル部160からユーザが入力することにより達成される。この作成者に関する情報は、当該ユーザの氏名に限らず、その電子メールのアドレスや電話番号なども含んでよい。会社などにおいて、各ユーザに識別子が割り当てられているような場合には、この識別子などを操作パネル部から入力してもよいし、当該識別子の情報やICカードや磁気カードに記憶している場合には、カードリーダにより当該情報を読み取るようにしてもよい。この場合、識別子自体が作成者に関する情報となり得るが、さらに詳しい情報を得るため、例えば、中央制御部120内に当該識別子とユーザの氏名などの情報を対応させたテーブルを格納しておけば、容易に作成者の氏名などの情報が取得できる。
次に、当該電子文書の保存先のボックス番号を取得する(ステップS102)。操作パネル部160の表示部161の左側の部分に(図4参照)、001から010のボックス番号を付したボタンが表示され、ユーザが自分に割り当てられたボックス番号のボタンを押すとそのボタンの文字表示の色が白黒反転表示されると共に(図4の表示画面参照)、当該ボックス番号が中央制御部120内のRAM内に格納されるので、この格納されたボックス番号の情報を読み出して取得する。
ファイルリングの対象となる原稿の画像データを原稿読取部160でスキャンして取得し(ステップS103)、これを一旦RAMに保存する(以下、この取得された原稿の画像データを「電子文書」という。)。そしてこの保存された電子文書に対して文字認識を実行する(ステップS104)。
この文字認識は、公知の手法が用いられる。例えば、電子文書である原稿の画像データ(ビットマップデータ)の濃度ヒストグラムを生成して、この濃度ヒストグラムの分布状態から文字画像を一文字ずつ切り出し、当該切り出した文字画像のパターンと、予め辞書データとして内部ROMなどに格納している文字のパターンとを照合して文字認識が実行される(例えば、特開平09−259220号公報、特開平09−251514号公報など参照)。
そして、これらの文字認識により得られたテキストデータについて意味を解析し、要約文を作成する(ステップS105)。
この意味解析は、自然言語処理の手法によってなされる。本実施の形態では、より具体的に、Lexical Functional Grammar(「語彙機能文法」、以下「LFG」という。)と呼ばれる言語理論に基づいて、テキストデータの意味を解析する。このLFGによる意味解析は、日本語文法特有の言語現象、例えば、接続助詞、接続詞、受動文、使役文、固有名詞、関係詞などを手がかりとして文章の構文を解析し、解析された各単語について内部の辞書を参照して意味解析を行うものであり、機械翻訳のプログラムなどにも採用されているものである。
そして、その意味解析結果に基づき、当該テキストデータの要約文を作成するが、これについても様々な提案がされている。例えば、特開2004−94946号公報には、構文解析されたテキストデータについてあまり重要でないと考えられる構造表現を除去して構造的に要約し、さらに等位関係(内容が等しいと考えられる関係)にある構造表現を一般化して要約文を作成する方法が詳細に開示されている。
もっとも、本発明における意味解析や要約文作成の手法は、公知のどのような手法を用いてもよく、上記のものに限定されない。
当該電子文書は、例えばJPEGなどの適当なフォーマットに変換され、上記作成された要約文と関連付けされた状態で、ステップS102で取得した番号のボックス内に保存される(ステップS106)。このJPEGへの変換は、文字認識を実行する前に実行しても構わない。
そして、上記記憶部130内の全てのボックスにすでに格納されている電子文書の要約文を参照して、今取得した電子文書と関連しているものを検索する(ステップS107)。
具体的には、上記意味解析の際に、構造解析されているので、要約文中の構造の単位となる単語で、要約文同士を比較して一致する単語が所定数以上、例えば2つ以上ある場合に関連文書であると判断する。この検索用の単語は、助詞や接続詞などではなく、できるだけ要約の内容を示す意味のある単語が望ましく、例えば「名詞」と解析された単語が用いられる。
要約文自身がその文書の要点を示す短い文章であるので、そのうち、2つの単語が一致すれば、内容的にかなり関連性がある文書とみなすことができる。もっとも、さらに内容の類似する電子文書を検索したい場合には、3つ以上の適当な数の単語が一致するように設定しても構わない。
また、主な単語について評価値を設定したテーブルを予め作成しておき、一番評価値の高い単語から比較していくようにしても構わない。この場合、例えば、会社においては、「稟議書」、「仕様書」、「計画書」、「契約書」、「報告書」など通常の業務で使用される文書の種類を示す単語について評価値を高く設定しておけば、より一層関連性の高い電子文書を検索できる。
上記検索処理により関連する電子文書が検索された場合には、当該電子文書と検索された電子文書とを関連付ける処理を行う(ステップS108:YES、ステップS109)。
図3は、電子文書のボックスへの格納状態を示すデータ構造の一例である。電子文書たる原稿の画像データにはヘッダー情報が付されており、このヘッダー情報には、そのファイル名、保存日時、作成者名、ファイル形式、原稿サイズとその枚数、およびその要約文のデータほかに、上記ステップS109の関連付け処理において、関連電子文書のファイル名の情報が記入されるようになっている。この際、関連先の電子文書のヘッダー情報にも、本件の電子文書のファイル名が追加され、相互に関連電子文書の存在が分かるように構成される。
そして、図4に示すように、当該ユーザが入力した原稿画像に関する情報とその関連電子文書に関する情報が、操作パネル160の表示部161に表示される(ステップS110)。なお、ここで表示される情報は、文書のファイル名、保存日時、原稿サイズとそのページ数などであるが、その他、要約文の内容や作者名なども表示させても構わない。特に、要約文の表示により、本当に参考にしたい電子文書か否かについて直ぐに知ることができるので、無駄にプリントアウトさせることがなくなる。
ここで、ユーザが関連する電子文書の内容を参照したい場合、図4の表示部161における当該電子文書のアイコンを押下してこれを選択してから印刷ボタンを押せば、その内容がプリントアウトされるようになっている。また、選択した電子文書を他のPC端末に送信したい場合には、送信ボタンを操作することにより指定された送信先のPC端末に送信することもできる(次の図5のステップS208〜S212の説明参照)。
なお、本例では、ファイル名は、保存した日時とその日の保存の順番などにより自動的に作成されるが、その他の情報、例えば、作成者名を特定する情報を含む名称としてもよいし、ユーザが適当に変更できる構成としてもよい。
ステップS108において関連する電子文書がなかった場合には、ユーザの入力した電子文書に関する情報のみ表示し(ステップS111)、ファイリング処理を終了する。
以上のように本実施例によれば、自己の原稿をスキャンさせて電子文書としてファイルする際に、自動的に関連する電子文書を知ることができるので、大変便利である。
(3)電子文書出力処理の内容
次にファイリングされた電子文書を出力する際における中央制御部120の処理内容の一例について説明する。
まず、ユーザによるボックスの指定を受付け(ステップS201)、そのボックスにファイルされている電子文書の一覧を、図6(a)に示すように操作パネル部160の表示部161に表示させる(ステップS202)。
その中から特定の一の電子文書の指定を受付け(ステップS203)、その指定された電子文書に関連する電子文書がある場合には、図6(b)に示すように双方の電子文書に関する情報を操作パネル部120に表示し(ステップS204:YES、ステップS205)、そのうちのどちらかの電子文書の選択を受け付けた後、印刷ボタンが押下されて印刷指示があれば、当該指定された電子文書の画像データを記憶部130から読み出して画像形成部140に印刷処理を実行させる(ステップS206、S208:YES、S209)。
印刷ボタンではなく送信ボタンが押下されて送信が指示されれば(ステップS208:NO、S210:YES)、操作パネル部160の表示部161に送信先指定画面(不図示)を表示してユーザによる送信先の入力を受け付け(ステップS211)、ネットワークを介して当該送信先に電子文書を送信する(ステップS212)。この送信先はIPアドレスであってもよいし、電子メールのアドレスであっても構わない。指定された送信先に応じて、FTPによるファイル送信もしくは、電子メールの添付ファイルとして送信が実行される。また、MFP100がファクシミリ機能を有し、電話の公衆回線に接続されている場合には、当該電子文書をファクシミリデータに変換して相手方のファクシミリ装置に送信するようにしてもよい。
なお、図6(b)の消去ボタンが押下された場合には、当該電子文書はファイルごと削除されるが、この際、ユーザの識別子やパスワードなどを入力させるようにしておき、許可された場合のみ削除できるようにすることが望ましいであろう。
上記実施例では、電子文書が削除される場合、そのファイル全体を削除するようにしたが、本実施例では、そのヘッダー情報を残しておいて、ユーザが削除された電子文書を参考にしたい場合にその作成者に何らかのアクセスができるようにした点に特徴がある。他の構成は実施例1と全く同じなので、以下では、本実施例特有の電子文書削除処理についてのみ説明する。
図7は、本実施例において中央制御部120で実行される電子文書削除処理の内容を示すフローチャートである。
まず、図5のステップS201〜203と同様にして目的の電子文書のファイル名を操作パネル部160の表示部161に表示させ、特定の電子文書の指定を受け付ける(ステップS301〜S303)。そして入力画面上の消去ボタン(図6(b)参照)が押下されると、その電子文書のヘッダー情報に当該電子文書が削除された旨と、その削除日時を記録し(ステップS305)、当該ヘッダー情報を残して、画像データのみを削除する(ステップS306)。
図8は、例えば、ファイル名050105-1.jpgの電子文書と関連するファイル名040828-3.jpgの電子文書が削除された場合におけるデータ構造を示す図である。
同図に示すようにイメージデータは削除されており、ヘッダー情報におけるファイル状態を示す欄には、当該ファイルが削除された旨とその削除日が記入されている。
図9は、関連先の電子文書のファイル名050105-1を操作パネル部160に表示させたときの表示画面の例を示すものである。
同図に示すように参考文書が削除されたこととその日時および作成者名と連絡先が操作パネル部160に表示される。操作者はこれを見てどうしても当該参考電子文書を参考にしたければ、その作成者に連絡することができ、使い勝手がよい。
なお、連絡先は、電子メールのアドレスや電話番号、ファクシミリ番号などが直接表示されてもよいし、それらを表すアイコンを表示させるようにしてもよい。具体的には、電子メールの場合には、レターの形のアイコン、電話の場合には電話器の形状のアイコンで表示し、そのアイコンにタッチすることにより連絡先の番号を表示するようにプログラムしてもよい。
上記実施例では、記憶部内に物理的に設定された記憶領域にボックスを設定していき、ユーザが割り当てたボックス(ユーザボックス)に電子文書をファイリングしていくようにした。本実施例では、当該ユーザボックス以外に、関連する電子文書を格納する仮想的なボックスを設定してより利便性を向上した点に特徴がある。
以下、物理的に設定されたユーザボックスを「物理ボックス」といい、関連する電子文書同士を格納する仮想的なボックスを「論理ボックス」ということにする。
ハードウェアの構成は実施例1と全く同じなので、以下では、中央制御部120で実行される本実施例特有のファイリング処理およびボックス表示処理についてのみ説明する。なお、上記実施の形態においては、電子文書のソースとして、画像読取部150で読み取った原稿の画像データのみについて考えたが、本実施例では、PC端末から受信したプリントデータも電子文書として保存する場合における利便性についても合わせて考える。
図10は、本実施例におけるファイリング処理の内容を示すフローチャートである。
まず、図2のステップS101〜S109に該当する処理、すなわち電子文書を取得し、その文書情報として要約文を作成し、当該電子文書に関連付けて保存する処理を実行する(ステップS401)。ここで、PC端末のプリントドライバは、プリント指示と同時にファイリングを指示し、あるいはファイリングのみをMFP100に対して行えるようにプログラムされており、ファイリングを指示する際には、ボックス番号、作成者に関する情報などの入力画面が表示されるように構成される。もっともプリンタドライバではなくファイリング専用のアプリケーションをPC端末にインストールしてファイリングの指示を行っても構わない。また、プリントデータは通常ページ記述言語(PDL)の形式で送信されるが、本実施例ではPDLをイメージ展開した後の画像データが電子文書として指定されたボックスに格納されるものとする。もっとも、イメージに展開する前にPDLデータに含まれるテキストデータを利用すれば、文字認識を行う手間が省けて便利である。
そして要約文の作成過程において行われたテキストデータに対する意味解析データに基づき、論理的な「木」(以下、「論理ツリー」という。)を作成する(ステップS403)。このような論理ツリーの作成自体は公知であり、例えば、特開2004−5714号公報や特開平6−266780号公報などに詳しい。そして、ステップS403において当該論理ツリーに偏りがあるか否かを判断し、偏りがあれば、当該ツリーの構成を最適化する(ステップS404)。
例えば、ステップS402で作成された論理ツリーが図11(a)のようになったとする。この場合、上位概念の数が多く、しかもその従属概念(枝)の数が1個から4個と偏っていて、全体としてバランスが悪いため、多量の電子文書をツリー構造により類型化して検索しやすくしようとした意味が薄れる。そこで、図11(b)のように上位概念の単語を若干入れ替えて論理ツリーを構成し直し、上位概念に従属する下位概念の数に偏りがないようにすることにより最適化される。ここで、最適化の判断は、例えば各上位概念に従属する枝の数の差が最小になる場合に最適化されたと判断するものとする。
そして、上記構成された論理ツリーの構造を記憶部130内に記憶する(ステップS405)。
なお、上記ツリーの最適化により、次に述べる論理ボックスの構成が円滑に行えるが、最適化自体は必須ではない。
次に、ボックス表示処理について図12のフローチャートに基づき説明する。
まず、ユーザよりボックスの種類の指定を受け付ける(ステップS501)。そして論理ボックスが指定されてか否かを判定し(ステップS502)、もし、選択されたのが物理ボックスであれば(ステップS502:YES)、実施例1で述べたのと同様、物理ボックス(ユーザボックス)を表示する画面が表示され、当該画面でボックス番号が指定されると、図6(a)に示すように当該ボックス内にファイルされている電子文書に関する情報が表示される(ステップS508、S509)。
ステップS502において、論理ブロックが選択された場合には、次に電子文書のモードの選択を受け付ける(ステップS502:YES、S504)。ここで、電子文書のモードとは、ソースによって分類した電子文書のボックスを表示させるためのモードであって、ボックス表示させたい電子文書が、画像読取により得られた電子文書(以下、「スキャン文書」という。)か、端末から送信されてきたプリンタデータに係る電子文書(以下、「プリント文書」という。)か、もしくは双方を含む全体の電子文書(全てのモード)かの選択を受け付ける。
全てのモードが選択された場合には、図10のステップS405で記憶した論理ツリーに基づきボックス表示を行う(ステップS505:YES、S506)。反対にスキャン文書もしくはプリント文書のどちらかに限定して選択された場合には、当該選択されたモードの電子文書のみから論理ツリーを構築しなおして最適化し、これに基づきボックス表示を行う(ステップS505:NO、S507)。当該ボックス表示画面から特定のボックスが指定されると、当該指定されたボックス内の電子文書が表示される(ステップS508、S509)。
図13(a)(b)は、図7のボックスツリーをMFP100の操作パネル部160の表示部161で表示する場合の例を示す。表示部の左側における「プリント文書」「スキャン文書」「全ての文書」は、上記ステップS504でモードを選択するためのボタンである。また、また「論理BOX」「物理BOX」のボタン表示は、現在の表示形式が論理ボックスか物理ボックスのどちらの態様であるかを示し、選択された方が反転表示される。
図13(a)では、論理ボックス表示が選択され、さらに電子文書の種類としてスキャン文書が選択された場合において、論理ツリーの「社内」が選択されている場合のボックス(スキャンボックス)の表示例を示す。
ここで、スキャン文書の論理ツリーが、図11(b)のように作成されたとすると、「社内」に属する論理ボックスは、「稟議書」、「議事録」、「レター」、「その他」の4個あり、操作パネル部には図13(a)に示すようにそれらの論理ボックスを示す4個のボタンが表示される。
ここで、ユーザが、「議事録」のボタンにタッチして選択し、「中に移動」のボタンにタッチすると、図13(b)のように「議事録」のボックス内部の電子文書を示す画面に変わる。
仮に、ユーザが「社内会議における議事録文書」をスキャンしてユーザボックス001に保存した場合、この電子文書には「社内」「議事録」と「会議」「社内」のそれぞれの用語を含んでいるため、図11(b)の破線で示すように論理ツリーの2箇所のボックスに仮想的に存在することになる。
そこで、図13(b)の表示画面では、当該電子文書に関する情報(ファイル名「社内会議の議事録」、保存日など)を表示すると共に、物理的な保存先である「ボックス001」への移動ボタンと、もう一つの論理的な保存先のボックスである「会議>社内>」への移動ボタンを表示させ、それらボタンにタッチすると当該ボックスにジャンプするようになっている。
なお、図13(b)では、「社内>議事録」の論理ボックス内には、便宜上1個の電子文書しか示されていないが、大量の文書を管理する場合には、一つの論理ボックス内に複数の電子文書があるのが一般的であり、これにより関連のある電子文書を極めて容易に見つけることができる。もし、この論理ボックス内に関連電子文書見つけることができなければ、ボックス001にジャンプして、関連文書に関す情報を確認することもできるし(図6(b)参照)、また、他の「会議>社内>」の論理ボックスにジャンプして探すこともできる。
このように電子文書の意味解析において実行される構造解析の解析結果に基づき、ボックスを論理的に分けることができるので、内容的に関連性のある電子文書の検索が極めて容易になる。また、この際、電子文書のモードを選択することにより選択された電子文書の種類について最適な論理ツリーを構築しなおして論理ボックスを作成しているので、より効率的な文書検索が行える。
なお、本発明に係る文書管理装置を実現するためのプログラムは、例えば磁気テープ、フレキシブルディスク等の磁気ディスク、DVD、CD−ROM、CD−R、MO、PDなどの光記録媒体、Smart Media(登録商標)、COMPACTFLASH(登録商標)などのフラッシュメモリ系記録媒体等、コンピュータ読み取り可能な各種記録媒体に記録することが可能であり、当該記録媒体の形態で生産、譲渡等がなされる場合もあるし、プログラムの形態で、インターネットを含む有線、無線の各種ネットワーク、放送、電気通信回線、衛星通信等を介して伝送、供給される場合もある。
<変形例>
以上、本発明を実施例に基づいて説明してきたが、本発明の内容が、上記実施の形態に示された具体例に限定されないことは勿論であり、例えば、以下のような変形例を考えることができる。
(1)即ち、上記実施の形態では、文書管理装置の一例として本発明をMFP100に適用した場合について詳細に説明したが、本発明に係る文書管理装置はMFP以外にも、スキャナー、プリンタ、ファクシミリ装置など原稿画像を処理する機器に適用する装置に適用することができる。
(2)さらに、MFP100でスキャンした電子文書をファイルサーバ400に転送し、ファイルサーバ400において上記ファイリング処理などを実行させるようにしても構わない。また、PC端末200、300のモニターに上記操作パネル部160の表示部161と同様な表示をさせて、PC端末からネットワーク500を介して、MFP100内のファイリング文書を参照するように構成すれば、さらに使い勝手がよくなる。なお、これらの場合でもあってもシステム全体として「文書管理装置」として機能しうるものである。
図14は、実施例1における図6(b)に相当する表示をWebブラウザによるPC端末200のモニター201の画面表示例を示す図である。また、図15は、実施例3における図13(b)に相当するモニター表示画面の例である。
それぞれカーソルを目的箇所に移動させてマウスをクリックすることにより目的の操作が実行されるように構成される。なお、本例では、表示ボタンをクリックすると当該ブラウザ画面に、参照したい電子文書を表示させて確認することができるようにプログラムされており、わざわざプリントアウトせずとも電子文書の内容を確認できるので便利である。
(3)上記実施の形態においては、電子文書の内容を特徴付けるため、その要約文を作成したが、必ずしも要約文でなくとも、文字認識して得られたテキストデータからいくつかのキーワードを抽出して、これを電子文書に関連付けるようにしても構わない。なお、このようなキーワードを具体的に抽出する方法は、例えば、特開2004−152041号公報などに開示されている。
本発明の実施例1に係る文書管理装置(MFP)、及び当該MFPを含むネットワークシステムの構成の一例を示す機能ブロック図である。 中央制御部120におけるファイリング処理の内容を説明するためのフローチャートである。 電子文書の保存時のデータ構造を示す図である。 操作パネル部の表示部に、関連する電子文書に関する情報を表示する場合の画面の一例を示す図である。 中央制御部120における電子文書出力処理の内容を説明するためのフローチャートである。 (a)(b)は電子文書出力処理をする際に、操作パネル部の表示部に表示される画面の例を示す図である。 本発明に実施例2に係る文書管理装置における電子文書削除処理の内容を説明するためのフローチャートである。 削除された電子文書のヘッダー情報を示す図である。 関連する電子文書が削除された場合における操作パネル部の表示部の表示例を示す図である。 本発明の実施例3に係るファイリング処理の内容を示すフローチャートである。 (a)(b)は、論理ツリーの例を示す図である。 実施例3におけるボックス表示処理の内容を示すフローチャートである。 (a)(b)は上記ボックス表示処理をする際における、操作パネル部の表示部に表示される画面の例を示す図である。 PC端末のWebブラウザによるボックスの表示例である。 PC端末のWebブラウザによる別のボックスの表示例である。
符号の説明
100 MFP
110 通信制御部
120 中央制御部
130 記憶部
140 画像形成部
150 画像読取部
160 操作パネル部
200、300 PC端末
400 ファイルサーバ
500 LAN

Claims (9)

  1. 文字を含む原稿の画像データを管理する文書管理装置であって、
    原稿の画像データを取得する画像データ取得手段と、
    取得した原稿の画像データに対して文字認識を行ってテキストデータを取得し、このテキストデータに基づき当該原稿の内容を特徴付ける文書情報を作成する文書情報作成手段と、
    原稿の画像データとその文書情報とを関連付けて記憶する記憶手段と、
    原稿の画像データを新たに取得した場合に、その画像データの文書情報と、前記記憶手段に記憶されている画像データの文書情報とから、当該新たに取得された画像データと関連する画像データを検索する検索手段と、
    前記新たに取得された画像データと、前記検索された画像データを関連付ける関連付け手段と、
    前記新たに取得された画像データに関連付けされた画像データに関する情報を表示する表示手段と
    を備えたことを特徴とする文書管理装置。
  2. 前記文書情報作成手段は、取得したテキストデータの意味を解析して、その要約文を作成する要約文作成手段を有し、前記文書情報は、当該要約文作成手段により作成された要約文であることを特徴とする請求項1に記載の文書管理装置。
  3. 前記検索手段は、新たに取得された画像データの文書情報と、記憶手段に記憶されている画像データの文書情報とを比較して、一致する単語が所定数ある場合に、双方の画像データが関連していると判断することを特徴とする請求項1または2に記載の文書管理装置。
  4. 前記関連付けられた画像データに関する情報とは、当該画像データのファイル名もしくは格納場所の情報を含むことを特徴とする請求項1から3のいずれかに記載の文書管理装置。
  5. 原稿の画像データの入力者に関する情報を取得する入力者特定情報取得手段と、
    第1と第2の原稿の画像データが関連付けられている場合において、前記第1の原稿の画像データが消去された場合に、当該第1の原稿の画像データが消去された旨とその原稿の画像データの入力者に関する情報を原稿消去情報として、前記第2の原稿の画像データに関連付ける消去情報関連付手段と
    を備え、
    前記表示手段は、
    前記第2の原稿の画像データに関する情報を表示する際に、前記第1の原稿の画像データの原稿消去情報も表示することを特徴とする請求項1から4のいずれかに記載の文書管理装置。
  6. 各画像データに関連付けられた文書情報の論理的な構成にしたがって、当該原稿の画像データを仮想的なボックスに分類する分類手段を備え、
    前記表示手段は、当該分類されたボックスを表示することを特徴とする請求項1から5のいずれかに記載の文書管理装置。
  7. 前記表示手段は、前記分類された画像データの物理的な格納場所に関する情報を表示することを特徴とする請求項6に記載の文書管理装置。
  8. 画像データの取得形態の指定を受け付ける受付手段を備え、
    前記分類手段は、受け付けた取得形態の画像データについてのみ分類を実行することを特徴とする文書管理装置。
  9. 原稿の画像を読み取る画像読取手段と、接続された外部端末から受信した印刷データに基づき画像を形成する画像形成手段とを備え、
    前記画像データの取得形態は、前記画像読取手段により原稿を読み取って得た画像データであるか、外部端末から受信した印刷データであるか、あるいはその双方のデータであるかを意味することを特徴とする請求項8に記載の文書管理装置。
JP2005103858A 2005-03-31 2005-03-31 文書管理装置 Pending JP2006285581A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005103858A JP2006285581A (ja) 2005-03-31 2005-03-31 文書管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005103858A JP2006285581A (ja) 2005-03-31 2005-03-31 文書管理装置

Publications (1)

Publication Number Publication Date
JP2006285581A true JP2006285581A (ja) 2006-10-19

Family

ID=37407454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005103858A Pending JP2006285581A (ja) 2005-03-31 2005-03-31 文書管理装置

Country Status (1)

Country Link
JP (1) JP2006285581A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008234207A (ja) * 2007-03-19 2008-10-02 Ricoh Co Ltd 文書表示装置、文書表示方法及び文書表示プログラム
CN112306433A (zh) * 2020-11-12 2021-02-02 深圳市华博创新科技有限公司 一种电子稿袋印刷处理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008234207A (ja) * 2007-03-19 2008-10-02 Ricoh Co Ltd 文書表示装置、文書表示方法及び文書表示プログラム
CN112306433A (zh) * 2020-11-12 2021-02-02 深圳市华博创新科技有限公司 一种电子稿袋印刷处理方法

Similar Documents

Publication Publication Date Title
US8326090B2 (en) Search apparatus and search method
US7475336B2 (en) Document information processing apparatus and document information processing program
JP2006120125A (ja) ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム
CN100545846C (zh) 文档搜索设备和方法
JP2002132547A (ja) 電子情報管理サーバ、電子情報管理クライアントおよび電子情報管理方法ならびに電子情報管理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4879930B2 (ja) コンテンツ管理装置、コンテンツ管理システム及びコンテンツ管理方法
US20060206498A1 (en) Document information management apparatus, document information management method, and document information management program
US8090728B2 (en) Image processing apparatus, control method thereof, and storage medium that stores program thereof
JP2008271534A (ja) 画像再生装置において実行されるコンテンツに基づくアカウンティング方法
JP2011039580A (ja) 文書処理装置、文書処理方法およびプログラム
JP4849087B2 (ja) コンテンツ管理システム及びコンテンツ管理方法
JP4125097B2 (ja) 電子化原稿管理装置及びその制御方法、電子化原稿管理システム、プログラム
US11593386B2 (en) Information processing apparatus and non-transitory computer readable medium
US20090037384A1 (en) Image processing apparatus, image processing method and storage medium that stores program thereof
US20210295033A1 (en) Information processing apparatus and non-transitory computer readable medium
JP4645731B2 (ja) 画像処理装置、画像データ管理方法、およびコンピュータプログラム
JP2006285581A (ja) 文書管理装置
JP2003196270A (ja) 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体
JP2004357305A (ja) ドキュメント管理保存システム、方法及びそのプログラム
JP2009134580A (ja) 文書データベースシステムおよび画像入力装置
JP2004348467A (ja) 画像検索装置及びその制御方法、プログラム
JP2007048082A (ja) ファイル処理装置、ファイル処理方法、およびファイル処理プログラム
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
JP2005149210A (ja) 画像処理装置及びその制御方法、プログラム
JP5217513B2 (ja) 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。