JP2012084029A - 文書管理装置及び文書管理プログラム - Google Patents
文書管理装置及び文書管理プログラム Download PDFInfo
- Publication number
- JP2012084029A JP2012084029A JP2010231150A JP2010231150A JP2012084029A JP 2012084029 A JP2012084029 A JP 2012084029A JP 2010231150 A JP2010231150 A JP 2010231150A JP 2010231150 A JP2010231150 A JP 2010231150A JP 2012084029 A JP2012084029 A JP 2012084029A
- Authority
- JP
- Japan
- Prior art keywords
- document data
- document
- keyword
- keywords
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】画像形成装置は、ボックス部に各文書データ(文書A,文書B,文書C)を記憶する際に、各文書データに含まれる単語を抽出し、抽出した単語のうち各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択し、そのキーワードを各文書データに関連付けて記憶しておく。文書データを検索する際には、全ての文書データ(文書A,文書B,文書C)における出現頻度の高い上位数個のキーワードを表示する(単語B;16回、単語A;14回、単語C;8回)。表示されたキーワードのいずれかをユーザが選択することにより、選択されたキーワードに関連付けられた文書データが検索される。これらの表示処理、選択処理、検索処理を繰り返すことにより、文書データの絞り込み検索が行えるようになる。
【選択図】図6
Description
この先行技術によれば、文書中に直接現れないが関連の強いキーワードを検索用キーワード候補として提示することができるので、利用者は期待する関連語句を簡単に検索することができると考えられる。また、この先行技術を利用して、関連文書を検索するためのキーワードを選択項目として追加提示するように設定すれば、キーワードの入力操作の簡便化を図ることができると考えられる。
この先行技術では、検索サーバからユーザに対して絞り込みの提案を行うことができるので、ユーザは、キーワードを追加したり、検索条件を変更したりと積極的に検索を進めることなく、検索サーバからの提案に対して「はい」又は「いいえ」を単に選択するだけで、容易に検索結果を絞り込んでいくことができる。一般に、検索時においては、1つめのキーワードが思い浮かんだとしても、2つめのキーワードを追加する(思い浮かぶ)ことが困難であることが多いが、この先行技術によれば、ユーザは新たなキーワードを考える必要がなくなり、利便性を向上させることができると考えられる。
本発明の文書管理装置は、複数の文書データを記憶する文書データ記憶手段と、文書データ記憶手段に各文書データを記憶する際に、各文書データに含まれる単語を抽出する単語抽出手段と、単語抽出手段が抽出した単語のうち、各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択するキーワード選択手段と、キーワード選択手段が選択したキーワードを、各文書データに関連付けて記憶するキーワード記憶手段と、キーワード記憶手段が記憶しているキーワードの中から、文書データ記憶手段が記憶している全ての文書データにおける出現頻度の高い上位数個のキーワードを表示するキーワード表示手段と、キーワード表示手段が表示したキーワードのいずれかを選択する選択手段と、選択手段により選択されたキーワードに関連付けられた文書データを文書データ記憶手段から検索する検索手段と、検索手段が検索した文書データに関して、所定の検索終了条件を満たす場合、その文書データが検索対象の文書データであると判断し、所定の検索終了条件を満たさない場合、選択手段により選択されたキーワードを除いて、選択手段により選択されたキーワードに関連付けられた文書データにおける出現頻度の高い上位数個のキーワードを表示し、選択手段及び検索手段に再び処理を行わせる判断手段とを備える文書管理装置である。
本発明の文書管理プログラムは、複数の文書データを記憶する機能を有する文書管理装置のコンピュータに、各文書データを記憶する際に、各文書データに含まれる単語を抽出する単語抽出手順と、単語抽出手順で抽出した単語のうち、各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択するキーワード選択手順と、キーワード選択手順で選択したキーワードを、各文書データに関連付けて記憶するキーワード記憶手順と、キーワード記憶手順で記憶しているキーワードの中から、複数の文書データの全ての文書データにおける出現頻度の高い上位数個のキーワードを表示するキーワード表示手順と、キーワード表示手順で表示したキーワードのいずれかが選択される選択手順と、選択手順により選択されたキーワードに関連付けられた文書データを複数の文書データの中から検索する検索手順と、検索手順で検索した文書データに関して、所定の検索終了条件を満たす場合、その文書データが検索対象の文書データであると判断し、所定の検索終了条件を満たさない場合、選択手順により選択されたキーワードを除いて、選択手順により選択されたキーワードに関連付けられた文書データにおける出現頻度の高い上位数個のキーワードを表示し、選択手順及び検索手順を再び行わせる判断手順とを実行させるための文書管理プログラムである。
文書管理システム1は、例えばLAN等のネットワーク2を用いて構成され、このネットワーク2には、画像形成装置4及び複数のクライアントPC6がそれぞれ接続されている。
画像形成装置4は、文書管理装置の一例として挙げるものであり、ネットワークインターフェース26を介してネットワーク2(図1参照)に接続され、公衆回線にも接続されている。また、この画像形成装置4は、デジタル複合機であり、いわゆる多機能周辺機器(Multiple Function Peripheral)である。そして、画像形成装置4は、プログラムの命令にしたがって各種動作を実行する。
より具体的には、HDD(ハードディスク)32は、スキャナ部22で読み込まれたデータや、クライアントPC6(図1参照)から送信されたデータ、FAX通信部24にて受信したデータ等の種々のデータを逐次保存するボックス機能を有している。ボックス機能は、HDD32のボックス部34によって実現される。
キーワード記憶処理部13は、キーワードを各文書データに関連付けて記憶する処理を実行する。
キーワード表示処理部14は、全ての文書データにおける出現頻度の高い上位数個のキーワードを表示する処理を実行する。
選択処理部15は、キーワードのいずれかを選択する処理を実行する。
検索処理部16は、キーワードに関連付けられた文書データを検索する処理を実行する。
判断処理部17は、所定の場合に検索対象の文書データであると判断する処理を実行する。
文書データ情報表示処理部18は、文書データに関する情報を表示する処理を実行する。
なお、上記各種処理部による処理の詳細については後述する。
図3は、画像形成装置により実行されるメイン処理について説明するフローチャートである。
ステップS100:制御部10は、文書データ記憶指示を受信したか否かを確認する。具体的には、ユーザが操作パネル28を操作して、「文書データ記憶ボタン」を押下(タッチ)することにより、操作パネル28から文書データ記憶指示を受信した場合、制御部10は、ステップS200の処理を実行する。
操作パネル28から文書データ記憶指示を受信していない場合、制御部10は、何も処理をせずに、ステップS300に進む。
操作パネル28から文書データ検索指示を受信していない場合、制御部10は、何も処理をせずに、ステップS500に進む。
操作パネル28からその他の指示を受信していない場合、制御部10は、何も処理をせずに、ステップS100に戻る。
次に、図3におけるステップS200の文書データ記憶処理の詳細について説明する。
図4は、文書データ記憶処理の詳細について説明するフローチャートである。
ステップS201:単語抽出処理部11は、単語抽出処理を実行する。この処理は、ボックス部34に各文書データを記憶する際に、各文書データに含まれる単語を抽出する処理である(単語抽出手順)。具体的には、スキャンした文書データ(原稿)の文字認識を行って、文書データに含まれる全ての単語を抽出する。文字認識は、OCR(Optical Character Reader;光学式読取装置)によって実現することができる。
単語A;出現頻度10回
単語B;出現頻度8回
単語C;出現頻度5回
単語D;出現頻度3回
単語B;出現頻度6回
単語C;出現頻度3回
単語D;出現頻度2回
単語E;出現頻度1回
なお、文書Bには、単語Aは登場しない。
単語A;出現頻度4回
単語B;出現頻度2回
単語D;出現頻度1回
単語E;出現頻度1回
なお、文書Cには、単語Cは登場しない。
そして、これらの処理を終えると、制御処理は、図3のメインループ処理のステップS200の末尾のアドレスに復帰する。
次に、図3におけるステップS400の文書データ検索処理の詳細について説明する。
図5は、文書データ検索処理の詳細について説明するフローチャートである。
ステップS401:キーワード表示処理部14は、キーワード表示処理を実行する。この処理は、ボックス部34が各文書とともに記憶している全てのキーワードの中から、ボックス部34が記憶している全ての文書データ(文書A,文書B,文書Cの全て)における出現頻度の高い上位数個のキーワードを表示する処理である(キーワード表示手順)。
本実施形態においては、リスト表示するキーワードは、図6の全てのキーワードの中から、出現頻度が高い上位3個のキーワードを表示するようにしている。図6において、出現頻度が高い上位3個のキーワードは、以下の通りである。
(2)上位2位;単語A、出現頻度14回(文書Aの出現頻度10回+文書Bの出現頻度0回+文書Cの出現頻度4回)
(3)上位3位;単語C、出現頻度8回(文書Aの出現頻度5回+文書Bの出現頻度3回+文書Cの出現頻度0回)
図7に示す表示状態において、ユーザが操作パネル28にて単語Aを選択したとすると、単語Aを含む文書C・文書Aが検索結果となる。上述したように、本実施形態では、操作パネル28の選択画面では、図7中一点鎖線の部分のみが表示されるので、ユーザが操作パネル28にて単語Aを選択しても、基本的には、検索対象となった文書C・文書Aは、操作パネル28に表示されない。ただし、仕様や設計によっては、検索対象となった文書C・文書Aを一旦表示するようにしてもよい。
判断処理部17は、ステップS404の検索処理で検索した文書データに関して、所定の検索終了条件を満たすと判断した場合、その文書データが検索対象の文書データであると判断して、ステップS406に進む(判断手順)。
これに対して、ステップS404の検索処理で検索した文書データに関して、判断処理部17が所定の検索終了条件を満たさないと判断した場合、ステップS401に戻る。このように、所定の検索終了条件を満たさないと判断してステップS401に戻った場合、判断処理部17は、ステップS401のキーワード表示処理において、操作パネル28で選択されたキーワードに関連付けられた文書データに関して、操作パネル28で選択されたキーワードを除く出現頻度の高い上位数個のキーワードを表示させて、ステップS402の選択処理及びステップS404の検索処理を再び行わせる(判断手順)。
これらの処理を終えると、制御処理は、図3のメインループ処理のステップS400の末尾のアドレスに復帰する。
(1)文書管理装置は、画像形成装置に適用する例で説明したが、複写機やプリンタ、ファクシミリ装置、スキャナとそれらの複合機等に適用することもできる。
2 ネットワーク
4 画像形成装置
6 クライアントPC
10 制御部
11 単語抽出処理部
12 キーワード選択処理部
13 キーワード記憶処理部
14 キーワード表示処理部
15 選択処理部
16 検索処理部
17 判断処理部
18 文書データ情報表示処理部
20 プリントエンジン
22 スキャナ部
24 FAX通信部
26 ネットワークインターフェース
28 操作パネル
30 メモリ
32 HDD
34 ボックス部
Claims (6)
- 複数の文書データを記憶する文書データ記憶手段と、
前記文書データ記憶手段に各文書データを記憶する際に、前記各文書データに含まれる単語を抽出する単語抽出手段と、
前記単語抽出手段が抽出した単語のうち、前記各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択するキーワード選択手段と、
前記キーワード選択手段が選択したキーワードを、前記各文書データに関連付けて記憶するキーワード記憶手段と、
前記キーワード記憶手段が記憶しているキーワードの中から、前記文書データ記憶手段が記憶している全ての文書データにおける出現頻度の高い上位数個のキーワードを表示するキーワード表示手段と、
前記キーワード表示手段が表示したキーワードのいずれかを選択する選択手段と、
前記選択手段により選択されたキーワードに関連付けられた文書データを前記文書データ記憶手段から検索する検索手段と、
前記検索手段が検索した文書データに関して、所定の検索終了条件を満たす場合、その文書データが検索対象の文書データであると判断し、所定の検索終了条件を満たさない場合、前記選択手段により選択されたキーワードを除いて、前記選択手段により選択されたキーワードに関連付けられた文書データにおける出現頻度の高い上位数個のキーワードを表示し、前記選択手段及び前記検索手段に再び処理を行わせる判断手段と
を備える文書管理装置。 - 請求項1に記載の文書管理装置において、
前記所定の検索終了条件は、
前記検索手段が検索した文書データの該当数が1であることを特徴とする文書管理装置。 - 請求項1又は2に記載の文書管理装置において、
前記判断手段が検索対象の文書データであると判断した場合、その文書データに関する情報を表示する文書データ情報表示手段をさらに備えることを特徴とする文書管理装置。 - 請求項1から3までのいずれかに記載の文書管理装置において、
前記選択手段は、
前記キーワード表示手段が表示したキーワード以外の情報であって、いずれのキーワードにも該当するものがない旨の非該当情報を選択可能であり、
前記キーワード表示手段は、
前記選択手段により前記非該当情報が選択された場合、一旦表示した出現頻度の高い上位数個のキーワードを非表示として、その次に出現頻度の高い上位数個のキーワードを表示することを特徴とする文書管理装置。 - 請求項1から4までのいずれかに記載の文書管理装置において、
前記判断手段は、
前記検索手段が前回検索した文書データの該当数と、前記検索手段が今回検索した文書データの該当数とが同じである場合、出現頻度が高いほうのキーワードに関連付けられた文書データを検索対象の文書データであると判断することを特徴とする文書管理装置。 - 複数の文書データを記憶する機能を有する文書管理装置のコンピュータに、
前記各文書データを記憶する際に、前記各文書データに含まれる単語を抽出する単語抽出手順と、
前記単語抽出手順で抽出した単語のうち、前記各文書データにおける出現頻度の高い上位数個の単語をキーワードとして選択するキーワード選択手順と、
前記キーワード選択手順で選択したキーワードを、前記各文書データに関連付けて記憶するキーワード記憶手順と、
前記キーワード記憶手順で記憶しているキーワードの中から、前記複数の文書データの全ての文書データにおける出現頻度の高い上位数個のキーワードを表示するキーワード表示手順と、
前記キーワード表示手順で表示したキーワードのいずれかが選択される選択手順と、
前記選択手順により選択されたキーワードに関連付けられた文書データを前記複数の文書データの中から検索する検索手順と、
前記検索手順で検索した文書データに関して、所定の検索終了条件を満たす場合、その文書データが検索対象の文書データであると判断し、所定の検索終了条件を満たさない場合、前記選択手順により選択されたキーワードを除いて、前記選択手順により選択されたキーワードに関連付けられた文書データにおける出現頻度の高い上位数個のキーワードを表示し、前記選択手順及び前記検索手順を再び行わせる判断手順と
を実行させるための文書管理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010231150A JP2012084029A (ja) | 2010-10-14 | 2010-10-14 | 文書管理装置及び文書管理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010231150A JP2012084029A (ja) | 2010-10-14 | 2010-10-14 | 文書管理装置及び文書管理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012084029A true JP2012084029A (ja) | 2012-04-26 |
Family
ID=46242811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010231150A Pending JP2012084029A (ja) | 2010-10-14 | 2010-10-14 | 文書管理装置及び文書管理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012084029A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015207069A (ja) * | 2014-04-18 | 2015-11-19 | 富士通株式会社 | キーワード決定装置、キーワード決定プログラム及びキーワード決定方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10187739A (ja) * | 1996-12-20 | 1998-07-21 | Nec Corp | 情報検索装置 |
JP2006178599A (ja) * | 2004-12-21 | 2006-07-06 | Fuji Xerox Co Ltd | 文書検索装置および方法 |
JP2008234559A (ja) * | 2007-03-23 | 2008-10-02 | Yahoo Japan Corp | ドキュメント絞り込み検索装置、方法及びプログラム |
JP2010049372A (ja) * | 2008-08-20 | 2010-03-04 | G 02:Kk | コンテンツ検索装置 |
-
2010
- 2010-10-14 JP JP2010231150A patent/JP2012084029A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10187739A (ja) * | 1996-12-20 | 1998-07-21 | Nec Corp | 情報検索装置 |
JP2006178599A (ja) * | 2004-12-21 | 2006-07-06 | Fuji Xerox Co Ltd | 文書検索装置および方法 |
JP2008234559A (ja) * | 2007-03-23 | 2008-10-02 | Yahoo Japan Corp | ドキュメント絞り込み検索装置、方法及びプログラム |
JP2010049372A (ja) * | 2008-08-20 | 2010-03-04 | G 02:Kk | コンテンツ検索装置 |
Non-Patent Citations (1)
Title |
---|
丹羽 芳樹: "動的な共起解析を用いた対話的文書検索支援", 情報処理学会研究報告, vol. 96, no. 88, JPN6013041943, 13 September 1996 (1996-09-13), JP, pages 41 - 48, ISSN: 0002613818 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015207069A (ja) * | 2014-04-18 | 2015-11-19 | 富士通株式会社 | キーワード決定装置、キーワード決定プログラム及びキーワード決定方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10554647B2 (en) | Information processing device, information management method, and information processing system | |
US9471261B2 (en) | Image processing apparatus, display control method, and recording medium | |
US7797150B2 (en) | Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database | |
CN101178725B (zh) | 用于信息检索的设备和方法 | |
US8385650B2 (en) | Image processing apparatus, information processing apparatus, and information processing method | |
JP4940982B2 (ja) | 画像形成装置およびWebページ印刷制御方法 | |
JP2007293418A (ja) | 表示制御装置、画像処理装置、表示制御方法 | |
JP2006254431A (ja) | ドキュメント処理選択システム、方法およびプログラム | |
JP2007188479A (ja) | スキャン画像管理装置 | |
CN102694940B (zh) | 信息处理装置及其控制方法 | |
JP2009253771A (ja) | 出力装置とその制御方法 | |
JP2008236016A (ja) | 情報処理装置、情報処理方法、およびそのプログラム | |
US8533795B2 (en) | Information processing apparatus, information processing method, information processing program, and computer-readable medium | |
JP5207696B2 (ja) | 情報処理装置及び情報処理装置の制御方法、並びにプログラム | |
US20090310183A1 (en) | Display screen image creating apparatus, image forming apparatus, image forming system, and display control device | |
JP2012203152A (ja) | 制御装置、画像形成装置およびプログラム | |
JP2019117622A (ja) | 画像処理装置および画像処理プログラム | |
US8867091B2 (en) | Image processing system, image processing apparatus, image scanning apparatus, and control method and program for image processing system | |
US20090287692A1 (en) | Information processing apparatus and method for controlling the same | |
JP2012084029A (ja) | 文書管理装置及び文書管理プログラム | |
JP2010140136A (ja) | 画像処理装置、画像データ管理方法、およびコンピュータプログラム | |
US20130138708A1 (en) | Document processing apparatus | |
JP2007336008A (ja) | 画像検索装置および方法 | |
JP4186973B2 (ja) | ファクシミリ送信装置、ファクシミリ送信プログラム、ファクシミリ送信方法、およびファクシミリ送信システム | |
JP4980965B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120412 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120421 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120924 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131028 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140218 |