JP2007011721A - Document retrieval device - Google Patents
Document retrieval device Download PDFInfo
- Publication number
- JP2007011721A JP2007011721A JP2005192243A JP2005192243A JP2007011721A JP 2007011721 A JP2007011721 A JP 2007011721A JP 2005192243 A JP2005192243 A JP 2005192243A JP 2005192243 A JP2005192243 A JP 2005192243A JP 2007011721 A JP2007011721 A JP 2007011721A
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- business
- unit
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本願発明は文書検索装置に関する。 The present invention relates to a document search apparatus.
文書を業務プロセスと関連づけて管理する文書管理装置としては、例えば、特許文献1などに開示されている。
しかしながら、従来の文書検索装置には、以下のような問題があった。(1)類似の業務が複数あった場合、複数業務の文書が検索結果として表示されるが、どの業務がより必要とする業務に近いのか判断できない。(2)類似の業務が複数あった場合、複数の文書が検索結果として表示されるが、どの文書がより業務に役立つ文書か判断できない。 However, the conventional document search apparatus has the following problems. (1) When there are a plurality of similar jobs, a document of a plurality of jobs is displayed as a search result, but it cannot be determined which job is closer to a job that is more necessary. (2) When there are a plurality of similar tasks, a plurality of documents are displayed as search results, but it cannot be determined which document is more useful for the task.
そこで、本発明は、利用者にとってより参考になる文書を効率よく検索できる、文書検索装置を提供することを目的とする。 SUMMARY An advantage of some aspects of the invention is that it provides a document search apparatus that can efficiently search for a document that is more useful for a user.
請求項1は、文書を格納する文書データベースから所定の文書を検索する文書検索装置であって、検索条件を入力する検索条件入力部と、文書データベースに格納された文書の文書名、文書がどの業務において作成されたのかを表す業務カテゴリ情報、文書が前記業務のどのフェーズで作成されたのかを表す業務フェーズ情報、を格納する文書属性格納部と、文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、業務カテゴリ、及び業務フェーズに該当する文書を抽出する該当文書抽出部と、文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、及び業務カテゴリに該当するもので、前記第1文書抽出部で抽出されなかった文書を抽出する関連文書抽出部と、該当文書抽出部で抽出された文書に関する情報と、関連文書抽出部で抽出された文書に関する情報と、を業務フェーズの順序に基づいて出力する検索結果出力部を備える。
請求項1の文書検索装置によれば、検索結果の文書(=該当文書)と、その文書に業務で関連する文書(=関連文書)を出力するので、文書検索装置の利用者は、該当文書が作られた背景情報を知ることができる。これにより、例えば上記検索で該当文書が多く検出された場合、どの該当文書が本当に必要な文書であるかを把握することができる。また、関連文書を表示することにより、利用者の該当文書の理解に役立てることができる。
According to the document search device of
請求項2は、文書を格納する文書データベースから所定の文書を検索する文書検索装置であって、検索条件を入力する検索条件入力部と、文書データベースに格納された文書の文書名、文書がどの業務において作成されたのかを表す業務カテゴリ情報、を格納する文書属性格納部と、文書データベースに格納された文書数を、作成者ごと、文書カテゴリごとに管理する格納文書数管理部と、格納文書数管理部において、業務カテゴリにおける作成文書数が所定数以上である作成者を該業務カテゴリの専門家と判定する、専門家判定部と、文書データベースに格納された各文書にアクセスしたアクセス者を管理するアクセス者管理部と、文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、及び業務カテゴリに該当する文書を抽出する文書抽出部と、文書抽出部で抽出された文書に関する情報を、前記専門家判定部が専門家と判定したアクセス者によるアクセス回数に基づいて出力する検索結果出力部を備える。
請求項2の文書検索装置によれば、専門家が頻繁に使用している文書の順番を表示するので、文書検索装置の利用者は、どの文書がより業務に役に立つのかを容易に判断することができる。
According to the document retrieval apparatus of
本願発明によれば、利用者にとってより参考になる文書を効率よく検索できる、文書検索装置を提供することができる。例えば、文書が作られた背景情報や、専門家が参照した文書の情報を表示することで、利用者はどの文書が本当に必要な文書かを知ることができる。 According to the present invention, it is possible to provide a document search apparatus that can efficiently search for a document that is more useful for a user. For example, the user can know which document is really necessary by displaying the background information on which the document was created and the information on the document referred to by the expert.
(文書検索装置10の構成)
本願発明の文書検索装置の構成例を説明する。図1を参照して、文書検索装置10は、検索結果入力部1、文書データベース2、文書属性格納部3、格納文書数管理部4、操作履歴管理部5、文書抽出部6、検索結果出力部7、を有している。この文書検索装置10は、例えばサーバ型の電子計算機により実現される。
(Configuration of Document Search Device 10)
A configuration example of the document search apparatus according to the present invention will be described. Referring to FIG. 1, a
検索結果入力部1は、文書検索装置10の利用者からの検索条件入力を受け付ける。利用者とは、利用者は、例えば文書検索装置10とネットワークで接続された端末から検索条件入力を行う。
The search
文書データベース2は、様々な文書のデータを蓄積、保存するデータベースである。
The
文書属性格納部3は、文書データベース2に保存されている文書の属性情報を格納している。図2は、文書属性格納部3内に記憶されているデータの例を示す図である。属性情報とは、例えば、文書の文書名、文書が作成された業務を示す業務カテゴリ情報、文書が作成されたフェーズを示す業務フェーズ情報、文書の作成者名などである。なお、これらのデータは、作成文書の文書DBへの登録時に作成者により入力される。或いは、文書データベース2への登録時に、作成された文書のデータに基づいて自動的に文書属性格納部3の情報が作成されるものであってもよい。
The document
格納文書数管理部4は、文書データベース2に保存されている文書の数を管理する。図3は、格納文書数管理部4内に記憶されているデータの例を示す図である。例えば、業務カテゴリごと、作成者ごとの文書数を管理している。
The stored document
操作履歴管理部5は、文書データベース2の各文書に対するアクセス履歴などを管理する。図4は、操作履歴管理部5内に記憶されているデータの例を示す図である。この操作履歴管理部5には、アクセス者に関する情報の他、文書データベース2の各文書へのアクセス回数、及び、専門家の文書データベース2の各文書へのアクセスした回数が記録されている。また、図示していないが、操作履歴管理部5は、アクセス履歴を詳細に記録していても良い。
The operation
この文書管理装置10においては、特定の業務カテゴリに属する文書を多く作成した作成者を専門家と定義している。例えば、図3を参照して、業務カテゴリ「AAA」における専門家は、作成文書数が多いX課長、Y主任である。作成文書数が少ないZ社員、B社員は、専門家ではないと判断される。従って、図4の表における「専門家のアクセス回数」とは、このケースではX課長とY主任のアクセス回数の合計のことを指している。
In this
文書抽出部6は、文書データベース2、文書属性格納部3、格納文書数管理部4などを参照して、検索結果入力部1から入力された検索条件に適合する文書を、文書データベース2から抽出する。
The
検索結果出力部7は、文書抽出部6により抽出された文書に関する情報を出力する。出力先は、例えば、この文書検索装置10の利用者の端末である。
The search
図5は、利用者の端末の表示部に表示される検索条件入力画面の例を示したものである。検索条件入力画面には、文書キーワードを入力するためのテキストボックス11、業務カテゴリを入力するためのテキストボックス12、業務フェーズを入力するためのテキストボックス13、検索ボタン14が表示されている。また、検索の種類を指定するためのチェックボックス15a〜cも表示されている。
FIG. 5 shows an example of a search condition input screen displayed on the display unit of the user's terminal. On the search condition input screen, a
文書キーワードとは、例えば、文書データベース2の文書内に登場するキーワード、単語、或いは字句である。業務カテゴリは、文書属性格納部3における文書管理単位である業務カテゴリに対応し、業務フェーズは文書属性格納部3の業務フェーズに対応するものである。
The document keyword is, for example, a keyword, a word, or a lexical word that appears in a document in the
また、検索の種類を指定するためのチェックボックスは3種類ある。チェックボックス15aにより指定される「通常検索」とは、テキストボックス11から入力された文書キーワードを含み、かつ、テキストボックス12から入力された業務カテゴリに属する文書(以後、これを「該当文書」と呼ぶ)を検索するものである。
There are three types of check boxes for specifying the type of search. “Normal search” specified by the
チェックボックス15bにより指定される「関連文書検索」とは、上記の該当文書、及び、該当文書と同じ業務カテゴリに属する他の文書(以後、これを「関連文書」と呼ぶ)を検索するものである。
The “related document search” specified by the
また、チェックボックス15cにより指定される「専門家参照文書検索」とは、上記の該当文書検索、或いは、関連文書検索でヒットした文書のうち、専門家が多くアクセスした文書を検索するものである。
The “expert reference document search” specified by the
(文書検索の処理例1)
図6は、文書検索装置10により文書検索が行われるときの処理フローの一例を示すものである。
(Document Search Processing Example 1)
FIG. 6 shows an example of a processing flow when a document search is performed by the
ステップS10では、検索条件入力部10が、利用者による検索条件の入力を受け付ける。この例では、利用者は、文書キーワードとして、「YYYY」を、業務カテゴリとして「AAA」を、業務フェーズとして「結果」を入力したものとする。
In step S10, the search
ステップS12では、文書抽出部6が、検索条件入力画面のテキストボックス11から入力された文書キーワード「YYYY」を含む文書を文書データベース2から抽出する。なお、この例では、図7で示すように、「111.doc」「112.doc」「119.doc」の3文書が、文書データベース2の文書中に「YYYY」という字句を含むものであったとする。
In step S <b> 12, the
ステップS14では、文書抽出部6が、文書属性格納部3を参照して、検索条件入力画面のテキストボックス12から入力された業務カテゴリに当てはまり、かつ、テキストボックス13から入力された業務フェーズにも当てはまる文書を、文書データベース2から抽出する。
In step S14, the
ステップS16では、上記ステップS12、及びステップS14の両方でヒットした文書を抽出する。このステップS16で抽出された文書が上記で定義した「該当文書」に相当するが、この例では、該当案件は1件もないものとする。 In step S16, the document hit in both step S12 and step S14 is extracted. The document extracted in step S16 corresponds to the “corresponding document” defined above, but in this example, it is assumed that there is no corresponding case.
ステップS18では、チェックボックス15からの入力に応じて処理が分岐される。利用者が関連文書検索を選択した場合(チェックボックス15bがONの場合)、ステップS20へ進む。ステップS20では、文書抽出部6が、文書属性格納部3を参照して、ステップS16で抽出された文書の業務カテゴリと同じ業務カテゴリに属する他の文書(以後、これを「関連文書」と呼ぶ)を抽出する。
In step S18, the process branches according to the input from the check box 15. When the user selects the related document search (when the
そしてステップS22では、文書抽出部6が抽出した結果が、検索結果出力部7を介して、利用者の端末の表示部に表示される。
In step S22, the result extracted by the
図8は、このときに、表示部に表示される検索結果画面を示すものである。関連文書が業務のどのフェーズで作成されたものなのかが一目瞭然で分かるように表示されている。 FIG. 8 shows a search result screen displayed on the display unit at this time. It is displayed so that you can see at a glance which phase of the business the related document was created.
この検索では、利用者が希望する、「文書キーワード:YYYY、業務カテゴリ:AAA、業務フェーズ:結果」に該当する案件はなく、この検索結果画面に表示されている文書名は全て関連文書名である。また、下線付きで表示されている文書名「111.doc」「112.doc」「119.doc」は、業務フェーズは異なるものの、「文書キーワード:YYYY、業務カテゴリ:AAA、」に該当する案件である。このことから、「結果」フェーズの文書には「YYYY」というキーワードは登場しないものの、他のフェーズの文書には「YYYY」というキーワードが登場していることから、「結果」フェーズの文書「130.doc」「140.doc」「150.doc」のうちのいずれかは、「YYYY」に関連する記載がある可能性が考えられ、これらの文書の中に利用者が知りたい情報が記載されている可能性がある。 In this search, there is no case that corresponds to “document keyword: YYYY, business category: AAA, business phase: result” desired by the user, and all the document names displayed on this search result screen are related document names. is there. In addition, the document names “111.doc”, “112.doc”, and “119.doc” displayed with an underline are different in the business phase but correspond to “document keyword: YYYY, business category: AAA”. It is. Therefore, although the keyword “YYYY” does not appear in the “result” phase document, the keyword “YYYY” appears in the other phase documents. .doc "," 140.doc ", or" 150.doc "may have a description related to" YYYY ", and the information that the user wants to know is described in these documents. There is a possibility.
ここで、このように、「結果」フェーズには文書キーワード「YYYY」が含まれている文書が1つもないのに対し、他のフェーズには文書キーワード「YYYY」が含まれている文書があるケースとは、例えば、以下のようなものが考えられる。第1には、文書作成者によって用語の使い方が異なり、同じ意味の事柄を表すのに異なる単語を用いている場合である。第2には、業務の状況が変化してしまい、初期の「調査」フェーズや、「計画」フェーズでの業務ターゲットが、「結果」フェーズでの業務ターゲットではなくなった場合が考えられる。 Here, as described above, the “result” phase does not include any document including the document keyword “YYYY”, while the other phases include documents including the document keyword “YYYY”. Examples of cases are as follows. The first is a case in which terms are used differently depending on document creators, and different words are used to represent the same meaning. Secondly, it is conceivable that the business situation has changed, and the business target in the initial “investigation” phase or the “planning” phase is no longer the business target in the “result” phase.
一方、利用者が通常検索を選択した場合(チェックボックス15aがONの場合)、ステップS24へ進む。このとき、利用者の端末の表示部には、図9のように、利用者端末の表示画面には、「該当案件はありません」という文字が表示される。
On the other hand, when the user selects the normal search (when the
なお、この検索結果画面は、HTML文書により構成されていてもよい。このとき、利用者は、文書名の箇所をクリックすると、文書データベース2にアクセスして、文書の内容を閲覧することが可能である。
This search result screen may be composed of an HTML document. At this time, when the user clicks the location of the document name, the user can access the
また、上記の検索例では「該当文書」は1件もヒットしなかったが、仮に「実施」フェーズを対象に検索した場合(テキストボックス13に「実施」と入力した場合)、「119.doc」が「該当文書」としてヒットする。このとき、図10で示すように、利用者端末の表示画面には、「119.doc」は他の文書名よりも大きな文字サイズで表示される。 Further, in the above search example, no “corresponding document” was hit, but if a search was made for the “execution” phase (when “execution” was entered in the text box 13), “119.doc” "Is hit as" corresponding document ". At this time, as shown in FIG. 10, “119.doc” is displayed in a larger character size than other document names on the display screen of the user terminal.
(文書検索の処理例2)
上記の文書検索装置10を用いた検索処理の他の例を説明する。図11は、文書検索装置10により文書検索が行われるときの他の処理フロー例である。
(Example 2 of document search)
Another example of search processing using the
ステップS30では、検索条件入力部10が、利用者による検索条件の入力を受け付ける。図12は、このときの入力画面を示すものである。ここでは、利用者はテキストボックス12に業務カテゴリのみを入力し、テキストボックス11への文書キーワード、テキストボックス13への業務フェーズ入力しなかったものと仮定する。また、チェックボックス15については、チェックボックス15cのみを選択(専門家参照文書検索を選択)したものとして、以後の説明を行う。
In step S30, the search
ステップS32では、文書抽出部6が、文書属性格納部3を参照して、検索条件入力画面のテキストボックス12から入力された業務カテゴリに該当する文書を、文書データベース2から抽出する。
In step S 32, the
ステップS34では、文書抽出部6が、操作履歴管理部5を参照して、専門家がアクセスした回数に基づいて、ステップS32で抽出された文書に対して順序づけを行う。
In step S34, the
そして、ステップS36では、検索結果出力部7は、抽出された文書の文書名を、その順序づけに従って出力する。
In step S36, the search
図13は、検索結果出力部7の出力を利用者の端末の表示部に表示させた検索結果画面である。検索結果画面では、「111.doc」「112.doc」「120.doc」「116.doc」「113.doc」が、専門家が多くアクセスした文書であるとして、表示されている。
FIG. 13 is a search result screen in which the output of the search
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施の形態の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。 The embodiment disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is shown not by the above description of the embodiments but by the scope of claims for patent, and is intended to include meanings equivalent to the scope of claims for patent and all modifications within the scope.
例えば、専門家の定義方法としては、上記のように「単一の業務カテゴリ内における作成文書数が多い人」を専門家とする以外にも、「類似する複数の業務カテゴリにおける作成文書数が多い人」を専門家と定義しても良い。 For example, as a method of defining an expert, in addition to selecting “a person with a large number of created documents in a single business category” as described above, an expert may define “the number of created documents in a plurality of similar business categories”. “Many people” may be defined as experts.
1 検索結果入力部
2 文書データベース
3 文書属性格納部
4 格納文書数管理部
5 操作履歴管理部
6 文書抽出部
7 検索結果出力部
DESCRIPTION OF
Claims (2)
検索条件を入力する検索条件入力部と、
文書データベースに格納された文書の文書名、文書がどの業務において作成されたのかを表す業務カテゴリ情報、文書が前記業務のどのフェーズで作成されたのかを表す業務フェーズ情報、を格納する文書属性格納部と、
文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、業務カテゴリ、及び業務フェーズに該当する文書を抽出する該当文書抽出部と、
文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、及び業務カテゴリに該当するもので、該当文書抽出部で抽出されなかった他の文書を抽出する関連文書抽出部と、
該当文書抽出部で抽出された文書に関する情報と、関連文書抽出部で抽出された文書に関する情報と、を業務フェーズの順序に基づいて出力する検索結果出力部を備えた、文書検索装置。
A document search device for searching a predetermined document from a document database storing documents,
A search condition input part for inputting a search condition;
Document attribute storage for storing the document name of the document stored in the document database, the business category information indicating in which business the document was created, and the business phase information indicating in which phase of the business the document was created And
A document extraction unit that extracts documents corresponding to a document keyword, a job category, and a job phase input from the search condition input unit with reference to the document database and the document attribute storage unit;
A related document that refers to the document database and the document attribute storage unit, and that corresponds to the document keyword and business category input from the search condition input unit and extracts other documents not extracted by the corresponding document extraction unit An extractor;
A document search apparatus comprising a search result output unit that outputs information related to a document extracted by a corresponding document extraction unit and information related to a document extracted by a related document extraction unit based on the order of business phases.
検索条件を入力する検索条件入力部と、
文書データベースに格納された文書の文書名、文書がどの業務において作成されたのかを表す業務カテゴリ情報、を格納する文書属性格納部と、
文書データベースに格納された文書数を、作成者ごと、文書カテゴリごとに管理する格納文書数管理部と、
格納文書数管理部において、業務カテゴリにおける作成文書数が所定数以上である作成者を該業務カテゴリの専門家と判定する、専門家判定部と、
文書データベースに格納された各文書にアクセスしたアクセス者を管理するアクセス者管理部と、
文書データベース、及び文書属性格納部を参照して、検索条件入力部から入力された文書キーワード、及び業務カテゴリに該当する文書を抽出する文書抽出部と、
文書抽出部で抽出された文書に関する情報を、前記専門家判定部が専門家と判定したアクセス者によるアクセス回数に基づいて出力する検索結果出力部を備えた、文書検索装置。
A document search device for searching a predetermined document from a document database storing documents,
A search condition input part for inputting a search condition;
A document attribute storage unit for storing the document name of the document stored in the document database and the business category information indicating in which business the document was created;
A stored document number management unit for managing the number of documents stored in the document database for each creator and each document category;
In the stored document number management unit, an expert determination unit that determines a creator whose number of created documents in the business category is a predetermined number or more as an expert of the business category;
An accessor management unit for managing an accesser who has accessed each document stored in the document database;
A document extraction unit for extracting a document corresponding to the business keyword and the document keyword input from the search condition input unit with reference to the document database and the document attribute storage unit;
A document search apparatus comprising: a search result output unit that outputs information on a document extracted by a document extraction unit based on the number of accesses by an accessor determined by the expert determination unit as an expert.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005192243A JP2007011721A (en) | 2005-06-30 | 2005-06-30 | Document retrieval device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005192243A JP2007011721A (en) | 2005-06-30 | 2005-06-30 | Document retrieval device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007011721A true JP2007011721A (en) | 2007-01-18 |
Family
ID=37750125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005192243A Pending JP2007011721A (en) | 2005-06-30 | 2005-06-30 | Document retrieval device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007011721A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009025264A1 (en) * | 2007-08-20 | 2009-02-26 | Nec Corporation | File management device, file management system, file management method, and program |
JP2009181479A (en) * | 2008-01-31 | 2009-08-13 | Japan Digital Laboratory Co Ltd | Data management system, method, and program |
-
2005
- 2005-06-30 JP JP2005192243A patent/JP2007011721A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009025264A1 (en) * | 2007-08-20 | 2009-02-26 | Nec Corporation | File management device, file management system, file management method, and program |
JP2009181479A (en) * | 2008-01-31 | 2009-08-13 | Japan Digital Laboratory Co Ltd | Data management system, method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7769771B2 (en) | Searching a document using relevance feedback | |
JP2001075969A (en) | Method and device for image management retrieval and storage medium | |
US20090313539A1 (en) | Information processor, information processing method, and recording medium | |
JP3803961B2 (en) | Database generation apparatus, database generation processing method, and database generation program | |
US20070185832A1 (en) | Managing tasks for multiple file types | |
US8612431B2 (en) | Multi-part record searches | |
US20100036888A1 (en) | Method and system for managing tags | |
JP2001256255A (en) | Device and method for retrieving data | |
JP2005202714A (en) | Document retrieval system | |
JP2008234078A (en) | Information processor, information processing method, information processing program, and recording medium in which information processing program is recorded | |
JP2007011721A (en) | Document retrieval device | |
JP2012043258A (en) | Retrieval system, retrieval device, retrieval program, recording medium and retrieval method | |
JP2009223679A (en) | Electronic document search device and electronic document search program | |
JP2009146013A (en) | Content retrieval method, its device, and program | |
JP2000163439A (en) | Device and method for electronic file retrieval | |
JP2812357B2 (en) | Database search system | |
JP2005056223A (en) | Text data retrieval system, method therefor and its program | |
JP2006338114A (en) | Data management device and data management method | |
JP3933407B2 (en) | Document processing apparatus, document processing method, and storage medium storing document processing program | |
JP2004030021A (en) | Document processor and processing method | |
JPH06195386A (en) | Data retriever | |
JP2005275929A (en) | Csv data providing system | |
JP7284371B2 (en) | Information processing device, information processing method, and program | |
JP5156491B2 (en) | Information processing apparatus, information processing method, and program | |
JP2007179130A (en) | Classification management device and its program |