JP6479232B1 - Document management apparatus and document management method - Google Patents
Document management apparatus and document management method Download PDFInfo
- Publication number
- JP6479232B1 JP6479232B1 JP2018034979A JP2018034979A JP6479232B1 JP 6479232 B1 JP6479232 B1 JP 6479232B1 JP 2018034979 A JP2018034979 A JP 2018034979A JP 2018034979 A JP2018034979 A JP 2018034979A JP 6479232 B1 JP6479232 B1 JP 6479232B1
- Authority
- JP
- Japan
- Prior art keywords
- search
- unit
- document
- keyword
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims description 53
- 238000000605 extraction Methods 0.000 claims abstract description 82
- 239000000284 extract Substances 0.000 claims abstract description 29
- 230000004044 response Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 12
- 230000008859 change Effects 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 239000000470 constituent Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】属性情報の登録によるユーザ負担の軽減を可能とし、且つ、属性情報のデータ量の増大を抑制可能とする。【解決手段】検索条件が指定された場合に、データ記録部12から当該検索条件と一致するキーワードが含まれる属性情報を抽出する文書検索部22と、文書検索部22で用いられた検索条件を含む検索履歴情報をデータ記録部12に記録する履歴記録部23と、指定日時に、データ記録部12から抽出条件を満たす検索条件を抽出する検索条件抽出部25と、ファイルシステム11から、検索条件抽出部25により抽出された検索条件と一致するキーワードが含まれるファイルを抽出し、当該ファイルに紐づく文書を抽出する全文検索部26と、データ記録部12に対し、全文検索部26により抽出された文書の属性情報に、検索条件抽出部25により抽出された検索条件であるキーワードを記録するキーワード登録部27とを備えた。【選択図】図1It is possible to reduce a burden on a user by registering attribute information and to suppress an increase in the data amount of attribute information. When a search condition is specified, a document search unit for extracting attribute information including a keyword that matches the search condition from a data recording unit, and a search condition used by the document search unit. The search history information including the search history information included in the data recording unit 12, the search condition extraction unit 25 that extracts the search conditions satisfying the extraction condition from the data recording unit 12 at the specified date and time, and the file system 11 A full-text search unit 26 that extracts a file including a keyword that matches the search condition extracted by the extraction unit 25 and extracts a document associated with the file, and a full-text search unit 26 for the data recording unit 12 And a keyword registration unit 27 for recording a keyword which is a search condition extracted by the search condition extraction unit 25 in the attribute information of the document. [Selection] Figure 1
Description
この発明は、文書を管理する文書管理装置及び文書管理方法に関する。 The present invention relates to a document management apparatus and a document management method for managing documents.
従来から、文字を示す電子データ(ファイル)を管理することで、文書を管理する文書管理装置が知られている。なお、文書は、1つ又は複数のファイルから構成される。
この文書管理装置では、キーワードを用いた文書検索を可能とするため、ユーザが、文書登録の際に、文書の属性情報を登録する必要がある。この際、より検索性を高めるためには、ユーザが十分な属性情報を登録する必要があり、ユーザ負担が増大する。
2. Description of the Related Art Conventionally, document management apparatuses that manage documents by managing electronic data (files) indicating characters are known. A document is composed of one or a plurality of files.
In this document management apparatus, it is necessary for a user to register document attribute information when registering a document in order to enable document search using a keyword. At this time, in order to further improve the searchability, it is necessary for the user to register sufficient attribute information, which increases the burden on the user.
これに対し、属性情報の登録の手間を軽減するため、文書管理装置が、文書登録の際に、その文書の内容からキーワードを自動で抽出し、その抽出したキーワードを属性情報として登録するものが知られている(例えば特許文献1参照)。 On the other hand, in order to reduce the trouble of registering attribute information, a document management apparatus automatically extracts a keyword from the content of the document and registers the extracted keyword as attribute information when registering the document. It is known (for example, see Patent Document 1).
しかしながら、特許文献1に開示されるような従来の文書管理装置では、使用頻度の少ない不要なキーワードであっても属性情報として登録される可能性が高く、属性情報のデータ量が増大するという課題がある。 However, in the conventional document management apparatus as disclosed in Patent Document 1, there is a high possibility that even unnecessary keywords that are less frequently used are registered as attribute information, and the amount of attribute information data increases. There is.
この発明は、上記のような課題を解決するためになされたもので、属性情報の登録によるユーザ負担の軽減が可能であり、且つ、属性情報のデータ量の増大を抑制可能な文書管理装置を提供することを目的としている。 The present invention has been made to solve the above-described problems, and provides a document management apparatus that can reduce the burden on the user by registering attribute information and can suppress an increase in the data amount of attribute information. It is intended to provide.
この発明に係る文書管理装置は、1つ以上のキーワードである検索条件が指定された場合に、ファイルシステムに記録されているファイルに紐づく文書の属性情報を記録しているデータ記録部から、当該検索条件と一致するキーワードが含まれる属性情報を抽出する文書検索部と、文書検索部で用いられた検索条件を含む検索履歴情報を、データ記録部に記録する履歴記録部と、指定された日時に、データ記録部から、抽出条件を満たす検索条件を抽出する検索条件抽出部と、ファイルシステムから、検索条件抽出部により抽出された検索条件と一致するキーワードが含まれるファイルを抽出し、当該ファイルに紐づく文書を抽出する全文検索部と、データ記録部に対し、全文検索部により抽出された文書の属性情報に、検索条件抽出部により抽出された検索条件であるキーワードを拡張キーワードとして記録するキーワード登録部とを備えたことを特徴とする。 When a search condition that is one or more keywords is specified, the document management apparatus according to the present invention includes a data recording unit that records attribute information of a document associated with a file recorded in the file system, A document search unit for extracting attribute information including a keyword matching the search condition, a history recording unit for recording search history information including the search condition used in the document search unit in the data recording unit, and a designated At the time of day, a search condition extraction unit that extracts a search condition that satisfies the extraction condition from the data recording unit, and a file that includes a keyword that matches the search condition extracted by the search condition extraction unit is extracted from the file system. The full-text search unit that extracts the document associated with the file and the attribute information of the document extracted by the full-text search unit are added to the data recording unit by the search condition extraction unit. Which is the extracted search condition Keyword is characterized in that a keyword registration unit that records the extended keyword.
この発明によれば、上記のように構成したので、属性情報の登録によるユーザ負担の軽減が可能であり、且つ、属性情報のデータ量の増大を抑制可能である。 According to this invention, since it comprised as mentioned above, the user burden by registration of attribute information can be reduced, and the increase in the data amount of attribute information can be suppressed.
以下、この発明の実施の形態について図面を参照しながら詳細に説明する。
実施の形態1.
図1はこの発明の実施の形態1に係る文書管理装置の構成例を示す図である。
文書管理装置は、文字を示す電子データ(ファイル)を管理することで、文書を管理する。なお、文書は1つ以上のファイルから成る。また以下では、文書管理装置が有する機能のうち、キーワードを用いた文書検索に関する機能について示す。この文書管理装置は、図1に示すように、管理部1及び処理部2を備えている。管理部1は、ファイルシステム11、データ記録部12及びインデックス部13を有している。処理部2は、文書登録部21、文書検索部22、履歴記録部23、抽出条件設定部24、検索条件抽出部25、全文検索部26及びキーワード登録部27を有している。なお、抽出条件設定部24、検索条件抽出部25及びキーワード登録部27は、管理処理部28を構成する。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
Embodiment 1 FIG.
FIG. 1 is a diagram showing a configuration example of a document management apparatus according to Embodiment 1 of the present invention.
The document management apparatus manages documents by managing electronic data (files) indicating characters. A document consists of one or more files. Hereinafter, among the functions of the document management apparatus, functions related to document search using keywords will be described. As shown in FIG. 1, the document management apparatus includes a management unit 1 and a
ファイルシステム11は、ファイルを記録する。
データ記録部12は、属性情報を含む文書情報、検索履歴情報を有する検索履歴テーブル、及び、抽出条件情報を記録する。属性情報は、ファイルシステム11に記録されているファイルに紐づく文書の属性を示す情報である。検索履歴情報は、文書管理装置でキーワードを用いた文書検索が行われた際の履歴を示す情報である。抽出条件情報は、文書管理装置で属性情報としてキーワードの自動登録を行う際に候補とするキーワードの抽出条件、及び、キーワードの自動登録の方法を示す情報である。
The
The
属性情報には、例えば図2に示すように、文書名称、文書番号、登録日、更新日、登録者、更新者、格納先、キーワード、ファイル名称、及び、拡張キーワード等、を示す情報が含まれている。
文書名称は、文書の名称である。文書番号は、文書を識別する番号(副版)である。登録日は、文書が文書管理装置に登録された日である。更新日は、文書の最終更新日である。登録者は、文書を登録したユーザの名称である。更新者は、文書の最終更新をしたユーザの名称である。記録先は、文書を構成するファイルの記録先を示す階層である。キーワードは、文書登録の際に、ユーザにより登録された文書検索のためのキーワードである。ファイル名称は、文書を構成するファイル毎の名称である。ファイル備考は、ファイル毎の説明文である。拡張キーワードは、文書管理装置がファイル毎に自動で抽出する文書検索のためのキーワードである。
For example, as shown in FIG. 2, the attribute information includes information indicating a document name, a document number, a registration date, an update date, a registrant, an updater, a storage location, a keyword, a file name, an extended keyword, and the like. It is.
The document name is the name of the document. The document number is a number (subversion) for identifying a document. The registration date is the date when the document is registered in the document management apparatus. The update date is the last update date of the document. The registrant is the name of the user who registered the document. The updater is the name of the user who last updated the document. The recording destination is a hierarchy indicating the recording destination of the files constituting the document. The keyword is a keyword for document search registered by the user at the time of document registration. The file name is a name for each file constituting the document. A file remark is an explanatory text for each file. The extended keyword is a keyword for document search that is automatically extracted for each file by the document management apparatus.
検索履歴情報には、例えば図3に示すように、検索条件、最終更新日時、実施回数、ヒット件数、及び、前回対象、を示す情報が含まれる。
検索条件は、文書検索で用いられた1つ以上のキーワードである。最終更新日時は、検索条件が用いられた最終日時である。実施回数は、検索条件を用いて文書検索を行った回数である。ヒット件数は、検索条件と一致するキーワードが含まれる属性情報の件数である。前回対象は、前回実施したキーワードの自動登録において、検索条件抽出部25が対象件数の条件で検索条件の抽出を行った結果、対象となったか否かを示し、図3の例では、前回のキーワードの自動登録で対象となった場合を1とし、それ以外を0としている。
For example, as shown in FIG. 3, the search history information includes information indicating the search condition, the last update date, the number of executions, the number of hits, and the previous target.
The search condition is one or more keywords used in document search. The last update date and time is the last date and time when the search condition is used. The number of executions is the number of times a document search is performed using a search condition. The number of hits is the number of attribute information including a keyword that matches the search condition. The last target indicates whether or not the search
抽出条件情報には、例えば図4に示すように、対象件数、対象ヒット件数、対象更新日時、対象実施回数、及び、実行条件、を示す情報が含まれる。
対象件数は、検索履歴テーブルに含まれる検索条件のうち、検索条件抽出部25が優先順位の高い順に抽出する検索条件の件数である。なお、検索条件の優先順位は、例えば、最終更新日が新しく且つ実施回数が多い順等のように、適宜設定される。対象ヒット件数は、検索履歴テーブルに含まれる検索条件のうち、検索条件抽出部25が抽出する検索条件のヒット件数の範囲である。対象更新日時は、検索履歴テーブルに含まれる検索条件のうち、検索条件抽出部25が抽出する検索条件の最終更新日時の範囲である。対象実施回数は、検索履歴テーブルに含まれる検索条件のうち、検索条件抽出部25が抽出する検索条件の実施回数の範囲である。実行条件は、文書管理装置でキーワードの自動登録を行う際に、属性情報の拡張キーワードにキーワードを追加するか上書きするかを指定する項目である。
For example, as illustrated in FIG. 4, the extraction condition information includes information indicating the number of target cases, the number of target hits, the target update date and time, the number of target executions, and the execution conditions.
The target number is the number of search conditions that the search
インデックス部13は、ファイルシステム11に記録されたファイルからインデックスを抽出し、そのインデックスを記録する。このインデックス部13によるインデックスの生成及び記録は定期的に実施される。
The
ファイルシステム11、データ記録部12及びインデックス部13としては、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(Electrically EPROM)等の不揮発性又は揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、又は、DVD(Digital Versatile Disc)等が用いられる。
As the
なお図1では、文書管理装置の内部に管理部1が設けられた場合を示している。しかしながら、これに限らず、文書管理装置の外部に管理部1が設けられてもよい。 FIG. 1 shows a case where the management unit 1 is provided inside the document management apparatus. However, the present invention is not limited to this, and the management unit 1 may be provided outside the document management apparatus.
文書登録部21は、外部からファイルが転送されて文書の登録が要求された場合に、ファイルシステム11に当該ファイルを記録させ、また、当該ファイルの情報を含めユーザにより設定された文書の属性情報を、データ記録部12に記録する。
また、文書登録部21は、登録済みの文書に対して外部からファイルの変更が要求された場合に、ファイルシステム11に記録されている当該ファイルを変更する。また、文書登録部21は、データ記録部12に記録されている上記ファイルの情報を含めユーザにより変更された文書の属性情報を変更する。この際、文書登録部21は、上記属性情報のうち、上記ファイルに紐づく拡張キーワードについては削除する。
The
The
文書検索部22は、外部から検索条件が指定されて文書検索が要求された場合に、データ記録部12から当該検索条件と一致するキーワードが含まれる文書の属性情報を抽出する。この文書検索部22により抽出された属性情報は外部に通知される。
When a search condition is designated from the outside and a document search is requested, the
履歴記録部23は、文書検索部22で用いられた検索条件を含む検索履歴情報を、データ記録部12に記録する。
The
抽出条件設定部24は、外部からの要求に応じ、データ記録部12で記録される抽出条件情報の設定及び確認を行う。
The extraction
検索条件抽出部25は、外部又は内部スケジューラにより指定された日時に、データ記録部12から、抽出条件情報が示す抽出条件を満たす検索条件を抽出する。この検索条件抽出部25により抽出された検索条件を示す情報は全文検索部26に通知される。また、検索条件抽出部25は、抽出条件情報に含まれる実行条件が上書きを示している場合には、上記日時に、データ記録部12に記録されている属性情報から、検索履歴テーブルの前回対象が0である検索条件に対応する拡張キーワードを全て削除する。
The search
全文検索部26は、ファイルシステム11から、検索条件抽出部25により抽出された検索条件と一致するキーワードが含まれるファイルを抽出し、当該ファイルに紐づく文書を抽出する。図1の例では、全文検索部26は、インデックス部13に記録されているインデックスからキーワードが一致するファイルを抽出し、当該ファイルに紐づく文書を抽出する。この全文検索部26により抽出されたファイル及び文書を示す情報はキーワード登録部27に通知される。
The full-
キーワード登録部27は、データ記録部12に対し、全文検索部26により抽出された文書の属性情報に、検索条件抽出部25により抽出された検索条件であるキーワードを拡張キーワードとして記録する。
The
次に、文書管理装置の動作例について、図5〜8を参照しながら説明する。
まず、文書管理装置による文書登録の動作例について、図5を参照しながら説明する。
文書管理装置による文書登録では、外部からファイルが転送されて文書の登録が要求されると、図5に示すように、まず、文書登録部21は、ファイルシステム11に当該ファイルを記録する(ステップST501)。なお、文書登録部21は、1つの文書に複数の異なるファイルを登録することもできる。
また、文書登録部21は、上記ファイルの情報を含めユーザにより設定された文書の属性情報を、データ記録部12に記録する(ステップST502)。
Next, an operation example of the document management apparatus will be described with reference to FIGS.
First, an operation example of document registration by the document management apparatus will be described with reference to FIG.
In document registration by the document management apparatus, when a file is transferred from the outside and registration of the document is requested, the
Further, the
次に、文書管理装置によるファイル変更の動作例について、図6を参照しながら説明する。
文書管理装置によるファイル変更では、登録済みの文書に対して外部からファイルの変更が要求されると、図6に示すように、まず、文書登録部21は、ファイルシステム11に記録されている当該ファイルを変更する(ステップST601)。
また、文書登録部21は、データ記録部12に記録されている属性情報をユーザにより設定された内容に変更する(ステップST602)。
また、文書登録部21は、上記属性情報のうち、文書管理装置が自動で登録する属性情報である拡張キーワードについては変更したファイルのものは削除する(ステップST603)。
Next, an example of file change operation by the document management apparatus will be described with reference to FIG.
In the file change by the document management apparatus, when a file change is requested from the outside with respect to a registered document, first, as shown in FIG. The file is changed (step ST601).
Further, the
Also, the
次に、文書管理装置によるキーワードを用いた文書検索の動作例について、図7を参照しながら説明する。
文書管理装置によるキーワードを用いた文書検索では、外部から検索条件が指定されて文書検索が要求されると、図7に示すように、まず、文書検索部22は、データ記録部12から当該検索条件と一致するキーワードが含まれる文書の属性情報を抽出する(ステップST701)。この文書検索部22により抽出された属性情報は外部に通知される。
Next, an example of document search operation using keywords by the document management apparatus will be described with reference to FIG.
In the document search using keywords by the document management apparatus, when a search condition is specified from the outside and a document search is requested, the
次いで、履歴記録部23は、文書検索部22で用いられた検索条件を含む検索履歴情報を、データ記録部12に記録する(ステップST702)。履歴記録部23は、例えば、データ記録部12に対し、文書検索部22で用いられた検索条件及び当該検索条件でのヒット件数を記録し、また、当該検索条件を用いた最終更新日及び実施回数の更新を行う。
Next, the
次に、文書管理装置によるキーワードの自動登録の動作例について、図8を参照しながら説明する。なお以下では、抽出条件情報に、対象件数、対象ヒット件数、対象更新日時、対象実施回数、及び、実行条件、を示す情報が含まれているものとする。
文書管理装置によるキーワードの自動登録では、図8に示すように、検索条件抽出部25は、外部又は内部スケジューラにより指定された日時になったかを判定する(ステップST801)。
このステップST801において、検索条件抽出部25が上記日時にはなっていないと判定した場合には、シーケンスはステップST801に戻る。
なお、指定日時による実行は、シーケンスによる判定に限らず、タイマ機能による割込み処理又は外部スケジュールによるイベント起動等でもよく、その方法は問わない。
Next, an operation example of automatic keyword registration by the document management apparatus will be described with reference to FIG. In the following, it is assumed that the extraction condition information includes information indicating the number of targets, the number of target hits, the target update date, the number of target executions, and the execution conditions.
In the automatic keyword registration by the document management apparatus, as shown in FIG. 8, the search
In step ST801, if the search
Note that the execution based on the designated date and time is not limited to the determination based on the sequence, but may be interrupt processing by the timer function or event activation by an external schedule, and the method thereof is not limited.
一方、ステップST801において、検索条件抽出部25は、上記日時になったと判定した場合には、抽出条件情報に含まれる実行条件が上書きを示しているかを判定する(ステップST802)。
このステップST802において、検索条件抽出部25は、実行条件が上書きを示していると判定した場合に、データ記録部12に記録されている属性情報から、検索履歴テーブルの前回対象が0である検索条件に対応する拡張キーワードを全て削除する(ステップST803)。
On the other hand, if the search
In this step ST802, if the search
一方、ステップST802において、検索条件抽出部25は、実行条件が上書きを示していないと判定した場合、すなわち実行条件が追加を示している場合には、ステップST803はスキップされ、シーケンスはステップST804へ移行する。
On the other hand, in step ST802, if the search
次いで、検索条件抽出部25は、データ記録部12に記録されている検索履歴テーブルに対し、抽出条件に含まれる対象件数に該当する検索条件の前回対象を1とし、それ以外の検索条件の前回対象を0とする(ステップST804)。
Next, the search
次いで、検索条件抽出部25は、データ記録部12に記録されている検索履歴テーブルのうち、抽出条件情報に含まれる対象件数に該当する検索条件が有るかを判定する(ステップST805)。
Next, the search
このステップST805において、検索条件抽出部25は、対象件数に該当する検索条件が有ると判定した場合に、当該検索条件のうち、抽出条件情報に含まれる対象ヒット件数、対象更新日時及び対象実施回数に該当する検索条件が有るかを判定する(ステップST806)。
このステップST806において、検索条件抽出部25は、上記各条件に該当する検索条件が有ると判定した場合には、シーケンスはステップST807へ移行する。
一方、検索条件抽出部25は、ステップST805において対象件数に該当する検索条件が無いと判定した場合、又は、ステップST806において上記各条件に該当する検索条件が無いと判定した場合には、その後の処理はスキップされ、シーケンスは終了する。
In step ST805, when the search
In step ST806, if the search
On the other hand, if it is determined in step ST805 that there is no search condition corresponding to the target number in step ST805, or if it is determined in step ST806 that there is no search condition corresponding to each of the above conditions, Processing is skipped and the sequence ends.
ステップST801〜ST806の処理により、検索条件抽出部25は、データ記録部12から、抽出条件情報が示す抽出条件を満たす検索条件を抽出することができる。
なお、キーワードの自動登録を行うことで、前回も今回も対象件数の条件には該当するが、ヒット件数の条件が今回は範囲外となる検索条件が発生する可能性がある。そこで、検索履歴情報に前回対象を示す情報を含めることで、上記のようなケースで検索条件が対象となったりならなかったりすることを繰り返さないようにする。
Through the processing of steps ST801 to ST806, the search
It should be noted that by performing automatic keyword registration, there may be a search condition in which the condition for the number of hits applies to the previous time and the current time, but the condition for the number of hits is outside the range this time. Therefore, by including information indicating the previous target in the search history information, it is possible not to repeat that the search condition is not the target in the above case.
次いで、全文検索部26は、ファイルシステム11から、検索条件抽出部25により抽出された検索条件と一致するキーワードが含まれるファイルを抽出し、当該ファイルに紐づく文書を抽出する(ステップST807)。図1の例では、全文検索部26は、インデックス部13に記録されているインデックスからキーワードが一致するファイルを抽出し、当該ファイルに紐づく文書を抽出する。
Next, the full-
次いで、キーワード登録部27は、データ記録部12に対し、全文検索部26により抽出された文書の属性情報に、検索条件抽出部25により抽出された検索条件であるキーワードを拡張キーワードとして記録する(ステップST808)。その後、シーケンスは終了する。
Next, the
このように、実施の形態1に係る文書管理装置では、キーワードを用いた文書検索が実施される度にその履歴を記録している。そして、文書管理装置は、キーワードの自動登録の際に、上記履歴のうちの抽出条件に合致する検索条件のみを抽出して全文検索を行い、全文検索により得られた検索条件を対応するファイルに紐づく文書の属性情報として拡張キーワードを自動登録している。これにより、属性情報の登録によるユーザ負担の軽減が可能であり、また、有効な拡張キーワードのみを登録可能であるため、属性情報のデータ量の増大を抑制可能である。 As described above, the document management apparatus according to the first embodiment records the history every time a document search using a keyword is performed. Then, when automatically registering the keyword, the document management device extracts only the search condition that matches the extraction condition in the history and performs a full-text search, and the search condition obtained by the full-text search is stored in a corresponding file. An extended keyword is automatically registered as attribute information of the associated document. As a result, it is possible to reduce the burden on the user by registering the attribute information, and it is possible to register only valid expansion keywords, and therefore it is possible to suppress an increase in the data amount of the attribute information.
また、文書管理装置は、キーワードの自動登録方法として、キーワードの上書きを行うことで、自動登録した拡張キーワードのデータ量の増大を抑制できる。
また、文書管理装置は、文書登録の際にユーザが指定したキーワードと、文書管理装置が自動登録した拡張キーワードとを分けて管理することで、実行条件の変更、又は、ファイルの変更又は削除といった操作と連動して拡張キーワードを自動的に削除可能となる。
また、ヒット件数を抽出条件とすることで検索結果の期待度が高い半面、結果の少ないキーワードに絞って、自動的に検出することができる。すなわち、ヒット件数の条件は、ある検索条件でヒットした属性情報の件数が多い場合(例えば1000件)に、文書管理装置が自動で当該検索条件であるキーワードを拡張キーワードとして登録しないようにするためのものである。このヒット件数は、よく検索されるのにあまりヒットしない検索条件を拡張キーワードとして登録することでユーザが探したいものを自動で検索可能とし、既に多くの検索結果がでているものについては除外することを目的としている。
Further, the document management apparatus can suppress an increase in the data amount of the automatically registered extended keyword by overwriting the keyword as an automatic keyword registration method.
Further, the document management apparatus separately manages the keyword specified by the user at the time of document registration and the extended keyword automatically registered by the document management apparatus, thereby changing the execution condition or changing or deleting the file. Extended keywords can be automatically deleted in conjunction with the operation.
In addition, by using the number of hits as an extraction condition, search results can be automatically detected by narrowing down to a keyword with a low result, while the degree of expectation of a search result is high. That is, the condition for the number of hits is to prevent the document management apparatus from automatically registering the keyword that is the search condition as an extended keyword when the number of attribute information hit under a certain search condition is large (for example, 1000). belongs to. The number of hits can be searched automatically by registering search conditions that are frequently searched but do not hit very much as extended keywords so that users can search automatically and exclude those that already have many search results. The purpose is that.
なお、検索履歴テーブルにおける検索条件の登録可能数を制限してもよい。これによっても、属性情報のデータ量の増大を抑制できる。 Note that the number of search conditions that can be registered in the search history table may be limited. This also can suppress an increase in the data amount of the attribute information.
以上のように、この実施の形態1によれば、1つ以上のキーワードである検索条件が指定された場合に、ファイルシステム11に記録されているファイルと紐づく文書の属性情報を記録しているデータ記録部12から、当該検索条件と一致するキーワードが含まれる属性情報を抽出する文書検索部22と、文書検索部22で用いられた検索条件を含む検索履歴情報を、データ記録部12に記録する履歴記録部23と、指定された日時に、データ記録部12から、抽出条件を満たす検索条件を抽出する検索条件抽出部25と、ファイルシステム11から、検索条件抽出部25により抽出された検索条件と一致するキーワードが含まれるファイルを抽出し、当該ファイルに紐づく文書を抽出する全文検索部26と、データ記録部12に対し、全文検索部26により抽出された文書の属性情報に、検索条件抽出部25により抽出された検索条件であるキーワードを拡張キーワードとして記録するキーワード登録部27とを備えたので、属性情報の登録によるユーザ負担の軽減が可能であり、且つ、属性情報のデータ量の増大を抑制可能である。
As described above, according to the first embodiment, when the search condition that is one or more keywords is designated, the attribute information of the document associated with the file recorded in the
最後に、図9を参照して、実施の形態1における処理部2のハードウェア構成例を説明する。
処理部2における文書登録部21、文書検索部22、履歴記録部23、抽出条件設定部24、検索条件抽出部25、全文検索部26及びキーワード登録部27の各機能は、処理回路51により実現される。処理回路51は、図9Aに示すように、専用のハードウェアであってもよいし、図9Bに示すように、メモリ53に記録されるプログラムを実行するCPU(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサ、又はDSP(Digital Signal Processor)ともいう)52であってもよい。
Finally, an example of the hardware configuration of the
The functions of the
処理回路51が専用のハードウェアである場合、処理回路51は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、又はこれらを組み合わせたものが該当する。文書登録部21、文書検索部22、履歴記録部23、抽出条件設定部24、検索条件抽出部25、全文検索部26及びキーワード登録部27の各部の機能それぞれを処理回路51で実現してもよいし、各部の機能をまとめて処理回路51で実現してもよい。
When the
処理回路51がCPU52の場合、文書登録部21、文書検索部22、履歴記録部23、抽出条件設定部24、検索条件抽出部25、全文検索部26及びキーワード登録部27の機能は、ソフトウェア、ファームウェア、又はソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェア及びファームウェアはプログラムとして記述され、メモリ53に記録される。処理回路51は、メモリ53に記録されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、処理部2は、処理回路51により実行されるときに、例えば図5〜8に示した各ステップが結果的に実行されることになるプログラムを記録するためのメモリ53を備える。また、これらのプログラムは、文書登録部21、文書検索部22、履歴記録部23、抽出条件設定部24、検索条件抽出部25、全文検索部26及びキーワード登録部27の手順及び方法をコンピュータに実行させるものであるともいえる。ここで、メモリ53としては、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(Electrically EPROM)等の不揮発性又は揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、又はDVD(Digital Versatile Disc)等が該当する。
When the
なお、文書登録部21、文書検索部22、履歴記録部23、抽出条件設定部24、検索条件抽出部25、全文検索部26及びキーワード登録部27の各機能について、一部を専用のハードウェアで実現し、一部をソフトウェア又はファームウェアで実現するようにしてもよい。例えば、文書登録部21については専用のハードウェアとしての処理回路51でその機能を実現し、文書検索部22、履歴記録部23、抽出条件設定部24、検索条件抽出部25、全文検索部26及びキーワード登録部27については処理回路51がメモリ53に記録されたプログラムを読み出して実行することによってその機能を実現することが可能である。
Note that some of the functions of the
このように、処理回路51は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせによって、上述の各機能を実現することができる。
As described above, the
なお、本願発明はその発明の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。 In the present invention, any constituent element of the embodiment can be modified or any constituent element of the embodiment can be omitted within the scope of the invention.
1 管理部、2 処理部、11 ファイルシステム、12 データ記録部、13 インデックス部、21 文書登録部、22 文書検索部、23 履歴記録部、24 抽出条件設定部、25 検索条件抽出部、26 全文検索部、27 キーワード登録部、28 管理処理部、51 処理回路、52 CPU、53 メモリ。 DESCRIPTION OF SYMBOLS 1 Management part, 2 Processing part, 11 File system, 12 Data recording part, 13 Index part, 21 Document registration part, 22 Document search part, 23 History recording part, 24 Extraction condition setting part, 25 Search condition extraction part, 26 Full text Search unit, 27 Keyword registration unit, 28 Management processing unit, 51 Processing circuit, 52 CPU, 53 Memory.
Claims (4)
前記文書検索部で用いられた検索条件を含む検索履歴情報を、前記データ記録部に記録する履歴記録部と、
指定された日時に、前記データ記録部から、抽出条件を満たす検索条件を抽出する検索条件抽出部と、
前記ファイルシステムから、前記検索条件抽出部により抽出された検索条件と一致するキーワードが含まれるファイルを抽出し、当該ファイルに紐づく文書を抽出する全文検索部と、
前記データ記録部に対し、前記全文検索部により抽出された文書の属性情報に、前記検索条件抽出部により抽出された検索条件であるキーワードを拡張キーワードとして記録するキーワード登録部と
を備えた文書管理装置。 When a search condition that is one or more keywords is specified, a keyword that matches the search condition is included from the data recording unit that records the attribute information of the document associated with the file recorded in the file system. A document search unit for extracting attribute information
A history recording unit that records search history information including search conditions used in the document search unit in the data recording unit;
A search condition extraction unit that extracts a search condition that satisfies the extraction condition from the data recording unit at a designated date and time;
A full-text search unit that extracts a file including a keyword that matches the search condition extracted by the search condition extraction unit from the file system, and extracts a document associated with the file;
A document management unit comprising: a keyword registration unit that records, as an extended keyword, a keyword that is a search condition extracted by the search condition extraction unit in the attribute information of the document extracted by the full-text search unit. apparatus.
ことを特徴とする請求項1記載の文書管理装置。 In response to a request from the outside, the search condition extraction unit was previously executed from the attribute information recorded in the data recording unit at the date and time when the execution condition included in the extraction condition indicates overwriting. 2. The document management apparatus according to claim 1, wherein, in automatic keyword registration, all extended keywords corresponding to search conditions that do not correspond to the number of search conditions extracted in descending order of priority are deleted. .
ことを特徴とする請求項1又は請求項2記載の文書管理装置。 The document management apparatus according to claim 1, wherein the extraction condition is set by a user.
履歴記録部は、前記文書検索部で用いられた検索条件を含む検索履歴情報を、前記データ記録部に記録し、
検索条件抽出部は、指定された日時に、前記データ記録部から、抽出条件を満たす検索条件を抽出し、
全文検索部は、前記ファイルシステムから、前記検索条件抽出部により抽出された検索条件と一致するキーワードが含まれるファイルを抽出し、当該ファイルに紐づく文書を抽出し、
キーワード登録部は、前記データ記録部に対し、前記全文検索部により抽出された文書の属性情報に、前記検索条件抽出部により抽出された検索条件であるキーワードを拡張キーワードとして記録する
ことを特徴とする文書管理方法。 When a search condition that is one or more keywords is specified, the document search unit receives the search condition from the data recording unit that records the attribute information of the document associated with the file recorded in the file system. Extract attribute information that contains matching keywords,
The history recording unit records search history information including the search conditions used in the document search unit in the data recording unit,
The search condition extraction unit extracts a search condition satisfying the extraction condition from the data recording unit at a specified date and time,
The full-text search unit extracts, from the file system, a file containing a keyword that matches the search condition extracted by the search condition extraction unit, extracts a document associated with the file,
The keyword registration unit records the keyword that is the search condition extracted by the search condition extraction unit as an extended keyword in the attribute information of the document extracted by the full-text search unit to the data recording unit. Document management method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018034979A JP6479232B1 (en) | 2018-02-28 | 2018-02-28 | Document management apparatus and document management method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018034979A JP6479232B1 (en) | 2018-02-28 | 2018-02-28 | Document management apparatus and document management method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6479232B1 true JP6479232B1 (en) | 2019-03-06 |
JP2019149117A JP2019149117A (en) | 2019-09-05 |
Family
ID=65655807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018034979A Active JP6479232B1 (en) | 2018-02-28 | 2018-02-28 | Document management apparatus and document management method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6479232B1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06214850A (en) * | 1993-01-14 | 1994-08-05 | Fuji Xerox Co Ltd | File retrieving device |
JPH09114839A (en) * | 1995-10-19 | 1997-05-02 | Fuji Xerox Co Ltd | Keyword controller |
JP2005309727A (en) * | 2004-04-21 | 2005-11-04 | Hitachi Ltd | File system |
JP2012083929A (en) * | 2010-10-12 | 2012-04-26 | Hitachi Solutions Ltd | File retrieval device and file retrieval program |
-
2018
- 2018-02-28 JP JP2018034979A patent/JP6479232B1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06214850A (en) * | 1993-01-14 | 1994-08-05 | Fuji Xerox Co Ltd | File retrieving device |
JPH09114839A (en) * | 1995-10-19 | 1997-05-02 | Fuji Xerox Co Ltd | Keyword controller |
JP2005309727A (en) * | 2004-04-21 | 2005-11-04 | Hitachi Ltd | File system |
JP2012083929A (en) * | 2010-10-12 | 2012-04-26 | Hitachi Solutions Ltd | File retrieval device and file retrieval program |
Also Published As
Publication number | Publication date |
---|---|
JP2019149117A (en) | 2019-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108319654B (en) | Computing system, cold and hot data separation method and device, and computer readable storage medium | |
JP5890308B2 (en) | Automatic discovery of contextually related task items | |
US7689574B2 (en) | Index and method for extending and querying index | |
US7908276B2 (en) | Filesystem having a filename cache | |
JP3554459B2 (en) | Text data registration search method | |
BRPI0714938A2 (en) | sorting functions using an incrementally updatable modified bayesian query query classifier | |
JP2005267600A5 (en) | ||
WO2020211236A1 (en) | Read-write conflict resolution method and apparatus employing b+ tree and storage medium | |
TW200907677A (en) | Data tree storage methods, systems and computer program products using page structure of flash memory | |
JP2003030025A (en) | Virtual file system for dynamically-generated web page | |
Tan et al. | Microsearch: When search engines meet small devices | |
WO2018133762A1 (en) | File merging method and apparatus | |
US10210165B2 (en) | File management for eDiscovery | |
US8037058B2 (en) | Reducing access time for data in file systems when seek requests are received ahead of access requests | |
JP2007287147A (en) | Fast file attribute search | |
US20140320498A1 (en) | Terminal device, information processing method, and computer program product | |
Garfinkel et al. | An automated solution to the multiuser carved data ascription problem | |
JP6479232B1 (en) | Document management apparatus and document management method | |
CN110704573B (en) | Catalog storage method, catalog storage device, computer equipment and storage medium | |
US20140280050A1 (en) | Term searching based on context | |
CN101826103A (en) | Method for reversely searching packet depended relationship in unix operating system | |
JP5879284B2 (en) | Information recording method, information recording apparatus, and program | |
JP2008234403A (en) | Data retrieval method, program, and device | |
JP2009037359A (en) | Data registration retrieval method, data registration retrieval program, and database system | |
JP7180128B2 (en) | Material management program, material management system and material management method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6479232 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |