JP4356640B2 - Document management device - Google Patents
Document management device Download PDFInfo
- Publication number
- JP4356640B2 JP4356640B2 JP2005101361A JP2005101361A JP4356640B2 JP 4356640 B2 JP4356640 B2 JP 4356640B2 JP 2005101361 A JP2005101361 A JP 2005101361A JP 2005101361 A JP2005101361 A JP 2005101361A JP 4356640 B2 JP4356640 B2 JP 4356640B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- document
- new
- registration candidate
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は文書管理装置に関し、特に、分類階層化された文書集合を管理する文書管理装置に関するものである。 The present invention relates to a document management apparatus, and more particularly, to a document management apparatus that manages a document set that is classified and hierarchized.
文書を階層化して分類する代表的な従来技術は特許文献1や特許文献2に記載されている。特許文献1の発明では、過去に生成した分類情報を参照する手段および再利用する手段を利用者に与える。分類情報として使われるのは、分類のラベル、例えば単語のブール式である分類の定義、分類された文書、である。分類構造化は基本的に利用者が行う。また、特許文献1の発明では、分類結果に基づいてカテゴリー構造情報が生成され、生成されたカテゴリー構造情報が保存され、その後のカテゴリー構造情報の生成作業時、保存されている過去に生成されたカテゴリー構造情報を参照したり修正したりしてカテゴリー構造化作業をおこなうことができるようにして、カテゴリー構造化作業を効率良く行うことができるようにしている。また、特許文献2の発明では、ベクトル空間法による文書分類装置を再帰的に呼び出すことで階層的な分類を実現している。分類は利用者の作業ではなく、自動化されている。
しかしながら、特許文献1の分類の助けとなる情報を提示して利用者が文書を階層分類化する方法では、分類の精度は高いが、分類作業に多くの労力を要するという問題点がある。また、分類精度を維持するためには、文書の属する全領域に熟知した限定された利用者によって階層分類化が行われなくてはならず、得られた階層分類が利用者全体の考える階層分類と乖離する可能性がある。また、特許文献1では、過去に生成されたカテゴリー構造情報を参照したり修正したりしてカテゴリー構造化作業を効率良く行うことはできるが、全利用者が分類階層に従って探索した探索経路の履歴に基づいて所定の分類階層への分類の追加を自動で行い文書登録を行うということはできなかった。また、特許文献2の階層分類化を完全自動化する方法では、分類作業の労力はかからないが、分類の精度が低くなるという問題点がある。
本発明の目的は、少ない労力で精度の高い文書の階層分類化を行う装置を提供することにある。ここで精度が高いとは、全利用者の平均した概念階層に最も近いという意味である。
However, in the method in which a user classifies documents by presenting information that helps classification in
An object of the present invention is to provide an apparatus for performing hierarchical classification of documents with little effort and high accuracy. Here, high accuracy means that it is closest to the average concept hierarchy of all users.
本発明の文書管理装置は、階層的に分類された文書群を管理する文書管理装置であって、分類階層と前記分類階層に対応づけられた文書群とを格納する文書格納手段と、利用者に前記分類階層に沿って対話的に文書を探索させるインタフェース手段と、前記利用者が前記インタフェース手段によって前記分類階層に沿って文書を探索した際に、前記利用者が到達した最終分類を履歴として格納する履歴格納手段と、前記利用者が前記探索によって意図した文書を見付けられない場合に、前記利用者が新規に登録を希望する文書を登録候補文書として前記履歴と対応づけて格納する登録候補文書格納手段と、前記登録候補文書のうち同一の最終分類下にあるものを前記履歴から判定し、それらのうち類似度の高い一群を新たな分類とする登録候補文書分類手段とを備えることを特徴とする。
また、前記登録候補文書分類手段は、前記登録候補文書を前記利用者が到達した最終分類毎に分類して新規分類を生成し、前記新規分類の数が予め定められた定数値を超える場合に限って、前記最終分類の下に前記新規分類を追加するようにすることができる。
また、前記登録候補文書分類手段は、前記登録候補文書を前記利用者が到達した最終分類毎に分類して新規分類を生成し、前記新規分類の数が予め定められた定数値を超えない場合に、前記新規分類を最も良く代表する前記登録候補文書を新規文書として追加するようにすることができる。
また、前記登録候補文書分類手段は、前記登録候補文書を前記利用者が到達した最終分類より上位の分類毎に分類して新規分類を生成し、前記新規分類の数が予め定められた定数値を超える場合に限って、前記上位分類の下に前記新規分類を追加するようにすることができる。
本発明の文書管理方法は、階層的に分類された文書群を管理する文書管理装置における文書管理方法であって、分類階層と前記分類階層に対応づけられた文書群とを格納する文書格納ステップと、利用者に前記分類階層に沿って対話的に文書を探索させるインタフェースステップと、前記利用者が前記インタフェースステップにおいて前記分類階層に沿って文書を探索した際に、前記利用者が到達した最終分類を履歴として格納する履歴格納ステップと、前記利用者が前記探索によって意図した文書を見付けられない場合に、前記利用者が新規に登録を希望する文書を登録候補文書として前記履歴と対応づけて格納する登録候補文書格納ステップと、前記登録候補文書のうち同一の最終分類下にあるものを前記履歴から判定し、それらのうち類似度の高い一群を新たな分類とする登録候補文書分類ステップとを備えることを特徴とする。
また、前記登録候補文書分類ステップにおいては、前記登録候補文書を前記利用者が到達した最終分類毎に分類して新規分類を生成し、前記新規分類の数が予め定められた定数値を超える場合に限って、前記最終分類の下に前記新規分類を追加するようにすることができる。
また、前記登録候補文書分類ステップにおいては、前記登録候補文書を前記利用者が到達した最終分類毎に分類して新規分類を生成し、前記新規分類の数が予め定められた定数値を超えない場合に、前記新規分類を最も良く代表する前記登録候補文書を新規文書として追加するようにすることができる。
また、前記登録候補文書分類ステップにおいては、前記登録候補文書を前記利用者が到達した最終分類より上位の分類毎に分類して新規分類を生成し、前記新規分類の数が予め定められた定数値を超える場合に限って、前記上位分類の下に前記新規分類を追加するようにすることができる。
本発明の文書管理プログラムは、階層的に分類された文書群を管理する文書管理装置を制御する文書管理プログラムであって、分類階層と前記分類階層に対応づけられた文書群とを格納する文書格納ステップと、利用者に前記分類階層に沿って対話的に文書を探索させるインタフェースステップと、前記利用者が前記インタフェースステップにおいて前記分類階層に沿って文書を探索した際に、前記利用者が到達した最終分類を履歴として格納する履歴格納ステップと、前記利用者が前記探索によって意図した文書を見付けられない場合に、前記利用者が新規に登録を希望する文書を登録候補文書として前記履歴と対応づけて格納する登録候補文書格納ステップと、前記登録候補文書のうち同一の最終分類下にあるものを前記履歴から判定し、それらのうち類似度の高い一群を新たな分類とする登録候補文書分類ステップとを前記文書管理装置に実行させることを特徴とする。
また、前記登録候補文書分類ステップにおいては、前記登録候補文書を前記利用者が到達した最終分類毎に分類して新規分類を生成し、前記新規分類の数が予め定められた定数値を超える場合に限って、前記最終分類の下に前記新規分類を追加するようにすることができる。
また、前記登録候補文書分類ステップにおいては、前記登録候補文書を前記利用者が到達した最終分類毎に分類して新規分類を生成し、前記新規分類の数が予め定められた定数値を超えない場合に、前記新規分類を最も良く代表する前記登録候補文書を新規文書として追加するようにすることができる。
また、前記登録候補文書分類ステップにおいては、前記登録候補文書を前記利用者が到達した最終分類より上位の分類毎に分類して新規分類を生成し、前記新規分類の数が予め定められた定数値を超える場合に限って、前記上位分類の下に前記新規分類を追加するようにすることができる。
The document management apparatus of the present invention is a document management apparatus for managing a hierarchically classified document group, a document storage means for storing a classification hierarchy and a document group associated with the classification hierarchy, and a user Interface means for interactively searching for a document along the classification hierarchy, and when the user searches for a document along the classification hierarchy by the interface means, the final classification reached by the user is used as a history. A history storage means for storing and a registration candidate for storing a document that the user wishes to newly register as a registration candidate document in association with the history when the user cannot find the document intended by the search registration climate to the document storage means, and the ones that are under the same final classification of the registered candidate document to determine from the history, the new classification of high similarity group of them Characterized in that it comprises a document classification means.
Further, the registration candidate document classification means generates a new classification by classifying the registration candidate document for each final classification reached by the user, and the number of the new classification exceeds a predetermined constant value. For example, the new classification can be added under the final classification.
Further, the registration candidate document classification means generates the new classification by classifying the registration candidate document for each final classification reached by the user, and the number of the new classification does not exceed a predetermined constant value In addition, the registration candidate document that best represents the new classification can be added as a new document.
Further, the registration candidate document classification unit generates a new classification by classifying the registration candidate document for each classification higher than the final classification reached by the user, and a constant value in which the number of the new classification is determined in advance. The new classification can be added below the superordinate class only when the number exceeds .
The document management method of the present invention is a document management method in a document management apparatus that manages a hierarchically classified document group, and stores a classification hierarchy and a document group associated with the classification hierarchy. And an interface step for allowing a user to search for a document interactively along the classification hierarchy , and a final result reached by the user when the user searches for a document along the classification hierarchy in the interface step. A history storing step for storing the classification as a history, and when the user cannot find a document intended by the search, a document that the user desires to newly register is associated with the history as a registration candidate document. a registration candidate document storage step of storing, what is under the same final classification of the registered candidate document to determine from the history, among them Characterized in that it comprises a registration candidate document classification step of the high group of similarity score as a new classification.
In the registration candidate document classification step, the registration candidate document is classified for each final classification reached by the user to generate a new classification, and the number of the new classifications exceeds a predetermined constant value. Only the new classification can be added below the final classification.
Further, in the registration candidate document classification step, the registration candidate document is classified for each final classification reached by the user to generate a new classification, and the number of the new classifications does not exceed a predetermined constant value. In this case, the registration candidate document that best represents the new classification can be added as a new document.
Further, in the registration candidate document classification step, the registration candidate document is classified for each classification higher than the final classification reached by the user to generate a new classification, and the number of the new classifications is determined in advance. Only when the numerical value is exceeded, the new classification can be added under the superordinate classification.
The document management program of the present invention is a document management program for controlling a document management apparatus that manages a hierarchically classified document group, and stores a classification hierarchy and a document group associated with the classification hierarchy. A storage step; an interface step for allowing a user to search for a document interactively along the classification hierarchy; and the user reaching when the user searches for a document along the classification hierarchy in the interface step. A history storage step for storing the final classification as a history, and when the user cannot find a document intended by the search, a document that the user desires to newly register corresponds to the history as a registration candidate document. a registration candidate document storage step of storing in association, those under same final classification of the registered candidate document to determine from the history Among them a registration candidate document classification step of the high similarity group and a new classification, characterized in that to be executed by the document management apparatus.
In the registration candidate document classification step, the registration candidate document is classified for each final classification reached by the user to generate a new classification, and the number of the new classifications exceeds a predetermined constant value. Only the new classification can be added below the final classification.
Further, in the registration candidate document classification step, the registration candidate document is classified for each final classification reached by the user to generate a new classification, and the number of the new classifications does not exceed a predetermined constant value. In this case, the registration candidate document that best represents the new classification can be added as a new document.
Further, in the registration candidate document classification step, the registration candidate document is classified for each classification higher than the final classification reached by the user to generate a new classification, and the number of the new classifications is determined in advance. Only when the numerical value is exceeded, the new classification can be added under the superordinate classification.
本発明の文書管理装置によれば、利用者が分類階層に従って行った探索によって意図した文書を見付けられない場合に利用者が新規に登録を希望する登録候補文書を格納するようにしたので、次のような効果が得られる。第1の効果は、階層分類の労力を軽減することができることである。必要な労力は、各利用者が自分の欲しい文書を分類階層に従って探索し、見つからなかったときに文書登録することだけである。分類階層への新規の分類の追加は自動的に行われる。第2の効果は、階層分類の精度を維持することができることである。新規の分類が既存の分類階層のどの位置にあたるかが関係する全利用者によって判断されているからである。 According to the document management apparatus of the present invention, when the user cannot find the intended document by the search performed according to the classification hierarchy, the registration candidate document that the user desires to newly register is stored. The following effects can be obtained. The first effect is that the labor of hierarchical classification can be reduced. All that is required is that each user searches for the desired document according to the classification hierarchy and registers the document when it is not found. Adding new classifications to the classification hierarchy is done automatically. The second effect is that the accuracy of hierarchical classification can be maintained. This is because it is determined by all users who are related to the position of the new classification hierarchy in the existing classification hierarchy.
本発明は、分類階層化された文書集合を管理する分野に関するものであり、例えば、FAQ(Frequently Asked Questions)を分類階層に従って探索し、所望の質問および回答を発見することができない場合に、新たな質問および回答を追加するという分野も含まれる The present invention relates to the field of managing a document set that is classified into hierarchies. For example, when a frequently asked question (FAQ) is searched according to a classification hierarchy and a desired question and answer cannot be found, the present invention is newly added. Including adding additional questions and answers
次に、発明を実施するための最良の形態について図面を参照して詳細に説明する。 Next, the best mode for carrying out the invention will be described in detail with reference to the drawings.
図1は本発明の実施の形態の動作を説明する図である。文書格納部101は、分類階層と文書を格納する。インタフェース部102は、分類階層に沿って利用者に対話的に文書を探索させ、探索の履歴を出力する。インタフェース部102は、適切な文書が見つからなかった場合は、利用者に登録候補文書を入力させ、同文書を出力する。履歴格納部103は上記インタフェース部が出力した利用者の探索履歴を格納する。登録候補文書格納部104はインタフェース部が出力した登録候補文書を格納する。登録候補文書分類部105は登録候補文書を分類し、得られた分類を既存の分類階層位置に追加する。
FIG. 1 is a diagram for explaining the operation of the embodiment of the present invention. The
図1に示した実施の形態の各構成要素について説明する前に、図9を用いて分類階層および文書の概念を説明する。分類の第一階層は分類1と分類2の2分類である。分類1の下位分類は分類11、分類12、分類13の3分類である。分類2の下位分類は分類21、分類22、分類12の3分類である。分類13の下位分類は分類131、分類132の2分類である。分類11には文書11a、文書11b、文書11c3つの文書が対応付けられている。
Before describing each component of the embodiment shown in FIG. 1, the concept of the classification hierarchy and the document will be described with reference to FIG. The first level of classification includes two classifications,
例えば、PC用電子メールソフトの管理方法を知りたい利用者を考える。利用者は分類1「メールについて」を選択し、次に分類11「PCメール」を選択したが、自分の意図した内容の文書が見つからないので、結局別手段で課題を解決し、その内容を記述した文書を次回の利用者のために登録することを希望する。この文書を登録候補文書と呼んで登録候補文書格納部104が格納する。その際、履歴格納部103には「分類1→分類11→登録候補文書」という履歴情報が格納される。このようにして本文書管理装置には登録候補文書が次々に格納されていく。
For example, consider a user who wants to know how to manage PC email software. The user selects
本発明の第1の実施の形態の特徴は、これらの蓄積された登録候補文書を分類し、分類11の下に新たに分類を作成することである。例えば図9に示すように、「メールソフトの管理」に関する登録候補文書がまとまった数存在し、他の新規文書との独立性が高い場合、「メールソフトの管理」は分類111として分類階層に追加登録される。従来技術との相違点は、文書の内容だけでなく、履歴情報を分類の作成に用いているところである。
A feature of the first embodiment of the present invention is that these accumulated registration candidate documents are classified, and a new classification is created under the
図10に第2の実施の形態の概念図を示す。図10においては、図9と異なり、分類11の下に新規分類を追加するのではなく、新規の文書を追加している。分類として大きな塊にならないものは、このように文書として追加するのが適切である。
FIG. 10 shows a conceptual diagram of the second embodiment. In FIG. 10, unlike FIG. 9, a new document is added instead of adding a new category under the
図11に第3の実施の形態の概念図を示す。図11においては、図9と異なり、分類11の下に新規分類を追加するのではなく、分類11と同レベルに新規の分類を追加している。分類の抽象度によっては、このように既存の分類と同レベルに新規分類を追加するのが適切である。
FIG. 11 shows a conceptual diagram of the third embodiment. In FIG. 11, unlike FIG. 9, a new classification is added at the same level as the
続いて、図1の各構成要素の詳細な説明を行う。図2は文書格納部101の構成例を示す図である。201は分類階層である。分類階層201は、分類ID203、上位分類ID204、分類名205とからなる表である。分類ID203は分類を一意に特定する数値である。上位分類ID204は分類の上位に位置する分類IDを示す。上記分類IDは複数もつことができる。例えば図中、分類12は分類1と分類2が上位分類であることを示している。分類名205はその分類の名称であり、利用者に表示する際に使われる。
Subsequently, each component in FIG. 1 will be described in detail. FIG. 2 is a diagram illustrating a configuration example of the
202は文書である。文書202は、文書ID206、分類ID207、文書名208、文書内容209とからなる表である。文書ID206は文書を一意に特定する数値である。分類ID207はその文書の属する分類IDである。文書名208はその文書の名称であり、利用者に表示する際に使われる。文書内容209はその文書の実体である文字列であり、利用者に表示する際に使われる。
図3はインタフェース部102の構成例を示す図である。301は画面遷移の例を示している。画面304には分類1とその下位分類である分類11、分類12、分類13が表示されている。画面304においてマウスなどのポインティングデバイスを用いて分類11である「PCメール」が選択されると、分類11に属する文書の文書名が画面305のように表示される。画面305においてマウスなどのポインティングデバイスを用いて文書11aである「メールソフトの種類」が選択されると、文書11aの文書名と文書内容が画面306のように表示される。
FIG. 3 is a diagram illustrating a configuration example of the
画面制御部302はこのような画面遷移を制御するとともに、履歴取得部303に利用者の選択した分類や文書のIDを送信する。利用者の求める文書がなかった場合は、画面305の新規ボタン305aを利用者がマウスなどのポインティングデバイスを用いて選択することにより、登録候補文書入力のための画面に遷移し、利用者は同画面から登録候補文書を登録することができる。上記登録候補文書は画面制御部302によって、登録候補文書取得部307に送信される
The
図4は履歴格納部103の構成例を示す図である。履歴格納部103は履歴ID402、最終分類403、履歴404、到達時刻405からなる表である。履歴ID402は履歴を一意に特定する数値である。最終分類403は利用者が最終的に到達した分類の分類IDである。履歴404は最終分類403にいたる分類の経路である。例えば表103の3行目と5行目のように、最終分類が同一でも、経路は異なることがある。到達時刻405は、利用者が最終分類403に到達した時刻である。
FIG. 4 is a diagram illustrating a configuration example of the
図5は登録候補文書格納部104の構成例を示す図である。登録候補文書格納部104は登録候補文書ID502、履歴ID503、文書内容504からなる表である。登録候補文書ID502は登録候補文書を一意に特定する数値である。履歴ID503は、その登録候補文書が新規に記述されるにあたり利用者がたどった経路の履歴IDである。文書内容503はその登録候補文書の実体である文字列である。
FIG. 5 is a diagram illustrating a configuration example of the registration candidate
図6は登録文書候補分類部105の処理フローを示す図である。601において、登録候補文書格納部104から登録候補文書を獲得する。602において、601で獲得した文書を最終分類403毎に分類する。登録候補文書には履歴ID503が付与されているので、履歴格納部103の履歴ID402と照合することにより、最終分類403が決まる。
FIG. 6 is a diagram illustrating a processing flow of the registered document
以降、最終分類403毎に、新規の分類を追加すべきかどうかを判定する処理にはいる。ステップ603はその処理が全ての最終分類について行われたかどうかを判断するステップである。ステップ604において、登録候補文書を分類する。分類手法には既知の手法を使えば良い。例えば文書中に出現する単語の頻度をもとにベクトルを作り、ベクトルのコサイン測度で文書距離を計算し、あらかじめ決められた距離以下の文書をクラスターとする手法を使えば良い。
Thereafter, processing for determining whether a new category should be added for each
ステップ605において、ステップ604で分類された文書集合の性質を吟味し、新規の分類として採用するか否かを判定する。判定の基準としては例えば、クラスター数や、1クラスターに属する文書の最小数が考えられる。これらの判断基準はあらかじめ装置全体で定義しておく。例えばクラスター数が少ない場合は分類数が少ないことを意味するから、わざわざ分類を新規に作る必要はない。
In
また、1クラスターに属する文書の数が少ない場合、それを分類として追加していくと、分類の数が必要以上に増大する危険性がある。ステップ605において、新規分類として追加すべきと判定された場合、ステップ606で新規分類と文書が文書格納部101の分類階層201および文書202に追加される。追加後、登録候補文書格納部104から該当文書は削除される。
Further, when the number of documents belonging to one cluster is small, there is a risk that the number of classifications will increase more than necessary if they are added as classifications. If it is determined in
図7は、第2の実施の形態における登録文書候補分類部105の処理フローである。第1の実施の形態の図6とはステップ705とステップ706が異なる。ステップ705では、最終分類604の下に新たな分類を作るのではなく、新たに文書を登録すべきかどうかが判定される。例えば第1の実施の形態における分類追加を示す概念図である図9において、分類111、分類112、分類113は第1の実施の形態の装置によって追加された新しい分類を示している。
FIG. 7 is a processing flow of the registered document
それに対して、第2の実施の形態における文書追加を示す概念図である図10においては、分類111、分類112、分類113の代表文書がそれぞれ文書11d、文書11e、文書11fとして登録されている。図6におけるステップ605で、新規に分類を追加するという基準に達しないものについても、クラスター数や一クラスターに属する文書数に関する第二の基準をあらかじめ定めておき、同基準を満たすものは図7におけるステップ705で、代表文書として登録する。
On the other hand, in FIG. 10, which is a conceptual diagram showing document addition in the second embodiment, representative documents of classification 111,
なお、代表文書の選択には既知の技術を使えば良い。例えばクラスターの重心に最も近い文書を選択する方法が考えられる。さらに近傍の文書の内容も考慮し、人手によって新たに文書を作成できる編集手段を提供することも考えられる。 A known technique may be used to select the representative document. For example, a method of selecting a document closest to the center of gravity of the cluster can be considered. Furthermore, considering the contents of nearby documents, it may be possible to provide an editing means that can create a new document manually.
図8は、第3の実施の形態における登録文書候補分類部105の処理フローである。図11は本実施の形態によって新規に分類が追加された様子を示す概念図である。分類1の下に分類14と分類15が追加されている。この2つの分類は、最終分類である分類11、分類12、分類13の登録候補文書の和から生成されたものである。言い替えれば、新規分類が、分類11、分類12、分類13の下に追加されるのではなく、並行に追加される様子を示している。
FIG. 8 is a processing flow of the registered document
図8は、第1の実施の形態の図6とはステップ802、ステップ803、およびステップ806が異なる。また、新たにステップ809が追加されている。ステップ802では、ステップ602のように最終分類毎に登録候補文書を分類するのではなく、任意階層の分類で登録候補文書が分類されている。例えば図11において、分類11や分類12の下にある登録候補文書は、分類11や分類12の上位である分類1の登録候補文書としても扱われる。ステップ809は、新規分類を追加するにあたり、深い階層の分類から順に判定を行うため、深さ順に分類をソートする処理である。
FIG. 8 differs from FIG. 6 of the first embodiment in
例えば、図11において、分類1よりは分類11や分類12、分類13が、分類13よりは分類131や分類132が優先的に、その下に新規分類が追加可能かどうかが判定される。ステップ803では、ステップ603のように全ての最終分類について処理が完了したのかではなく、全ての任意分類について処理が完了したかどうかを判定する。ステップ806は新規分類を最終分類下に追加するステップ606と異なり、ステップ803で判定された分類の下に追加される。
For example, in FIG. 11, it is determined whether
なお、上記実施の形態の構成及び動作は例であって、本発明の趣旨を逸脱しない範囲で適宜変更することができることは言うまでもない。 It should be noted that the configuration and operation of the above-described embodiment are examples, and it goes without saying that they can be changed as appropriate without departing from the spirit of the present invention.
本発明は、多量の文書を効率よく検索する情報検索装置や、情報検索装置をコンピュータに実現するためのプログラムといった用途に適用することができる。 The present invention can be applied to applications such as an information retrieval apparatus that efficiently retrieves a large amount of documents and a program for realizing the information retrieval apparatus in a computer.
101 文書格納部
102 インタフェース部
103 履歴格納部
104 登録文書候補格納部
105 登録文書候補分類部
201 分類階層
202 文書
203 文書ID
204 上位分類ID
205 分類名
206 文書ID
207 分類ID
208 文書名
209 文書内容
301 インタフェースの画面遷移
302 画面制御部
303 履歴取得部
304 分類とその下位分類を示す画面
305 分類と対応文書を示す画面
306 文書内容を示す画面
307 新規文書取得部
402 履歴ID
403 最終分類
404 履歴
405 到達時刻
502 登録候補文書ID
503 履歴ID
504 文書内容
204 Upper classification ID
205
207 Classification ID
208
403
503 History ID
504 Document Contents
Claims (12)
分類階層と前記分類階層に対応づけられた文書群とを格納する文書格納手段と、
利用者に前記分類階層に沿って対話的に文書を探索させるインタフェース手段と、
前記利用者が前記インタフェース手段によって前記分類階層に沿って文書を探索した際に、前記利用者が到達した最終分類を履歴として格納する履歴格納手段と、
前記利用者が前記探索によって意図した文書を見付けられない場合に、前記利用者が新規に登録を希望する文書を登録候補文書として前記履歴と対応づけて格納する登録候補文書格納手段と、
前記登録候補文書のうち同一の最終分類下にあるものを前記履歴から判定し、それらのうち類似度の高い一群を新たな分類とする登録候補文書分類手段と
を備えることを特徴とする文書管理装置。 A document management apparatus for managing a hierarchically classified document group,
Document storage means for storing a classification hierarchy and a document group associated with the classification hierarchy;
Interface means for allowing a user to interactively search for a document along the classification hierarchy;
When the user searches for a document along the classification hierarchy by the interface means, history storage means for storing the final classification reached by the user as history,
A registration candidate document storage unit that stores a document that the user desires to newly register as a registration candidate document in association with the history when the user cannot find the document that the user intended by the search;
Document management comprising: a registration candidate document classifying unit that determines, from the history, documents under the same final classification among the registration candidate documents , and sets a group having a high similarity among them as a new classification apparatus.
分類階層と前記分類階層に対応づけられた文書群とを格納する文書格納ステップと、
利用者に前記分類階層に沿って対話的に文書を探索させるインタフェースステップと、
前記利用者が前記インタフェースステップにおいて前記分類階層に沿って文書を探索した際に、前記利用者が到達した最終分類を履歴として格納する履歴格納ステップと、
前記利用者が前記探索によって意図した文書を見付けられない場合に、前記利用者が新規に登録を希望する文書を登録候補文書として前記履歴と対応づけて格納する登録候補文書格納ステップと、
前記登録候補文書のうち同一の最終分類下にあるものを前記履歴から判定し、それらのうち類似度の高い一群を新たな分類とする登録候補文書分類ステップと
を備えることを特徴とする文書管理方法。 A document management method in a document management apparatus for managing a hierarchically classified document group,
A document storage step for storing a classification hierarchy and a document group associated with the classification hierarchy;
An interface step for allowing a user to interactively search for a document along the classification hierarchy;
When the user searches for a document along the classification hierarchy in the interface step, a history storage step for storing the final classification reached by the user as a history;
A registration candidate document storage step of storing a document that the user desires to newly register in association with the history as a registration candidate document when the user cannot find the document intended by the search;
Document registration comprising: a registration candidate document classification step for determining, from the history, documents under the same final classification among the registration candidate documents , and setting a group having a high similarity among them as a new classification. Method.
分類階層と前記分類階層に対応づけられた文書群とを格納する文書格納ステップと、
利用者に前記分類階層に沿って対話的に文書を探索させるインタフェースステップと、
前記利用者が前記インタフェースステップにおいて前記分類階層に沿って文書を探索した際に、前記利用者が到達した最終分類を履歴として格納する履歴格納ステップと、
前記利用者が前記探索によって意図した文書を見付けられない場合に、前記利用者が新規に登録を希望する文書を登録候補文書として前記履歴と対応づけて格納する登録候補文書格納ステップと、
前記登録候補文書のうち同一の最終分類下にあるものを前記履歴から判定し、それらのうち類似度の高い一群を新たな分類とする登録候補文書分類ステップと
を前記文書管理装置に実行させることを特徴とする文書管理プログラム。 A document management program for controlling a document management apparatus that manages a hierarchically classified document group,
A document storage step for storing a classification hierarchy and a document group associated with the classification hierarchy;
An interface step for allowing a user to interactively search for a document along the classification hierarchy;
When the user searches for a document along the classification hierarchy in the interface step, a history storage step for storing the final classification reached by the user as a history;
A registration candidate document storage step of storing a document that the user desires to newly register in association with the history as a registration candidate document when the user cannot find the document intended by the search;
Determining from the history those documents that are under the same final classification among the registration candidate documents, and causing the document management apparatus to execute a registration candidate document classification step in which a group having a high degree of similarity is a new classification. Document management program characterized by
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005101361A JP4356640B2 (en) | 2005-03-31 | 2005-03-31 | Document management device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005101361A JP4356640B2 (en) | 2005-03-31 | 2005-03-31 | Document management device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006285390A JP2006285390A (en) | 2006-10-19 |
JP4356640B2 true JP4356640B2 (en) | 2009-11-04 |
Family
ID=37407286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005101361A Expired - Fee Related JP4356640B2 (en) | 2005-03-31 | 2005-03-31 | Document management device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4356640B2 (en) |
-
2005
- 2005-03-31 JP JP2005101361A patent/JP4356640B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006285390A (en) | 2006-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10318556B2 (en) | Computer readable electronic records automated classification system | |
US7231375B2 (en) | Computer aided query to task mapping | |
CN101923557B (en) | Data analysis system and method | |
JP4153883B2 (en) | Hierarchical database device and product selection method and program in hierarchical database device | |
JP4467583B2 (en) | Design support program, design support method, and design support apparatus | |
US20060004528A1 (en) | Apparatus and method for extracting similar source code | |
JP2005115514A (en) | Database search system, its search method, and program | |
US20210272029A1 (en) | Context aware recommendation of analytic components | |
JP2007052744A (en) | Classification rule creation supporting method | |
US7239985B1 (en) | Methods, systems, and data structures for modeling information quality and maturity | |
CN101710274A (en) | Method and system for generating help information of application software | |
JP2011034457A (en) | Data mining system, data mining method and data mining program | |
JP4839087B2 (en) | Workflow management system | |
CN113033990A (en) | Intelligent designer matching method | |
JP4287464B2 (en) | System infrastructure configuration development support system and support method | |
JP4356640B2 (en) | Document management device | |
JP2008129940A (en) | Business flow management program, business flow managing device and business flow managing method | |
CN114450643A (en) | Method for generating self-describing data module | |
EP4002151A1 (en) | Data tagging and synchronisation system | |
RU2602783C2 (en) | Managing versions of cases | |
JPH10162011A (en) | Information retrieval method, information retrieval system, information retrieval terminal equipment, and information retrieval device | |
JP2019101829A (en) | Software component management system, computor, and method | |
JP2003242323A (en) | Conference room system and method for creating the same | |
JP2010108173A (en) | Document processor | |
JP2004145555A (en) | Data base registration system and data base registration method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090407 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090714 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090727 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120814 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |