JP2006039810A - Device for supporting classification - Google Patents

Device for supporting classification Download PDF

Info

Publication number
JP2006039810A
JP2006039810A JP2004216981A JP2004216981A JP2006039810A JP 2006039810 A JP2006039810 A JP 2006039810A JP 2004216981 A JP2004216981 A JP 2004216981A JP 2004216981 A JP2004216981 A JP 2004216981A JP 2006039810 A JP2006039810 A JP 2006039810A
Authority
JP
Japan
Prior art keywords
document
classification
access
directory
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004216981A
Other languages
Japanese (ja)
Inventor
Katsuhide Tanaka
克英 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004216981A priority Critical patent/JP2006039810A/en
Publication of JP2006039810A publication Critical patent/JP2006039810A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a classification supporting device for supporting the design of a classification system and the classification of documents by presenting evaluation concerning the classification. <P>SOLUTION: The classification supporting device is accessibly connected to a holding means which holds the documents in connection with one of the classifications. The device records the access history of a user to the documents related to one of the classifications, calculates the evaluation value of each classification, based on the recorded access history, and presents information concerning the generated evaluation value. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、ディレクトリなど、ドキュメントの分類体系の設計等を支援する分類支援装置に関する。   The present invention relates to a classification support apparatus that supports design of a document classification system such as a directory.

近年では、多くのドキュメントが電子的に管理されている。例えば企業では、ドキュメントを文書管理ソフトウエアを用いて管理することが広く行われている。こうした文書管理ソフトウエアでは、利用者が、大量のドキュメントから所望のドキュメントを容易に探索できるよう、ドキュメントを分類できるようになっているのが一般的である。具体的に、このようなドキュメントの分類管理を実現するため、階層ディレクトリ構造を備えたファイルシステムを利用することが多い。   In recent years, many documents are managed electronically. For example, in companies, it is widely performed to manage documents using document management software. Such document management software generally allows a user to classify documents so that a desired document can be easily searched from a large number of documents. Specifically, in order to realize such document classification management, a file system having a hierarchical directory structure is often used.

ここで各分類を表すディレクトリには、例えば「総務書類」といったように、分類の内容を表す分類ラベル(ディレクトリ名)が設定される。また、一部の分類には、ドキュメントだけでなく、さらに下位の分類(ディレクトリ)が関連づけられている場合もある。例えば「総務書類」の分類には、さらに下位の分類として「勤怠関係」や「人事関係」といった分類がさらに関連づけられていてもよい。   Here, a classification label (directory name) representing the contents of the classification, such as “general affairs document”, is set in the directory representing each classification. Some classifications may be associated with not only documents but also lower classifications (directories). For example, classifications such as “time attendance” and “personnel relations” may be further associated with the classification of “general affairs documents” as lower classifications.

なお、ウエブサイトがどのようなディレクトリ構造となっているかの一覧を生成するシステムの例が、非特許文献1に開示されている。
“全自動WEB診断システムWEB-Checks”、[online]、 [平成16年7月13日検索]、インターネット<URL:http://www.syntax.co.jp/webchecks/>
Note that Non-Patent Document 1 discloses an example of a system that generates a list of what directory structure a website has.
“Full-automatic web diagnostic system WEB-Checks”, [online], [searched July 13, 2004], Internet <URL: http://www.syntax.co.jp/webchecks/>

しかしながら、上記従来の文書管理ソフトウエア等における分類体系の設計やドキュメントの分類は、管理者などに任せられているのが一般的である。この場合に、当該管理者による分類が利用者にとって利用しやすいものとなっているか否かについての指標は提示されていない。また、非特許文献1に開示のもののように、ディレクトリ構造の一覧を生成するシステムはあるが、当該構造が利用者にとって利用しやすいかについての情報は得られない。このため、管理者によって定められた分類が必ずしも利用者にとって使いよいものとなっているとは限らない。   However, the design of the classification system and the classification of documents in the conventional document management software and the like are generally left to an administrator or the like. In this case, no index is presented as to whether or not the classification by the administrator is easy for the user to use. Further, although there is a system that generates a list of directory structures as disclosed in Non-Patent Document 1, information on whether or not the structure is easy to use for a user cannot be obtained. For this reason, the classification determined by the administrator is not necessarily usable for the user.

本発明は上記実情に鑑みて為されたもので、分類に関する評価を提示し、分類体系の設計やドキュメントの分類を支援できる分類支援装置を提供することを、その目的の一つとする。   The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a classification support apparatus that presents an evaluation related to classification and can support design of a classification system and classification of documents.

上記従来例の問題点を解決するための本発明は、分類支援プログラムにおいて、ドキュメントを、複数の分類のいずれかに関連づけて保持する保持手段に対してアクセス可能に接続されるコンピュータに、前記分類のいずれかに関連づけられているドキュメントへの利用者のアクセス履歴を記録する手順と、前記アクセス履歴に基づいて、各分類の評価値を演算する評価演算手順と、当該生成した評価値に関する情報を提示する手順と、を実行させることを特徴としている。   The present invention for solving the problems of the conventional example described above is characterized in that in the classification support program, a computer connected to a holding means for holding a document in association with one of a plurality of classifications is connected to the classification. A procedure for recording a user's access history to a document associated with any of the above, an evaluation calculation procedure for calculating an evaluation value for each classification based on the access history, and information on the generated evaluation value And a procedure to present is executed.

ここで前記評価演算手順においては、注目分類に関連づけられているドキュメントの一覧を参照した旨の履歴に続いて、当該注目分類とは異なる他の分類へのアクセスの履歴が記録されているときに、当該注目分類の評価値を低減させることとしてもよい。また、この評価演算手順においては、注目分類に関連づけられているドキュメントの一覧を参照した旨の履歴に続いて、当該注目分類に関連づけられているドキュメントへのアクセスの履歴が記録されているときに、当該注目分類の評価値を上昇させることとしてもよい。さらに前記評価演算手順において、ドキュメントへの利用者のアクセスの履歴が記録されているときに、当該記録の前に当該ドキュメントが関連づけられている分類へのアクセスの履歴が記録されていない場合には、少なくとも当該分類の評価値を低減させることとしてもよい。   Here, in the evaluation calculation procedure, when a history of referring to a list of documents associated with the target category is recorded, and a history of access to another category different from the target category is recorded. The evaluation value of the attention classification may be reduced. Further, in this evaluation calculation procedure, when the history of referring to the list of documents associated with the attention classification is recorded, and the history of access to the document associated with the attention classification is recorded. The evaluation value of the attention classification may be increased. Further, in the evaluation calculation procedure, when a history of user access to a document is recorded, if a history of access to a classification associated with the document is not recorded before the recording, At least the evaluation value of the classification may be reduced.

また本実施の一態様に係る分類支援プログラムは、ドキュメントを、複数の分類のいずれかに関連づけて、分類して保持する保持手段に対してアクセス可能に接続されるコンピュータに、前記分類のいずれかに関連づけられているドキュメントへの利用者のアクセス履歴を記録する手順と、前記アクセス履歴に基づいて、各ドキュメントの分類に係る評価値を演算する評価演算手順と、当該生成した評価値に関する情報を提示する手順と、を実行させることを特徴としている。   In addition, the classification support program according to one aspect of the present invention provides any one of the above classifications to a computer that is connected to a holding unit that classifies and holds a document in association with any of a plurality of classifications. A procedure for recording a user's access history to a document associated with the document, an evaluation calculation procedure for calculating an evaluation value related to the classification of each document based on the access history, and information on the generated evaluation value And a procedure to present is executed.

さらに、上記従来例の問題点を解決するための本発明は、ドキュメントを、複数の分類のいずれかに関連づけて保持する保持手段に対してアクセス可能に接続されるコンピュータを用い、前記分類のいずれかに関連づけられているドキュメントへの利用者のアクセス履歴を記録する工程と、前記アクセス履歴に基づいて、各分類の評価値を演算する評価演算工程と、当該生成した評価値に関する情報を提示する工程と、を実行させることを特徴としている。   Furthermore, the present invention for solving the problems of the above conventional example uses a computer connected to a holding means for holding a document in association with one of a plurality of classifications. A step of recording a user's access history to a document associated with the document, an evaluation operation step of calculating an evaluation value of each classification based on the access history, and information relating to the generated evaluation value The process is performed.

さらに、本発明の一態様に係る分類支援装置は、ドキュメントを、複数の分類のいずれかに関連づけて保持する保持手段に対してアクセス可能に接続される分類支援装置であって、前記分類のいずれかに関連づけられているドキュメントへの利用者のアクセス履歴を記録する手段と、前記アクセス履歴に基づいて、各分類の評価値を演算する手段と、当該生成した評価値に関する情報を提示する手段と、を含むことを特徴としている。   Furthermore, a classification support apparatus according to an aspect of the present invention is a classification support apparatus that is connected so as to be accessible to a holding unit that holds a document in association with one of a plurality of classifications. Means for recording a user's access history to a document associated with the device, means for calculating an evaluation value of each classification based on the access history, and means for presenting information relating to the generated evaluation value It is characterized by including.

本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る分類支援装置は、図1に示すように、制御部11と、記憶部12と、ストレージ部13と、操作部14と、表示部15と、通信部16とを含んで構成され、ネットワークを介して利用者側のクライアント装置Cに接続されている。   Embodiments of the present invention will be described with reference to the drawings. As shown in FIG. 1, the classification support apparatus according to the embodiment of the present invention includes a control unit 11, a storage unit 12, a storage unit 13, an operation unit 14, a display unit 15, and a communication unit 16. And is connected to a client device C on the user side via a network.

ここで制御部11は、CPUなどを用いて実現でき、記憶部12に格納されているプログラムに従って動作している。この制御部11の処理の具体的な内容については、後に詳しく述べる。記憶部12は、RAM(Random Access Memory)や、ROM(Read Only Memory)等のメモリ素子、並びにハードディスク等によって実現できる。この記憶部12は、制御部11によって実行されるプログラムが保持されている。また、この記憶部12は、制御部11の処理の過程で利用される種々のデータを保持するワークメモリとしても動作する。   Here, the control unit 11 can be realized by using a CPU or the like, and operates according to a program stored in the storage unit 12. Specific contents of the processing of the control unit 11 will be described in detail later. The storage unit 12 can be realized by a memory element such as a random access memory (RAM) or a read only memory (ROM), a hard disk, or the like. The storage unit 12 holds a program executed by the control unit 11. The storage unit 12 also operates as a work memory that holds various data used in the process of the control unit 11.

ストレージ部13は、ドキュメントの実体データを保持している。このストレージ部13が本発明の保持手段に相当する。本実施の形態ではストレージ部13は、ドキュメントを階層ディレクトリ構造を用いて分類して格納している。   The storage unit 13 holds document entity data. This storage unit 13 corresponds to the holding means of the present invention. In the present embodiment, the storage unit 13 classifies and stores documents using a hierarchical directory structure.

操作部14は、マウスやキーボード等によって実現できる。この操作部14は、利用者の操作を受け入れて、当該操作の内容を制御部11に出力する。表示部15は、ディスプレイ等であり、制御部11から入力される指示に従って情報を表示出力する。通信部16は、ネットワークに接続されており、制御部11から入力される指示に従って、ネットワークを介してデータを送信出力する。またこの通信部16は、ネットワークを介して到来するデータ(クライアント装置Cからのドキュメントの要求など)を受信して制御部11に出力する。   The operation unit 14 can be realized by a mouse, a keyboard, or the like. The operation unit 14 accepts a user operation and outputs the content of the operation to the control unit 11. The display unit 15 is a display or the like, and displays and outputs information according to instructions input from the control unit 11. The communication unit 16 is connected to a network, and transmits and outputs data via the network in accordance with an instruction input from the control unit 11. Further, the communication unit 16 receives data (such as a document request from the client device C) received via the network and outputs the data to the control unit 11.

ここで、制御部11によって実行される処理の具体的内容について説明する。制御部11は、ストレージ部13に格納されているドキュメントへのアクセス要求を受けて、当該要求に応答してドキュメントを提示する処理を実行している。具体的にここでの制御部11は、ウエブサーバとして動作するものとして説明する。   Here, the specific content of the process performed by the control part 11 is demonstrated. The control unit 11 receives a request to access a document stored in the storage unit 13 and executes a process of presenting the document in response to the request. Specifically, the control part 11 here demonstrates as what operate | moves as a web server.

制御部11は、クライアント装置Cからのアクセスを受けると、クライアント装置Cの利用者をユーザ名やパスワード等によって認証する。制御部11は、利用者側から予め定められたユーザ名とそれに対応するパスワードが受信されるなど、認証に成功すると、固有のセッション識別子を発行して、クッキー(Cookie)などとして、クライアント装置Cに送信する。   When receiving an access from the client device C, the control unit 11 authenticates the user of the client device C with a user name, a password, or the like. When the authentication is successful, such as when a predetermined user name and a password corresponding to the user name are received from the user side, the control unit 11 issues a unique session identifier and uses it as a cookie (Cookie) or the like. Send to.

クライアント装置Cでは、このセッション識別子を保持し、ドキュメントやディレクトリへのアクセス要求の際に、このセッション識別子を併せて送信する。また制御部11は、クライアント装置Cからログアウト(セッションの終了)をする旨の指示を受信すると、セッション識別子を削除するようクライアント装置Cに指示し、クライアント装置Cがセッション識別子のクッキーを削除する。   The client device C holds this session identifier, and transmits this session identifier together with an access request to a document or directory. When the control unit 11 receives an instruction to log out (end of session) from the client device C, the control unit 11 instructs the client device C to delete the session identifier, and the client device C deletes the session identifier cookie.

制御部11は、ストレージ部13内のディレクトリの指定を含むアクセス要求を受けて、当該指定されたディレクトリに含まれる下位のディレクトリ、及びドキュメントの一覧のデータを要求元のクライアント装置Cに対して送信する。また、制御部11は、ドキュメントの指定を含むアクセス要求を受信すると、当該指定されたドキュメントをクライアント装置Cに対して送信する。ここで、ディレクトリ又はドキュメントの指定は、例えばURL(Uniform Resource Locator)によって行われる。   Upon receiving an access request including the designation of a directory in the storage unit 13, the control unit 11 transmits the lower directory included in the designated directory and document list data to the requesting client apparatus C. To do. In addition, when receiving an access request including a document specification, the control unit 11 transmits the specified document to the client device C. Here, the designation of a directory or a document is performed by, for example, a URL (Uniform Resource Locator).

制御部11はまた、利用者のドキュメントへのアクセスの履歴を記録する処理(記録処理)を実行している。この記録処理では、ネットワークを介して受信したアクセス要求に含まれている、ディレクトリやドキュメントの指定の内容と、当該要求を行った利用者(又はクライアント装置C)を特定する情報(クライアント特定情報)と、セッション識別子と、アクセス要求を受け入れた日時の情報(図示しない時計などから取得する)を関連付けて、ストレージ部13に履歴データベースとして格納する。この履歴データベースの内容は、例えば図2に示すようなものとなる。   The control unit 11 also executes processing (recording processing) for recording a history of access to the user's document. In this recording process, information specifying the directory or document specified in the access request received via the network and the user (or client device C) making the request (client specifying information) The session identifier is associated with the date and time information (acquired from a clock (not shown)) when the access request is accepted, and stored in the storage unit 13 as a history database. The contents of this history database are, for example, as shown in FIG.

制御部11は、こうして記録した履歴データベースの内容を参照して、分類に相当するディレクトリの評価値と、各ドキュメントの分類に係る評価値とを演算する。本実施の形態では、図3(a)に示すように、ディレクトリごとに、ディレクトリを特定する情報と、その評価値の情報とを関連付けたディレクトリ評価テーブルを記憶部12に格納している。また図3(b)に示すように、ドキュメントごとに、ドキュメントを特定する情報と、当該ドキュメントの分類に係る評価値の情報とを関連付けたドキュメント分類評価テーブルを記憶部12に格納している。   The control unit 11 calculates the evaluation value of the directory corresponding to the classification and the evaluation value related to the classification of each document with reference to the contents of the history database thus recorded. In the present embodiment, as shown in FIG. 3A, for each directory, a directory evaluation table in which information for specifying a directory and information on its evaluation value are associated is stored in the storage unit 12. Further, as shown in FIG. 3B, for each document, a document classification evaluation table in which information for specifying a document and evaluation value information related to the classification of the document are associated is stored in the storage unit 12.

次に、ディレクトリの評価値の演算の処理について説明する。制御部11は、履歴データベースに記録されているアクセスの記録をセッション(利用者の一連のアクセス記録)ごとに切分ける。具体的に、履歴データベースに記録されているアクセスの記録を、同一のセッション識別子を含む記録からなるセッション記録に分割する。そして各セッション記録について次の処理を行う。   Next, directory evaluation value calculation processing will be described. The control unit 11 separates the access records recorded in the history database for each session (a series of user access records). More specifically, the access record recorded in the history database is divided into session records composed of records including the same session identifier. Then, the following processing is performed for each session record.

制御部11は、セッション記録に含まれるアクセス記録を、日時の情報を参照しながら日時順に並べ替える。そしてディレクトリへのアクセス記録(ディレクトリ内のドキュメントや下位ディレクトリの一覧を参照した記録)を検索する。制御部11は、検索によって見いだされたディレクトリへのアクセス記録(この記録によってアクセスされるディレクトリをここでは注目ディレクトリと呼ぶ)に続いて、注目ディレクトリとは異なる他のディレクトリへのアクセスが記録されているときに、当該注目ディレクトリに関連付けて記憶部12に格納されている評価値を低減させる。具体的には注目ディレクトリに関連づけられている評価値を予め定めた値だけ小さくする。   The control unit 11 rearranges the access records included in the session record in order of date and time while referring to the date and time information. Then, a directory access record (a record referring to a list of documents and subdirectories in the directory) is searched. The control unit 11 records the access to the directory found by the search (the directory accessed by this record is referred to as the noticed directory here), and the access to another directory different from the noticed directory is recorded. The evaluation value stored in the storage unit 12 in association with the target directory is reduced. Specifically, the evaluation value associated with the target directory is reduced by a predetermined value.

さらに例えばディレクトリへのアクセス順序を参照して、階層の下位の方向へのアクセスが行われた後に、ドキュメントへのアクセスが行われることなく、続いて上位の方向へのアクセスが行われている場合に、アクセスされた一連のディレクトリのうち、最も下位にあったディレクトリに関連付けられた評価値を低減させる。具体的には当該最も下位にあったディレクトリに関連付けられた評価値を予め定めた値だけ小さくする。   Furthermore, for example, referring to the access order to the directory, after accessing in the lower direction of the hierarchy, the access to the document is not performed, and then the upper direction is accessed. In addition, the evaluation value associated with the lowest directory in the series of accessed directories is reduced. Specifically, the evaluation value associated with the lowest directory is reduced by a predetermined value.

具体的に本実施の形態では、ストレージ部13内の各ディレクトリについて、その階層の深さを表す数値(階層深度情報)を関連付けて記憶しておく(図4)。例えば、ルートディレクトリに関連づけられている「総務関係」のディレクトリの階層は「1」、この「総務関係」に関連づけられている「人事書類」のディレクトリの階層を「2」…とする。そして制御部11は、ディレクトリへのアクセス記録の各々について、階層深度情報を参照して、階層深度情報の値が増大し、続いて(ドキュメントへのアクセスが行われることなく)階層深度情報の値が減少している、階層深度情報の極値にあたるアクセス記録を見いだす。そして当該見いだしたアクセス記録に係るディレクトリ(アクセスされた一連のディレクトリのうち、最も下位にあったディレクトリ)の評価値を低減させる。   Specifically, in the present embodiment, for each directory in the storage unit 13, a numerical value (hierarchy depth information) representing the depth of the hierarchy is stored in association (FIG. 4). For example, it is assumed that the directory level of “General Affairs” associated with the root directory is “1”, the directory of “HR Documents” associated with this “General Affairs” is “2”, and so on. Then, the control unit 11 refers to the layer depth information for each access record to the directory, increases the value of the layer depth information, and then continues (without accessing the document) the value of the layer depth information. The access record corresponding to the extreme value of the hierarchical depth information is found. Then, the evaluation value of the directory related to the found access record (the lowest directory among a series of accessed directories) is reduced.

これにより、図5にアクセスの概要を示すように、利用者が上位側のディレクトリから所望のドキュメントを求めて、ディレクトリ階層を下位へと降りていったとき(S1,S2)に、結局所望のドキュメントが見いだされず、上位に戻ったような場合(S3)に、当該所望のドキュメントを見いだすことのできなかった分類に関する評価を低減することとなる。   As a result, as shown in FIG. 5, when the user obtains a desired document from the upper directory and descends down the directory hierarchy (S 1, S 2), the desired document is eventually obtained. In the case where the document is not found and returns to the top (S3), the evaluation regarding the classification in which the desired document cannot be found is reduced.

一方、セッション記録に含まれるアクセス記録を、日時の情報を参照しながら日時順に並べ替えた後、ドキュメントへのアクセス記録を検索する。制御部11は、検索によって見いだされたドキュメントへのアクセス記録の直前にアクセスされたディレクトリ(上記検索によって見いだされたドキュメントが関連づけられているディレクトリ)を注目ディレクトリとして、当該注目ディレクトリに関連付けて記憶部12に格納されている評価値を上昇させる。具体的には注目ディレクトリに関連づけられている評価値を予め定めた値だけ大きくする。つまり、注目ディレクトリへのアクセスの後、当該注目ディレクトリに関連づけられているドキュメントへのアクセスの履歴が記録されている場合は、当該注目ディレクトリ内で所望のドキュメントが見いだされたことを意味すると推定されるので、当該注目ディレクトリの評価値を上昇させるのである。   On the other hand, after the access records included in the session record are rearranged in order of date and time with reference to the date and time information, the access record to the document is searched. The control unit 11 uses the directory accessed immediately before the record of access to the document found by the search (the directory to which the document found by the search is associated) as the noticed directory, and associates the noticed directory with the storage part. The evaluation value stored in 12 is increased. Specifically, the evaluation value associated with the directory of interest is increased by a predetermined value. In other words, after access to a directory of interest, if a history of access to a document associated with the directory of interest is recorded, it is estimated that this means that a desired document has been found in the directory of interest. Therefore, the evaluation value of the target directory is increased.

制御部11は、さらに、こうして演算した評価値を表示部15に表示する。管理者は、この評価値の表示を参照して、評価値の低いディレクトリについて、対応策を検討することができるようになる。ここで対応策としてはディレクトリ名を変更することや、ディレクトリの新規作成や移動(他のディレクトリの下位に関連付けるなど)といったものがある。   The control unit 11 further displays the evaluation value thus calculated on the display unit 15. With reference to the display of the evaluation value, the administrator can consider a countermeasure for the directory having a low evaluation value. Here, countermeasures include changing the directory name, creating a new directory, or moving the directory (eg, associating it with other directories).

また制御部11は、ドキュメントの分類に係る評価値を演算する。本実施の形態では、一つのセッションの間にアクセスされた複数のドキュメントを、互いに共起アクセスドキュメントとして記録する。具体的に制御部11は、図6に示すように、同じセッションの間にアクセスを受けたドキュメントのペアに係るアクセス回数(共起アクセスの回数)を表す共起アクセステーブルを記憶部12に格納している。なお、図6において、左下三角の部分の値がないのは、右上三角に設定される値と同じ値となるから(ドキュメントa,b間の共起アクセス回数は、ドキュメントb,a間の共起アクセス回数と同じであるから)である。   Further, the control unit 11 calculates an evaluation value related to the classification of the document. In this embodiment, a plurality of documents accessed during one session are recorded as co-occurrence access documents. Specifically, as shown in FIG. 6, the control unit 11 stores in the storage unit 12 a co-occurrence access table that represents the number of accesses (number of co-occurrence accesses) related to a document pair accessed during the same session. is doing. In FIG. 6, the value in the lower left triangle is not the same as the value set in the upper right triangle (the number of co-occurrence accesses between documents a and b is the same between documents b and a). This is because it is the same as the number of times of access.

制御部11は、共起アクセステーブルを生成するため次の処理を行う。制御部11は、まず履歴データベースに記録されているアクセスの記録をセッション(利用者の一連のアクセス記録)ごとに切分ける。つまり履歴データベースに記録されているアクセスの記録を、同一のセッション識別子を含む記録からなるセッション記録に分割し、セッションの数をカウントする。   The control unit 11 performs the following processing to generate a co-occurrence access table. First, the control unit 11 separates the access records recorded in the history database for each session (a series of user access records). In other words, the access records recorded in the history database are divided into session records composed of records including the same session identifier, and the number of sessions is counted.

そして制御部11は、各セッション記録に含まれるドキュメントへのアクセス記録を参照して、一つのセッション中に複数のドキュメントがアクセスされているか否かを調べる。ここで、複数のドキュメントがアクセスされていれば、それらを共起アクセスドキュメントとして、共起アクセスドキュメントのうちから任意に2つ選択して得られるドキュメントの組み合せ(ドキュメントペア)を選択し、当該選択したドキュメントペアに係るそれぞれの共起アクセス回数をインクリメントし、共起アクセステーブルを更新する。   Then, the control unit 11 refers to the access record to the document included in each session record, and checks whether or not a plurality of documents are accessed during one session. Here, if a plurality of documents are accessed, they are selected as co-occurrence access documents, and a combination (document pair) of documents obtained by arbitrarily selecting two documents from the co-occurrence access documents is selected and selected. The co-occurrence access count for each document pair is incremented, and the co-occurrence access table is updated.

例えば、一つのセッション内に、ドキュメントA,B,Cがアクセスされている場合、これらが共起アクセスドキュメントとなり、ドキュメントA,Bの組み合せと、ドキュメントB,Cの組み合せと、ドキュメントA,Cの組み合せとに係る共起アクセス回数がインクリメントされる。   For example, when documents A, B, and C are accessed in one session, these become co-occurrence access documents, and a combination of documents A and B, a combination of documents B and C, and documents A and C The number of co-occurrence accesses related to the combination is incremented.

制御部11は、すべてのセッションについて、上記共起アクセステーブルの更新の処理を完了すると、共起アクセステーブル上の共起アクセス回数をセッションの数で除して、各ドキュメントのペアごとに、全セッションあたりに、共起アクセスドキュメントとなった割合を算出する。   When the update of the co-occurrence access table is completed for all the sessions, the control unit 11 divides the number of co-occurrence accesses on the co-occurrence access table by the number of sessions, and for each pair of documents, Calculate the ratio of co-occurrence access documents per session.

制御部11は、算出した割合が所定のしきい値を越えているドキュメントペアを特定する。そして当該ドキュメントペアに係る2つのドキュメントがそれぞれ互いに異なるディレクトリに関連づけられているか否かを調べる。ここで、当該2つのドキュメントが互いに異なるディレクトリに関連づけられている場合は、当該2つのドキュメントを報知対象として、当該2つのドキュメントを特定する情報と、各ドキュメントを含むディレクトリを特定する情報とを報知対象情報として記憶部12に格納する。そして制御部11は、記憶部12に格納した報知対象情報を表示部15に表示出力する。   The control unit 11 identifies document pairs in which the calculated ratio exceeds a predetermined threshold value. Then, it is checked whether or not the two documents related to the document pair are associated with different directories. Here, when the two documents are associated with different directories, information for specifying the two documents and information for specifying the directory including each document are notified for the two documents. The information is stored in the storage unit 12 as target information. The control unit 11 then displays and outputs the notification target information stored in the storage unit 12 on the display unit 15.

管理者は、この報知対象の情報を参照して、同じディレクトリに関連付けておくべきドキュメントペアを認識できるようになる。   The administrator can recognize the document pair to be associated with the same directory by referring to the information to be notified.

さらに制御部11は、報知対象情報を参照して、報知対象情報に係るディレクトリの組(ドキュメントペアの各ドキュメントをそれぞれ含むディレクトリの組)の一覧を生成する。そして各ディレクトリの組の出現頻度の値を演算する。   Furthermore, the control unit 11 refers to the notification target information, and generates a list of directory groups (directory groups each including each document of the document pair) related to the notification target information. Then, the value of the appearance frequency of each directory set is calculated.

例えば、ディレクトリAに含まれるドキュメントa1,a2,a3と、ディレクトリBに含まれるドキュメントb1,b2とがある場合に、報知対象情報に、a1とb1、a1とb2、a2とb1、a2とb2、a3とb1、の各ドキュメントペアが含まれているとする。この場合、報知対象情報に係るディレクトリの組として、ディレクトリA,Bの組が5つ出現することになる。   For example, when there are documents a1, a2, and a3 included in the directory A and documents b1 and b2 included in the directory B, the notification target information includes a1 and b1, a1 and b2, a2 and b1, a2 and b2. , A3 and b1 document pairs are included. In this case, five sets of directories A and B appear as a set of directories related to the notification target information.

制御部11は、上記生成した一覧に含まれるディレクトリの組の各々について、当該組に係る2つのディレクトリのそれぞれからドキュメントを取り出して得られる組み合せの数(ディレクトリA,Bの組の場合、ディレクトリAに含まれるドキュメントの数とディレクトリBに含まれるドキュメントの数との積)を演算する。そして、各ディレクトリの組について、上記一覧における出現頻度を、上記演算した組み合せの数で除した値(ペア含有率)を演算する。   For each set of directories included in the generated list, the control unit 11 determines the number of combinations obtained by extracting documents from each of the two directories in the set (in the case of a set of directories A and B, directory A Product of the number of documents included in the directory B and the number of documents included in the directory B). Then, for each set of directories, a value (pair content rate) obtained by dividing the appearance frequency in the list by the calculated number of combinations is calculated.

そして、ディレクトリの組のうち、上記ペア含有率が予め定めたしきい値を越えるディレクトリの組がある場合は、当該ディレクトリの組を特定する情報(当該組に含まれる2つのディレクトリのそれぞれのディレクトリ名等)を表示部15に表示する。   If there is a directory set whose pair content rate exceeds a predetermined threshold among the set of directories, information specifying the set of the directory (the directories of the two directories included in the set) Name) is displayed on the display unit 15.

管理者は、この表示を参照して、多くの利用者が当該2つのディレクトリ内のドキュメントを1つのセッションでアクセスする確率が高いことを知ることができ、例えば当該2つのディレクトリを統合した一つのディレクトリを生成するなどの対策を検討することができるようになる。   By referring to this display, the administrator can know that there is a high probability that many users will access the documents in the two directories in one session. For example, one administrator integrating the two directories Measures such as creating a directory can be considered.

このように本実施の形態によると、ディレクトリの構成やドキュメントの分類についての評価に関する情報を提供でき、分類体系の設計やドキュメントの分類を支援できる。   As described above, according to the present embodiment, it is possible to provide information related to the evaluation of the directory configuration and the document classification, and support the design of the classification system and the document classification.

また、制御部11は、ディレクトリを辿ってドキュメントにアクセスする態様だけでなく、例えば利用者から検索語の入力を受けて、当該検索語に関係するドキュメントの一覧を検索結果として提示する処理(いわゆる全文検索処理)を実行してもよい。このとき制御部11は、アクセスの履歴に、検索を行ったことを示す記録と、検索結果とを追記する。   Further, the control unit 11 not only has a mode of accessing a document by tracing a directory, but also, for example, receives a search word input from a user and presents a list of documents related to the search word as a search result (so-called so-called search result). Full-text search processing) may be executed. At this time, the control unit 11 adds a record indicating that the search has been performed and a search result to the access history.

このように検索を行った場合、制御部11は、与えられた検索語に基づく検索結果のドキュメントを含むディレクトリと、当該検索語との相関値を演算して、当該相関値が予め定めたしきい値より低い場合に、当該ディレクトリの名称等が適切でない旨を表示部15に表示してもよい。この相関値は、例えば所定の単語群に含まれる単語ペアの相関値を予め定めた相関値テーブルを参照し、検索語に含まれる単語と、ディレクトリ名に含まれる単語との相関値の総和を算出して演算することができる。   When the search is performed in this way, the control unit 11 calculates a correlation value between the directory containing the search result document based on the given search word and the search word, and the correlation value is determined in advance. When the value is lower than the threshold, the display unit 15 may display that the name of the directory is not appropriate. This correlation value is obtained by, for example, referring to a correlation value table in which the correlation values of word pairs included in a predetermined word group are determined in advance, and calculating the sum of correlation values between words included in the search word and words included in the directory name. It can be calculated and calculated.

さらに、検索によって見いだされたドキュメントに対して利用者がアクセスした場合には、アクセスの履歴には、検索結果の記録の後にドキュメントへのアクセスが記録されていることになる。制御部11は、このように当該ドキュメントへのアクセスの記録の前に当該ドキュメントが関連づけられている分類(ディレクトリ)へのアクセスの履歴が記録されていない場合には、少なくとも当該分類の評価値を低減させる。例えば分類であるディレクトリが階層的に構成されている場合は、ルートから当該分類(アクセスされたドキュメントが属している分類)までのパス上の各分類の評価値を低減してもよい。   Further, when the user accesses a document found by the search, the access history records the access to the document after the search result is recorded. If the history of access to the classification (directory) with which the document is associated is not recorded before recording the access to the document, the control unit 11 sets at least the evaluation value of the classification. Reduce. For example, when a directory that is a category is hierarchically configured, the evaluation value of each category on the path from the root to the category (the category to which the accessed document belongs) may be reduced.

具体的に制御部11は、検索結果の記録の後にドキュメントへのアクセスが記録されている場合、当該検索結果の提示の直後にアクセスの対象となったドキュメントが、当該検索結果であるドキュメントの一覧に含まれているものであるか否かを調べる。そして、アクセスの対象となったドキュメントが、一覧に含まれている場合は、ルートディレクトリから、当該アクセスの対象となったドキュメントを含むディレクトリまでのパス上の各ディレクトリの評価値を低減する。具体的には、一定の値を、各ディレクトリの評価値から差引く。例えば、検索によって見いだされたドキュメントへアクセスするために、本来はルートからディレクトリA→B→Cと辿る必要がある場合(当該ドキュメントはディレクトリCに分類されていることになる)、ルートからディレクトリCまでのパス上の各ディレクトリ、A,B,Cの評価値を低減させることになる。   Specifically, when the access to the document is recorded after the search result is recorded, the control unit 11 is a list of documents in which the access target immediately after the presentation of the search result is the search result. To see if it is included in. If the document to be accessed is included in the list, the evaluation value of each directory on the path from the root directory to the directory including the document to be accessed is reduced. Specifically, a certain value is subtracted from the evaluation value of each directory. For example, in order to access a document found by a search, it is necessary to trace the directory A → B → C from the root (the document is classified into the directory C). The evaluation values of the directories A, B, and C on the paths up to are reduced.

本発明の実施の形態に係る分類支援装置の構成ブロック図である。It is a block diagram of the configuration of a classification support apparatus according to an embodiment of the present invention. アクセス履歴の例を表す説明図である。It is explanatory drawing showing the example of an access history. ディレクトリやドキュメントの評価値の格納例を表す説明図である。It is explanatory drawing showing the example of storage of the evaluation value of a directory or a document. 階層深度の変化を用いた評価を行うためのテーブルの例を表す説明図である。It is explanatory drawing showing the example of the table for performing the evaluation using the change of a hierarchy depth. 利用者のアクセスの概要例を表す説明図である。It is explanatory drawing showing the example of an outline of a user's access. 共起アクセス回数のテーブルの例を表す説明図である。It is explanatory drawing showing the example of the table of the co-occurrence access frequency.

符号の説明Explanation of symbols

11 制御部、12 記憶部、13 ストレージ部、14 操作部、15 表示部、16 通信部。
11 control unit, 12 storage unit, 13 storage unit, 14 operation unit, 15 display unit, 16 communication unit.

Claims (7)

ドキュメントを、複数の分類のいずれかに関連づけて、分類して保持する保持手段に対してアクセス可能に接続されるコンピュータに、
前記分類のいずれかに関連づけられているドキュメントへの利用者のアクセス履歴を記録する手順と、
前記アクセス履歴に基づいて、各分類の評価値を演算する評価演算手順と、
当該生成した評価値に関する情報を提示する手順と、
を実行させることを特徴とする分類支援プログラム。
A computer connected to a holding means for categorizing and holding a document in association with one of a plurality of classifications;
Recording a user's access history to a document associated with any of the classifications;
An evaluation calculation procedure for calculating an evaluation value of each classification based on the access history;
A procedure for presenting information on the generated evaluation value;
A classification support program characterized in that
請求項1に記載のプログラムであって、
前記評価演算手順において、
注目分類に関連づけられているドキュメントの一覧を参照した旨の履歴に続いて、当該注目分類とは異なる他の分類へのアクセスの履歴が記録されているときに、当該注目分類の評価値を低減させることを特徴とするプログラム。
The program according to claim 1,
In the evaluation calculation procedure,
Reduces the evaluation value of the target category when the history of referring to the list of documents associated with the target category is recorded followed by the history of access to other categories different from the target category. A program characterized by letting
請求項1又は2に記載のプログラムであって、
前記評価演算手順において、
注目分類に関連づけられているドキュメントの一覧を参照した旨の履歴に続いて、当該注目分類に関連づけられているドキュメントへのアクセスの履歴が記録されているときに、当該注目分類の評価値を上昇させることを特徴とするプログラム。
The program according to claim 1 or 2,
In the evaluation calculation procedure,
When the history of accessing the document associated with the target category is recorded following the history of referring to the list of documents associated with the target category, the evaluation value of the target category is increased. A program characterized by letting
請求項1から3のいずれか一項に記載のプログラムであって、
前記評価演算手順において、
ドキュメントへの利用者のアクセスの履歴が記録されているときに、当該記録の前に当該ドキュメントが関連づけられている分類へのアクセスの履歴が記録されていない場合には、少なくとも当該分類の評価値を低減させることを特徴とするプログラム。
A program according to any one of claims 1 to 3,
In the evaluation calculation procedure,
When the history of user access to a document is recorded, if the history of access to the classification to which the document is associated is not recorded before the recording, at least the evaluation value of the classification A program characterized by reducing the above.
ドキュメントを、複数の分類のいずれかに関連づけて、分類して保持する保持手段に対してアクセス可能に接続されるコンピュータに、
前記分類のいずれかに関連づけられているドキュメントへの利用者のアクセス履歴を記録する手順と、
前記アクセス履歴に基づいて、各ドキュメントの分類に係る評価値を演算する評価演算手順と、
当該生成した評価値に関する情報を提示する手順と、
を実行させることを特徴とする分類支援プログラム。
A computer connected to a holding means for categorizing and holding a document in association with one of a plurality of classifications;
Recording a user's access history to a document associated with any of the classifications;
An evaluation calculation procedure for calculating an evaluation value related to the classification of each document based on the access history;
A procedure for presenting information on the generated evaluation value;
A classification support program characterized in that
ドキュメントを、複数の分類のいずれかに関連づけて保持する保持手段に対してアクセス可能に接続されるコンピュータを用い、
前記分類のいずれかに関連づけられているドキュメントへの利用者のアクセス履歴を記録する工程と、
前記アクセス履歴に基づいて、各分類の評価値を演算する評価演算工程と、
当該生成した評価値に関する情報を提示する工程と、
を実行させることを特徴とする分類支援方法。
Using a computer that is connected to a holding means for holding the document in association with one of a plurality of classifications;
Recording a user's access history to a document associated with any of the classifications;
An evaluation calculation step for calculating an evaluation value of each classification based on the access history;
Presenting information about the generated evaluation value;
A classification support method characterized in that
ドキュメントを、複数の分類のいずれかに関連づけて保持する保持手段に対してアクセス可能に接続される分類支援装置であって、
前記分類のいずれかに関連づけられているドキュメントへの利用者のアクセス履歴を記録する手段と、
前記アクセス履歴に基づいて、各分類の評価値を演算する手段と、
当該生成した評価値に関する情報を提示する手段と、
を含むことを特徴とする分類支援装置。
A classification support apparatus that is connected to a holding unit that holds a document in association with one of a plurality of classifications,
Means for recording a user's access history to a document associated with any of the classifications;
Means for calculating an evaluation value of each classification based on the access history;
Means for presenting information on the generated evaluation value;
A classification support apparatus comprising:
JP2004216981A 2004-07-26 2004-07-26 Device for supporting classification Pending JP2006039810A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004216981A JP2006039810A (en) 2004-07-26 2004-07-26 Device for supporting classification

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004216981A JP2006039810A (en) 2004-07-26 2004-07-26 Device for supporting classification

Publications (1)

Publication Number Publication Date
JP2006039810A true JP2006039810A (en) 2006-02-09

Family

ID=35904764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004216981A Pending JP2006039810A (en) 2004-07-26 2004-07-26 Device for supporting classification

Country Status (1)

Country Link
JP (1) JP2006039810A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010224873A (en) * 2009-03-24 2010-10-07 Nomura Research Institute Ltd Commodity retrieval server, commodity retrieval method, program, and recording medium
JP2011515767A (en) * 2008-03-21 2011-05-19 アリババ グループ ホールディング リミテッド Web access using cross-domain cookies
JP2011113563A (en) * 2009-11-23 2011-06-09 Palo Alto Research Center Inc Method for approximating user task representations by document-usage clustering
WO2015121966A1 (en) * 2014-02-14 2015-08-20 楽天株式会社 Management device, management method, storage medium, and program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011515767A (en) * 2008-03-21 2011-05-19 アリババ グループ ホールディング リミテッド Web access using cross-domain cookies
US8874695B2 (en) 2008-03-21 2014-10-28 Alibaba Group Holding Limited Web access using cross-domain cookies
US9307036B2 (en) 2008-03-21 2016-04-05 Alibaba Group Holding Limited Web access using cross-domain cookies
JP2010224873A (en) * 2009-03-24 2010-10-07 Nomura Research Institute Ltd Commodity retrieval server, commodity retrieval method, program, and recording medium
JP2011113563A (en) * 2009-11-23 2011-06-09 Palo Alto Research Center Inc Method for approximating user task representations by document-usage clustering
WO2015121966A1 (en) * 2014-02-14 2015-08-20 楽天株式会社 Management device, management method, storage medium, and program

Similar Documents

Publication Publication Date Title
US11921873B1 (en) Authenticating data associated with a data intake and query system using a distributed ledger system
US10289618B2 (en) Third party search applications for a search system
US10452668B2 (en) Smart defaults for data visualizations
US7730409B2 (en) Method and system for visualizing weblog social network communities
US8407218B2 (en) Role based search
US10552429B2 (en) Discovery of data assets using metadata
KR20110009198A (en) Search results with most clicked next objects
EP2545469A2 (en) User role based customizable semantic search
WO2016054196A1 (en) Document curation system
WO2009055712A1 (en) Apparatuses, methods and systems for a forum ferreting system
Sisodia et al. Fast prediction of web user browsing behaviours using most interesting patterns
JP2010128928A (en) Retrieval system and retrieval method
US20150127668A1 (en) Document generation system
JP4682549B2 (en) Classification guidance device
JP5084796B2 (en) Relevance determination device, relevance determination method, and program
US20030163465A1 (en) Processing information about occurrences of multiple types of events in a consistent manner
JP2006039810A (en) Device for supporting classification
JP2008181218A (en) Input support method and device
JP2011100191A (en) Device, method, and program for retrieving document
US20140136274A1 (en) Providing multiple level process intelligence and the ability to transition between levels
JP2006260074A (en) Cad data management device
JP5774535B2 (en) Content recommendation program, content recommendation device, and content recommendation method
WO2017053155A1 (en) Intelligent tabular big data presentation in search environment based on prior human input configuration
JP2000293531A (en) Method and device for retrieving information
JP2007249622A (en) Method, system and program for providing information containing disclosure/non-disclosure item