JPH09212492A - Document processor - Google Patents
Document processorInfo
- Publication number
- JPH09212492A JPH09212492A JP8015535A JP1553596A JPH09212492A JP H09212492 A JPH09212492 A JP H09212492A JP 8015535 A JP8015535 A JP 8015535A JP 1553596 A JP1553596 A JP 1553596A JP H09212492 A JPH09212492 A JP H09212492A
- Authority
- JP
- Japan
- Prior art keywords
- knowledge
- information
- user
- knowledge state
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は利用者に提供すべき
文書の作成を補助する文書処理装置に関し、特に所定の
用語に対する利用者の理解度を個別に管理している文書
処理装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document processing apparatus that assists in creating a document to be provided to a user, and more particularly to a document processing apparatus that individually manages a user's degree of understanding of a predetermined term.
【0002】[0002]
【従来の技術】人間の情報伝達において文書が果たす役
割は大きい。人間の知的活動の結果を保存して、後の他
の人間の用に供するための手段として、文書の形にして
おくのはもっともポピュラーな手段である。また、日々
のコミュニケーションにおいても、昨今は電子メールと
いう電子的な文書を利用して行われる事が多い。2. Description of the Related Art Documents play a large role in human information transmission. It is the most popular means to preserve the results of human intellectual activity and to keep it in the form of documents for later use by other humans. Also, in daily communication, electronic documents such as electronic mail are often used these days.
【0003】ところが、このような文書による情報伝達
には、文書の作成者が持つ知識と、文書の利用者が持つ
知識との違いから、ミスコミュニケーションがもたらさ
れ、文書作成者と利用者との相互にかかる負荷が増大す
るという大きな問題がある。例えば、文書の利用者が文
書を読む場合に、文書中にある専門用語の定義や関連す
る情報を知らず、文書の内容を充分に理解できないこと
は頻繁に起こる。その結果、文書の内容についての価値
を正確に判断できず、重要な情報を見逃してしまうこと
は多い。また、文書の内容を誤解し、その後の行動に支
障をきたす事もある。このような、ミスコミュニケーシ
ョンを防ぐためには、利用者は、文書作成者あるいは、
文書作成者と同様の知識をもつ別人に種々の問合せを行
わなければならず、これは文書作成者/利用者双方にと
って大きな負荷になる。However, in such information transmission using a document, miscommunication is caused due to the difference between the knowledge of the creator of the document and the knowledge of the user of the document, and the communication between the document creator and the user. However, there is a big problem that the mutual load on each other increases. For example, when a user of a document reads the document, it often happens that he / she does not fully understand the contents of the document without knowing the definition of technical terms and related information in the document. As a result, the value of the content of a document cannot be accurately determined, and important information is often overlooked. In addition, the content of the document may be misunderstood, and the subsequent actions may be disturbed. In order to prevent such miscommunication, the user must be the document creator or
It is necessary to make various inquiries to another person who has the same knowledge as that of the document creator, which is a heavy load for both the document creator and the user.
【0004】そこで、文書の作成者は、ミスコミュニケ
ーションや文書の利用者に必要以上の負荷がかかること
を防ぐために、文書の利用者の知識レベルを想定して、
用語を選択したり、用語の定義や関連情報を文書に追加
したりする。したがって、文書の作成者と利用者の共有
する知識が少ないほど、より多くの情報を文書に載せね
ばならず、文書作成者の大きな負荷となっている。Therefore, the document creator assumes the knowledge level of the user of the document in order to prevent miscommunication and unnecessary load on the user of the document.
Select terms and add term definitions and related information to the document. Therefore, the less the knowledge shared between the creator of the document and the user, the more information has to be put in the document, which is a great burden on the document creator.
【0005】また、文書の利用者が多い場合、利用者の
持つ知識は様々であり、文書作成者は、利用者毎に利用
者に理解可能な文書を作るとか、あるいは、利用者に多
いと思われる知識のレベルを想定して、そのレベルに合
わせた単一の文書を作成することになる。ただし、前者
の場合は、同じ情報を伝えるのに複数の文書を作成する
という負荷を作成者に負わせる事になる。後者の場合
は、文書作成者と多くの知識を共有している文書利用者
には、不必要な情報が多い冗長な文章となり、読むのに
必要以上に時間がかかる。逆に、文書作成者が想定した
レベルの知識を持たない文書利用者にとっては充分理解
できない文書になる。Further, when there are many users of the document, the knowledge possessed by the users is various, and the document creator needs to create a document that the user can understand for each user, or that there are many users. Assuming the level of knowledge you think, you will create a single document for that level. However, in the former case, the load of creating multiple documents to convey the same information is imposed on the creator. In the latter case, a document user who shares a lot of knowledge with the document creator has a redundant sentence with a lot of unnecessary information, and it takes more time than necessary to read it. On the contrary, the document cannot be fully understood by the document user who does not have the level of knowledge assumed by the document creator.
【0006】このような、問題点を解消するために、特
開平7−93334号公報に開示された発明では、利用
者が持つ単語の既知未知の状態を計算機がシミュレート
し、文書中の単語のうち利用者が知らない単語を自動的
に判別するステップと、前記未知の単語に利用者が知っ
ている同義語を自動的に補足するステップと、前記同義
語を補足した文書を自動的に表示するステップとからな
る文書処理方法が示されている。In order to solve such a problem, according to the invention disclosed in Japanese Patent Laid-Open No. 7-93334, a computer simulates a known or unknown state of a word held by a user, and a word in a document is reproduced. Step of automatically determining a word unknown to the user, a step of automatically supplementing the unknown word with a synonym known by the user, and a document supplementing the synonym automatically There is shown a document processing method comprising displaying steps.
【0007】また、前記の公報には、利用者が持つ単語
の既知未知の状態を計算機がシミュレートし、文書中の
単語のうち利用者が知らない単語を自動的に判別する手
段と、前記未知の単語に利用者が知っている同義語を自
動的に補足する手段と、前記同義語を補足した文書を自
動的に表示する手段と、を備えた文書処理装置も開示さ
れている。Further, the above-mentioned publication discloses a means for simulating a known or unknown state of a word possessed by a user and automatically discriminating a word which is not known by the user among words in a document, A document processing apparatus is also disclosed, which comprises means for automatically supplementing unknown words with synonyms known to the user, and means for automatically displaying a document supplementing the synonyms.
【0008】このような文書処理方法及び文書処理装置
によって、文書利用者毎に、文書の利用者の知らない用
語に文書の利用者が知っている同義語を自動的に付加す
る事で、文書の利用者の理解を助け、さらには、文書の
作成者の負担を軽減している。With such a document processing method and document processing device, a synonym known to the user of the document is automatically added to a term unknown to the user of the document for each document user. Helps users understand and reduces the burden on the creator of the document.
【0009】[0009]
【発明が解決しようとする課題】しかし、特開平7−9
3334号公報に開示されたシステムでは、計算機上に
シミュレートした利用者の単語の既知未知の状態は、シ
ステムの利用につれて徐々に利用者の実際の知識の状態
を反映したものに近づいていく。したがって、このシス
テムは、比較的初期の状態には、利用者の状態に適合し
た同義語の付加ができず、ある程度以上使用しなけれ
ば、利用者に利益をもたらさない。However, Japanese Patent Laid-Open No. 7-9 / 1995
In the system disclosed in Japanese Patent No. 3334, the known / unknown state of a user's word simulated on a computer gradually approaches the state of the user's actual knowledge as the system is used. Therefore, this system cannot add a synonym suitable for the user's state in a relatively initial state, and will not bring a benefit to the user unless it is used for a certain amount or more.
【0010】しかも、利用者の使う単語は少なくとも数
万のオーダーの数にのぼり、これらの単語の既知未知の
状態が利用者の実際のものと一致するには、非常に長い
時間が必要になる。よって、システムが利用者に利益を
もたらすようになるまで、利用者がシステムを使う意欲
が継続せず、効果をまったく発揮せずに、使用されなく
なる。Moreover, the words used by the user reach at least the order of tens of thousands, and it takes a very long time for the known and unknown states of these words to match the actual ones of the user. . Therefore, the user's motivation to use the system does not continue until the system comes to benefit the user, the effect is not exerted at all, and the system is not used.
【0011】本発明はこのような点に鑑みてなされたも
のであり、知識状態の情報量の少ない利用者の知識状態
を予測できる文書処理装置を提供することを目的とす
る。The present invention has been made in view of the above circumstances, and an object thereof is to provide a document processing apparatus capable of predicting the knowledge state of a user having a small amount of knowledge state information.
【0012】[0012]
【課題を解決するための手段】図1は本発明の原理構成
図である。本発明では上記課題を解決するために、各利
用者の知識状態を管理している文書処理装置において、
複数の利用者の知識状態を参照し、利用者を複数の集団
に分類するための分類軸となる用語を決定する分類軸決
定手段2と、前記分類軸となる用語に対する予測対象者
の知識状態から、前記予測対象者の属する集団を決定す
る分類手段3と、前記予測対象者と同じ集団内の他の利
用者の知識状態に基づき、前記予測対象者の知識状態の
典型例を作成し、前記典型例を前記予測対象者の知識状
態へ反映する典型例作成手段4と、を有することを特徴
とする文書処理装置が提供される。FIG. 1 is a block diagram showing the principle of the present invention. In the present invention, in order to solve the above problems, in a document processing device that manages the knowledge state of each user,
Classification axis determining means 2 for determining a term as a classification axis for classifying a user into a plurality of groups by referring to knowledge statuses of a plurality of users, and a knowledge status of a prediction target person for the term as the classification axis From the classification means 3 that determines the group to which the prediction target person belongs, and a typical example of the knowledge state of the prediction target person, based on the knowledge states of other users in the same group as the prediction target person, A typical example creating unit 4 for reflecting the typical example on the knowledge state of the prediction target person is provided.
【0013】この構成によれば、分類軸決定手段2によ
り、複数の利用者の知識状態が参照され、利用者を複数
の集団に分類するための分類軸となる用語が定められ
る。次いで、分類手段3により、分類軸となる用語に対
する予測対象者の知識状態から、前記予測対象者の属す
る集団が決定される。そして、典型例作成手段4によ
り、予測対象者と同じ集団内の他の利用者の知識状態に
基づき、予測対象者の知識状態の典型例が作成され、前
記典型例が前記予測対象者の知識状態へ反映される。According to this structure, the classification axis determining means 2 refers to the knowledge states of a plurality of users, and defines the term as a classification axis for classifying the users into a plurality of groups. Next, the classification unit 3 determines the group to which the prediction target person belongs from the knowledge state of the prediction target person with respect to the term as the classification axis. Then, the typical example creating means 4 creates a typical example of the knowledge state of the prediction target person based on the knowledge states of other users in the same group as the prediction target person, and the typical example is the knowledge of the prediction target person. It is reflected in the state.
【0014】これにより、その予測結果は、予測対象者
の実際の知識状態と近いものとなる。As a result, the prediction result becomes close to the actual knowledge state of the person to be predicted.
【0015】[0015]
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。図1は本発明の原理構成図であ
る。複数の利用者の知識状態が知識状態管理手段1a〜
1cでシミュレートされている。分類軸決定手段2は、
知識状態管理手段1a〜1c内の各利用者の知識状態を
参照し、利用者を複数の集団に分類するための分類軸と
なる用語を決定する。分類手段3は、分類軸となる用語
に対する予測対象者の知識状態から、予測対象者の属す
る集団を決定する。典型例作成手段4は、予測対象者と
同じ集団内の他の利用者の知識状態に基づき、予測対象
者の知識状態の典型例を作成し、その典型例を、予測対
象者の知識状態を管理している知識状態管理手段5へ反
映させる。Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing the principle of the present invention. Knowledge states of a plurality of users are the knowledge state management means 1a to.
Simulated in 1c. The classification axis determining means 2 is
By referring to the knowledge status of each user in the knowledge status management means 1a to 1c, a term as a classification axis for classifying the user into a plurality of groups is determined. The classification unit 3 determines the group to which the prediction target person belongs from the knowledge state of the prediction target person with respect to the term as the classification axis. The typical example creating means 4 creates a typical example of the knowledge state of the prediction target person based on the knowledge states of other users in the same group as the prediction target person, and sets the typical example to the knowledge state of the prediction target person. It is reflected in the knowledge state management means 5 being managed.
【0016】このような構成により、例えば、分類軸決
定手段2が、「CPU」と「VOD」との2つの用語を
分類軸として決定すると、分類手段3は予測対象者の
「CPU」と「VOD」とに対する知識の入力を受け付
ける。ここでは、「CPU」は既知であり、「VOD」
は未知であったものとする。すると、典型例作成手段4
は、知識状態管理手段1a〜1cから、「CPU」は既
知、「VOD」は未知である利用者のみを抽出し、それ
らの利用者の知識状態を用いて、典型例を作成する。作
成された典型例は、予測対象者の知識状態管理手段5に
反映される。With such a configuration, for example, when the classification axis determining means 2 determines two terms "CPU" and "VOD" as classification axes, the classification means 3 determines "CPU" and "CPU" of the prediction target person. Input of knowledge for "VOD" is accepted. Here, "CPU" is known and "VOD"
Is unknown. Then, the typical example creating means 4
Extracts only users whose "CPU" is known and "VOD" is unknown from the knowledge state management means 1a to 1c, and a typical example is created using the knowledge states of those users. The created typical example is reflected in the knowledge state management means 5 of the prediction target person.
【0017】このようにして、新たに文書処理装置を使
用する者を予測対象者とし、その者の知識状態を予測す
ることができる。従って、新たに文書処理装置を使用す
る者であっても、直ぐに文書処理装置の機能を有効に使
用することが可能である。In this way, a person who newly uses the document processing apparatus can be set as a prediction target person, and the knowledge state of the person can be predicted. Therefore, even a person who newly uses the document processing apparatus can immediately and effectively use the function of the document processing apparatus.
【0018】図2は本発明を実施するための文書処理装
置の具体例を示す構成図である。これは、利用者が理解
すべき第1の文書を入力すると、利用者の理解可能な第
2の文書に自動的に変換する文書処理装置に対して、本
発明の機能を付加した場合の例である。FIG. 2 is a block diagram showing a concrete example of a document processing apparatus for carrying out the present invention. This is an example in which the function of the present invention is added to a document processing device that automatically converts a first document to be understood by a user into a second document that the user can understand. Is.
【0019】図2において、関連情報管理部40は、利
用者が文書の内容を理解するのに必要な情報(以後、関
連情報と呼ぶ)の蓄積/管理/検索を行う部分である。
関連情報管理部40に管理されている関連情報の登録/
削除/更新は、関連情報作成者22が関連情報入出力i
/f21を通して行なうことができる。In FIG. 2, a related information management section 40 is a section for accumulating / managing / retrieving information (hereinafter referred to as related information) necessary for a user to understand the contents of a document.
Registration of related information managed by the related information management unit 40 /
For deletion / update, the related information creator 22 inputs / outputs the related information i
/ F21.
【0020】また、利用者15に対応して、知識状態管
理部11、追加情報抽出部12、個別文書作成部13、
利用者入出力i/f14、および知識状態予測部16が
設けられている。知識状態管理部11は、対応する利用
者15の知識状態を表す情報を蓄積/管理する部分であ
る。In addition, corresponding to the user 15, the knowledge status management unit 11, the additional information extraction unit 12, the individual document creation unit 13,
A user input / output i / f 14 and a knowledge state prediction unit 16 are provided. The knowledge state management unit 11 is a unit that accumulates / manages information representing the knowledge state of the corresponding user 15.
【0021】追加情報抽出部12は、専門用語抽出部1
2aと条件絞り込み部12bとを含んでいる。専門用語
抽出部12aは、第1の文書を解析し、その文書から専
門用語を抽出する。そして、抽出された専門用語により
専門用語リストを作る。条件絞り込み部12bは、専門
用語抽出部12aで抽出された用語に対して、その用語
に関する情報で、利用者に必要な情報の関連種を決定す
る。条件絞り込み部12bで決定された関連種の関連情
報を、追加情報抽出部12が関連情報管理部40から取
り出し、さらに、第1の文書と取り出した関連情報のリ
ストを個別文書作成部13に送る。なお、第1の文書
は、利用者入出力i/f14を介して入力される。The additional information extraction unit 12 is a technical term extraction unit 1
2a and the condition narrowing unit 12b are included. The technical term extraction unit 12a analyzes the first document and extracts technical terms from the document. Then, a technical term list is created based on the extracted technical terms. The condition narrowing unit 12b determines, for the term extracted by the technical term extracting unit 12a, information related to the term and a related species of information necessary for the user. The additional information extraction unit 12 extracts the related information of the related species determined by the condition narrowing unit 12b from the related information management unit 40, and further sends the list of the first document and the extracted related information to the individual document creation unit 13. . The first document is input via the user input / output i / f 14.
【0022】個別文書作成部13は、追加情報抽出部1
2から送られた文書と関連情報から、第2の文書を作成
する。利用者15は、利用者入出力i/f14を通し
て、第2の文書を読むことができる。また、このとき知
識状態管理部11は、関連情報管理部から取り出された
関連情報に応じて、利用者15の知識状態を更新する。The individual document creating section 13 is provided with the additional information extracting section 1
A second document is created from the document sent from 2 and related information. The user 15 can read the second document through the user input / output i / f 14. At this time, the knowledge status management unit 11 updates the knowledge status of the user 15 according to the related information retrieved from the related information management unit.
【0023】知識状態予測部16は、利用者15の知識
の状態を予測し、その結果を利用者の知識状態管理部1
1の内容に反映させる部分である。この知識状態予測部
16は、利用者を分類する基準となる用語を決定する分
類軸決定部16a、利用者15からの入力により利用者
15の該当する分類を決定する分類部16c、及び利用
者15と同じ分類の他の利用者の知識状態から利用者1
5の典型例を作成する典型例作成部16bを有してい
る。The knowledge state prediction unit 16 predicts the state of knowledge of the user 15, and the result is used by the knowledge state management unit 1 of the user.
This is the part to be reflected in the contents of 1. The knowledge state prediction unit 16 includes a classification axis determination unit 16a that determines a term that serves as a reference for classifying users, a classification unit 16c that determines a corresponding classification of the user 15 based on input from the user 15, and a user. User 1 from the knowledge status of other users in the same category as 15
It has a typical example creating unit 16b for creating the typical example of No. 5.
【0024】なお、利用者15は、利用者入出力i/f
14を通して予測の指示を行うことができる。また、知
識状態の予測は、多くの利用者の知識の状態を参照して
行うので、利用者15の知識状態予測部16は、他の多
くの利用者の知識状態管理部31,32の内容を参照す
ることができる。The user 15 uses the user input / output i / f.
A prediction instruction can be given through 14. In addition, since the knowledge state prediction is performed by referring to the knowledge states of many users, the knowledge state prediction unit 16 of the user 15 determines the contents of the knowledge state management units 31 and 32 of many other users. Can be referred to.
【0025】以上のような構成の文書処理装置におい
て、利用者15は新規にこの文書処理装置を利用する者
であるとした場合、利用者15に対応する知識状態管理
部11は、情報がほとんど格納されていないはずであ
る。この状態では、第1の文書に関連情報を付加して第
2の文書を作成しても、基準となるデータが十分にない
ために、正しい判断をすることができない。そこで、ま
ず初めに、他の利用者の知識状態管理部31,32を利
用して、利用者15の知識状態管を予測する必要があ
る。以下に、知識状態予測部16による、利用者15の
知識状態の予測処理について説明する。In the document processing apparatus having the above-mentioned configuration, if the user 15 is a new user of this document processing apparatus, the knowledge state management unit 11 corresponding to the user 15 has almost no information. It should not be stored. In this state, even if the related information is added to the first document to create the second document, the correct reference cannot be made because there is insufficient reference data. Therefore, first, it is necessary to predict the knowledge status pipe of the user 15 by using the knowledge status management units 31 and 32 of other users. The process of predicting the knowledge state of the user 15 by the knowledge state prediction unit 16 will be described below.
【0026】新たにこの文書処理装置を利用する利用者
15は、利用者入出力i/f14を介して、知識状態管
理部11の初期化指令を入力する。初期化指令を受け取
った知識状態予測部16は、知識状態の予測を行い、そ
の結果を該利用者の知識状態管理部の初期内容とする処
理を実行する。The user 15 who newly uses this document processing apparatus inputs an initialization command for the knowledge state management unit 11 via the user input / output i / f 14. Upon receiving the initialization command, the knowledge state prediction unit 16 performs a process of predicting the knowledge state and using the result as the initial contents of the knowledge state management unit of the user.
【0027】図3は、知識状態の初期化の際の処理手順
を示すフローチャートである。まず、分類軸決定部16
aで分類の軸の決定が行われる(ステップS1)。この
例では、2つの用語をどの程度知っているか知らないか
を分類軸とする。したがって、予測対象の利用者15の
知識状態が属する可能性のある類は、4つである。この
分類軸によって、知識状態予測部16から参照可能な多
くのユーザの知識状態も、4つの類の内のどれかに分類
することができる。分類軸決定部16aは、知識状態予
測部16から参照可能な多くのユーザの知識状態を参照
する。そして、任意の2つの用語を選択し、その用語に
対する既知、未知の別により、ユーザの知識状態を分類
する。このような分類処理を様々な用語を用いて行い、
各類内に属する利用者の知識状態が、相互にもっとも似
ている類に分類できるような用語を2つ見つけ出す。FIG. 3 is a flow chart showing a processing procedure for initializing the knowledge state. First, the classification axis determination unit 16
The classification axis is determined in a (step S1). In this example, the classification axis is how much the two terms are known or not. Therefore, there are four classes to which the knowledge state of the prediction target user 15 may belong. With this classification axis, the knowledge states of many users that can be referred to by the knowledge state prediction unit 16 can also be classified into any of the four classes. The classification axis determination unit 16a refers to the knowledge states of many users that can be referred to from the knowledge state prediction unit 16. Then, two arbitrary terms are selected, and the knowledge state of the user is classified according to whether the terms are known or unknown. Such classification processing is performed using various terms,
Find two terms that allow users belonging to each category to be classified into categories that are most similar to each other's knowledge state.
【0028】次に、分類部16cにおいて、利用者の知
識状態が、分類軸決定部16aで決定された分類軸で規
定される類の内のどれに該当するかが決定される(ステ
ップS2)。さらに、典型例作成部16bにおいて、分
類部16cで決定された類に属する、多くのユーザの知
識状態を平均した知識状態が作成される(ステップS
3)。最後に、典型例作成部16bで作成した知識状態
を、知識状態管理部11の初期状態とすべく、現在の知
識状態管理部11の内容が消去され、知識状態の更新が
行われ(ステップS4)、処理が終了する。Next, the classification unit 16c determines which of the categories defined by the classification axis determined by the classification axis determination unit 16a the user's knowledge state corresponds to (step S2). . Further, the typical example creating unit 16b creates a knowledge state that averages the knowledge states of many users belonging to the class determined by the classifying unit 16c (step S).
3). Finally, in order to make the knowledge state created by the typical example creation unit 16b the initial state of the knowledge state management unit 11, the current contents of the knowledge state management unit 11 are erased and the knowledge state is updated (step S4). ), The process ends.
【0029】以上のようにして、知識状態管理部11の
内容が初期化される。ここで、分類軸の決定の処理(ス
テップS1)の詳細を説明する。図4は、分類軸決定部
16aで行われる、分類軸の決定の処理の手順を示すフ
ローチャートである。なお、各知識状態管理部31,3
2は、各用語に対する理解度を、既知レコードとして管
理しているものとする。この既知レコードは、「キー
部」、「関連種部」、「既知度」で構成されている。
「キー部」は管理対象となる用語を示しており、「関連
種部」は用語の種別(定義情報、詳細情報、付帯情報な
ど)を示しており、「既知度」は該当する用語の該当す
る種別に対する理解度を数値(値が大きい程よく知って
いることを示す)で示している。既知レコードの詳細は
後述する。まず、分類軸となる用語の組合わせの候補の
リストが作成される(ステップS11)。この際、分類
軸となり得る用語は、知識状態予測部16から参照可能
な多くのユーザの知識状態の既知レコードのキー部の文
字列である。参照可能な全てのユーザの知識状態から、
キー部に存在する文字列の集合を作り、そのなかから、
可能な2つの用語組合せのリストを作成する。As described above, the contents of the knowledge status management unit 11 are initialized. Here, the details of the classification axis determination process (step S1) will be described. FIG. 4 is a flowchart showing a procedure of a classification axis determination process performed by the classification axis determination unit 16a. In addition, each knowledge state management unit 31, 3
2. Assume that the degree of understanding of each term is managed as a known record. This known record is composed of a "key part", a "related seed part", and a "known degree".
The "key part" indicates the term to be managed, the "related species part" indicates the type of the term (definition information, detailed information, supplementary information, etc.), and the "known degree" corresponds to the relevant term. The degree of understanding for each type is indicated by a numerical value (the larger the value, the better the person knows). Details of the known record will be described later. First, a list of candidates for a combination of terms to be a classification axis is created (step S11). At this time, the term that can be the classification axis is the character string of the key part of the known record of the knowledge state of many users that can be referred to by the knowledge state prediction unit 16. From the knowledge state of all users who can refer to,
Create a set of character strings existing in the key part, and from that,
Create a list of two possible term combinations.
【0030】次にリストが空かどうかのチェックを行う
(ステップS12)。リストが空であれば、平均距離が
最小な用語の組み合わせを、分類軸として決定する(ス
テップS13)。リストが空でなければ、用語の組合せ
をリストからひとつ取り出す(ステップS14)。取り
出された組合せは、リストから削除する。Next, it is checked whether or not the list is empty (step S12). If the list is empty, the combination of terms with the smallest average distance is determined as the classification axis (step S13). If the list is not empty, one term combination is extracted from the list (step S14). The retrieved combination is deleted from the list.
【0031】次に、取り出した用語について既知かどう
かで、知識状態予測部16から参照可能な多くのユーザ
の知識状態を4つの集団に分類する(ステップS1
5)。分類においては、取り出した用語をキー部に持つ
定義情報の既知レコードの既知度が15以上の場合は取
り出した用語を既知なものとみなし、15より少ない場
合には、取り出した用語を未知なものとみなす。知識状
態管理部11の中に取り出した用語をキー部に持つ既知
レコードがない場合には、既知および未知双方に重複し
て分類する。さらに、利用者間の平均距離を計算し(ス
テップS16)、リストが空かどうかのチェック(ステ
ップS12)に戻る。Next, the knowledge states of many users that can be referred to by the knowledge state prediction unit 16 are classified into four groups based on whether the extracted terms are known (step S1).
5). In classification, if the known degree of the known record of the definition information having the retrieved term in the key part is 15 or more, the retrieved term is regarded as known, and if it is less than 15, the retrieved term is unknown. To consider. If there is no known record in the knowledge state management unit 11 that has the extracted term in the key part, it is classified into both known and unknown. Further, the average distance between the users is calculated (step S16), and the process returns to the check whether the list is empty (step S12).
【0032】このような処理を行うことにより、分類軸
を決定することができる。以下に、図4に示す処理を具
体的なデータを用いて説明する。図5は知識状態予測部
16から参照可能なユーザの知識状態の例を示した図で
ある。知識状態予測部16から参照可能な知識状態は、
ユーザAからユーザOまでの15人おり、分類軸に利用
可能な用語は、「本体データ」、「追加情報」、「関連
情報」、「知識状態」、「知識状態管理部」、「追加情
報抽出部」、「関連情報管理部」、「関連種」、「既知
レコード」、および「関連種属性」の10個ある。それ
ぞれの用語に対する定義情報の既知レコードがない場合
には、空欄になっている。定義情報の既知レコードが存
在し、その既知度が15以上の場合は既知、15より小
さい場合は未知となっている。By performing such processing, the classification axis can be determined. The processing shown in FIG. 4 will be described below using specific data. FIG. 5 is a diagram showing an example of a user's knowledge state that can be referred to from the knowledge state prediction unit 16. The knowledge state that can be referred from the knowledge state prediction unit 16 is
There are 15 users from user A to user O, and the terms that can be used for the classification axis are "main body data", "additional information", "related information", "knowledge status", "knowledge status management unit", and "additional information". There are ten "extraction section", "related information management section", "related species", "known record", and "related species attribute". If there is no known record of definition information for each term, it is blank. There is a known record of definition information, and it is known when the degree of knownness is 15 or more, and unknown when it is less than 15.
【0033】図5の場合に、例えば「関連情報」と「既
知レコード」の2つの用語によって知識状態を分類する
と、以下のように分類される。第1の集団は「関連情
報」と「既知レコード」両方既知な集団であり、「C,
D,E,O」のユーザが含まれる。第2の集団は「関連
情報」は既知だが「既知レコード」は未知な集団であ
り、「G,I」のユーザが含まれる。第3の集団は「関
連情報」は未知だが「既知レコード」は既知な集団であ
り、「B,C,D,E,F,L,M,O」のユーザが含
まれる。第4の集団は「関連情報」と「既知レコード」
両方未知な集団であり、「A,H,J,K,N」のユー
ザが含まれる。In the case of FIG. 5, for example, when the knowledge states are classified by two terms of "related information" and "known record", they are classified as follows. The first group is a group in which both “related information” and “known record” are known, and “C,
D, E, O ”users are included. In the second group, the "related information" is known but the "known record" is an unknown group, and the users "G, I" are included. In the third group, the "related information" is unknown but the "known record" is a known group, and the users "B, C, D, E, F, L, M, O" are included. The fourth group is "related information" and "known records"
Both are unknown groups and include users “A, H, J, K, N”.
【0034】このような知識状態の分類が終了したら、
その分類によって作られた集団の知識状態間の平均距離
を計算する。ここで、集団を跨った距離は平均にカウン
トしない。つまり、同一集団内の利用者同士の知識状態
間の距離の平均値が求まる。これにより、距離の平均
が、取り出された用語によってどのぐらい似通った知識
状態の集団に分類されたかの指標になる。When the classification of knowledge states is completed,
Calculate the average distance between the knowledge states of the group created by the classification. Here, the distance across the group is not counted as an average. That is, the average value of the distances between the knowledge states of the users in the same group is obtained. Thus, the average of the distances serves as an index of how similar the knowledge states are to each other according to the extracted terms.
【0035】個々の知識状態間の距離は、既知を1、未
知を−1、既知レコードがない場合を0としたときの知
識状態間のユークリッド距離である。正確にいえば、用
語がm個存在し、ユーザAのi版目の用語の値がXi、
ユーザBのi版目の用語の値がYiであるとき、ユーザ
Aの知識状態とユーザBの知識状態の間の距離は、The distance between individual knowledge states is the Euclidean distance between knowledge states when the known value is 1, the unknown value is -1, and the known record is 0. To be precise, there are m terms, and the value of the term of the i-th edition of user A is Xi,
When the value of the term of the i-th edition of user B is Yi, the distance between the knowledge state of user A and the knowledge state of user B is
【0036】[0036]
【数1】 ((X1−Y1)2+... +( Xi−Yi)2+... +(Xm−Ym)2)1/2 ・・・・・(1) になる。## EQU1 ## ((X1-Y1) 2 + ... + (Xi-Yi) 2 + ... + (Xm-Ym) 2 ) 1/2 (1)
【0037】たとえば、図5におけるAとBの距離は、For example, the distance between A and B in FIG.
【0038】[0038]
【数2】 ((0−1)2+( 1−( −1))2 +... +( 0−( −1))2)1/2 =4.12 ・・・・・(2) である。[Number 2] ((0-1) 2 + (1- (-1)) 2 + ... + (0 (-1)) 2) 1/2 = 4.12 ..... (2 ) Is.
【0039】平均距離の計算が終了すると、リストが空
かどうかのチェックにもどる。リストが空の場合、平均
距離が最小な用語の組合せを分類の軸と決定し、処理が
終了する。平均距離が最小ということは、その用語によ
って分類されてできた集団は、最も似通った知識状態の
集まりであることを示している。When the calculation of the average distance is completed, the process returns to checking whether the list is empty. If the list is empty, the combination of terms with the smallest average distance is determined as the classification axis, and the process ends. The minimum mean distance indicates that the group formed by the term is the most similar group of knowledge states.
【0040】図6は用語の組合せごとに距離の平均を計
算した例を示す図である。図6の場合、「関連情報」と
「既知レコード」の2つの用語を分類軸とした場合が、
平均距離が2.54で最も小さい。したがって、この場
合は、分類軸として「関連情報」と「既知レコード」の
2つの用語を使うことに決定する。FIG. 6 is a diagram showing an example in which the average of distances is calculated for each combination of terms. In the case of FIG. 6, the two axes of “related information” and “known record” are used as classification axes.
The average distance is 2.54, which is the smallest. Therefore, in this case, it is decided to use the two terms “related information” and “known record” as the classification axis.
【0041】このようにして決定された分類軸を用い
て、分類部16cは、分類軸となる用語を利用者15が
知っているかどうか、利用者入出力i/f14を通して
利用者15に質問する。その質問に対する利用者15の
回答から、利用者が分類軸で規定される類の内のどれに
属するかが決定される。Using the classification axis determined in this way, the classification unit 16c asks the user 15 through the user input / output i / f 14 whether the user 15 knows the term to be the classification axis. . From the answer of the user 15 to the question, it is determined which one of the classes defined by the classification axis the user belongs to.
【0042】例えば、利用者15が分類部16cの発し
た質問に対して、「関連情報は知らないが、既知レコー
ドは知っている」と答えた場合、分類軸で分類された集
団のうちの第3の集団に分類されることになる。For example, when the user 15 replies to the question posed by the classification unit 16c, "I do not know related information, but I know a known record", among the groups classified by the classification axis. It will be classified into the third group.
【0043】典型例作成部16bでは、分類部で決定さ
れた類に属する知識状態の用語毎の平均をとる。例え
ば、第3の集団に分類されることが決定された場合、第
3の集団に属する知識状態の平均をとる。このとき、考
慮するのは知識状態に含まれる用語に関する定義情報の
既知度のみである。しかも、定義情報の既知レコードが
存在し、その既知度が15以上の場合は1、15より小
さい場合は−1、定義情報の既知レコードが存在しない
場合は0として計算する。In the typical example creating section 16b, the knowledge states belonging to the class determined by the classifying section are averaged for each term. For example, when it is decided to be classified into the third group, the knowledge states belonging to the third group are averaged. At this time, only the degree of knownness of the definition information regarding the terms included in the knowledge state is considered. In addition, the calculation is made as 1 when the known record of the definition information exists and the known degree thereof is 15 or more, -1 when the known degree is less than 15, and 0 when the known record of the definition information does not exist.
【0044】種々のユーザの知識の状態が図5のようで
あり、上記の第3の集団の知識状態の平均を計算する
と、「本体データ」の定義情報は0.5、「追加情報」
の定義情報は0、「関連情報」の定義情報は−0.5、
「知識状態」の定義情報は0.875、「知識状態管理
部」の定義情報は1、「追加情報抽出部」の定義情報は
0.25、「関連情報管理部」の定義情報は−0.2
5、「関連種」の定義情報は−0.5、「既知レコー
ド」の定義情報は1、「関連種属性」の定義情報は−
0.375となる。The states of knowledge of various users are as shown in FIG. 5, and when the average of the states of knowledge of the above-mentioned third group is calculated, the definition information of "main body data" is 0.5, and "additional information".
Definition information is 0, definition information of "related information" is -0.5,
The definition information of “knowledge state” is 0.875, the definition information of “knowledge state management unit” is 1, the definition information of “additional information extraction unit” is 0.25, and the definition information of “related information management unit” is −0. .2
5, definition information of “related species” is −0.5, definition information of “known record” is 1, definition information of “related species attribute” is −
It becomes 0.375.
【0045】これをみると、第3の集団の利用者は「本
体データ」「知識状態」「知識状態管理部」「追加情報
抽出部」「既知レコード」の用語は知っており、「関連
情報」「関連情報抽出部」「関連種」「関連種属性」の
用語は知らないという傾向にあることがわかる。これ
が、典型例になる。From this, the users of the third group know the terms "main data", "knowledge state", "knowledge state management section", "additional information extraction section", and "known record", and "related information". It can be seen that there is a tendency that the terms “related information extraction unit”, “related species”, and “related species attribute” are not known. This is a typical example.
【0046】典型例作成部16bでの典型例の作成が終
了すると、現在の知識状態管理部11の内容が消去され
たのち、典型例に基づいて、更新の指示が知識状態管理
部11に出される。上記の例では、「本体データ」「知
識状態」「知識状態管理部」「追加情報抽出部」「既知
レコード」の定義情報に対して既知モード、「関連情
報」「関連情報抽出部」「関連種」「関連種属性」の定
義情報に対して未知モードの更新が指示される。When the typical example creating unit 16b finishes creating the typical example, the current contents of the knowledge state managing unit 11 are erased, and then an update instruction is issued to the knowledge state managing unit 11 based on the typical example. Be done. In the above example, the known mode, “related information”, “related information extraction unit”, and “related information” are defined for the definition information of “body data”, “knowledge state”, “knowledge state management unit”, “additional information extraction unit”, and “known record”. The update of the unknown mode is instructed to the definition information of “seed” and “related seed attribute”.
【0047】以上のよにして、この文書管理装置を新た
に利用する利用者15の知識状態を作成することができ
る。この知識状態は、利用者15と似た知識を有する他
の利用者の知識状態に基づき作成されたため、利用者1
5の実際の知識状態に近いものが作成できる。As described above, the knowledge state of the user 15 who newly uses this document management apparatus can be created. Since this knowledge state is created based on the knowledge states of other users who have similar knowledge to the user 15, the user 1
It is possible to create a state close to the actual knowledge state of 5.
【0048】ところで、上記の例は、利用者15の知識
状態管理部11の内容を全て更新する場合であるが、す
でに蓄積された知識状態はそのままにしておき、他の知
識状態のみを更新することもできる。この場合、利用者
15から利用者入出力i/f14をとおして知識状態の
合成の指示を受け取た知識状態予測部16は、知識状態
の予測を行い、その結果を利用者15の知識状態管理部
11の現在の知識状態と合成する。By the way, in the above example, the contents of the knowledge state management unit 11 of the user 15 are all updated, but the already accumulated knowledge states are left as they are and only the other knowledge states are updated. You can also In this case, the knowledge state prediction unit 16 that has received the instruction to synthesize the knowledge state from the user 15 through the user input / output i / f 14 predicts the knowledge state and manages the result as the knowledge state management of the user 15. This is combined with the current knowledge state of the section 11.
【0049】図7は、知識状態の合成の際の処理の手順
をフローチャートで示したものである。まず、分類軸決
定部で分類の軸の決定が行われる(ステップS21)。
その処理内容は図3に示したものとほぼ同じであるが、
分類軸に使用される用語が、知識状態の予測の対象とな
る利用者の知識状態管理部内に定義情報の既知レコード
が存在するものに限られる。FIG. 7 is a flow chart showing the procedure of processing when synthesizing knowledge states. First, the classification axis determination unit determines the classification axis (step S21).
The processing content is almost the same as that shown in FIG.
The terms used for the classification axis are limited to those for which a known record of definition information exists in the knowledge state management unit of the user whose knowledge state is to be predicted.
【0050】たとえば、各ユーザの知識の状態が図5の
ようであった場合に、ユーザCの知識を予測する場合、
分類軸として「追加情報」や「関連情報」は利用できな
い。この場合、分類軸は、「関連種属性」と「既知レコ
ード」が利用される(図6によれば、「関連種属性」と
「既知レコード」による平均距離は2.67で、使用可
能な用語の組合せの中で最も小さい)。For example, when the knowledge state of each user is as shown in FIG. 5, when the knowledge of the user C is predicted,
"Additional information" and "related information" cannot be used as classification axes. In this case, as the classification axis, “related species attribute” and “known record” are used (according to FIG. 6, the average distance between “related species attribute” and “known record” is 2.67, which is usable. The smallest of the combinations of terms).
【0051】分類軸が決定されたら、分類部で分類先が
決定される(ステップS22)。分類先は、予測の対象
となる利用者の知識状態を参照して行われる。例えば、
各ユーザの知識の状態が図5、分類軸が「関連種属性」
と「既知レコード」で、ユーザCの知識状態を予測する
場合、ユーザCの知識状態管理部の内容が参照され、
「関連種属性」の定義情報の既知度と「既知レコード」
の定義情報の既知度で分類される。この場合、「関連種
属性」「既知レコード」両方を知っている類に属すると
決定される。When the classification axis is determined, the classification unit determines the classification destination (step S22). The classification destination is performed by referring to the knowledge state of the user who is the target of prediction. For example,
The state of knowledge of each user is shown in Fig. 5, and the classification axis is "related species attribute".
When predicting the knowledge state of the user C by using "and known record", the content of the knowledge state management unit of the user C is referred to,
Knownness of definition information of "related species attribute" and "known record"
Are classified according to the degree of knownness of the definition information. In this case, it is determined to belong to a class that knows both the “related species attribute” and the “known record”.
【0052】分類先が決定されたら、典型例作成部で該
分類先の集団の知識状態の典型例が作成される(ステッ
プS23)。手順は、知識状態の初期化の部分で説明し
たものと同じである。たとえば、上記の例で、「関連種
属性」「既知レコード」両方を知っている類には、
「C,E,F,L,M,O」のユーザの知識状態があ
る。この集団の典型例は、「本体データ」の定義情報は
0.5、「追加情報」の定義情報は0.33、「関連情
報」の定義情報は−0.5、「知識状態」の定義情報は
0.83、「知識状態管理部」の定義情報は1、「追加
情報抽出部」の定義情報は0.33、「関連情報管理
部」の定義情報は−0.33、「関連種」の定義情報は
−0.5、「既知レコード」の定義情報は1、「関連種
属性」の定義情報は0.83となる。When the classification destination is determined, the typical example creating unit creates a typical example of the knowledge state of the group of the classification destination (step S23). The procedure is the same as described in the initialization of knowledge state section. For example, in the above example, if you know both "related species attribute" and "known record",
There is a user knowledge state of “C, E, F, L, M, O”. Typical examples of this group are: definition information of "main data" is 0.5, definition information of "additional information" is 0.33, definition information of "related information" is -0.5, and definition of "knowledge state". The information is 0.83, the definition information of the “knowledge state management unit” is 1, the definition information of the “additional information extraction unit” is 0.33, the definition information of the “related information management unit” is −0.33, and the “related species”. The definition information of "" is -0.5, the definition information of "known record" is 1, and the definition information of "related species attribute" is 0.83.
【0053】典型例作成部16bでの典型例の作成が終
了すると、現在の知識状態と典型例が合成され(ステッ
プS24)、処理は終了する。合成は、現在の知識状態
に定義情報の既知レコードのない用語に対して、典型例
に従った既知レコードの更新をおこなうことになる。When the typical example creation unit 16b finishes creating the typical example, the current knowledge state and the typical example are combined (step S24), and the process ends. In the synthesis, the known record is updated according to a typical example for a term having no known record of the definition information in the current knowledge state.
【0054】上記の例の場合、ユーザCの知識状態にな
い、「追加情報」「関連情報」「追加情報抽出部」「関
連情報管理部」「関連種」の定義情報が更新される。上
記典型例に従い、「追加情報」「追加情報抽出部」の定
義情報の未知モードの更新と、「関連情報」「関連情報
管理部」「関連種」の既知モードの更新がユーザCの知
識状態管理部に指示される。In the case of the above example, the definition information of "additional information", "related information", "additional information extraction unit", "related information management unit", and "related species" which is not in the knowledge state of the user C is updated. According to the above-mentioned typical example, the update of the unknown mode of the definition information of "additional information" and "additional information extraction unit" and the update of the known mode of "related information""related information management unit""relatedspecies" are performed by the user C's knowledge state. Instructed by the management department.
【0055】このようにして、利用者15の知識状態が
作成された後は、利用者15が第1の文書を利用者入出
力i/f14から入力すると、その文書に関連情報が付
加された第2の文書が作成される。以下に、その処理機
能の詳細について説明する。After the knowledge state of the user 15 is created in this way, when the user 15 inputs the first document from the user input / output i / f 14, the relevant information is added to the document. A second document is created. The details of the processing function will be described below.
【0056】関連情報管理部40において、関連情報
は、情報本体を示す本体データと、本体データがどんな
種類の型のデータかを示すデータ型属性と、その情報が
何に関する情報かを示す文字列を格納するキー属性と、
キー部で指定された対象に対してどのような関連をもつ
情報かを示す関連種属性と、からなるデータとして管理
されている。本体データは、文字列あるいは各種図形な
どのデータ型のデータが格納されている。この例で利用
可能なデータ型は、文字列型、表型、幾何図形型、数式
型、イメージ型、そしてそれらの複合型である。本体デ
ータがどの型に属するかは、データ型属性に示されてい
る。In the related information management section 40, the related information includes body data indicating the information body, a data type attribute indicating what type of data the body data is, and a character string indicating what the information is about. A key attribute that stores
It is managed as data consisting of a related species attribute indicating what kind of relationship is related to the target specified by the key part. Data of a data type such as a character string or various figures is stored as the main body data. The data types that can be used in this example are string type, table type, geometric type, mathematical type, image type, and composite type thereof. The type to which the body data belongs is indicated by the data type attribute.
【0057】関連種属性には、関連情報がキー属性で示
された対象の定義であることを示す「定義情報」と、関
連情報がキー属性で示された対象の詳細であることを示
す「詳細情報」と、関連情報がキー属性で示された対象
に付随するものであることを示す「付帯情報」の3種の
値のうちのどれかが格納される。The related-species attribute includes "definition information" indicating that the related information is the definition of the target indicated by the key attribute, and "definition information" indicating that the related information is the details of the target indicated by the key attribute. Any one of three values of “detailed information” and “additional information” indicating that the related information is associated with the object indicated by the key attribute is stored.
【0058】そして、関連情報管理部40は、検索機能
を有している。この検索機能は、キー属性の値、関連種
属性の値とともに関連情報の取り出しが指定された場合
に、指定されたキー属性値、関連種属性値を持つ関連情
報を検索し、その関連情報が存在すれば取り出しを行
う。The related information management section 40 has a search function. This search function searches for related information that has the specified key attribute value and related seed attribute value when the extraction of the related information is specified along with the value of the key attribute and the value of the related seed attribute, and the related information is retrieved. If it exists, it is taken out.
【0059】図8は関連情報管理部に管理されている関
連情報の例を示す図である。関連情報は、キー属性4
1、関連種属性42、データ型属性43、本体データ4
4の項目により管理されている。この図では、6種類の
関連情報40a〜40fを示している。なお、この例に
示す関連情報は全て「文字列型」のデータ型属性であ
る。FIG. 8 is a diagram showing an example of the related information managed by the related information management unit. Related information is key attribute 4
1, related species attribute 42, data type attribute 43, body data 4
It is managed by 4 items. In this figure, six types of related information 40a-40f are shown. Note that all the related information shown in this example is a "character string type" data type attribute.
【0060】キー属性が「関連情報」である関連情報は
2種類あり、1つめの関連情報40aの関連種属性は
「定義情報」、2つめの関連情報40bの関連種属性は
「詳細情報」である。キー属性が「知識状態」である関
連情報は3種類あり、1つめの関連情報40cの関連種
属性は「定義情報」、2つめの関連情報40dの関連種
属性は「詳細情報」、3つめの関連情報40eの関連種
属性は「付帯情報」である。キー属性が「追加情報」で
ある関連情報は1種類あり、その関連情報40fの関連
種属性は「定義情報」である。There are two types of related information whose key attribute is "related information", the related type attribute of the first related information 40a is "definition information", and the related type attribute of the second related information 40b is "detailed information". Is. There are three types of related information whose key attribute is "knowledge state", the related type attribute of the first related information 40c is "definition information", the related type attribute of the second related information 40d is "detailed information", and the third type. The related species attribute of the related information 40e is “incidental information”. There is one type of related information whose key attribute is “additional information”, and the related species attribute of the related information 40f is “definition information”.
【0061】次に、図2に示す知識状態管理部11につ
いて説明する。知識状態管理部11では、ユーザが知っ
ている情報を表す既知レコードが管理されている。個々
の既知レコードは、ユーザが知っている情報のカテゴリ
と、ユーザがその情報のカテゴリの情報をどの程度知っ
ているかの度合を表す既知度(0から30の整数値)
と、からなる。Next, the knowledge state management unit 11 shown in FIG. 2 will be described. The knowledge state management unit 11 manages known records that represent information that the user knows. Each known record is a known degree (an integer value from 0 to 30) that represents the category of information that the user knows and the degree to which the user knows the information in that category of information.
And consisting of
【0062】この例における情報のカテゴリは、情報が
何に関するものであるかを示す文字列を保持しているキ
ー部と、キー部で指定された対象に対するどのような情
報かを示す関連種部と、からなる。関連種部には、情報
がキー属性で示された対象の定義であることを示す「定
義情報」と、情報がキー属性で示された対象の詳細であ
ることを示す「詳細情報」と、情報がキー属性で示され
た対象に付随するものであることを示す「付帯情報」の
3種の値のうちのどれかが格納される。The information category in this example is a key part that holds a character string indicating what the information is about, and a related seed part that indicates what kind of information the object designated by the key part is. And consists of. In the related seed part, "definition information" indicating that the information is the definition of the target indicated by the key attribute, and "detailed information" indicating that the information is the details of the target indicated by the key attribute, Any one of three values of “incidental information” indicating that the information is associated with the object indicated by the key attribute is stored.
【0063】知識状態管理部11は、知識状態の参照の
指示が文字列とともに入力されると、該文字列をキー部
に持つ既知レコードを出力する。なお、同じ文字列をキ
ー部に持つ既知レコードは関連種ごとに複数存在し得る
ため、指示された文字列に該当する既知レコードが複数
あれば、それら全てを出力する。When the instruction to refer to the knowledge state is input together with the character string, the knowledge state management unit 11 outputs a known record having the character string in the key portion. Since there may be a plurality of known records having the same character string in the key part for each related species, if there are a plurality of known records corresponding to the designated character string, all of them are output.
【0064】また、知識状態管理部11は、キーを表す
文字列、関連種の値、更新モード(「既知」、「未知」
のどちらか)とともに、知識状態の更新が指定されれ
ば、管理している既知レコードの登録/更新を行なう。
更新モードが既知であった場合、該キーを表す文字列、
関連種の値を持つ既知レコードが存在すれば、その既知
度を30にする。該当する既知レコードが存在しなけれ
ば、該キーを表す文字列、関連種の値を持つ既知レコー
ドを作り、その既知度を30にする。The knowledge status management unit 11 also uses the character string representing the key, the value of the related species, and the update mode (“known”, “unknown”).
If either of the two) is specified, the known record managed is registered / updated.
If the update mode is known, a character string representing the key,
If there is a known record having the value of the related species, the known degree is set to 30. If the corresponding known record does not exist, a known record having the character string representing the key and the value of the related species is created, and the known degree thereof is set to 30.
【0065】更新モードが未知であった場合、該キーを
表す文字列、関連種の値を持つ既知レコードが存在すれ
ば、その既知度を0にする。該当する既知レコードが存
在しなければ、該キーを表す文字列、関連種の値を持つ
既知レコードを作り、その既知度を0にする。When the update mode is unknown, if there is a known record having the character string representing the key and the value of the related species, the known degree thereof is set to 0. If the corresponding known record does not exist, a known record having the character string representing the key and the value of the related species is created, and the known degree thereof is set to 0.
【0066】さらに、知識状態管理部11は、管理して
いるすべての既知レコードの既知度の値を、24時間経
過ごとに−1する機能を含んでいる。これは、時間の経
過とともに忘却してしまう人間の特徴をシミュレートす
るためである。ただし、既知度が0であるものは、それ
以上減少しない。Further, the knowledge status management unit 11 includes a function of decreasing the knownness values of all known records managed by -1 every 24 hours. This is to simulate human characteristics that are forgotten over time. However, the degree of knownness of 0 does not decrease any further.
【0067】図9は知識状態管理部11で管理されてい
る既知レコードの例を示す図である。既知レコードは、
キー部111、関連種部112、既知度113の項目に
より管理されている。この図では、5種類の既知レコー
ド11a〜11eを示している。FIG. 9 is a diagram showing an example of known records managed by the knowledge status management unit 11. Known records are
The key section 111, the related seed section 112, and the known degree 113 are managed. In this figure, five types of known records 11a to 11e are shown.
【0068】キー部が「関連情報」である既知レコード
は2種類あり、1つめの既知レコード11aの関連種部
は「定義情報」、既知度は「20」であり、2つめの既
知レコード11bの関連種部は「詳細情報」、既知度は
「10」である。キー部が「知識状態」である既知レコ
ードは3種類あり、1つめの既知レコード11cの関連
種部は「定義情報」、既知度は「25」であり、2つめ
の既知レコード11dの関連種部は「詳細情報」、既知
度は「20」であり、3つめの既知レコード11eの関
連種属性は「付帯情報」、既知度は「0」である。There are two types of known records whose key part is "related information", the related seed part of the first known record 11a is "definition information", the degree of knownness is "20", and the second known record 11b. The related species part of is "detailed information", and the degree of knownness is "10". There are three types of known records whose key part is “knowledge state”, the related species part of the first known record 11c is “definition information”, the degree of known is “25”, and the related species of the second known record 11d. The part is "detailed information", the degree of knownness is "20", the related species attribute of the third known record 11e is "incidental information", and the degree of knownness is "0".
【0069】次に、追加情報抽出部12について説明す
る。図10は、第1の文書が追加情報抽出部に入力され
た場合の関連情報の抽出と知識状態の更新の手順を示し
たフローチャートである。Next, the additional information extraction unit 12 will be described. FIG. 10 is a flowchart showing a procedure of extracting related information and updating the knowledge state when the first document is input to the additional information extraction unit.
【0070】まず、専門用語抽出部12aで、利用者入
出力i/f14から入力された第1の文書を解析し、文
書中の専門的な意味を持つ名詞(以降、専門用語と呼
ぶ)のリストを作る(ステップS31)。そのために、
専門用語抽出部12aは、文書中の文を分類する形態素
解析部と、一般用語の名詞辞書を持っている。専門用語
抽出部12aは、形態素解析の結果抽出された名詞を一
般用語の名詞辞書で調べ、そこになかったものを専門用
語と判断する。First, the technical term extracting unit 12a analyzes the first document input from the user input / output i / f 14 to identify nouns (hereinafter referred to as technical terms) having a technical meaning in the document. Create a list (step S31). for that reason,
The technical term extraction unit 12a has a morphological analysis unit that classifies sentences in a document and a noun dictionary of general terms. The technical term extraction unit 12a examines the noun extracted as a result of the morphological analysis in the noun dictionary of general terms, and determines that the term that is not there is a technical term.
【0071】次に専門用語リストが空かどうかを調べる
(ステップS32)。空なら、第1の文書と関連情報の
リストを個別文書作成部に送って(ステップS33)、
処理が終了する。専門用語リストが空でなければ、リス
トから専門用語を一つ取り出す(ステップS34)。こ
のとき、取り出した専門用語はリストから削除する。Next, it is checked whether the technical term list is empty (step S32). If it is empty, the first document and the list of related information are sent to the individual document creation unit (step S33),
The process ends. If the technical term list is not empty, one technical term is extracted from the list (step S34). At this time, the extracted technical term is deleted from the list.
【0072】次に、取得した用語に対して、条件絞り込
み部で利用者が第1の文書を理解するために必要な情報
の関連種の決定を行う(ステップS35)。関連種の決
定の結果、利用者に必要な関連情報があるか否かを判断
する(ステップS36)。関連種の決定の結果、利用者
にはどの関連種の情報も必要ないと決定されれば、専門
用語リストのチェック(ステップS32)にもどる。Next, with respect to the acquired term, the condition narrowing unit determines the related species of information necessary for the user to understand the first document (step S35). As a result of the determination of the related species, it is determined whether the user has the necessary related information (step S36). If it is determined that the user does not need information of any related species as a result of the determination of the related species, the process returns to the check of the technical term list (step S32).
【0073】利用者には定義情報が必要であると決定さ
れた場合には、後述する定義情報が必要な場合の処理を
行い(ステップS37)、専門用語リストのチェック
(ステップS32)にもどる。利用者には詳細情報が必
要であると決定された場合には、後述する詳細情報が必
要な場合の処理を行い(ステップS38)、専門用語リ
ストのチェック(ステップS32)にもどる。利用者に
は付帯情報が必要であると決定された場合には、後述す
る付帯情報が必要な場合の処理を行い(ステップS3
9)、専門用語リストのチェック(ステップS32)に
もどる。When it is determined that the user needs the definition information, the processing for the case where the definition information is necessary, which will be described later, is performed (step S37), and the process returns to the check of the technical term list (step S32). When it is determined that the user needs the detailed information, the processing for the detailed information described later is performed (step S38), and the process returns to the check of the technical term list (step S32). When it is determined that the user needs the supplementary information, the processing for the case where the supplementary information is necessary is performed (step S3).
9) Return to the check of the technical term list (step S32).
【0074】図11は、条件絞り込み部で行われる関連
種の決定(ステップS35)の手順をフローチャートで
示したものである。関連種の決定処理では、まず、取り
出した専門用語とともに知識状態の参照の指示が知識状
態管理部に送られ、該専門用語をキー部に持つ既知レコ
ードを取り出す(ステップS41)。既知レコードがあ
るか否かを判断し(ステップS42)、知識状態管理部
内に既知レコードが存在しなければ、その専門用語に関
するすべての情報が利用者にとって既知であり、どの関
連種の情報も必要ないと決定し(ステップS49)、終
了する。FIG. 11 is a flowchart showing the procedure of determining the related species (step S35) performed by the condition narrowing unit. In the related species determination process, first, an instruction to refer to the knowledge state is sent to the knowledge state management unit together with the extracted technical term, and a known record having the technical term in the key section is extracted (step S41). It is determined whether or not there is a known record (step S42), and if there is no known record in the knowledge state management unit, all information on the technical term is known to the user, and information on any related species is required. It is determined that there is not (step S49), and the process ends.
【0075】既知レコードが取り出せた場合、該既知レ
コードの内、関連種部の値が「定義情報」であるレコー
ドの既知度を調べる(ステップS43)。ここで、既知
度が15以下であった場合、利用者にとって定義情報が
必要であると決定し(ステップS44)、終了する。When the known record can be extracted, the known degree of the record of which the value of the related seed portion is "definition information" is checked (step S43). Here, when the known degree is 15 or less, it is determined that the user needs the definition information (step S44), and the process ends.
【0076】関連種部の値が「定義情報」であるレコー
ドの既知度が15より大きい場合、その専門用語の定義
情報は利用者にとって既知であると判断し、取り出した
既知レコードの内の関連種部の値が「詳細情報」である
レコードの既知度を調べる(ステップS45)。ここ
で、既知度が15以下であった場合、利用者にとって詳
細情報が必要であると決定し(ステップS46)、終了
する。When the degree of knownness of the record whose related seed part value is "definition information" is larger than 15, it is judged that the definition information of the technical term is known to the user, and the relation among the extracted known records is extracted. The degree of knownness of the record whose seed part value is "detailed information" is checked (step S45). Here, if the known degree is 15 or less, it is determined that the user needs detailed information (step S46), and the process ends.
【0077】関連種部の値が「詳細情報」であるレコー
ドの既知度が15より大きい場合、その専門用語の詳細
情報は利用者にとって既知であると判断し、取り出した
既知レコードの内の関連種部の値が「付帯情報」である
レコードの既知度を調べる(ステップS47)。ここ
で、既知度が15以下であった場合、利用者にとって付
帯情報が必要であると決定し(ステップS48)、終了
する。When the degree of knownness of the record whose related seed portion value is "detailed information" is greater than 15, it is determined that the detailed information of the technical term is known to the user, and the relation among the known records extracted is determined. The degree of knownness of the record in which the value of the seed portion is “additional information” is checked (step S47). Here, when the known degree is 15 or less, it is determined that the user needs the supplementary information (step S48), and the process ends.
【0078】関連種部の値が「付帯情報」であるレコー
ドの既知度が15より大きい場合、その専門用語に関す
るすべての情報が利用者にとって既知であり、どの関連
種の情報も必要ないと決定し(ステップS49)、終了
する。When the degree of knownness of the record in which the value of the related species part is “incidental information” is greater than 15, it is determined that all the information related to the technical term is known to the user and the information of any related species is unnecessary. Then (step S49), the process ends.
【0079】図12は、定義情報が必要な場合の処理
(ステップS37)の手順を示したフローチャートであ
る。まず、該専門用語をキー属性値とし、関連種属性値
が「定義情報」である関連情報の取り出しが関連情報管
理部に指示される(ステップS51)。ここで、定義情
報が存在したか否かを判断する(ステップS52)。関
連情報の取り出しに失敗した場合、利用者は該専門用語
について未知のままであるので、該専門用語をキーと
し、関連種を「定義情報」、更新モードを「未知」とし
た知識状態の更新の指示が知識状態管理部に対して行な
われる。その結果、定義情報の既知度が0に更新される
(ステップS53)。FIG. 12 is a flow chart showing the procedure of the process (step S37) when definition information is required. First, the technical term is used as a key attribute value, and the related information management unit is instructed to retrieve the related information whose related seed attribute value is "definition information" (step S51). Here, it is determined whether or not the definition information exists (step S52). When the retrieval of the related information fails, the user remains unknown about the technical term, and the technical term is used as a key, and the knowledge state is updated with the related species as “definition information” and the update mode as “unknown”. Is issued to the knowledge state management unit. As a result, the degree of knownness of the definition information is updated to 0 (step S53).
【0080】関連情報の取り出しに成功した場合、該関
連情報を関連情報リストに追加(ステップS54)した
後、該専門用語をキーとし、関連種を「定義情報」、更
新モードを「既知」とした知識状態の更新の指示が知識
状態管理部に対して行なわれる。つまり、定義情報は利
用者に対して提示されることになるので、「既知」にな
るのである。その結果、定義情報の既知度が30に更新
される(ステップS55)。When the extraction of the related information is successful, after adding the related information to the related information list (step S54), the related term is defined as "definition information" and the update mode is set as "known" using the technical term as a key. The knowledge state management unit is instructed to update the knowledge state. That is, since the definition information is presented to the user, it becomes “known”. As a result, the degree of knownness of the definition information is updated to 30 (step S55).
【0081】詳細情報が必要な場合、付帯情報が必要な
場合の処理も、図12のフローチャートと同様の手順で
ある。ただし、「定義情報」の部分が、それぞれ、「詳
細情報」、「付帯情報」になる。The process when the detailed information is required and the incidental information is required is the same procedure as the flowchart of FIG. However, the "definition information" portion becomes "detailed information" and "incidental information", respectively.
【0082】次に、個別文書作成部13について説明す
る。個別文書作成部13は、追加情報抽出部12から第
1の文書と後述する関連情報リストを受けとり、第1の
文書の適当な位置に、関連情報を追加することによっ
て、第2の文書を生成する。Next, the individual document creating section 13 will be described. The individual document creation unit 13 receives the first document and the related information list described below from the additional information extraction unit 12, and adds the related information to an appropriate position of the first document to generate the second document. To do.
【0083】図13は、個別文書作成部での第2の文書
作成の手順を示したフローチャートである。最初に、関
連情報リストが空かどうかが調べられる(ステップS6
1)。関連情報リストが空であれば、第2の文書は完成
であり、処理は終了する。関連情報リストが空でなけれ
ば、関連情報がリストから取り出される(ステップS6
2)。このとき、とりだされた関連情報はリストから削
除される。FIG. 13 is a flow chart showing the procedure for creating the second document in the individual document creating section. First, it is checked whether the related information list is empty (step S6).
1). If the related information list is empty, the second document is complete and the process ends. If the related information list is not empty, the related information is retrieved from the list (step S6).
2). At this time, the retrieved related information is deleted from the list.
【0084】次に、第1の文書の中で、関連情報のキー
属性の値と同じ文字列が出現する位置(正確には、マッ
チした文字列の再後尾の位置)を調べる(ステップS6
3)。該当する文字列が複数ある場合、最初に出現した
位置が採用される。Next, in the first document, the position where the same character string as the value of the key attribute of the related information appears (more precisely, the position of the tail end of the matched character string) is checked (step S6).
3). When there are multiple corresponding character strings, the position that appears first is adopted.
【0085】次に、関連情報のデータ型属性を調べる
(ステップS64)。データ型属性の値が文字列型でな
ければ、関連情報の本体データを前記文字列の位置の注
釈とする(ステップS68)。Next, the data type attribute of the related information is checked (step S64). If the value of the data type attribute is not the character string type, the body data of the related information is used as the annotation of the position of the character string (step S68).
【0086】データ型属性の値が文字列であれば、関連
情報の関連種属性の値が調べられる(ステップS6
5)。関連種属性の値が「定義情報」であった場合、本
体データの内容を括弧でくくり、ステップS63で検出
した位置に置き(ステップS67)、関連情報リストの
チェック(ステップS61)に戻る。If the value of the data type attribute is a character string, the value of the related species attribute of the related information is checked (step S6).
5). If the value of the related species attribute is "definition information", the contents of the main body data are put in parentheses, placed at the position detected in step S63 (step S67), and the process returns to the related information list check (step S61).
【0087】関連種属性の値が「詳細情報」であった場
合、本体データの長さが調べられる(ステップS6
6)。本体データの長さが20文字以下であった場合、
本体データの内容を括弧でくくり、ステップS63で検
出した位置に置き(ステップS67)、関連情報リスト
のチェック(ステップS61)に戻る。本体データの長
さが20文字より多かった場合、本体データを前記位置
の注釈とし(ステップS68)、関連情報リストのチェ
ック(ステップS61)に戻る。If the value of the related species attribute is "detailed information", the length of the body data is checked (step S6).
6). If the length of the body data is 20 characters or less,
The contents of the body data are put in parentheses, placed at the position detected in step S63 (step S67), and the process returns to the check of the related information list (step S61). When the length of the body data is more than 20 characters, the body data is used as the annotation of the position (step S68), and the process returns to the check of the related information list (step S61).
【0088】関連種属性の値が「付帯情報」であった場
合、本体データをステップS63で検出した位置の注釈
とし(ステップS68)、関連情報リストのチェック
(ステップS61)に戻る。When the value of the related species attribute is "incidental information", the body data is used as the annotation of the position detected in step S63 (step S68), and the process returns to the related information list check (step S61).
【0089】なお、この例の注釈処理(ステップS6
8)では、注釈を置く位置に注記号を置き、文書の後尾
に、該注記号とともに関連情報を置き、関連情報リスト
のチェックに戻る。The annotation process of this example (step S6)
In 8), a note symbol is placed at the position where the annotation is placed, relevant information is placed at the tail of the document together with the note symbol, and the process returns to the check of the relevant information list.
【0090】ここで、以上のような文書処理装置の追加
情報抽出部12に第1の文書が入力された場合の各種情
報の変化の様子について説明する。図14は利用者入出
力i/fから送られる第1の文書50を示す図である。
このような第1の文書が入力されると、専門用語リスト
の作成処理により、専門用語リストが作成される。図1
5は作成された専門用語リスト51を示す図である。そ
して、この専門用語リスト51は空でないため、最初の
専門用語「関連情報」が取り出される。ここで、関連情
報管理部40には図8に示す関連情報が管理されてお
り、知識状態管理部11には図9に示す知識状態が管理
されているものとする。Here, how the various information changes when the first document is input to the additional information extraction unit 12 of the document processing apparatus as described above will be described. FIG. 14 is a diagram showing the first document 50 sent from the user input / output i / f.
When such a first document is input, a technical term list is created by the technical term list creation processing. FIG.
5 is a diagram showing the created technical term list 51. Since this technical term list 51 is not empty, the first technical term "related information" is extracted. Here, it is assumed that the related information management unit 40 manages the related information shown in FIG. 8 and the knowledge state management unit 11 manages the knowledge state shown in FIG.
【0091】次に、「関連情報」をキー部に持つ既知レ
コードが取り出される。この場合、図9に示した既知レ
コードから、「関連情報」をキー部に持つ既知レコード
11a,11bが取り出される。図16は取り出された
2つの既知レコード11a,11bを示す図である。取
り出された既知レコードの内、関連種部の値が「定義情
報」である既知レコード11aの既知度は15より大き
く、関連種部の値が「詳細情報」である既知レコード1
1bの既知度は15以下であるので、利用者に必要なの
は、用語「関連情報」の「詳細情報」であると決定され
る。Next, a known record having "related information" in the key part is taken out. In this case, known records 11a and 11b having "related information" in the key part are extracted from the known records shown in FIG. FIG. 16 is a diagram showing the two known records 11a and 11b that have been taken out. Of the retrieved known records, the known degree of the known record 11a whose related seed part value is "definition information" is greater than 15, and the known record 1 whose related seed part value is "detailed information".
Since the known degree of 1b is 15 or less, it is determined that the user needs “detailed information” of the term “related information”.
【0092】そして、キー属性値が「関連情報」、関連
種属性値が「詳細情報」である関連情報の取り出しが関
連情報管理部に指示される。すると、図8に示した関連
情報からキー属性値が「関連情報」、関連種属性値が
「詳細情報」である関連情報がと取り出される。図17
は取り出された関連情報40bを示す図である。Then, the related information management unit is instructed to take out the related information whose key attribute value is “related information” and related seed attribute value is “detailed information”. Then, the related information whose key attribute value is “related information” and related species attribute value is “detailed information” is extracted from the related information shown in FIG. FIG.
FIG. 8 is a diagram showing the extracted related information 40b.
【0093】図17に示す関連情報40bを関連情報リ
ストに追加した後、「関連情報」をキーとし、関連種を
「詳細情報」、更新モードを「既知」とした知識状態の
更新の指示が知識状態管理部に対して行なわれる。そし
て、専門用語リストのチェックに処理が戻る。After adding the related information 40b shown in FIG. 17 to the related information list, an instruction to update the knowledge state with "related information" as a key, related species as "detailed information" and update mode as "known" is given. This is performed for the knowledge status management unit. Then, the process returns to the check of the technical term list.
【0094】このような処理が専門用語リスト内の全て
の専門用語に対して行われる。その結果、関連情報リス
トが完成する。図18は作成された関連情報リスト52
を示す図である。図18では、キー属性が「関連情
報」、関連種属性が「詳細情報」である関連情報40b
と、キー属性が「知識状態」、関連種属性が「付帯情
報」である関連情報40eとが登録されている。この
時、知識状態管理部で管理されている知識状態が更新さ
れる。図19は更新された知識状態を示す図である。図
19は図9の知識状態から更新されたものである。更新
されたのは、キー部が「関連情報」、関連種部が「詳細
情報」である既知レコード11fと、キー部が「知識状
態」、関連種部が「付帯情報」である既知レコード11
gである。既知レコード11fは、既知度が10から3
0に変更されている。既知レコード11gは、既知度が
0から30に変更されている。このように、随時既知レ
コードの値が更新されることにより、利用者15の知識
状態がシミュレートされている。Such processing is performed for all the technical terms in the technical term list. As a result, the related information list is completed. FIG. 18 shows the created related information list 52.
FIG. In FIG. 18, the related information 40b whose key attribute is "related information" and related species attribute is "detailed information"
And the related information 40e whose key attribute is "knowledge state" and related species attribute is "incidental information" are registered. At this time, the knowledge status managed by the knowledge status management unit is updated. FIG. 19 is a diagram showing the updated knowledge state. FIG. 19 is updated from the knowledge state of FIG. What is updated is a known record 11f in which the key part is "related information" and the related seed part is "detailed information", and a known record 11 in which the key part is "knowledge state" and the related seed part is "incidental information".
g. The known record 11f has a known degree of 10 to 3
It has been changed to 0. The known degree of the known record 11g is changed from 0 to 30. Thus, the knowledge state of the user 15 is simulated by updating the value of the known record at any time.
【0095】図20は第2の文書を示す図である。これ
は、第1の文書50が図14に示すものであり、関連情
報リスト52が図18のようであった場合に、個別文書
作成部13で作成された第2の文書53である。アンダ
ーラインのついた部分が第1の文書に追加された部分で
ある。FIG. 20 shows the second document. This is the second document 53 created by the individual document creating unit 13 when the first document 50 is as shown in FIG. 14 and the related information list 52 is as shown in FIG. The underlined part is the part added to the first document.
【0096】以上のようにして、利用者の知識の状態は
知識状態管理手段でシミュレートされており、知識状態
管理手段に管理されている複数の利用者の知識の状態か
ら、予測の対象となる利用者の知識の状態を予測するこ
とができる。そして、この予測結果を、予測の対象とな
る利用者の知識状態の初期設定や充実に利用することが
できる。しかも、上記の例で示したような文書処理装置
は、特定の組織で利用される場合が多く、知識状態管理
手段に知識状態を管理されている複数の利用者は、比較
的似かよった知識の状態を持つことが多いと予想され
る。従って、利用者はシステム使用開始直後から、知識
状態管理手段に自分の実際の知識状態に近い知識状態を
実現できる。As described above, the knowledge state of the user is simulated by the knowledge state managing means, and the knowledge state of the plurality of users managed by the knowledge state managing means is used as a prediction target. The state of knowledge of different users can be predicted. Then, this prediction result can be used for initial setting and enhancement of the knowledge state of the user who is the target of prediction. Moreover, the document processing apparatus as shown in the above example is often used in a specific organization, and a plurality of users whose knowledge states are managed by the knowledge state management unit have relatively similar knowledge. It is expected to have many states. Therefore, the user can realize the knowledge state close to his / her own knowledge state in the knowledge state management means immediately after the system is started to be used.
【0097】また、知識状態管理手段に管理されている
複数の利用者の知識の状態から、多くの状態において似
た傾向を持つ状態の集団に分類する分類軸を取り出し、
その分類軸により各利用者を分類した結果、予測対象で
ある利用者と同じ類に分類された集団から予測の対象と
なる利用者の知識の状態を予測するようにした。これに
より、この予測結果をより正確なものとすることがで
き、予測の対象となる利用者の知識状態の初期設定や充
実に利用することができる。つまり、文書処理装置は特
定の組織で利用される場合が多く、そこで必要な知識、
あるいは組織のメンバの構成は、組織毎に異なる。この
ような場合に、知識状態管理手段に管理されている複数
の利用者の知識状態から、組織のメンバの知識の状態の
タイプ分けをし、それを知識状態の予測に使うことは、
利用者の知識の状態の予測に有効である。従って、利用
者はシステム使用開始直後から、知識状態管理手段に自
分の実際の知識状態に近い知識状態を実現できる。From the knowledge states of a plurality of users managed by the knowledge state management means, a classification axis for classifying into a group of states having similar tendencies in many states is extracted,
As a result of classifying each user according to the classification axis, the state of knowledge of the user to be predicted is predicted from the group classified into the same class as the user to be predicted. As a result, this prediction result can be made more accurate, and can be used for initial setting and enhancement of the knowledge state of the user who is the target of prediction. In other words, the document processing device is often used in a specific organization,
Alternatively, the composition of the members of the organization differs from organization to organization. In such a case, it is necessary to classify the knowledge states of the members of the organization into the types of knowledge states from the knowledge states of a plurality of users managed by the knowledge state management means, and use it to predict the knowledge state.
It is effective in predicting the state of knowledge of the user. Therefore, the user can realize the knowledge state close to his / her own knowledge state in the knowledge state management means immediately after the system is started to be used.
【0098】[0098]
【発明の効果】以上説明したように本発明では、分類軸
となる用語を定め、その用語により他の利用者と予測対
象者とを複数の集団に分類し、予測対象者が属する集団
内の他の利用者の知識状態に基づき、予測対象者の知識
状態を予測するようにしたため、その予測結果は、予測
対象者の実際の知識状態と近いものとなる。その結果、
予測対象者は、自己の知識状態を利用した各種文書処理
機能を、使用開始直後から有効に利用することが可能と
なる。As described above, according to the present invention, a term to be a classification axis is defined, other users and prediction target persons are classified into a plurality of groups according to the terms, and the classification target group within the group to which the prediction target person belongs is classified. Since the knowledge state of the prediction target person is predicted based on the knowledge state of other users, the prediction result is close to the actual knowledge state of the prediction target person. as a result,
The prediction target person can effectively use various document processing functions using his / her knowledge state immediately after the start of use.
【図1】本発明の原理構成図である。FIG. 1 is a principle configuration diagram of the present invention.
【図2】本発明を実施するための文書処理装置の具体例
を示す構成図である。FIG. 2 is a configuration diagram showing a specific example of a document processing apparatus for carrying out the present invention.
【図3】知識状態の初期化の際の処理手順を示すフロー
チャートである。FIG. 3 is a flowchart showing a processing procedure when initializing a knowledge state.
【図4】分類軸決定部で行われる、分類軸の決定の処理
の手順を示すフローチャートでである。FIG. 4 is a flowchart showing a procedure of a process of determining a classification axis performed by a classification axis determining unit.
【図5】知識状態予測部から参照可能なユーザの知識状
態の例を示した図である。FIG. 5 is a diagram showing an example of a user's knowledge state that can be referred to from a knowledge state prediction unit.
【図6】用語の組合せごとに距離の平均を計算した例を
示す図である。FIG. 6 is a diagram showing an example in which an average of distances is calculated for each combination of terms.
【図7】知識状態の合成の際の処理の手順をフローチャ
ートで示したものである。FIG. 7 is a flowchart showing a procedure of processing when synthesizing knowledge states.
【図8】関連情報管理部に管理されている関連情報の例
を示す図である。FIG. 8 is a diagram showing an example of related information managed by a related information management unit.
【図9】知識状態管理部で管理されている既知レコード
の例を示す図である。FIG. 9 is a diagram showing an example of known records managed by a knowledge state management unit.
【図10】第1の文書が追加情報抽出部に入力された場
合の関連情報の抽出と知識状態の更新の手順を示したフ
ローチャートである。FIG. 10 is a flowchart showing a procedure of extracting related information and updating a knowledge state when the first document is input to the additional information extraction unit.
【図11】条件絞り込み部で行われる関連種の決定の手
順をフローチャートで示したものである。FIG. 11 is a flowchart showing a procedure for determining a related species performed by a condition narrowing unit.
【図12】定義情報が必要な場合の処理の手順を示した
フローチャートである。FIG. 12 is a flowchart showing a procedure of processing when definition information is required.
【図13】個別文書作成部での第2の文書作成の手順を
示したフローチャートである。FIG. 13 is a flowchart showing a procedure for creating a second document in the individual document creating unit.
【図14】利用者入出力から送られる第1の文書を示す
図である。FIG. 14 is a diagram showing a first document sent from user input / output.
【図15】作成された専門用語リストを示す図である。FIG. 15 is a diagram showing a created technical term list.
【図16】取り出された2つの既知レコードを示す図で
ある。FIG. 16 is a diagram showing two known records retrieved.
【図17】取り出された関連情報を示す図である。FIG. 17 is a diagram showing extracted related information.
【図18】作成された関連情報リストを示す図である。FIG. 18 is a diagram showing a created related information list.
【図19】更新された知識状態を示す図である。FIG. 19 is a diagram showing an updated knowledge state.
【図20】第2の文書を示す図である。FIG. 20 is a diagram showing a second document.
1a,1b,1c 知識状態管理手段 2 分類軸決定手段 3 分類手段 4 典型例作成手段 5 知識状態管理手段 11 知識状態管理部 12 追加情報抽出部 13 個別文書作成部 14 利用者入出力i/f 15 利用者 16 知識状態予測部 16a 分類軸決定部 16b 典型例作成部 16c 分類部 21 関連情報入出力i/f 22 関連情報作成者 31,32 知識状態管理部 40 関連情報管理部 1a, 1b, 1c Knowledge status management means 2 Classification axis determination means 3 Classification means 4 Typical example creation means 5 Knowledge status management means 11 Knowledge status management part 12 Additional information extraction part 13 Individual document creation part 14 User input / output i / f 15 user 16 knowledge state prediction unit 16a classification axis determination unit 16b typical example creation unit 16c classification unit 21 related information input / output i / f 22 related information creator 31, 32 knowledge state management unit 40 related information management unit
Claims (4)
処理装置において、 複数の利用者の知識状態を参照し、利用者を複数の集団
に分類するための分類軸となる用語を決定する分類軸決
定手段と、 前記分類軸となる用語に対する予測対象者の知識状態か
ら、前記予測対象者の属する集団を決定する分類手段
と、 前記予測対象者と同じ集団内の他の利用者の知識状態に
基づき、前記予測対象者の知識状態の典型例を作成し、
前記典型例を前記予測対象者の知識状態へ反映する典型
例作成手段と、 を有することを特徴とする文書処理装置。1. A document processing device that manages the knowledge status of each user, refers to the knowledge status of a plurality of users, and determines a term as a classification axis for classifying the users into a plurality of groups. A classification axis determining unit, a classifying unit that determines a group to which the prediction target person belongs from the knowledge state of the prediction target person with respect to the term to be the classification axis, and another user in the same group as the prediction target person. Based on the knowledge state, create a typical example of the knowledge state of the prediction target person,
A document processing apparatus comprising: a typical example creating unit that reflects the typical example in the knowledge state of the prediction target person.
用者同士の知識状態の乖離の程度が小さくなるような用
語を、前記分類軸として決定することを特徴とする請求
項1記載の文書処理装置。2. The classification axis deciding means decides, as the classification axis, a term such that the degree of deviation of knowledge states between users in the same group is small. Document processing device.
のまま前記予測対象者の知識状態とすることにより、前
記典型例を前記予測対象者の知識状態へ反映させること
を特徴とする請求項1記載の文書処理装置。3. The typical example creating means sets the typical example as it is to the knowledge state of the prediction target person, thereby reflecting the typical example in the knowledge state of the prediction target person. 1. The document processing device according to 1.
されていない用語の知識状態を前記典型例を用いて設定
することにより、前記典型例を前記予測対象者の知識状
態へ反映させることを特徴とする請求項1記載の文書処
理装置。4. The typical example creating means reflects the typical example on the knowledge state of the prediction target person by setting the knowledge state of a term for which the knowledge state is not set, by using the typical example. The document processing apparatus according to claim 1, wherein:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01553596A JP3580004B2 (en) | 1996-01-31 | 1996-01-31 | Document processing apparatus and document processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01553596A JP3580004B2 (en) | 1996-01-31 | 1996-01-31 | Document processing apparatus and document processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09212492A true JPH09212492A (en) | 1997-08-15 |
JP3580004B2 JP3580004B2 (en) | 2004-10-20 |
Family
ID=11891510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01553596A Expired - Fee Related JP3580004B2 (en) | 1996-01-31 | 1996-01-31 | Document processing apparatus and document processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3580004B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9020863B2 (en) | 2011-10-26 | 2015-04-28 | Sony Corporation | Information processing device, information processing method, and program |
-
1996
- 1996-01-31 JP JP01553596A patent/JP3580004B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9020863B2 (en) | 2011-10-26 | 2015-04-28 | Sony Corporation | Information processing device, information processing method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP3580004B2 (en) | 2004-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5802504A (en) | Text preparing system using knowledge base and method therefor | |
US6415283B1 (en) | Methods and apparatus for determining focal points of clusters in a tree structure | |
US6792418B1 (en) | File or database manager systems based on a fractal hierarchical index structure | |
JP5376163B2 (en) | Document management / retrieval system and document management / retrieval method | |
JP4647336B2 (en) | Method and system for ranking words and concepts in text using graph-based ranking | |
US6826567B2 (en) | Registration method and search method for structured documents | |
US20050108200A1 (en) | Category based, extensible and interactive system for document retrieval | |
US20070106499A1 (en) | Natural language search system | |
JP2000511671A (en) | Automatic document classification system | |
CA2144255A1 (en) | Training apparatus and method | |
US20100094855A1 (en) | System for transforming queries using object identification | |
US7325010B1 (en) | Information modeling method and database searching method using the information modeling method | |
KR100378240B1 (en) | Method for re-adjusting ranking of document to use user's profile and entropy | |
JP3315781B2 (en) | User information management device, information filter, information classification device, information reproduction device, information search device, and kana-kanji conversion device | |
EP1041499A1 (en) | File or database manager and systems based thereon | |
JP3580004B2 (en) | Document processing apparatus and document processing method | |
JP3752717B2 (en) | Document processing device | |
US5715442A (en) | Data unit group handling apparatus | |
JP2786118B2 (en) | Semantic knowledge acquisition device | |
Wen | Text mining using HMM and PMM | |
JP3428272B2 (en) | Document processing device | |
KR100431190B1 (en) | A system and method for tagging topic adoptive pos(part-of-speech) | |
JP3526198B2 (en) | Database similarity search method and apparatus, and storage medium storing similarity search program | |
JP3088805B2 (en) | Document management device | |
RU2266560C1 (en) | Method utilized to search for information in poly-topic arrays of unorganized texts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040629 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040712 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080730 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090730 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100730 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |