JPH09204418A - Document processor - Google Patents

Document processor

Info

Publication number
JPH09204418A
JPH09204418A JP8012868A JP1286896A JPH09204418A JP H09204418 A JPH09204418 A JP H09204418A JP 8012868 A JP8012868 A JP 8012868A JP 1286896 A JP1286896 A JP 1286896A JP H09204418 A JPH09204418 A JP H09204418A
Authority
JP
Japan
Prior art keywords
information
document
user
related information
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8012868A
Other languages
Japanese (ja)
Other versions
JP3752717B2 (en
Inventor
Hitoki Kiyoujima
仁樹 京嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP01286896A priority Critical patent/JP3752717B2/en
Publication of JPH09204418A publication Critical patent/JPH09204418A/en
Application granted granted Critical
Publication of JP3752717B2 publication Critical patent/JP3752717B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To convert a document for sufficiently obtaining effect that can help the understanding of a user. SOLUTION: A knowledge state management means 1 manages the understanding of the user on relation information for the respective relation types of plural words by a known record 1a. A relation information management means 2 manages relation information 2a required for helping the understanding of the user on the words. A word extraction means 4 extract the word 4a from an inputted original document 3. An information extraction means 5 acquires the understanding of the user on the word 4a which the word extraction means 4 extracts from the knowledge state management means 1 and extracts relation information from the relation information management means 2 in accordance with the understanding. A document generation means 6 adds relation information which the information extraction means 5 extracts to the original document 3 and generates the individual document 3a for supplying it to the user.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は既存の文書を理解し
やすいように変更する文書処理装置に関し、特に利用者
の理解度に応じて文書の変更を行う文書処理装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document processing apparatus for modifying an existing document so that it can be easily understood, and more particularly to a document processing apparatus for modifying a document according to the degree of understanding of a user.

【0002】[0002]

【従来の技術】人間の情報伝達において文書が果たす役
割は大きい。人間の知的活動の結果を保存して、後の他
の人間の用に供するための手段として、文書の形にして
おくのはもっともポピュラーな手段である。また、日々
のコミュニケーションにおいても、昨今は電子メールと
いう電子的な文書を利用して行われる事が多い。文書に
よる情報伝達の問題のうちで大きなものに、文書の作成
者が持つ知識と、文書の利用者が持つ知識との間の違い
がもたらす、ミスコミュニケーションや、文書作成者利
用者相互にかかる負荷の増大がある。
2. Description of the Related Art Documents play a large role in human information transmission. It is the most popular means to preserve the results of human intellectual activity and to keep it in the form of documents for later use by other humans. Also, in daily communication, electronic documents such as electronic mail are often used these days. One of the biggest problems of information transmission by documents is the miscommunication caused by the difference between the knowledge of the creator of the document and the knowledge of the user of the document, and the burden on the creators of the documents. There is an increase in

【0003】文書の利用者が文書を読む場合に、文書中
にある専門用語の定義や関連する情報を知らず、文書の
内容を充分に理解できないことは頻繁に起こる。その結
果、文書の内容についての価値を正確に判断できず、重
要な情報を見逃してしまうことは多い。また、文書の内
容を誤解し、その後の行動に支障をきたす事もある。こ
のようなミスコミュニケーションを防ぐためには、利用
者は可能ならば、文書作成者あるいは、文書作成者と同
様の知識をもつ別人に種々の問合せを行わなければなら
ず、これは文書作成者/利用者双方にとって大きな負荷
になる。
When a user of a document reads the document, it often happens that he / she does not fully understand the contents of the document without knowing the definition of technical terms and related information in the document. As a result, the value of the content of a document cannot be accurately determined, and important information is often overlooked. In addition, the content of the document may be misunderstood, and the subsequent actions may be disturbed. In order to prevent such miscommunication, the user should make various inquiries to the document creator or another person who has the same knowledge as the document creator, if possible. It will be a heavy load for both parties.

【0004】また、文書の作成者は、ミスコミュニケー
ションや文書の利用者に必要以上の負荷がかかることを
防ぐために、文書の利用者の知識レベルを想定して、用
語を選択したり、用語の定義や関連情報を文書に追加し
たりする。したがって、文書の作成者と利用者の共有す
る知識が少ないほど、より多くの情報を文書に載せねば
ならず、文書作成者の大きな負荷となっている。
In order to prevent miscommunication and an unnecessary load on the document user, the document creator selects a term or selects a term based on the knowledge level of the document user. Add definitions and related information to the document. Therefore, the less the knowledge shared between the creator of the document and the user, the more information has to be put in the document, which is a great burden on the document creator.

【0005】また、文書の利用者が多い場合、利用者の
持つ知識は様々であり、文書作成者は、利用者毎に利用
者に理解可能な文書を作るか、あるいは、利用者に多い
と思われる知識のレベルを想定して、そのレベルに合わ
せた単一の文書を作成することになる。
Further, when there are many users of the document, the knowledge possessed by the users is various, and the document creator has to create a document that the user can understand for each user, or if there are many users. Assuming the level of knowledge you think, you will create a single document for that level.

【0006】ところが、前者の場合は、同じ情報を伝え
るのに複数の文書を作成するという負荷を作成者に負わ
せる事になる。後者の場合は、文書作成者と多くの知識
を共有している文書利用者には、不必要な情報が多く、
読むのに必要以上に時間のかかる文書になり、また、文
書作成者が想定したレベルの知識を持たない文書利用者
にとっては充分理解できない文書になる。
In the former case, however, the creator is burdened with creating a plurality of documents to convey the same information. In the latter case, the document users who share a lot of knowledge with the document creator have much unnecessary information,
It will take more time than necessary to read the document, and will not be fully understood by the document user who does not have the level of knowledge assumed by the document creator.

【0007】このような問題点を解消するために、特開
平7−93334号公報に開示された発明では、利用者
が持つ単語の既知未知の状態を計算機がシミュレート
し、文書中の単語のうち利用者が知らない単語を自動的
に判別するステップと、前記未知の単語に利用者が知っ
ている同義語を自動的に補足するステップと、前記同義
語を補足した文書を自動的に表示するステップとからな
る文書処理方法が示されている。
In order to solve such a problem, in the invention disclosed in Japanese Patent Laid-Open No. 7-93334, a computer simulates a known or unknown state of a word held by a user, and Among them, a step of automatically identifying a word that the user does not know, a step of automatically supplementing the unknown word with a synonym known by the user, and automatically displaying a document supplementing the synonym And a document processing method including the steps of:

【0008】また、前記の公報には、利用者が持つ単語
の既知未知の状態を計算機がシミュレートし、文書中の
単語のうち利用者が知らない単語を自動的に判別する手
段と、前記未知の単語に利用者が知っている同義語を自
動的に補足する手段と、前記同義語を補足した文書を自
動的に表示する手段と、を備えた文書処理装置も開示さ
れている。
Further, the above-mentioned publication discloses a means for simulating a known or unknown state of a word possessed by a user and automatically discriminating a word which is not known by the user among the words in the document, A document processing apparatus is also disclosed, which comprises means for automatically supplementing unknown words with synonyms known to the user, and means for automatically displaying a document supplementing the synonyms.

【0009】このような文書処理方法及び文書処理装置
によって、文書利用者毎に、文書の利用者の知らない用
語に文書の利用者が知っている同義語を自動的に付加す
る事で、文書の利用者の理解を助け、さらには、文書の
作成者の負担を軽減している。
With such a document processing method and document processing apparatus, a synonym known to the user of the document is automatically added to a term unknown to the user of the document for each document user. Helps users understand and reduces the burden on the creator of the document.

【0010】[0010]

【発明が解決しようとする課題】しかし、特開平7−9
3334号公報開示された発明(以下、この発明を従来
例と呼ぶ)では、文書に追加されるのが文書中の用語の
同義語のみであるため、利用者の理解を助ける効果が不
十分である。
However, Japanese Patent Laid-Open No. 7-9 / 1995
In the disclosed invention (hereinafter, this invention is referred to as a conventional example), since only the synonyms of terms in the document are added to the document, the effect of helping the user to understand is insufficient. is there.

【0011】確かに、専門用語を知らない利用者に対し
て、利用者にとって既知な用語で言い替えてやる事には
利用者の理解を助ける効果があるが、それによって用語
の意味がわかったからといって、即文書の内容が理解で
きるわけではない。なぜなら、特定の概念や用語に対し
て、利用者が知りたい事には色々な種類があるからであ
る。 たとえば、「概念や用語の定義」、「概念や用語
が出現した経緯」、「概念や用語から派生した概念や用
語およびそれに関連する情報」、「概念や用語に関係の
深い概念や用語およびそれに関連する情報」等であり、
これ以外にも数多くある。
Certainly, for a user who does not know a technical term, paraphrasing it with a term known to the user has an effect of helping the user to understand, but because the meaning of the term is understood by it. However, the content of the document cannot be understood immediately. This is because there are various kinds of things that the user wants to know about a particular concept or term. For example, "definition of a concept or term", "how the concept or term appeared", "concept or term derived from a concept or term and related information", "concept or term related to a concept or term and its Related information ",
There are many other than this.

【0012】このように、文書を利用者が理解する過程
では、文書中の概念や用語ごとの利用者の知識の状態に
応じて、必要とする情報の種類が異なる。したがって、
従来例では、利用者は作成者が書いた文書中の概念や用
語に対する上記のような情報を得るために、相変わらず
多くの苦労をしなければならない。その結果、文書の作
成者は、このような受信者の苦労を斟酌して、複数の文
書を用意したり、文書に多くの情報を盛り込んだりとい
う苦労が依然として続くことになる。
As described above, in the process of understanding the document by the user, the kind of information required varies depending on the state of the user's knowledge for each concept or term in the document. Therefore,
In the conventional example, the user still has to make a lot of troubles in order to obtain the above information about the concept or term in the document written by the creator. As a result, the creator of the document takes into consideration such a pain of the receiver and prepares a plurality of documents, and the hard work of including a lot of information in the document continues.

【0013】また、従来例では、計算機が利用者の知識
の状態を自律的にシミュレートするために、利用者の真
の知識の状態を反映し続ける事が困難である。それは、
以下のような理由による。
Further, in the conventional example, since the computer autonomously simulates the state of knowledge of the user, it is difficult to continuously reflect the state of true knowledge of the user. that is,
For the following reasons.

【0014】第1の理由は、利用者の知識の変化の様子
は利用者毎に違い、計算機上に実装した一定の規則やプ
ログラムで、すべての利用者に有効な知識の状態のシミ
ュレートは不可能だということである。
The first reason is that the state of change of the knowledge of the user is different for each user, and it is not possible to simulate the knowledge state effective for all users with certain rules and programs implemented on the computer. It is impossible.

【0015】第2の理由は、利用者の知識の変化は、従
来例による文書処理装置を介した作業以外の、いろいろ
な局面でおこっており、そこでの知識の状態の変化を反
映できないということである。
The second reason is that the change of the user's knowledge occurs in various situations other than the work through the document processing apparatus according to the conventional example, and the change of the knowledge state there cannot be reflected. Is.

【0016】したがって、時間がたつに連れて、利用者
の知識の状態と計算機上でシミュレートされている知識
の状態の間の乖離が激しくなり、利用者にとって既知な
単語に対して同義語がついたり、未知な単語に対して同
義語がつかなかったり、ついた同義語が未知なものであ
ったりする事が頻繁に起こるようになる。つまり、従来
例では、このような乖離がおこった場合に、未知な単語
の同義語や、未知な同義語の代わりの既知な同義語を問
い合わせる手段がない。また、実情から乖離した計算機
上の知識の状態を修正する術がない。
Therefore, as time goes by, the gap between the state of knowledge of the user and the state of knowledge simulated on the computer becomes severe, and synonyms are synonymous with words known to the user. Frequently, a synonym cannot be attached to an unknown word, or a synonym attached to an unknown word is unknown. That is, in the conventional example, there is no means for inquiring a synonym of an unknown word or a known synonym instead of the unknown synonym when such a deviation occurs. In addition, there is no way to correct the state of knowledge on a computer that deviates from the actual situation.

【0017】これを解消するために、計算機上で管理さ
れている知識の状態を、エディタなどで直接編集する事
が考えられるが、これは以下の理由で現実的ではない。
それは、シミュレートされている知識の状態は膨大であ
り(用語の既知未知でも、数万から数十万の用語につい
ての情報が計算機上に存在することが予想される)、そ
の修正はとても人手の編集で可能なものではないからで
ある。また、知識の状態を修正した結果が、次の文書に
必ず反映されるわけではないので、修正の結果が利用者
の直接の利益に結び付かない。このため、利用者には修
正の負荷が徒労と認識される。
In order to solve this, it is conceivable to directly edit the state of knowledge managed on the computer with an editor or the like, but this is not realistic for the following reason.
The state of knowledge being simulated is enormous (it is expected that information on tens to hundreds of thousands of terms will exist on the computer even if the terms are known or unknown), and the modification is very manual. It is not possible by editing. In addition, since the result of correcting the state of knowledge is not necessarily reflected in the next document, the result of the correction does not lead to the direct benefit of the user. For this reason, the user recognizes that the burden of modification is unnecessary.

【0018】本発明はこのような点に鑑みてなされたも
のであり、利用者の真の知識の状態を反映させながら、
利用者の理解を助ける効果を十分に得ることができるよ
うな文書の変換を行う文書処理装置を提供することを目
的とする。
The present invention has been made in view of the above points, and reflects the true state of knowledge of the user.
An object of the present invention is to provide a document processing device for converting a document that can sufficiently obtain an effect of helping a user to understand.

【0019】[0019]

【課題を解決するための手段】図1は本発明の原理構成
図である。本発明では上記課題を解決するために、用語
に対する利用者の理解度を管理する知識状態管理手段1
と、用語に対する複数の関連情報を関連の種類に対応づ
けて管理する関連情報管理手段2と、入力された原文書
3から所定の用語を抽出する用語抽出手段4と、前記用
語抽出手段4が抽出した用語に対する前記利用者の理解
度を前記知識状態管理手段1から取得し、理解度に応じ
た関連の種類の関連情報を前記関連情報管理手段2から
抽出する情報抽出手段5と、を有することを特徴とする
文書処理装置が提供される。
FIG. 1 is a block diagram showing the principle of the present invention. In the present invention, in order to solve the above-mentioned problems, a knowledge state management means 1 for managing a user's understanding of terms
A related information management unit 2 that manages a plurality of related information for a term in association with a related type; a term extraction unit 4 that extracts a predetermined term from an input original document 3; An information extraction unit 5 that acquires the degree of understanding of the extracted term of the user from the knowledge state management unit 1 and extracts related information of a type of association corresponding to the degree of understanding from the related information management unit 2. There is provided a document processing device characterized by the above.

【0020】この構成によれば、原文書3が入力される
と、用語抽出手段4により原文書3から所定の用語が抽
出される。次に、情報抽出手段5により、利用者のその
用語に対する理解度に応じて、その用語に対する理解を
助けるための関連情報が抽出される。これにより、利用
者の理解度に応じた関連情報が抽出され、利用者は抽出
された関連情報を参照することにより、原文書3の内容
を十分に理解することができる。
According to this structure, when the original document 3 is input, the term extracting means 4 extracts a predetermined term from the original document 3. Next, the information extraction means 5 extracts relevant information for helping the user to understand the term according to the degree of understanding of the term by the user. Thereby, the related information according to the degree of understanding of the user is extracted, and the user can fully understand the content of the original document 3 by referring to the extracted related information.

【0021】[0021]

【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。図1は本発明の原理構成を示す図
である。知識状態管理手段1は、用語、その用語の関連
種、及び用語と関連種で特定される関連情報に対する利
用者の既知度が設定された既知レコード1aを管理して
いる。ここで関連種とは、定義情報、詳細情報、あるい
は付加情報等のように、その用語を補足する関連情報の
種類を表している。既知度は、例えばその関連情報が参
照された場合に大きな値に変更し、一定周期でその値が
減少するようなものとすることができる。この場合に
は、既知度の値が大きいほど、利用者が良く知っている
関連情報であると判断される。知識状態管理手段1は、
この既知レコード1aにより、複数の用語の関連種ごと
の関連情報に対する利用者の理解度を管理する。関連情
報管理手段2は、用語に対する利用者の理解を助けるた
めに必要な関連情報2aを、用語、関連種、及び本文に
3つ組で管理する。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing the principle configuration of the present invention. The knowledge state management unit 1 manages a known record 1a in which a known degree of a user for a term, a related species of the term, and related information specified by the term and the related species is set. Here, the related type represents a type of related information that supplements the term, such as definition information, detailed information, or additional information. The known degree may be changed to a large value when the related information is referred to, and the value may be decreased in a constant cycle. In this case, the larger the value of the degree of knownness is, the more the related information is known to the user. The knowledge state management means 1
With this known record 1a, the degree of understanding of the user regarding the related information for each related species of a plurality of terms is managed. The related information managing means 2 manages related information 2a necessary for helping the user to understand the terms in three groups of terms, related species, and text.

【0022】用語抽出手段4は、入力された原文書3か
ら用語4aを抽出する。情報抽出手段5は、用語抽出手
段4が抽出した用語4aに対する利用者の理解度を、知
識状態管理手段1から獲得し、その理解度に応じて、関
連情報管理手段2から関連情報2aを抽出する。文書作
成手段6は、原文書3に、情報抽出手段5が抽出した関
連情報2aを付加して、利用者に提供するための個別文
書3aを作成する。
The term extracting means 4 extracts terms 4a from the input original document 3. The information extraction unit 5 acquires the user's understanding level of the term 4a extracted by the term extraction unit 4 from the knowledge state management unit 1 and extracts the related information 2a from the related information management unit 2 according to the understanding level. To do. The document creating unit 6 adds the related information 2a extracted by the information extracting unit 5 to the original document 3 to create an individual document 3a to be provided to the user.

【0023】このような構成により、例えば、入力され
た原文書3に、必要に応じて関連情報を付加すべき「C
PU」という用語が含まれていた場合、用語抽出手段4
が、先ず原文書3から「CPU」という用語4aを抽出
する。次いで、情報抽出手段5が、知識状態管理手段1
から利用者の「CPU」の各関連種の関連情報に対する
理解度を獲得する。この例では、定義情報の既知度が
「20」であり、この程度の理解度では関連情報を付加
する必要があるものとする。そこで、情報抽出手段5
は、「CPU」の定義情報である関連情報2aを関連情
報管理手段2から抽出する。抽出された関連情報2a
が、文書作成手段6によって原文書3に付加され、個別
文書3aが生成される。
With such a configuration, for example, "C" in which related information should be added to the input original document 3 as necessary.
When the term "PU" is included, the term extraction means 4
First, the term 4a "CPU" is extracted from the original document 3. Then, the information extraction means 5 is replaced by the knowledge state management means 1
From the user, the degree of understanding of the related information of each related species of the “CPU” is acquired. In this example, the definition information has a known degree of “20”, and it is assumed that the related information needs to be added at this degree of understanding. Therefore, the information extraction means 5
Extracts the related information 2 a, which is the definition information of “CPU”, from the related information management means 2. Related information 2a extracted
Is added to the original document 3 by the document creating means 6 to generate the individual document 3a.

【0024】このようにして、利用者の知識状態に応じ
て必要な関連情報を付加することができ、各利用者の理
解を助ける効果を十分に得ることができる。図2は、本
発明を実施するための文書処理装置の第1の例の構成図
である。この例は、利用者が理解すべき第1の文書を入
力すると、利用者の理解可能な第2の文書に自動的に変
換する装置である。
In this way, necessary related information can be added according to the user's knowledge state, and the effect of helping each user's understanding can be sufficiently obtained. FIG. 2 is a block diagram of a first example of a document processing apparatus for implementing the present invention. In this example, when a user inputs a first document to be understood, it is automatically converted into a second document that the user can understand.

【0025】図2において、関連情報管理部11は、利
用者が文書の内容を理解するのに必要な情報(以後、関
連情報と呼ぶ)の蓄積/管理/検索を行う部分である。
関連情報管理部11に管理されている関連情報の登録/
削除/更新は、関連情報作成者17が関連情報入出力i
/f15を通して行なうことができる。知識状態管理部
12は、利用者18が持つ知識の状態を表す情報を蓄積
/管理する部分である。
In FIG. 2, the related information management section 11 is a section for accumulating / managing / searching information (hereinafter referred to as related information) necessary for the user to understand the contents of the document.
Registration of related information managed by the related information management unit 11 /
For deletion / update, the related information creator 17 inputs / outputs related information i
/ F15. The knowledge state management unit 12 is a unit that accumulates / manages information representing the state of knowledge held by the user 18.

【0026】追加情報抽出部13は、専門用語抽出部1
3aと条件絞り込み部13bとを含んでいる。専門用語
抽出部13aは、文書を解析し、その文書から専門用語
を抽出する。そして、抽出された専門用語により専門用
語リストを作る。条件絞り込み部13bは、専門用語抽
出部で抽出された用語に対して、該用語に関する情報
で、利用者に必要な情報の関連種を決定する。このよう
な構成の追加情報抽出部13では、第1の文書を利用者
が理解するのに必要な関連情報を関連情報管理部11か
ら取り出し、第1の文書と取り出した関連情報のリスト
を個別文書作成部14に送る。なお、第1の文書は、利
用者入出力i/f16を通して利用者18から入力され
る。
The additional information extraction unit 13 is a technical term extraction unit 1
3a and the condition narrowing portion 13b are included. The technical term extraction unit 13a analyzes a document and extracts a technical term from the document. Then, a technical term list is created based on the extracted technical terms. The condition narrowing unit 13b determines, for the term extracted by the technical term extracting unit, information related to the term and a related species of information necessary for the user. In the additional information extraction unit 13 having such a configuration, the related information required for the user to understand the first document is extracted from the related information management unit 11, and the first document and the list of the extracted related information are individually separated. It is sent to the document creation unit 14. The first document is input from the user 18 via the user input / output i / f 16.

【0027】個別文書作成部14は、追加情報抽出部1
3から送られた文書と関連情報から、第2の文書を作成
する。利用者18は、入出力i/fを通して、第2の文
書を読むことができる。
The individual document creating section 14 is provided with the additional information extracting section 1
A second document is created from the document and related information sent from No. 3. The user 18 can read the second document through the input / output i / f.

【0028】以下に、上記の各構成要素の詳細について
説明する。先ず、図2の例における関連情報管理部につ
いて説明する。関連情報管理部11において、関連情報
は、情報本体を示す本体データと、本体データがどんな
種類の型のデータかを示すデータ型属性と、その情報が
何に関する情報かを示す文字列を格納するキー属性と、
キー部で指定された対象に対してどのような関連をもつ
情報かを示す関連種属性と、からなるデータとして管理
されている。本体データには、文字列あるいは各種図形
などのデータ型のデータが格納されている。この例で利
用可能なデータ型は、文字列型、表型、幾何図形型、数
式型、イメージ型、そしてそれらの複合型である。本体
データがどの型に属するかは、データ型属性に示されて
いる。
The details of each of the above components will be described below. First, the related information management unit in the example of FIG. 2 will be described. In the related information management unit 11, the related information stores body data indicating the information body, a data type attribute indicating what type of body data the data is, and a character string indicating what the information is about. Key attributes,
It is managed as data consisting of a related species attribute indicating what kind of relationship is related to the target specified by the key part. Data of a data type such as a character string or various figures is stored in the main body data. The data types that can be used in this example are string type, table type, geometric type, mathematical type, image type, and composite type thereof. The type to which the body data belongs is indicated by the data type attribute.

【0029】関連種属性には、関連情報がキー属性で示
された対象の定義であることを示す「定義情報」と、関
連情報がキー属性で示された対象の詳細であることを示
す「詳細情報」と、関連情報がキー属性で示された対象
に付随するものであることを示す「付帯情報」の3種の
値のうちのどれかが格納される。
The related species attribute includes "definition information" indicating that the related information is the definition of the object indicated by the key attribute, and "definition information" indicating that the related information is the details of the object indicated by the key attribute. Any one of three values of “detailed information” and “additional information” indicating that the related information is associated with the object indicated by the key attribute is stored.

【0030】そして、関連情報管理部11は、キー属性
の値、関連種属性の値、とともに関連情報の取り出しが
指定された場合に、指定されたキー属性値、関連種属性
値、を持つ関連情報を検索し、その関連情報が存在すれ
ば取り出す検索機能を持っている。
Then, the related information management unit 11 has the specified key attribute value and related seed attribute value when the extraction of the related information is specified together with the value of the key attribute and the value of the related seed attribute. It has a search function that searches information and retrieves the related information if it exists.

【0031】図3は関連情報管理部に管理されている関
連情報の例を示す図である。関連情報は、キー属性11
1、関連種属性112、データ型属性113、本体デー
タ114の項目により管理されている。この図では、6
種類の関連情報11a〜11fを示している。なお、こ
の例に示す関連情報は全て「文字列型」のデータ型属性
である。
FIG. 3 is a diagram showing an example of related information managed by the related information management unit. Related information is key attribute 11
1, the related species attribute 112, the data type attribute 113, and the body data 114 are managed. In this figure, 6
The type-related information 11a-11f is shown. Note that all the related information shown in this example is a "character string type" data type attribute.

【0032】キー属性が「関連情報」である関連情報は
2種類あり、1つめの関連情報11aの関連種属性は
「定義情報」、2つめの関連情報11bの関連種属性は
「詳細情報」である。キー属性が「知識状態」である関
連情報は3種類あり、1つめの関連情報11cの関連種
属性は「定義情報」、2つめの関連情報11dの関連種
属性は「詳細情報」、3つめの関連情報11eの関連種
属性は「付帯情報」である。キー属性が「追加情報」で
ある関連情報は1種類あり、その関連情報11fの関連
種属性は「定義情報」である。
There are two types of related information whose key attribute is "related information", and the related type attribute of the first related information 11a is "definition information" and the related type attribute of the second related information 11b is "detailed information". Is. There are three types of related information whose key attribute is “knowledge state”, the related species attribute of the first related information 11c is “definition information”, the related species attribute of the second related information 11d is “detailed information”, the third The related species attribute of the related information 11e is “incidental information”. There is one type of related information whose key attribute is "additional information", and the related species attribute of the related information 11f is "definition information".

【0033】次に、図2の例に示す知識状態管理部12
について説明する。知識状態管理部12では、ユーザが
知っている情報を表す既知レコードが管理されている。
個々の既知レコードは、ユーザが知っている情報のカテ
ゴリと、ユーザがその情報のカテゴリの情報をどの程度
知っているかの度合を表す既知度(0から30の整数
値)と、からなる。
Next, the knowledge state management unit 12 shown in the example of FIG.
Will be described. The knowledge state management unit 12 manages known records that represent information that the user knows.
Each known record consists of a category of information that the user knows, and a degree of knownness (an integer value of 0 to 30) that indicates the degree to which the user knows the information of the category of the information.

【0034】この例における情報のカテゴリは、情報が
何に関するものであるかを示す文字列を保持しているキ
ー部と、キー部で指定された対象に対するどのような情
報かを示す関連種部と、からなる。関連種部には、情報
がキー属性で示された対象の定義であることを示す「定
義情報」と、情報がキー属性で示された対象の詳細であ
ることを示す「詳細情報」と、情報がキー属性で示され
た対象に付随するものであることを示す「付帯情報」と
の3種の値のうちのどれかが格納される。
The category of information in this example is a key portion holding a character string indicating what the information relates to, and a related seed portion indicating what kind of information the object designated by the key portion has. And consists of. In the related seed part, "definition information" indicating that the information is the definition of the target indicated by the key attribute, and "detailed information" indicating that the information is the details of the target indicated by the key attribute, Any one of three types of values of “incidental information” indicating that the information is associated with the object indicated by the key attribute is stored.

【0035】知識状態管理部12は、知識状態の参照の
指示が文字列とともに入力されると、該文字列をキー部
に持つ既知レコードを出力する。なお、同じ文字列をキ
ー部に持つ既知レコードは関連種ごとに複数存在し得る
ため、指示された文字列に該当する既知レコードが複数
あれば、それら全てを出力する。
When the instruction to refer to the knowledge state is input together with the character string, the knowledge state management unit 12 outputs a known record having the character string in the key portion. Since there may be a plurality of known records having the same character string in the key part for each related species, if there are a plurality of known records corresponding to the designated character string, all of them are output.

【0036】また、知識状態管理部12は、キーを表す
文字列、関連種の値、更新モード(「既知」、「未知」
のどちらか)とともに、知識状態の更新が指定されれ
ば、管理している既知レコードの登録/更新を行なう。
更新モードが既知であった場合、該キーを表す文字列、
関連種の値を持つ既知レコードが存在すれば、その既知
度を30にする。該当する既知レコードが存在しなけれ
ば、該キーを表す文字列、関連種の値を持つ既知レコー
ドを作り、その既知度を30にする。
The knowledge state management unit 12 also uses a character string representing a key, a value of a related species, and an update mode (“known”, “unknown”).
If either of the two) is specified, the known record managed is registered / updated.
If the update mode is known, a character string representing the key,
If there is a known record having the value of the related species, the known degree is set to 30. If the corresponding known record does not exist, a known record having the character string representing the key and the value of the related species is created, and the known degree thereof is set to 30.

【0037】更新モードが未知であった場合、該キーを
表す文字列、関連種の値を持つ既知レコードが存在すれ
ば、その既知度を0にする。該当する既知レコードが存
在しなければ、該キーを表す文字列、関連種の値を持つ
既知レコードを作り、その既知度を0にする。
When the update mode is unknown, if there is a known record having the character string representing the key and the value of the related species, the known degree is set to 0. If the corresponding known record does not exist, a known record having the character string representing the key and the value of the related species is created, and the known degree thereof is set to 0.

【0038】また知識状態管理部12は、管理している
すべての既知レコードの既知度の値を、24時間経過ご
とに−1する機能を含んでいる。これは、時間の経過と
ともに忘却してしまう人間の特徴をシミュレートするた
めである。ただし、既知度が0であるものは、それ以上
減少しない。
The knowledge state management unit 12 also includes a function of decreasing the knownness value of all known records managed by -1 every 24 hours. This is to simulate human characteristics that are forgotten over time. However, the degree of knownness of 0 does not decrease any further.

【0039】図4は知識状態管理部12で管理されてい
る既知レコードの例を示す図である。既知レコードは、
キー部121、関連種部122、既知度123の項目に
より管理されている。この図では、5種類の既知レコー
ド12a〜12eを示している。
FIG. 4 is a diagram showing an example of known records managed by the knowledge status management unit 12. Known records are
It is managed by the items of the key part 121, the related seed part 122, and the known degree 123. In this figure, five types of known records 12a to 12e are shown.

【0040】キー部が「関連情報」である既知レコード
は2種類あり、1つめの既知レコード12aの関連種部
は「定義情報」、既知度は「20」であり、2つめの既
知レコード12bの関連種部は「詳細情報」、既知度は
「10」である。キー部が「知識状態」である既知レコ
ードは3種類あり、1つめの既知レコード12cの関連
種部は「定義情報」、既知度は「25」であり、2つめ
の既知レコード12dの関連種部は「詳細情報」、既知
度は「20」であり、3つめの既知レコード12eの関
連種属性は「付帯情報」、既知度は「0」である。
There are two types of known records whose key part is "related information", the related seed part of the first known record 12a is "definition information", the degree of knownness is "20", and the second known record 12b. The related species part of is "detailed information", and the degree of knownness is "10". There are three types of known records whose key part is "knowledge state", the related species part of the first known record 12c is "definition information", the degree of known is "25", and the related species of the second known record 12d. The part is "detailed information", the degree of knownness is "20", the related species attribute of the third known record 12e is "incidental information", and the degree of knownness is "0".

【0041】次に、追加情報抽出部13について説明す
る。図5は、第1の文書が追加情報抽出部に入力された
場合の関連情報の抽出と知識状態の更新の手順を示した
フローチャートである。
Next, the additional information extraction unit 13 will be described. FIG. 5 is a flowchart showing a procedure for extracting related information and updating the knowledge state when the first document is input to the additional information extraction unit.

【0042】まず、専門用語抽出部13aで、利用者入
出力i/f16から送られた第1の文書を解析し、文書
中の専門的な意味を持つ名詞(以降、専門用語と呼ぶ)
のリストを作る(ステップS1)。そのために、専門用
語抽出部13aは、文書中の文を分割する形態素解析部
と、一般用語の名詞辞書を持っている。専門用語抽出部
13aは、形態素解析の結果抽出された名詞を一般用語
の名詞辞書で調べ、そこになかったものを専門用語と判
断する。
First, the technical term extracting unit 13a analyzes the first document sent from the user input / output i / f16, and has a noun having a technical meaning in the document (hereinafter referred to as technical term).
To make a list (step S1). Therefore, the technical term extraction unit 13a has a morphological analysis unit that divides sentences in a document and a noun dictionary of general terms. The technical term extraction unit 13a examines the noun extracted as a result of the morphological analysis in the noun dictionary of general terms, and determines that the term that is not there is a technical term.

【0043】次に専門用語リストが空かどうかを調べる
(ステップS2)。空なら、第1の文書と関連情報のリ
ストを文書作成部に送って(ステップS3)、処理が終
了する。専門用語リストが空でなければ、リストから専
門用語を一つ取り出す(ステップS4)。このとき、取
り出した専門用語はリストから削除する。
Next, it is checked whether the technical term list is empty (step S2). If it is empty, the list of the first document and the related information is sent to the document creating unit (step S3), and the process ends. If the technical term list is not empty, one technical term is extracted from the list (step S4). At this time, the extracted technical term is deleted from the list.

【0044】次に、取得した用語に対して、条件絞り込
み部で利用者が第1の文書を理解するために必要な情報
の関連種の決定を行う(ステップS5)。関連種の決定
の結果、利用者に必要な関連情報があるか否か、及び必
要な関連情報があるならその関連種は何かを判断する
(ステップS6)。関連種の決定の結果、利用者にはど
の関連種の情報も必要ないと決定されれば、専門用語リ
ストのチェック(ステップS2)にもどる。
Next, with respect to the acquired terms, the condition narrowing unit determines the related species of information necessary for the user to understand the first document (step S5). As a result of the determination of the related species, it is determined whether or not the user has the necessary related information, and if there is the necessary related information, the related species is determined (step S6). As a result of the determination of the related species, if it is determined that the user does not need information of any related species, the process returns to the check of the technical term list (step S2).

【0045】利用者には定義情報が必要であると決定さ
れた場合には、後述する定義情報が必要な場合の処理を
行い(ステップS7)、専門用語リストのチェック(ス
テップS2)にもどる。利用者には詳細情報が必要であ
ると決定された場合には、後述する詳細情報が必要な場
合の処理を行い(ステップS8)、専門用語リストのチ
ェック(ステップS2)にもどる。利用者には付帯情報
が必要であると決定された場合には、後述する付帯情報
が必要な場合の処理を行い(ステップS9)、専門用語
リストのチェックにもどる(ステップS2)。
When it is determined that the user needs the definition information, the processing for the case where the definition information is necessary, which will be described later, is performed (step S7), and the process returns to the check of the technical term list (step S2). When it is determined that the user needs the detailed information, a process for the detailed information described later is performed (step S8), and the process returns to the check of the technical term list (step S2). When it is determined that the user needs the supplementary information, the processing for the case where the supplementary information is required, which will be described later, is performed (step S9), and the technical term list is checked again (step S2).

【0046】図6は、条件絞り込み部で行われる関連種
の決定(ステップS5)の手順をフローチャートで示し
たものである。関連種の決定処理では、まず、取り出し
た専門用語とともに知識状態の参照の指示が知識状態管
理部に送られ、該専門用語をキー部に持つ既知レコード
を取り出す(ステップS11)。既知レコードがあるか
否かを判断し(ステップS12)、知識状態管理部内に
既知レコードが存在しなければ、その専門用語に関する
すべての情報が利用者にとって既知であり、どの関連種
の情報も必要ないと決定し(ステップS19)、終了す
る。
FIG. 6 is a flowchart showing the procedure for determining the related species (step S5) performed by the condition narrowing unit. In the related species determination process, first, an instruction to refer to the knowledge state is sent to the knowledge state management unit together with the extracted technical term, and a known record having the technical term in the key section is extracted (step S11). It is determined whether or not there is a known record (step S12), and if there is no known record in the knowledge state management unit, all information regarding the technical term is known to the user, and information on any related species is required. It is determined that there is not (step S19), and the process ends.

【0047】既知レコードが取り出せた場合、該既知レ
コードの内、関連種部の値が「定義情報」であるレコー
ドの既知度を調べる(ステップS13)。ここで、既知
度が15以下であった場合、利用者にとって定義情報が
必要であると決定し(ステップS14)、終了する。
When the known record can be extracted, the known degree of the record of which the value of the related seed part is "definition information" is checked (step S13). Here, when the known degree is 15 or less, it is determined that the user needs the definition information (step S14), and the process ends.

【0048】既知度が15より大きい場合、その専門用
語の定義情報は利用者にとって既知であると判断し、取
り出した既知レコードの内の関連種部の値が「詳細情
報」であるレコードの既知度を調べる(ステップS1
5)。ここで、既知度が15以下であった場合、利用者
にとって詳細情報が必要であると決定し(ステップS1
6)、終了する。
When the known degree is higher than 15, it is determined that the definition information of the technical term is known to the user, and the known value of the record of which the value of the related species part in the extracted known records is "detailed information". Check the degree (step S1
5). Here, when the known degree is 15 or less, it is determined that the user needs detailed information (step S1).
6) and end.

【0049】既知度が15より大きい場合、その専門用
語の詳細情報は利用者にとって既知であると判断し、取
り出した既知レコードの内の関連種部の値が「付帯情
報」であるレコードの既知度を調べる(ステップS1
7)。ここで、既知度が15以下であった場合、利用者
にとって付帯情報が必要であると決定し(ステップS1
8)、終了する。
When the degree of knownness is larger than 15, it is determined that the detailed information of the technical term is known to the user, and the known value of the record of which the value of the related seed part in the extracted known records is “incidental information” is known. Check the degree (step S1
7). If the known degree is 15 or less, it is determined that the user needs the supplementary information (step S1).
8), end.

【0050】既知度が15より大きい場合、その専門用
語に関するすべての情報が利用者にとって既知であり、
どの関連種の情報も必要ないと決定し(ステップS1
9)、終了する。
If the knownness is greater than 15, all information about the term is known to the user,
Decide that information on any related species is not needed (step S1
9), end.

【0051】図7は、定義情報が必要な場合の処理(ス
テップS7)の手順を示したフローチャートである。ま
ず、該専門用語をキー属性値とし、関連種属性値が「定
義情報」である関連情報の取り出しが関連情報管理部に
指示される(ステップS21)。ここで、定義情報が存
在したか否かを判断する(ステップS22)。関連情報
の取り出しに失敗した場合、利用者は該専門用語につい
て未知のままであるので、該専門用語をキーとし、関連
種を「定義情報」、更新モードを「未知」とした知識状
態の更新の指示が知識状態管理部に対して行なわれる。
その結果、定義情報の既知度が「0」に更新される(ス
テップS23)。
FIG. 7 is a flow chart showing the procedure of the processing (step S7) when definition information is required. First, using the technical term as a key attribute value, the related information management unit is instructed to take out the related information whose related seed attribute value is "definition information" (step S21). Here, it is determined whether or not the definition information exists (step S22). When the retrieval of the related information fails, the user remains unknown about the technical term, and the technical term is used as a key, and the knowledge state is updated with the related species as “definition information” and the update mode as “unknown”. Is issued to the knowledge state management unit.
As a result, the degree of knownness of the definition information is updated to "0" (step S23).

【0052】関連情報の取り出しに成功した場合、該関
連情報を関連情報リストに追加(ステップS24)した
後、該専門用語をキーとし、関連種を「定義情報」、更
新モードを「既知」とした知識状態の更新の指示が知識
状態管理部に対して行なわれる。つまり、定義情報は利
用者に対して提示されることになるので、「既知」にな
るのである。その結果、定義情報の既知度が「30」に
更新される(ステップS25)。
When the extraction of the related information has succeeded, the related information is added to the related information list (step S24), and then the related term is defined as "definition information" and the update mode is set as "known" with the technical term as a key. The knowledge state management unit is instructed to update the knowledge state. That is, since the definition information is presented to the user, it becomes “known”. As a result, the degree of knownness of the definition information is updated to "30" (step S25).

【0053】詳細情報が必要な場合、付帯情報が必要な
場合の処理も、図7のフローチャートと同様の手順であ
る。ただし、「定義情報」の部分が、それぞれ、「詳細
情報」、「付帯情報」になる。
The processing when the detailed information is required and the incidental information is required is the same procedure as the flowchart of FIG. However, the "definition information" portion becomes "detailed information" and "incidental information", respectively.

【0054】次に、個別文書作成部14について説明す
る。個別文書作成部14は、追加情報抽出部から第1の
文書と後述する関連情報リストを受けとり、第1の文書
の適当な位置に、関連情報を追加することによって、第
2の文書を生成する。
Next, the individual document creating section 14 will be described. The individual document creation unit 14 receives the first document and the related information list described later from the additional information extraction unit, and adds the related information to an appropriate position of the first document to generate the second document. .

【0055】図8は、個別文書作成部での第2の文書作
成の手順を示したフローチャートである。最初に、関連
情報リストが空かどうかが調べられる(ステップS3
1)。関連情報リストが空であれば、第2の文書は完成
であり、処理は終了する。関連情報リストが空でなけれ
ば、関連情報がリストから取り出される(ステップS3
2)。このとき、とりだされた関連情報はリストから削
除される。
FIG. 8 is a flow chart showing the procedure for creating the second document in the individual document creating section. First, it is checked whether the related information list is empty (step S3).
1). If the related information list is empty, the second document is complete and the process ends. If the related information list is not empty, the related information is retrieved from the list (step S3).
2). At this time, the retrieved related information is deleted from the list.

【0056】次に、第1の文書の中で、関連情報のキー
属性の値と同じ文字列が出現する位置(正確には、マッ
チした文字列の再後尾の位置)を調べる(ステップS3
3)。該当する文字列が複数ある場合、最初に出現した
位置が採用される。
Next, in the first document, the position where the same character string as the value of the key attribute of the related information appears (more precisely, the position of the tail end of the matched character string) is checked (step S3).
3). When there are multiple corresponding character strings, the position that appears first is adopted.

【0057】次に、関連情報のデータ型属性を調べる
(ステップS34)。データ型属性の値が文字列型でな
ければ、関連情報の本体データを前記文字列の位置の注
釈とする(ステップS38)。
Next, the data type attribute of the related information is checked (step S34). If the value of the data type attribute is not the character string type, the body data of the related information is used as the annotation of the position of the character string (step S38).

【0058】データ型属性の値が文字列であれば、関連
情報の関連種属性の値が調べられる(ステップS3
6)。関連種属性の値が「定義情報」であった場合、本
体データの内容を括弧でくくり、ステップS33で検出
した位置に置き(ステップS37)、関連情報リストの
チェック(ステップS31)に戻る。
If the value of the data type attribute is a character string, the value of the related species attribute of the related information is checked (step S3).
6). When the value of the related species attribute is "definition information", the contents of the main body data are put in parentheses, placed at the position detected in step S33 (step S37), and the process returns to the related information list check (step S31).

【0059】関連種属性の値が「詳細情報」であった場
合、本体データの長さが調べられる(ステップS3
6)。本体データの長さが20文字以下であった場合、
本体データの内容を括弧でくくり、ステップS33で検
出した位置に置き(ステップS37)、関連情報リスト
のチェック(ステップS31)に戻る。本体データの長
さが20文字より多かった場合、本体データを前記位置
の注釈とし(ステップS38)、関連情報リストのチェ
ックに戻る。
If the value of the related species attribute is "detailed information", the length of the body data is checked (step S3).
6). If the length of the body data is 20 characters or less,
The contents of the body data are put in parentheses, placed at the position detected in step S33 (step S37), and the process returns to the check of the related information list (step S31). When the length of the body data is more than 20 characters, the body data is used as the annotation of the position (step S38), and the process returns to the check of the related information list.

【0060】関連種属性の値が「付帯情報」であった場
合、本体データをステップS33で検出した位置の注釈
とし(ステップS38)、関連情報リストのチェック
(ステップS31)に戻る。
When the value of the related species attribute is "incidental information", the body data is used as the annotation of the position detected in step S33 (step S38), and the process returns to the related information list check (step S31).

【0061】なお、この例の注釈処理(ステップS3
8)では、注釈を置く位置に注記号を置き、文書の後尾
に、該注記号とともに置き、関連情報リストのチェック
に戻る。
The annotation process of this example (step S3)
In 8), the note symbol is placed at the position where the annotation is placed, placed at the tail of the document together with the note symbol, and the process returns to the check of the related information list.

【0062】以上のような文書処理装置により、例え
ば、図9の文書20が第1の文書であった場合、専門用
語リストの作成処理により、図10のような専門用語リ
スト21が作成される。専門用語リスト21が空でない
ので、最初の専門用語「関連情報」が取り出される。こ
こで、関連情報管理部には図3に示す関連情報が管理さ
れており、知識状態管理部には図4に示す知識状態が管
理されている場合を例にとり説明する。
With the document processing apparatus as described above, for example, when the document 20 in FIG. 9 is the first document, the technical term list 21 as shown in FIG. 10 is created by the technical term list creation processing. . Since the technical term list 21 is not empty, the first technical term “related information” is retrieved. Here, a case will be described as an example where the related information management unit manages the related information shown in FIG. 3 and the knowledge state management unit manages the knowledge state shown in FIG.

【0063】次に、「関連情報」をキー部に持つ既知レ
コードが取り出される。この場合、図4に示した既知レ
コードから、「関連情報」をキー部に持つ既知レコード
12a,12bが取り出される。図11は取り出された
2つの既知レコード12a,12bを示す図である。取
り出された既知レコードの内、関連種部の値が「定義情
報」である既知レコード12aの既知度は15より大き
く、関連種部の値が「詳細情報」である既知レコード1
2bの既知度は15以下であるので、利用者に必要なの
は、用語「関連情報」の「詳細情報」であると決定され
る。
Next, a known record having "related information" in the key part is taken out. In this case, known records 12a and 12b having "related information" in the key part are extracted from the known records shown in FIG. FIG. 11 is a diagram showing the two known records 12a and 12b that have been taken out. Of the retrieved known records, the known degree of the known record 12a having the related seed portion value of “definition information” is greater than 15, and the known record 1 having the related seed portion value of “detailed information”.
Since the known degree of 2b is 15 or less, it is determined that the user needs "detailed information" of the term "related information".

【0064】そして、キー属性値が「関連情報」、関連
種属性値が「詳細情報」である関連情報の取り出しが関
連情報管理部に指示される。図3に示した関連情報から
キー属性値が「関連情報」、関連種属性値が「詳細情
報」である関連情報が取り出される。図12は取り出さ
れた関連情報11bを示す図である。
Then, the related information management unit is instructed to take out the related information whose key attribute value is "related information" and related seed attribute value is "detailed information". Related information whose key attribute value is "related information" and related species attribute value is "detailed information" is extracted from the related information shown in FIG. FIG. 12 is a diagram showing the extracted related information 11b.

【0065】そして、図12に示す関連情報を関連情報
リストに追加した後、「関連情報」をキーとし、関連種
を「詳細情報」、更新モードを「既知」とした知識状態
の更新の指示が知識状態管理部に対して行なわれる。そ
して、専門用語リストのチェックに処理が戻る。
After adding the related information shown in FIG. 12 to the related information list, an instruction to update the knowledge state in which the "related information" is used as a key, the related species is "detailed information", and the update mode is "known" Is performed to the knowledge state management unit. Then, the process returns to the check of the technical term list.

【0066】このような処理が専門用語リスト内の全て
の専門用語に対して行われる。その結果、関連情報リス
トが完成する。図13は作成された関連情報リスト22
を示す図である。図13では、キー属性が「関連情
報」、関連種属性が「詳細情報」である関連情報11b
と、キー属性が「知識状態」、関連種属性が「付帯情
報」である関連情報11eとが登録されている。この
時、知識状態管理部で管理されている知識状態が更新さ
れる。図14は更新された知識状態を示す図である。図
14は図4の知識状態から更新されたものである。更新
されたのは、キー部が「関連情報」、関連種部が「詳細
情報」である既知レコード12fと、キー部が「知識状
態」、関連種部が「付帯情報」である既知レコード12
gである。既知レコード12fは、既知度が「10」か
ら「30」に変更されている。既知レコード12gは、
既知度が「0」から「30」に変更されている。
Such processing is performed for all the technical terms in the technical term list. As a result, the related information list is completed. FIG. 13 shows the created related information list 22.
FIG. In FIG. 13, the related information 11b whose key attribute is "related information" and related species attribute is "detailed information"
And the related information 11e whose key attribute is "knowledge state" and related species attribute is "incidental information" are registered. At this time, the knowledge status managed by the knowledge status management unit is updated. FIG. 14 is a diagram showing the updated knowledge state. FIG. 14 is updated from the knowledge state of FIG. What has been updated is a known record 12f in which the key portion is "related information" and the related seed portion is "detailed information", and a known record 12 in which the key portion is "knowledge state" and the related seed portion is "incidental information".
g. The known degree of the known record 12f is changed from “10” to “30”. The known record 12g is
The known degree is changed from “0” to “30”.

【0067】第1の文書20が図9に示すものであり、
関連情報リストが図13のようであった場合、図15に
示すような第2の文書23が、文書作成部で作成される
(アンダーラインのついた部分が第1の文書に追加され
た部分である)。
The first document 20 is shown in FIG.
When the related information list is as shown in FIG. 13, the second document 23 as shown in FIG. 15 is created by the document creating section (the underlined part is the part added to the first document). Is).

【0068】また、文書作成部において、第1の文書と
追加情報抽出部で抽出された関連情報を参照リンクでつ
なぐことにより、第2の文書をハイパーテキストとして
作成することも可能である。
In the document creating section, the second document can be created as hypertext by connecting the first document and the related information extracted by the additional information extracting section with a reference link.

【0069】図16は、ハイパーテキストとして第2の
文書を作成するための手順を示すフローチャートであ
る。まず、関連情報リストが空でないか否かを判断し
(ステップS41)、空であるなら処理を終了する。空
でないと判断されると、関連情報リストにある関連情報
を選択し、選択した関連情報をリストから削除する(ス
テップS42)。次いで、キー属性の値にマッチする文
字列を探索する(ステップS43)。マッチした文字列
から関連情報へ参照リンクを張り(ステップS43)、
ステップS41の処理に戻る。
FIG. 16 is a flowchart showing the procedure for creating the second document as hypertext. First, it is determined whether or not the related information list is empty (step S41), and if it is empty, the process is terminated. If it is determined that it is not empty, the related information in the related information list is selected and the selected related information is deleted from the list (step S42). Next, a character string that matches the value of the key attribute is searched (step S43). A reference link is provided from the matched character string to related information (step S43),
The process returns to step S41.

【0070】例えば参照リンクは、抽出された関連情報
に識別子を付与しておき、第1の文書中の文字列の位置
(たとえば、第1の文書の先頭から21バイト目からは
じまり、28バイト目で終了といったように表現する)
と、該識別子のペアとして表現しておけばよい。
For example, in the reference link, an identifier is added to the extracted related information, and the position of the character string in the first document (for example, starting from the 21st byte from the beginning of the first document to the 28th byte) End, etc.)
And may be expressed as a pair of the identifiers.

【0071】第1の文書が図9に示すものであり、関連
情報が図13のようであった場合、図17に示すような
ハイパーテキストが、文書作成部で作成される。この例
では、第1の文書内の関連情報へリンクが張られた文字
列24a,24bに、下線が引かれた文書24が作成さ
れる。この文書24が画面に表示される。利用者がポイ
ンティングデバイス等を用いて文字列24a,24bの
いずれかを指定することにより、指定した文字列にリン
クした関連情報25,26が画面に表示される。
When the first document is as shown in FIG. 9 and the related information is as shown in FIG. 13, the hypertext as shown in FIG. 17 is created by the document creating section. In this example, the document 24 in which the character strings 24a and 24b linked to the related information in the first document are underlined is created. This document 24 is displayed on the screen. When the user specifies one of the character strings 24a and 24b using a pointing device or the like, the related information 25 and 26 linked to the specified character string is displayed on the screen.

【0072】以上のようにして、利用者の知識の状態は
知識状態管理部でシミュレートされており、知識状態管
理部の内容に基づいて、文書を利用者が理解するために
必要な用語に関し、利用者の理解度に応じた関連情報が
利用者に提供される。したがって、利用者は、文書とと
もに、文書の理解の補助となる適切な種類の情報を、利
用者の知識の状態に応じて得る事ができる。これによ
り、文書の利用者にとっては、文書を理解するのに必要
な情報を得る苦労が軽減される。一方、文書作成者にと
っては、複数の文書を用意したり、文書に多くの情報を
盛り込んだりという苦労から開放される。
As described above, the knowledge state of the user is simulated by the knowledge state management section, and the terms necessary for the user to understand the document based on the contents of the knowledge state management section. , Related information is provided to the user according to the understanding level of the user. Therefore, the user can obtain, together with the document, an appropriate type of information that assists in understanding the document, according to the state of knowledge of the user. This alleviates the trouble for the user of the document to obtain the information necessary to understand the document. On the other hand, the document creator is relieved from the trouble of preparing a plurality of documents and incorporating a lot of information into the documents.

【0073】次に、上記の文書処理装置に加え、さらに
利用者の真の知識の状態を反映し続けて文書の変換を行
うことができる文書処理装置の発明について説明する。
図18は本発明を実施するための文書処理装置の第2の
例の構成図である。これは、利用者が理解すべき第1の
文書を入力すると、利用者の理解可能な第2の文書に自
動的に変換する装置である。
Next, in addition to the above document processing apparatus, an invention of a document processing apparatus capable of converting a document while continuously reflecting the true knowledge state of the user will be described.
FIG. 18 is a block diagram of the second example of the document processing apparatus for carrying out the present invention. This is an apparatus that, when a user inputs a first document to be understood, it is automatically converted into a second document that the user can understand.

【0074】図18において、関連情報管理部31は、
利用者が文書の内容を理解するのに必要な情報(以後、
関連情報と呼ぶ)の蓄積/管理/検索を行う部分であ
る。関連情報管理部31に管理されている関連情報の登
録/削除/更新は、関連情報作成者38が関連情報入出
力i/f36をとおして行なうことができる。知識状態
管理部32は、利用者39が持つ知識の状態を表す情報
を蓄積/管理する部分である。
In FIG. 18, the related information management section 31
Information necessary for the user to understand the contents of the document (hereinafter,
This is a part for accumulating / managing / searching (referred to as related information). Registration / deletion / update of the related information managed by the related information management unit 31 can be performed by the related information creator 38 through the related information input / output i / f 36. The knowledge state management unit 32 is a unit that accumulates / manages information representing the state of knowledge possessed by the user 39.

【0075】追加情報抽出部33は、専門用語抽出部3
3aと第1条件決定部33bとを含んでいる。専門用語
抽出部33aは、文書を解析し、その文書から専門用語
を抽出する。そして、抽出された専門用語により専門用
語リストを作る。第1条件決定部33bは、専門用語抽
出部で抽出された用語に対して、該用語に関する情報
で、利用者に必要な情報の関連種を決定する。このよう
な構成の追加情報抽出部33では、第1の文書を利用者
が理解するのに必要な関連情報を関連情報管理部31か
ら取り出し、第1の文書と取り出した関連情報のリスト
を個別文書作成部35に送る。第1の文書は、利用者入
出力i/f37を通して利用者39から入力される。第
2条件決定手部33cは、利用者39からの不明用語と
して入力された用語に対して、該用語に関する情報で、
利用者に必要な情報の関連種を決定する。
The additional information extraction unit 33 is the technical term extraction unit 3
3a and the 1st condition determination part 33b are included. The technical term extraction unit 33a analyzes a document and extracts a technical term from the document. Then, a technical term list is created based on the extracted technical terms. The first condition determining unit 33b determines, for the term extracted by the technical term extracting unit, information related to the term and a related species of information necessary for the user. In the additional information extraction unit 33 having such a configuration, the related information required for the user to understand the first document is extracted from the related information management unit 31, and the first document and the list of the extracted related information are individually separated. It is sent to the document creation unit 35. The first document is input from the user 39 through the user input / output i / f 37. The second condition deciding unit 33c, for a term input as an unknown term from the user 39, is information about the term,
Determine the relevant species of information needed by the user.

【0076】個別文書作成部35は、追加情報抽出部3
3から送られた文書と関連情報から、第2の文書を作成
する。利用者39は、利用者入出力i/f37を通し
て、第2の文書を読むことができる。処理内容記憶部3
4は、第1の文書と、該文書に対してどんな関連情報が
抽出されたかを、記憶している。
The individual document creating section 35 is the additional information extracting section 3
A second document is created from the document and related information sent from No. 3. The user 39 can read the second document through the user input / output i / f 37. Processing content storage unit 3
4 stores the first document and what related information is extracted for the document.

【0077】以下に、上記の各構成要素の詳細について
説明する。なお、関連情報管理部31と知識状態管理部
32と個別文書作成部35とは、それぞれ図2に示した
関連情報管理部11と知識状態管理部12と個別文書作
成部14と同じ機能のものであるため、ここでは説明を
省略する。
The details of each of the above components will be described below. The related information management unit 31, the knowledge status management unit 32, and the individual document creation unit 35 have the same functions as the related information management unit 11, the knowledge status management unit 12, and the individual document creation unit 14 shown in FIG. 2, respectively. Therefore, the description is omitted here.

【0078】追加情報抽出部33について説明する。図
19は、第1の文書が追加情報抽出部に入力された場合
の関連情報の抽出と知識状態の更新の手順を示したフロ
ーチャートである。
The additional information extraction unit 33 will be described. FIG. 19 is a flowchart showing a procedure of extracting related information and updating the knowledge state when the first document is input to the additional information extraction unit.

【0079】まず、専門用語抽出部33aで、利用者入
出力i/f37から送られた第1の文書を解析し、文書
中の専門的な意味を持つ名詞(以降、専門用語と呼ぶ)
のリストを作る(ステップS51)。そのために、専門
用語抽出部33aは、文書中の文を分割する形態素解析
部と、一般用語の名詞辞書を持っている。専門用語抽出
部33aは、形態素解析の結果抽出された名詞を一般用
語の名詞辞書で調べ、そこになかったものを専門用語と
判断する。
First, the technical term extracting section 33a analyzes the first document sent from the user input / output i / f 37, and has a noun having a technical meaning in the document (hereinafter referred to as technical term).
Is created (step S51). Therefore, the technical term extraction unit 33a has a morphological analysis unit that divides sentences in a document and a noun dictionary of general terms. The technical term extraction unit 33a examines the noun extracted as a result of the morphological analysis in the noun dictionary of general terms, and determines that the term that is not there is a technical term.

【0080】次に専門用語リストが空かどうかを調べる
(ステップS52)。空なら、第1の文書と関連情報リ
ストを処理内容記憶部に記憶し(ステップS53)、第
1の文書と関連情報のリストを個別文書作成部に送って
(ステップS54)、処理が終了する。
Next, it is checked whether the technical term list is empty (step S52). If it is empty, the first document and the related information list are stored in the processing content storage unit (step S53), the list of the first document and the related information is sent to the individual document creation unit (step S54), and the process ends. .

【0081】専門用語リストが空でなければ、リストか
ら専門用語を一つ取り出す(ステップS55)。このと
き、取り出した専門用語はリストから削除する。次に該
用語に対して、第1条件決定部33bで利用者が第1の
文書を理解するために必要な情報の関連種の決定を行う
(ステップS56)。関連種の決定の結果、利用者に必
要な関連情報があるか否か、及び必要な関連情報がある
ならその関連種は何かを判断する(ステップS57)。
関連種の決定の結果、利用者にはどの関連種の情報も必
要ないと決定されれば、専門用語リストのチェック(ス
テップS52)にもどる。
If the technical term list is not empty, one technical term is extracted from the list (step S55). At this time, the extracted technical term is deleted from the list. Next, with respect to the term, the first condition determining unit 33b determines the related species of information necessary for the user to understand the first document (step S56). As a result of the determination of the related species, it is determined whether or not the user has the necessary related information, and if there is the necessary related information, the related species is determined (step S57).
As a result of the determination of the related species, if it is determined that the user does not need information of any related species, the process returns to the check of the technical term list (step S52).

【0082】利用者には定義情報が必要であると決定さ
れた場合には、後述する定義情報が必要な場合の処理を
行い(ステップS58)、専門用語リストのチェック
(ステップS52)にもどる。利用者には詳細情報が必
要であると決定された場合には、後述する詳細情報が必
要な場合の処理を行い(ステップS59)、専門用語リ
ストのチェック(ステップS52)にもどる。利用者に
は付帯情報が必要であると決定された場合には、後述す
る付帯情報が必要な場合の処理を行い(ステップS6
0)、専門用語リストのチェックにもどる(ステップS
52)。
When it is determined that the user needs the definition information, the processing for the case where the definition information is necessary, which will be described later, is performed (step S58), and the process returns to the check of the technical term list (step S52). When it is determined that the user needs the detailed information, the process for the detailed information described below is performed (step S59), and the process returns to the check of the technical term list (step S52). When it is determined that the user needs the supplementary information, the processing for the case where the supplementary information is necessary is performed (step S6).
0) Return to checking the technical term list (step S)
52).

【0083】第1条件決定部の機能は、図2で示した例
の条件絞り込み部13bの機能と同じである。従って、
第1条件決定部で行われる関連種の決定の手順は、図6
に示したものと同じである。また、定義情報が必要な場
合の処理手順も図7に示したフローチャートと同じであ
る。さらに、詳細情報が必要な場合、付帯情報が必要な
場合の処理も、図7のフローチャートと同様の手順であ
る。ただし、「定義情報」の部分が、それぞれ、「詳細
情報」、「付帯情報」になる。
The function of the first condition determining section is the same as that of the condition narrowing section 13b of the example shown in FIG. Therefore,
The procedure of determining the related species performed by the first condition determining unit is shown in FIG.
Is the same as that shown in. The processing procedure when definition information is required is also the same as the flowchart shown in FIG. 7. Further, the processing when the detailed information is necessary and the incidental information is necessary is the same procedure as the flowchart of FIG. 7. However, the "definition information" portion becomes "detailed information" and "incidental information", respectively.

【0084】ここで、例えば図9の文書が第1の文書で
あり、図15の文書が第2の文書として生成されたもの
とする。このとき、利用者が、利用者入出力i/fをと
おして第2の文書を読んだ後に、第2の文書に対する評
価(評価情報)を利用者入出力i/fを通して入力する
ことができる。評価情報をもとに、必要な関連情報が再
度抽出されるとともに、評価情報を反映して知識状態が
更新される。評価情報は、第2の文書において、利用者
が理解できなかった用語のリスト(不明用語リストと呼
ぶ)の形で、追加情報抽出部に入力する。
Here, it is assumed that the document of FIG. 9 is the first document and the document of FIG. 15 is the second document, for example. At this time, the user can input the evaluation (evaluation information) for the second document through the user input / output i / f after reading the second document through the user input / output i / f. . Based on the evaluation information, necessary related information is extracted again, and the knowledge state is updated to reflect the evaluation information. The evaluation information is input to the additional information extraction unit in the form of a list of terms that the user could not understand in the second document (called an unknown term list).

【0085】図20は、不明用語リストが入力された場
合の関連情報の抽出と知識状態の更新の手順を示したフ
ローチャートである。不明用語リストが追加情報抽出部
33に入力されると、まず、不明用語リストが空かどう
かが調べられる(ステップS61)。空なら、処理内容
記憶部から、第1の文書と関連情報リストを取り出し
(ステップS62)、取り出した関連情報リストと今回
新たに取り出された関連情報リストをマージして、新し
い関連情報リストを作成する(ステップS63)。その
後、第1の文書と前記新しい関連情報リストを処理内容
記憶部に記憶し(ステップS64)、さらに第1の文書
と前記新しい関連情報リストを個別文書作成部に送っ
て、処理は終了する(ステップS65)。
FIG. 20 is a flow chart showing the procedure for extracting the related information and updating the knowledge state when the unknown term list is input. When the unknown term list is input to the additional information extraction unit 33, it is first checked whether or not the unknown term list is empty (step S61). If it is empty, the first document and the related information list are extracted from the processing content storage unit (step S62), and the extracted related information list and the newly extracted related information list are merged to create a new related information list. Yes (step S63). After that, the first document and the new related information list are stored in the processing content storage unit (step S64), the first document and the new related information list are sent to the individual document creating unit, and the process is completed ( Step S65).

【0086】不明用語リストが空でなければ、リストか
ら不明用語をひとつ取り出す(ステップS66)。取り
出された用語はリストから削除される。次に該用語に対
して、第2条件決定部で利用者が必要な情報の関連種の
決定が行われる(ステップS67)。関連種の決定の結
果、必要な関連種を判断し(ステップS68)、利用者
にはどの関連種の情報も必要ないと決定されれば、不明
用語リストのチェック(ステップS61)にもどる。
If the unknown term list is not empty, one unknown term is taken out from the list (step S66). The retrieved term is removed from the list. Then, for the term, the second condition determining unit determines the related species of information required by the user (step S67). As a result of the determination of the related species, the necessary related species are determined (step S68), and if it is determined that the user does not need information of any related species, the process returns to the unknown term list check (step S61).

【0087】利用者には、定義情報が必要であると決定
された場合には、図7のフローチャートで示した定義情
報が必要な場合の処理を行い(ステップS69)、不明
用語リストのチェック(ステップS61)にもどる。利
用者には、詳細情報が必要であると決定された場合に
は、図7のフローチャートで示した処理と同様の詳細情
報が必要な場合の処理を行い(ステップS70)、不明
用語リストのチェック(ステップS61)にもどる。利
用者には、付帯情報が必要であると決定された場合に
は、図7のフローチャートで示した処理と同様の付帯情
報が必要な場合の処理を行い(ステップS71)、不明
用語リストのチェック(ステップS61)にもどる。
When it is determined that the user needs the definition information, the process shown in the flowchart of FIG. 7 for the case where the definition information is necessary is performed (step S69), and the unknown term list is checked ( Return to step S61). When it is determined that the user needs the detailed information, the same process as the process shown in the flowchart of FIG. 7 is performed when the user needs the detailed information (step S70), and the unknown term list is checked. Return to (step S61). When it is determined that the user needs the additional information, the same processing as the processing shown in the flowchart of FIG. 7 is performed when the user needs the additional information (step S71), and the unknown term list is checked. Return to (step S61).

【0088】図21は、第2条件決定部で行われる関連
種の決定の手順をフローチャートで示したものである。
関連種の決定処理では、まず、取り出した用語とともに
知識状態の参照の指示が知識状態管理部に送られ、該用
語をキー部に持つ既知レコードを取り出す(ステップS
81)。知識状態管理部内に既知レコードが存在するか
否かを判断し(ステップS82)、既知レコードが存在
しなければ、利用者にとって定義情報が必要であると決
定し(ステップS83)、終了する。
FIG. 21 is a flow chart showing the procedure for determining the related species performed by the second condition determining section.
In the related species determination process, first, an instruction to refer to the knowledge state is sent to the knowledge state management unit together with the retrieved term, and a known record having the term in the key portion is retrieved (step S
81). It is determined whether or not a known record exists in the knowledge state management unit (step S82), and if the known record does not exist, it is determined that the user needs the definition information (step S83), and the process ends.

【0089】既知レコードが取り出せた場合、該既知レ
コードの内、関連種部の値が「定義情報」であるレコー
ドの既知度を調べる(ステップS84)。ここで、既知
度が15以下であった場合、利用者にとって定義情報が
必要であると決定し(ステップS83)、終了する。
When the known record can be extracted, the known degree of the record in which the value of the related seed part is "definition information" is checked (step S84). Here, when the known degree is 15 or less, it is determined that the user needs the definition information (step S83), and the process ends.

【0090】既知度が15より大きい場合、その用語の
定義情報は利用者にとって既知であると判断し、取り出
した既知レコードの内の関連種部の値が「詳細情報」で
あるレコードの既知度を調べる(ステップS85)。こ
こで、既知度が15以下であった場合、利用者にとって
詳細情報が必要であると決定し(ステップS86)、終
了する。
When the known degree is higher than 15, it is determined that the definition information of the term is known to the user, and the known degree of the record in which the value of the related seed portion of the retrieved known records is “detailed information”. Is checked (step S85). Here, when the known degree is 15 or less, it is determined that the user needs detailed information (step S86), and the process ends.

【0091】既知度が15より大きい場合、その用語の
詳細情報は利用者にとって既知であると判断し、取り出
した既知レコードの内の関連種部の値が「付帯情報」で
あるレコードの既知度を調べる(ステップS87)。こ
こで、既知度が15以下であった場合、利用者にとって
付帯情報が必要であると決定し(ステップS88)、終
了する。
When the known degree is higher than 15, it is judged that the detailed information of the term is known to the user, and the known degree of the record of which the value of the related seed part of the extracted known records is “incidental information”. Is checked (step S87). Here, when the known degree is 15 or less, it is determined that the user needs the supplementary information (step S88), and the process ends.

【0092】既知度が15より大きい場合、定義情報、
詳細情報、付帯情報のうち、最も既知度が小さい既知レ
コードの関連種を調べる(ステップS89)。既知度が
最も小さいのが定義情報であった場合、利用者にとって
定義情報が必要であると決定し(ステップS83)、終
了する。既知度が最も小さいのが詳細情報であった場
合、利用者にとって詳細情報が必要であると決定し(ス
テップS86)、終了する。既知度が最も小さいのが付
帯情報であった場合、利用者にとって付帯情報が必要で
あると決定し(ステップS88)、終了する。
If the known degree is higher than 15, definition information,
Of the detailed information and the incidental information, the related species of the known record having the smallest known degree is checked (step S89). If the definition information has the lowest known degree, it is determined that the user needs the definition information (step S83), and the process ends. If the smallest known degree is the detailed information, it is determined that the user needs the detailed information (step S86), and the process ends. If the incidental information has the smallest known degree, it is determined that the incidental information is necessary for the user (step S88), and the process ends.

【0093】ここで、「知識状態」と「追加情報」とが
不明用語として入力された場合を例にとり、評価情報反
映部の動きを説明する。図22は入力された不明用語リ
スト40を示す図である。不明用語として「知識状態」
と「追加情報」とがリストされている。この時、知識状
態管理部に管理されている知識状態は図14に示すもの
であり、処理内容記憶部に記憶されている第1の文書は
図9に示すものであり、関連情報リストは図13に示す
ものであるとする。
Here, the operation of the evaluation information reflecting section will be described by taking as an example the case where “knowledge state” and “additional information” are input as unknown terms. FIG. 22 is a diagram showing the input unknown term list 40. "Knowledge state" as an unknown term
And "additional information" are listed. At this time, the knowledge state managed by the knowledge state management unit is shown in FIG. 14, the first document stored in the processing content storage unit is shown in FIG. 9, and the related information list is shown in FIG. 13 is shown.

【0094】まず、不明用語リストから「知識状態」が
選択される。次に「知識状態」に関する既知レコード1
2c,12d,12g(図14に示す)が知識状態管理
部から取り出される。取り出された既知レコード12
c,12d,12gは、どれも既知度が15より大きい
ので、既知度が最小な詳細情報が利用者に必要であると
決定する。そして、「知識状態」をキー属性値とし、関
連種属性値が「詳細情報」である関連情報が取り出され
て関連情報リストに追加され、さらに、「知識状態」を
キーとし、関連種を「詳細情報」、更新モードを「既
知」とした知識状態の更新の指示が知識状態管理部に対
して行なわれる。
First, "knowledge state" is selected from the unknown term list. Next, known record 1 about "knowledge state"
2c, 12d, 12g (shown in FIG. 14) are retrieved from the knowledge state management unit. Known record 12 retrieved
Since c, 12d, and 12g all have a known degree greater than 15, it is determined that the user needs detailed information with the smallest known degree. Then, "knowledge status" is used as a key attribute value, related information whose related seed attribute value is "detailed information" is extracted and added to the related information list, and further, "knowledge status" is used as a key The detailed state ”and the instruction to update the knowledge state with the update mode set to“ known ”are issued to the knowledge state management unit.

【0095】次に、不明用語リストから「追加情報」が
選択される。「追加情報」に関する既知レコードが知識
状態管理部から取り出されるが、「追加情報」既知レコ
ードは存在しないので、定義情報が利用者に必要である
と決定する。そして、「追加情報」をキー属性値とし、
関連種属性値が「定義情報」である関連情報が取り出さ
れて関連情報リストに追加される。図23は作成された
関連情報リスト41を示す図である。図23では、キー
属性が「知識状態」、関連種属性が「詳細情報」である
関連情報11dと、キー属性が「追加情報」、関連種属
性が「定義情報」である関連情報11fとが登録されて
いる。
Next, "additional information" is selected from the unknown term list. Although the known record regarding the "additional information" is retrieved from the knowledge state management unit, there is no known record regarding the "additional information", so it is determined that the definition information is necessary for the user. Then, "additional information" is used as the key attribute value,
The related information whose related seed attribute value is “definition information” is extracted and added to the related information list. FIG. 23 is a diagram showing the created related information list 41. In FIG. 23, the related information 11d in which the key attribute is “knowledge state” and the related species attribute is “detailed information” and the related information 11f in which the key attribute is “additional information” and the related species attribute is “definition information” are shown. It is registered.

【0096】さらに、「追加情報」をキーとし、関連種
を「定義情報」、更新モードを「既知」とした知識状態
の更新の指示が知識状態管理部に対して行なわれる。図
24は、更新された知識状態を示す図である。図24は
図14の知識状態から更新されたものである。この例で
は、図14に対して新たに、キー部が「追加情報」、関
連種部が「定義情報」である既知レコード12hが、既
知度「30」の状態で追加されている。
Further, with the "additional information" as a key, the knowledge state management section is instructed to update the knowledge state in which the related species is "definition information" and the update mode is "known". FIG. 24 is a diagram showing the updated knowledge state. 24 is updated from the knowledge state of FIG. In this example, a known record 12h having a key part of "additional information" and a related seed part of "definition information" is newly added to FIG. 14 in a state of known degree "30".

【0097】不明用語リストが空になったので、処理内
容記憶部から第1の文書20(図9に示す)と、以前抽
出された古い関連情報リスト22(図13に示す)が取
り出され、新たな関連情報リスト41と古い関連情報リ
スト22がマージされ、別の関連情報リストが作成され
る。図25は作成された関連情報リストを示す図であ
る。この関連情報リスト42には、古い関連情報リスト
22に登録されていた、2つの関連情報11b,11e
に続けて、関連情報リスト41に登録されていた2つの
関連情報11d,11fが登録されている。
Since the unknown term list has become empty, the first document 20 (shown in FIG. 9) and the previously extracted old related information list 22 (shown in FIG. 13) are retrieved from the processing content storage section, The new related information list 41 and the old related information list 22 are merged to create another related information list. FIG. 25 is a diagram showing the created related information list. In the related information list 42, the two related information 11b and 11e registered in the old related information list 22 are registered.
After that, the two related information 11d and 11f registered in the related information list 41 are registered.

【0098】次に第1の文書20と図25の関連情報リ
スト42は、処理内容記憶部に記憶され、さらに文書作
成部に送られる。文書作成部で、第1の文書20と関連
情報リスト42から文書を作成する。図26は作成され
た第2の文書43を示す図である。図26のアンダーラ
インのついた部分が、抽出された関連情報である。
Next, the first document 20 and the related information list 42 shown in FIG. 25 are stored in the processing content storage unit and further sent to the document creation unit. The document creation unit creates a document from the first document 20 and the related information list 42. FIG. 26 is a diagram showing the created second document 43. The underlined portion in FIG. 26 is the extracted related information.

【0099】このようにして、取り出した関連情報と該
文書に対する利用者の理解の様子が不明用語として入力
され、その不明用語を用いて、文書を利用者が理解する
ためにさらにどのような情報が必要であるかの条件が決
定され、決定された条件に合った関連情報が抽出され
る。同時に、決定された条件に該当する情報についての
知識状態管理部内の知識の状態は変更される。
In this way, the extracted related information and the state of the user's understanding of the document are input as unknown terms, and by using the unknown terms, what kind of information is further used for the user to understand the document. Is determined, and relevant information that matches the determined condition is extracted. At the same time, the knowledge status in the knowledge status management unit regarding the information corresponding to the determined condition is changed.

【0100】したがって、利用者からの理解の様子の入
力を受け付け、それを反映した関連情報の抽出ができる
ので、計算機上でシミュレートされた知識の状態と実際
の知識の状態との乖離による関連情報の不足分を補うこ
とができる。さらに、このとき計算機上でシミュレート
された知識の状態を変更するので、計算機上の知識の状
態は常に利用者の持つ実際の知識の状態に近いものに保
たれる。しかも、それが文書を理解するのに必要な関連
情報を抽出するために利用者が行った行動に付随して起
こるので、利用者にはシミュレートされた知識の状態を
実際の知識の状態に近いものに保つための特別の負荷が
かからない。
Therefore, since it is possible to receive the input of the state of understanding from the user and extract the related information reflecting it, the relation due to the difference between the simulated knowledge state and the actual knowledge state on the computer can be extracted. The lack of information can be supplemented. Further, at this time, since the state of knowledge simulated on the computer is changed, the state of knowledge on the computer is always kept close to the state of actual knowledge of the user. Moreover, since it occurs in association with the action taken by the user to extract the relevant information necessary to understand the document, the user can change the simulated state of knowledge into the actual state of knowledge. No extra load to keep things close.

【0101】[0101]

【発明の効果】以上説明したように本発明では、用語に
対する利用者の理解度が知識状態管理手段により管理さ
れており、原文書が入力されると、知識状態管理手段の
内容に基づいて、原文書内の所定の用語に対する関連情
報を抽出するようにしたため、利用者は、原文書ととも
に、その原文書の理解の補助となる適切な関連情報を利
用者の知識の状態に応じて得る事ができる。この結果、
文書の利用者は、文書を理解するのに必要な情報を得る
苦労が軽減され、文書作成者は、複数の文書を用意した
り、文書に多くの情報を盛り込んだりという苦労から開
放される。
As described above, in the present invention, the user's understanding of terms is managed by the knowledge status management means, and when an original document is input, based on the contents of the knowledge status management means, Since the related information for a given term in the original document is extracted, the user must obtain the original document and appropriate related information to assist understanding of the original document according to the state of knowledge of the user. You can As a result,
The user of the document is relieved of the trouble of obtaining the information necessary for understanding the document, and the document creator is freed from the trouble of preparing a plurality of documents and including a lot of information in the document.

【0102】また、原文書に対して、原文書中に出現す
る用語に関する利用者の理解度に応じた関連文書を補っ
た個別文書を作成するようにしたため、利用者は、文書
の理解の補助となる適切な種類の情報が補われた新たな
文書を得る事ができる。この結果、文書の利用者は、文
書を理解するのに必要な情報を得る苦労が軽減され、文
書作成者は、複数の文書を用意したり、文書に多くの情
報を盛り込んだりという苦労から開放される。
Further, since the individual document is created for the original document by supplementing the related document according to the user's degree of comprehension regarding terms appearing in the original document, the user can assist the understanding of the document. It is possible to obtain a new document supplemented with the appropriate type of information. As a result, the user of the document is relieved of the trouble of obtaining the information necessary to understand the document, and the document creator is free from the trouble of preparing multiple documents and including a lot of information in the document. To be done.

【0103】また、知識状態管理手段は、用語の関連情
報が関連情報管理手段から抽出された際に、その用語の
理解度を変更するため、利用者の各用語に対する理解度
を、常に適切な値に保ことがでる。
Further, since the knowledge status management means changes the understanding level of the term when the related information of the term is extracted from the related information management means, the knowledge level of the user is always appropriate. It can be kept at the value.

【0104】また、不明用語が入力されると、その不明
用語に対する利用者の理解度に応じて関連情報を抽出す
るようにしたため、利用者の理解の度合いを反映した関
連情報の抽出ができるので、知識状態管理手段の管理し
ている知識の状態と実際の知識の状態との乖離による関
連情報の不足分を補うことができる。さらにこのとき、
知識状態管理手段の知識の状態を変更することにより、
計算機上の知識の状態は常に利用者の持つ実際の知識の
状態に近いものに保たれる。しかも、それが、文書を理
解するのに必要な関連情報を抽出するために利用者が行
った行動に付随して起こるので、利用者にはシミュレー
トされた知識の状態を実際の知識の状態に近いものに保
つための特別の負荷がかからない。
When an unknown term is input, the related information is extracted according to the degree of understanding of the user with respect to the unknown term. Therefore, the related information reflecting the degree of understanding of the user can be extracted. It is possible to compensate for the lack of related information due to the deviation between the knowledge state managed by the knowledge state management means and the actual knowledge state. At this time,
By changing the knowledge status of the knowledge status management means,
The state of knowledge on the computer is always kept close to the actual state of knowledge of the user. Moreover, since it occurs in association with the action taken by the user to extract the relevant information needed to understand the document, the user is given the simulated state of knowledge as the actual state of knowledge. No extra load to keep things close to.

【0105】また、原文書が入力された際には、その原
文書と、その際に情報抽出手段が抽出した関連情報とを
記憶手段に格納しておき、不明用語が入力されたときに
その不明用語に対する関連情報と情報抽出手段が抽出し
た関連情報とを原文書に付加した個別文書を作成するよ
うにしたため、利用者からの理解の様子の入力を受け付
け、それを反映した文書を作成することができ、利用者
は、自己の知識の状態に適したレベルの内容が記述され
た文書を得ることができる。
When an original document is input, the original document and the related information extracted by the information extracting unit at that time are stored in the storage unit, and when the unknown term is input, Since the individual document is created by adding the related information for the unknown term and the related information extracted by the information extraction means to the original document, the input of the understanding state from the user is accepted and the document reflecting it is created. Therefore, the user can obtain the document in which the contents of the level suitable for the state of his / her knowledge are described.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理構成図である。FIG. 1 is a principle configuration diagram of the present invention.

【図2】本発明を実施するための文書処理装置の第1の
例の構成図である。
FIG. 2 is a configuration diagram of a first example of a document processing apparatus for implementing the present invention.

【図3】関連情報管理部に管理されている関連情報の例
を示す図である。
FIG. 3 is a diagram showing an example of related information managed by a related information management unit.

【図4】知識状態管理部で管理されている既知レコード
の例を示す図である。
FIG. 4 is a diagram showing an example of known records managed by a knowledge state management unit.

【図5】第1の文書が追加情報抽出部に入力された場合
の関連情報の抽出と知識状態の更新の手順を示したフロ
ーチャートである。
FIG. 5 is a flowchart showing a procedure of extracting related information and updating a knowledge state when the first document is input to the additional information extracting unit.

【図6】条件絞り込み部で行われる関連種の決定(ステ
ップS5)の手順をフローチャートで示したものであ
る。
FIG. 6 is a flowchart showing a procedure of determining a related species (step S5) performed by a condition narrowing unit.

【図7】定義情報が必要な場合の処理(ステップ7)の
手順を示したフローチャートである。
FIG. 7 is a flowchart showing a procedure of processing (step 7) when definition information is required.

【図8】個別文書作成部での第2の文書作成の手順を示
したフローチャートである。
FIG. 8 is a flowchart showing a procedure of creating a second document in the individual document creating unit.

【図9】入力される文書の例を示す図である。FIG. 9 is a diagram showing an example of an input document.

【図10】作成された専門用語リストを示す図である。FIG. 10 is a diagram showing a created technical term list.

【図11】取り出された2つの既知レコードを示す図で
ある。
FIG. 11 is a diagram showing two known records extracted.

【図12】取り出された関連情報を示す図である。FIG. 12 is a diagram showing extracted related information.

【図13】作成された関連情報リストを示す図である。FIG. 13 is a diagram showing a created related information list.

【図14】更新された知識状態を示す図である。FIG. 14 is a diagram showing an updated knowledge state.

【図15】作成された第2の文書を示す図である。FIG. 15 is a diagram showing a created second document.

【図16】ハイパーテキストとして第2の文書を作成す
るための手順を示すフローチャートである。
FIG. 16 is a flowchart showing a procedure for creating a second document as hypertext.

【図17】ハイパーテキストで関連づけられた第2の文
書を示す図である。
FIG. 17 is a diagram showing a second document associated by hypertext.

【図18】本発明を実施するための文書処理装置の第2
の例の構成図である。
FIG. 18 is a second document processing apparatus for implementing the present invention.
FIG. 3 is a configuration diagram of an example of FIG.

【図19】第1の文書が追加情報抽出部に入力された場
合の関連情報の抽出と知識状態の更新の手順を示したフ
ローチャートである。
FIG. 19 is a flowchart showing a procedure of extracting related information and updating a knowledge state when the first document is input to the additional information extracting unit.

【図20】不明用語リストが入力された場合の関連情報
の抽出と知識状態の更新の手順を示したフローチャート
である。
FIG. 20 is a flowchart showing a procedure of extracting related information and updating a knowledge state when an unknown term list is input.

【図21】第2条件決定部で行われる関連種の決定の手
順をフローチャートで示したものである。
FIG. 21 is a flowchart showing a procedure of determining a related species performed by a second condition determining unit.

【図22】入力された不明用語リストを示す図である。FIG. 22 is a diagram showing an input unknown term list.

【図23】作成された関連情報リストを示す図である。FIG. 23 is a diagram showing a created related information list.

【図24】更新された知識状態を示す図である。FIG. 24 is a diagram showing an updated knowledge state.

【図25】作成された関連情報リストを示す図である。FIG. 25 is a diagram showing a created related information list.

【図26】作成された第2の文書を示す図である。FIG. 26 is a diagram showing a created second document.

【符号の説明】[Explanation of symbols]

1 知識状態管理手段 1a 既知レコード 2 関連情報管理手段 2a 関連情報 3 原文書 3a 個別文書 4 用語抽出手段 4a 用語 5 情報抽出手段 6 文書作成手段 11 関連情報管理部 12 知識状態管理部 13 追加情報抽出部 13a 専門用語抽出部 13b 条件絞り込み部 14 個別文書作成部 15 関連情報入出力i/f 16 利用者入出力i/f 1 Knowledge State Management Means 1a Known Records 2 Related Information Management Means 2a Related Information 3 Original Documents 3a Individual Documents 4 Term Extraction Means 4a Terms 5 Information Extraction Means 6 Document Creation Means 11 Related Information Management Department 12 Knowledge State Management Department 13 Additional Information Extraction Part 13a Technical term extraction part 13b Condition narrowing part 14 Individual document creation part 15 Related information input / output i / f 16 User input / output i / f

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 原文書を変換して利用者に提供する文書
処理装置において、 用語に対する複数の関連情報を関連の種類に対応付けて
管理する関連情報管理手段と、 用語に対する前記利用者の理解度を管理する知識状態管
理手段と、 入力された前記原文書から所定の用語を抽出する用語抽
出手段と、 前記用語抽出手段が抽出した用語に対する前記利用者の
理解度を前記知識状態管理手段から取得し、理解度に応
じた関連の種類の関連情報を前記関連情報管理手段から
抽出する情報抽出手段と、 を有することを特徴とする文書処理装置。
1. In a document processing apparatus for converting an original document and providing it to a user, a related information managing means for managing a plurality of related information for a term in association with a related type, and an understanding of the user for the term. From the knowledge state management unit, the knowledge state management unit that manages the degree of understanding, the term extraction unit that extracts a predetermined term from the input original document, and the degree of understanding of the user with respect to the term extracted by the term extraction unit. A document processing apparatus, comprising: an information extraction unit that acquires and extracts, from the related information management unit, related information of a related type according to an understanding level.
【請求項2】 前記原文書と前記情報抽出手段が抽出し
た関連情報とから、利用者に提供するための個別文書を
作成する文書作成手段を、 さらに有することを特徴とする請求項1記載の文書処理
装置。
2. The document creating means for creating an individual document to be provided to a user from the original document and the related information extracted by the information extracting means is further included. Document processing device.
【請求項3】 前記知識状態管理手段は、前記関連情報
管理手段から関連情報が抽出されると、抽出された関連
情報に対する前記利用者の理解度を変更することによ
り、前記利用者の理解度を管理していることを特徴とす
る請求項1記載の文書処理装置。
3. The knowledge status management unit, when the related information is extracted from the related information management unit, changes the understanding level of the user with respect to the extracted related information to thereby obtain the understanding level of the user. The document processing apparatus according to claim 1, wherein the document processing apparatus manages the document.
【請求項4】 不明用語が入力されると、不明用語に対
する前記利用者の理解度を前記知識状態管理手段から取
得し、不明用語の理解度に応じた関連情報を前記関連情
報管理手段から抽出する不明用語情報抽出手段を、 さらに有することを特徴とする請求項1記載の文書処理
装置。
4. When an unknown term is input, the degree of comprehension of the user with respect to the unknown term is acquired from the knowledge status management means, and relevant information corresponding to the degree of comprehension of the unknown term is extracted from the relevant information management means. The document processing apparatus according to claim 1, further comprising unknown term information extraction means for performing the unknown term information extraction.
【請求項5】 前記原文書と前記情報抽出手段が抽出し
た関連情報とを格納する記憶手段と、 不明用語が入力されると、前記記憶手段から前記原文書
と前記情報抽出手段が抽出した関連情報とを取り出し、
取り出した情報に前記不明用語情報抽出手段が抽出した
関連情報を加えて、利用者に提供するための個別文書を
作成する不明情報付加文書作成手段と、 をさらに有することを特徴とする請求項4記載の文書処
理装置。
5. A storage unit for storing the original document and the related information extracted by the information extracting unit, and a relation extracted by the original document and the information extracting unit from the storage unit when an unknown term is input. Take out information and
The unknown information added document creating means for creating the individual document to be provided to the user by adding the related information extracted by the unknown term information extracting means to the extracted information, further comprising: Document processing device described.
JP01286896A 1996-01-29 1996-01-29 Document processing device Expired - Fee Related JP3752717B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01286896A JP3752717B2 (en) 1996-01-29 1996-01-29 Document processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01286896A JP3752717B2 (en) 1996-01-29 1996-01-29 Document processing device

Publications (2)

Publication Number Publication Date
JPH09204418A true JPH09204418A (en) 1997-08-05
JP3752717B2 JP3752717B2 (en) 2006-03-08

Family

ID=11817402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01286896A Expired - Fee Related JP3752717B2 (en) 1996-01-29 1996-01-29 Document processing device

Country Status (1)

Country Link
JP (1) JP3752717B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009020092A1 (en) * 2007-08-03 2009-02-12 Nec Corporation Associated information search system and associated information search method
JP2009042968A (en) * 2007-08-08 2009-02-26 Nec Corp Information selection system, information selection method, and program for information selection
JP2016045796A (en) * 2014-08-25 2016-04-04 Kddi株式会社 Terminal, program and method indicating support information for interaction sentence from opposite party
WO2022003967A1 (en) * 2020-07-03 2022-01-06 日本電信電話株式会社 Speech understanding assistance system, method, device, and program
US11520839B2 (en) * 2020-07-06 2022-12-06 International Business Machines Corporation User based network document modification

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05257925A (en) * 1992-03-16 1993-10-08 Nippon Telegr & Teleph Corp <Ntt> Reader level adaptive type electronic newspaper editing system
JPH05265677A (en) * 1992-03-18 1993-10-15 Hitachi Ltd Information providing system
JPH08297661A (en) * 1995-04-26 1996-11-12 Canon Inc Device and method for document processor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05257925A (en) * 1992-03-16 1993-10-08 Nippon Telegr & Teleph Corp <Ntt> Reader level adaptive type electronic newspaper editing system
JPH05265677A (en) * 1992-03-18 1993-10-15 Hitachi Ltd Information providing system
JPH08297661A (en) * 1995-04-26 1996-11-12 Canon Inc Device and method for document processor

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009020092A1 (en) * 2007-08-03 2009-02-12 Nec Corporation Associated information search system and associated information search method
JP5218409B2 (en) * 2007-08-03 2013-06-26 日本電気株式会社 Related information search system and related information search method
JP2009042968A (en) * 2007-08-08 2009-02-26 Nec Corp Information selection system, information selection method, and program for information selection
JP2016045796A (en) * 2014-08-25 2016-04-04 Kddi株式会社 Terminal, program and method indicating support information for interaction sentence from opposite party
WO2022003967A1 (en) * 2020-07-03 2022-01-06 日本電信電話株式会社 Speech understanding assistance system, method, device, and program
US11520839B2 (en) * 2020-07-06 2022-12-06 International Business Machines Corporation User based network document modification

Also Published As

Publication number Publication date
JP3752717B2 (en) 2006-03-08

Similar Documents

Publication Publication Date Title
US10042828B2 (en) Rich text handling for a web application
US7130867B2 (en) Information component based data storage and management
US6889223B2 (en) Apparatus, method, and program for retrieving structured documents
US6012053A (en) Computer system with user-controlled relevance ranking of search results
US8117177B2 (en) Apparatus and method for searching information based on character strings in documents
US5752021A (en) Document database management apparatus capable of conversion between retrieval formulae for different schemata
US20050149538A1 (en) Systems and methods for creating and publishing relational data bases
US20090106238A1 (en) Contextual Searching of Electronic Records and Visual Rule Construction
US8788494B2 (en) Method, device and system for processing, browsing and searching an electronic documents
JPH0293866A (en) Summary generating device
JP4042830B2 (en) Content attribute information normalization method, information collection / service provision system, and program storage recording medium
KR20170134191A (en) Software domain topics extraction system using PageRank and topic modeling
JP3832693B2 (en) Structured document search and display method and apparatus
JPH0550774B2 (en)
JP3752717B2 (en) Document processing device
CN112685389B (en) Data management method, data management device, electronic device, and storage medium
JP3465615B2 (en) Search method and apparatus and recording medium on which the method is programmed and recorded
JPH11224263A (en) Key word retrieval device and computer-readable record medium where key word retrieving program is recorded
JP6703698B1 (en) Information provision system
JP3580004B2 (en) Document processing apparatus and document processing method
JP3428272B2 (en) Document processing device
JP4034503B2 (en) Document search system and document search method
JPH1145238A (en) Document management system and computer readable recording medium for recording program for having computer function as the same system
LACÃO MINING SOFTWARE MODEL REPOSITORIES
JPH10149364A (en) Word selection device and storage medium

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051205

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131222

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees