JP3428272B2 - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JP3428272B2
JP3428272B2 JP01553496A JP1553496A JP3428272B2 JP 3428272 B2 JP3428272 B2 JP 3428272B2 JP 01553496 A JP01553496 A JP 01553496A JP 1553496 A JP1553496 A JP 1553496A JP 3428272 B2 JP3428272 B2 JP 3428272B2
Authority
JP
Japan
Prior art keywords
document
information
user
term
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP01553496A
Other languages
English (en)
Other versions
JPH09212491A (ja
Inventor
仁樹 京嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP01553496A priority Critical patent/JP3428272B2/ja
Publication of JPH09212491A publication Critical patent/JPH09212491A/ja
Application granted granted Critical
Publication of JP3428272B2 publication Critical patent/JP3428272B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は利用者に提供すべき
文書の作成を補助する文書処理装置に関し、特に所定の
用語に対する利用者の理解度を個別に管理している文書
処理装置に関する。
【0002】
【従来の技術】人間の情報伝達において文書が果たす役
割は大きい。人間の知的活動の結果を保存して、後の他
の人間の用に供するための手段として、文書の形にして
おくのはもっともポピュラーな手段である。また、日々
のコミュニケーションにおいても、昨今は電子メールと
いう電子的な文書を利用して行われる事が多い。
【0003】ところが、このような文書による情報伝達
には、文書の作成者が持つ知識と、文書の利用者が持つ
知識との違いから、ミスコミュニケーションがもたらさ
れ、文書作成者と利用者との相互にかかる負荷が増大す
るという大きな問題がある。例えば、文書の利用者が文
書を読む場合に、文書中にある専門用語の定義や関連す
る情報を知らず、文書の内容を充分に理解できないこと
は頻繁に起こる。その結果、文書の内容についての価値
を正確に判断できず、重要な情報を見逃してしまうこと
は多い。また、文書の内容を誤解し、その後の行動に支
障をきたす事もある。このような、ミスコミュニケーシ
ョンを防ぐためには、利用者は、文書作成者あるいは、
文書作成者と同様の知識をもつ別人に種々の問合せを行
わなければならず、これは文書作成者/利用者双方にと
って大きな負荷になる。
【0004】そこで、文書の作成者は、ミスコミュニケ
ーションや文書の利用者に必要以上の負荷がかかること
を防ぐために、文書の利用者の知識レベルを想定して、
用語を選択したり、用語の定義や関連情報を文書に追加
したりする。したがって、文書の作成者と利用者の共有
する知識が少ないほど、より多くの情報を文書に載せね
ばならず、文書作成者の大きな負荷となっている。
【0005】また、文書の利用者が多い場合、利用者の
持つ知識は様々であり、文書作成者は、利用者毎に利用
者に理解可能な文書を作るとか、あるいは、利用者に多
いと思われる知識のレベルを想定して、そのレベルに合
わせた単一の文書を作成することになる。ただし、前者
の場合は、同じ情報を伝えるのに複数の文書を作成する
という負荷を作成者に負わせる事になる。後者の場合
は、文書作成者と多くの知識を共有している文書利用者
には、不必要な情報が多い冗長な文章となり、読むのに
必要以上に時間がかかる。逆に、文書作成者が想定した
レベルの知識を持たない文書利用者にとっては充分理解
できない文書になる。
【0006】このような問題点を解消するために、特開
平7−93334号公報に開示された発明では、利用者
が持つ単語の既知未知の状態を計算機がシミュレート
し、文書中の単語のうち利用者が知らない単語を自動的
に判別するステップと、前記未知の単語に利用者が知っ
ている同義語を自動的に補足するステップと、前記同義
語を補足した文書を自動的に表示するステップとからな
る文書処理方法が示されている。
【0007】また、前記の公報には、利用者が持つ単語
の既知未知の状態を計算機がシミュレートし、文書中の
単語のうち利用者が知らない単語を自動的に判別する手
段と、前記未知の単語に利用者が知っている同義語を自
動的に補足する手段と、前記同義語を補足した文書を自
動的に表示する手段と、を備えた文書処理装置も開示さ
れている。
【0008】このような文書処理方法及び文書処理装置
によって、文書利用者毎に、文書の利用者の知らない用
語に文書の利用者が知っている同義語を自動的に付加す
る事で、文書の利用者の理解を助け、さらには、文書の
作成者の負担を軽減している。
【0009】
【発明が解決しようとする課題】しかし、特開平7−9
3334号公報に開示された発明では、同義語の存在し
ない、比較的新規な概念を表す用語や表現を利用者に理
解してもらうことには無力である。しかも、実際に利用
者が文書を理解する際に問題になるのは、新規な概念を
表す用語や表現である。それは以下の理由による。
【0010】第1の理由は、同義語が存在するほど一般
的な概念に較べて、新規な概念は、該概念を既知な利用
者が圧倒的に少ないことである。第2の理由は、新たな
情報を含んでいる価値の高い情報には、新規な概念を表
す用語や表現が出現する事が多く、しかもそれが文書の
中で重要な役割を持っている事が多いことである。
【0011】上記の問題を回避するために、文書の作成
者は、新規な概念を表す場合、想定する利用者が持つ知
識で理解可能な程度に、理解の容易な用語や表現を使用
するのが一般的である。ところが、この場合には、想定
する利用者が文書の作成者のよく知っている人間でない
限り、利用者が持つ知識の想定は困難である。また、利
用者が多人数の場合には、利用者全体の知識の傾向を考
慮して文書を作成するのは非常に難しい。その結果、文
書作成者は、利用者にとって理解しにくい文書を作成し
てしまい、ミスコミュニケーションを起こすか、文書を
伝達した後に、相互理解のために作成者/利用者双方に
余分な負荷をかけることになるか、懇切丁寧な文書を作
成するのに必要以上の時間を割き、その上、多くの利用
者に文書の理解に必要以上の手間をとらせるかのいずれ
かになる。
【0012】このように、比較的新規な概念を含む文書
を配付する場合、その利用者の知識の程度が分からない
ため、利用者が理解し易いような用語で文章を構成する
ことが困難であった。
【0013】本発明はこのような点に鑑みてなされたも
のであり、既存の文書に含まれる用語や表現に関する利
用者の理解度を予測する文書処理装置を提供することを
目的とする。
【0014】
【課題を解決するための手段】図1は本発明の原理構成
図である。本発明では上記課題を解決するために、利用
者に提供する文書の作成を補助する文書処理装置におい
て、複数の利用者ごとに設けられ、用語に対する利用者
の理解度を管理する知識状態管理手段1a,1b,1c
・・・と、任意の用語に対する各利用者の理解度を示す
情報を前記知識状態管理手段1a,1b,1c・・・か
ら収集し、収集した情報の統計をとる利用者理解度予測
手段4と、を有することを特徴とする文書処理装置が提
供される。
【0015】この構成によれば、複数の利用者の用語に
対する理解度が、各利用者に対応する知識状態管理手段
1a,1b,1c・・・によって管理されている。利用
者理解度予測手段4は、任意の用語に対する各利用者の
理解度を示す情報を各利用者の知識状態管理手段1a,
1b,1c・・・から収集し、収集した情報の統計をと
る。これにより、文書作成者は、利用者理解度予測手段
4が計算した統計結果から利用者の理解度が予測でき
る。
【0016】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて説明する。図1は本発明の原理構成図であ
る。本発明の文書処理装置には、複数の利用者ごとに知
識状態管理手段1a,1b,1c,・・・が設けられて
いる。知識状態管理手段1a,1b,1c,・・・は、
対応する利用者の任意の用語に対する理解度を管理して
いる。用語抽出手段3は、入力された文書2から所定の
用語3aを抽出する。理解度解析手段4は、用語抽出手
段3が抽出した用語3aに対する利用者の理解度に関す
る情報を、各知識状態管理手段1a,1b,1c,・・
・から収集し、収集した情報の統計をとり、予測データ
を作成する。その予測データは、理解度解析手段4内の
記憶部4aに格納される。記憶部4aに格納された予測
データは、利用者に配付すべき文書を作成する者(文書
作成者)の要求に応じて、表示装置に表示させることが
できる。
【0017】このような構成により、例えば、文書作成
者が作成した文書2に「VOD(Video On Demand)」と
いう比較的新しい用語が含まれている場合、用語抽出手
段3が文書2から「VOD」という用語3aを抽出す
る。このとき、知識状態管理手段1aでは「VOD」の
既知度は「20」であり、知識状態管理手段1bでは
「VOD」の既知度は「30」であり、知識状態管理手
段1cでは「VOD」の既知度は「0」であるものとす
る。なお、既知度は、値が大きい程その用語をよく知っ
ていることを示す。
【0018】理解度予測手段4は、各知識状態管理手段
1a,1b,1c,・・・から「VOD」に対する既知
度を収集する。そして、収集した多数の既知度の情報に
基づき予測データを作成し、その予測データを記憶部4
aに格納する。この例では、利用者の理解度を、「高度
既知者」、「既知者」、「未知者」の3段階に分けてい
る。そして、「VOD」に対する既知度を50人分収集
し、高度既知者が10人、既知者が25人、未知者が1
5人だったものとする。すると、全体の人数に対する各
理解度に含まれる人の割合が計算され、高度既知者が2
0%、既知者が50%、未知者が30%となる。これ
が、「VOD」という用語に対する利用者の理解度の予
測データとして記憶部4aに格納される。同様の処理を
文書2内の多数の用語に対して行えば、文書2全体に対
する利用者の理解度の予測結果が作成される。
【0019】文書作成者は記憶部4a内の予測データを
表示装置の画面に表示させることにより、自分が作成し
ている文書の内容が利用者にどの程度理解されるかを、
利用者にその文書を配付する前に知ることができる。そ
の結果、利用者にとって必要十分な詳しさ、丁寧さ、簡
単さを満たした文書を作成することが可能となる。
【0020】図2は、本発明を実施するための文書処理
装置の具体例を示す構成図である。これは、利用者が理
解すべき第1の文書を入力すると、利用者の理解可能な
第2の文書に自動的に変換する文書処理装置に対して、
本発明の機能を付加した場合の例である。
【0021】図2において、関連情報管理部40は、利
用者が文書の内容を理解するのに必要な情報(以後、関
連情報と呼ぶ)の蓄積/管理/検索を行う部分である。
関連情報管理部40に管理されている関連情報の登録/
削除/更新は、関連情報作成者が管理している。なお、
関連情報作成者は、文書作成者34が兼任することもで
きる。
【0022】また、利用者15,25毎に知識状態管理
部11,21、追加情報抽出部12,22、文書作成部
13,23、および利用者入出力i/f14,24が設
けられている。知識状態管理部11,21は、対応する
利用者15,25の知識状態を表す情報を蓄積/管理す
る部分である。
【0023】追加情報抽出部12,22は、それぞれ専
門用語抽出部12a,22aと条件絞り込み部12b,
22bとを含んでいる。専門用語抽出部12a,22a
は、文書を解析し、その文書から専門用語を抽出する。
そして、抽出された専門用語により専門用語リストを作
る。条件絞り込み部12b,22bは、専門用語抽出部
12a,22aで抽出された用語に対して、その用語に
関する情報で、利用者に必要な情報の関連種を決定す
る。このような構成の追加情報抽出部12,22では、
第1の文書を利用者が理解するのに必要な関連情報を関
連情報管理部40から取り出し、第1の文書と取り出し
た関連情報のリストを文書作成部13,23に送る。な
お、第1の文書は、文書作成者34から文書の送信先の
指定を受けた場合に、文書編集部32で編集中の文書が
送られる。
【0024】文書作成部13,23は、追加情報抽出部
12,22から送られた文書と関連情報から、第2の文
書を作成する。利用者15,25は、入出力i/fをと
おして、第2の文書を読むことができる。また、このと
き知識状態管理部11,22は、第1の文書の内容に応
じて、利用者15,25の知識状態を更新する。
【0025】一方、文書作成者34側には、知識状態管
理部11,21に接続された利用者理解度予測部31、
追加情報抽出部12,22に接続された文書編集部3
2、および文書作成者34の入出力を管理する文書作成
者入出力i/f33が設けられている。文書編集部32
は、文書作成者が文書の編集を行なう部分である。ま
た、文書の文書作成者から文書作成者入出力i/f33
を通して文書の送信先の指定を受けると、現在編集中の
文書を指定された利用者毎の追加情報抽出部12,22
に送る。
【0026】利用者理解度予測部31は、専門用語抽出
部31aと用語理解度予測部31bとを有している。専
門用語抽出部31aは文書編集部で編集中の文書から所
定の専門用語を抽出する。用語理解度予測部31bは、
各利用者15,25の知識状態に基づき、指定された利
用者15,25が指定された用語や文書についてどの程
度の理解度を持っているかの傾向を予測する。
【0027】以下に、上記の構成により実行される処理
機能の詳細について説明する。なお、図2の文書処理装
置では、利用者理解度予測部31が本発明の主要部であ
るが、この利用者理解度予測部31において正確な予測
を行うには、利用者の用語に対する理解度が常に知識状
態管理部でシミュレートされていることが重要である。
そこで、各利用者15,25の知識状態をシミュレート
するための機能から説明する。
【0028】関連情報管理部40において、関連情報
は、情報本体を示す本体データと、本体データがどんな
種類の型のデータかを示すデータ型属性と、その情報が
何に関する情報かを示す文字列を格納するキー属性と、
キー部で指定された対象に対してどのような関連をもつ
情報かを示す関連種属性と、からなるデータとして管理
されている。本体データは、文字列あるいは各種図形な
どのデータ型のデータが格納されている。この例で利用
可能なデータ型は、文字列型、表型、幾何図形型、数式
型、イメージ型、そしてそれらの複合型である。本体デ
ータがどの型に属するかは、データ型属性に示されてい
る。
【0029】関連種属性には、関連情報がキー属性で示
された対象の定義であることを示す「定義情報」と、関
連情報がキー属性で示された対象の詳細であることを示
す「詳細情報」と、関連情報がキー属性で示された対象
に付随するものであることを示す「付帯情報」との3種
の値のうちのどれかが格納される。
【0030】そして、関連情報管理部40は、検索機能
を有している。この検索機能は、キー属性の値、関連種
属性の値、とともに関連情報の取り出しが指定された場
合に、指定されたキー属性値、関連種属性値、を持つ関
連情報を検索し、その関連情報が存在すれば取り出しを
行う。
【0031】図3は関連情報管理部に管理されている関
連情報の例を示す図である。関連情報は、キー属性4
1、関連種属性42、データ型属性43、本体データ4
4の項目により管理されている。この図では、6種類の
関連情報40a〜40fを示している。なお、この例に
示す関連情報は全て「文字列型」のデータ型属性であ
る。
【0032】キー属性が「関連情報」である関連情報は
2種類あり、1つめの関連情報40aの関連種属性は
「定義情報」、2つめの関連情報40bの関連種属性は
「詳細情報」である。キー属性が「知識状態」である関
連情報は3種類あり、1つめの関連情報40cの関連種
属性は「定義情報」、2つめの関連情報40dの関連種
属性は「詳細情報」、3つめの関連情報40eの関連種
属性は「付帯情報」である。キー属性が「追加情報」で
ある関連情報は1種類あり、その関連情報40fの関連
種属性は「定義情報」である。
【0033】次に、図2の例に示す知識状態管理部1
1,21について説明する。知識状態管理部11,21
では、ユーザが知っている情報を表す既知レコードが管
理されている。個々の既知レコードは、ユーザが知って
いる情報のカテゴリと、ユーザがその情報のカテゴリの
情報をどの程度知っているかの度合を表す既知度(0か
ら30の整数値)と、からなる。
【0034】この例における情報のカテゴリは、情報が
何に関するものであるかを示す文字列を保持しているキ
ー部と、キー部で指定された対象に対するどのような情
報かを示す関連種部と、からなる。関連種部には、情報
がキー属性で示された対象の定義であることを示す「定
義情報」と、情報がキー属性で示された対象の詳細であ
ることを示す「詳細情報」と、情報がキー属性で示され
た対象に付随するものであることを示す「付帯情報」と
の3種の値のうちのどれかが格納される。
【0035】知識状態管理部11,21は、知識状態の
参照の指示が文字列とともに入力されると、該文字列を
キー部に持つ既知レコードを出力する。なお、同じ文字
列をキー部に持つ既知レコードは複数存在し得るため、
指示された文字列に該当する既知レコードが複数あれ
ば、それら全てを出力する。
【0036】また、知識状態管理部11,21は、キー
を表す文字列、関連種の値、更新モード(「既知」、
「未知」のどちらか)とともに、知識状態の更新が指定
されれば、管理している既知レコードの登録/更新を行
なう。更新モードが既知であった場合、該キーを表す文
字列、関連種の値を持つ既知レコードが存在すれば、そ
の既知度を30にする。該当する既知レコードが存在し
なければ、該キーを表す文字列、関連種の値を持つ既知
レコードを作り、その既知度を30にする。
【0037】更新モードが未知であった場合、該キーを
表す文字列、関連種の値を持つ既知レコードが存在すれ
ば、その既知度を0にする。該当する既知レコードが存
在しなければ、該キーを表す文字列、関連種の値を持つ
既知レコードを作り、その既知度を0にする。
【0038】さらに、知識状態管理部11,21は、管
理しているすべての既知レコードの既知度の値を、24
時間経過ごとに−1する機能を含んでいる。これは、時
間の経過とともに忘却してしまう人間の特徴をシミュレ
ートするためである。ただし、既知度が0であるもの
は、それ以上減少しない。
【0039】図4は知識状態管理部11で管理されてい
る既知レコードの例を示す図である。既知レコードは、
キー部111、関連種部112、既知度113の項目に
より管理されている。この図では、5種類の既知レコー
ド11a〜11eを示している。
【0040】キー部が「関連情報」である既知レコード
は2種類あり、1つめの既知レコード11aの関連種部
は「定義情報」、既知度は「20」であり、2つめの既
知レコード11bの関連種部は「詳細情報」、既知度は
「10」である。キー部が「知識状態」である既知レコ
ードは3種類あり、1つめの既知レコード11cの関連
種部は「定義情報」、既知度は「25」であり、2つめ
の既知レコード11dの関連種部は「詳細情報」、既知
度は「20」であり、3つめの既知レコード11eの関
連種属性は「付帯情報」、既知度は「0」である。
【0041】次に、追加情報抽出部12,22について
説明する。図5は、第1の文書が追加情報抽出部に入力
された場合の関連情報の抽出と知識状態の更新の手順を
示したフローチャートである。
【0042】まず、専門用語抽出部12a,22aで、
文書編集部32から送られた第1の文書を解析し、文書
中の専門的な意味を持つ名詞(以降、専門用語と呼ぶ)
のリストを作る(ステップS1)。そのために、専門用
語抽出部12a,22aは、文書中の文を分割する形態
素解析部と、一般用語の名詞辞書を持っている。専門用
語抽出部12a,22aは、形態素解析の結果抽出され
た名詞を一般用語の名詞辞書で調べ、そこになかったも
のを専門用語と判断する。
【0043】次に専門用語リストが空かどうかを調べる
(ステップS2)。空なら、第1の文書と関連情報のリ
ストを文書作成部に送って(ステップS3)、処理が終
了する。専門用語リストが空でなければ、リストから専
門用語を一つ取り出す(ステップS4)。このとき、取
り出した専門用語はリストから削除する。
【0044】次に、取得した用語に対して、条件絞り込
み部で利用者が第1の文書を理解するために必要な情報
の関連種の決定を行う(ステップS5)。関連種の決定
の結果、利用者に必要な関連情報があるか否か、必要な
関連情報があるならば、その関連種は何かを判断する
(ステップS6)。関連種の決定の結果、利用者にはど
の関連種の情報も必要ないと決定されれば、専門用語リ
ストのチェック(ステップS2)にもどる。
【0045】利用者には定義情報が必要であると決定さ
れた場合には、後述する定義情報が必要な場合の処理を
行い(ステップS7)、専門用語リストのチェック(ス
テップS2)にもどる。利用者には詳細情報が必要であ
ると決定された場合には、後述する詳細情報が必要な場
合の処理を行い(ステップS8)、専門用語リストのチ
ェック(ステップS2)にもどる。利用者には付帯情報
が必要であると決定された場合には、後述する付帯情報
が必要な場合の処理を行い(ステップS9)、専門用語
リストのチェック(ステップS2)にもどる。
【0046】図6は、条件絞り込み部で行われる関連種
の決定(ステップS5)の手順をフローチャートで示し
たものである。関連種の決定処理では、まず、取り出し
た専門用語とともに知識状態の参照の指示が知識状態管
理部に送られ、該専門用語をキー部に持つ既知レコード
を取り出す(ステップS11)。既知レコードがあるか
否かを判断し(ステップS12)、知識状態管理部内に
既知レコードが存在しなければ、その専門用語に関する
すべての情報が利用者にとって既知であり、どの関連種
の情報も必要ないと決定し(ステップS19)、終了す
る。
【0047】既知レコードが取り出せた場合、該既知レ
コードの内、関連種部の値が「定義情報」であるレコー
ドの既知度を調べる(ステップS13)。ここで、既知
度が15以下であった場合、利用者にとって定義情報が
必要であると決定し(ステップS14)、終了する。
【0048】関連種部の値が「定義情報」であるレコー
ドの既知度が15より大きい場合、その専門用語の定義
情報は利用者にとって既知であると判断し、取り出した
既知レコードの内の関連種部の値が「詳細情報」である
レコードの既知度を調べる(ステップS15)。ここ
で、既知度が15以下であった場合、利用者にとって詳
細情報が必要であると決定し(ステップS16)、終了
する。
【0049】関連種部の値が「詳細情報」であるレコー
ドの既知度が15より大きい場合、その専門用語の詳細
情報は利用者にとって既知であると判断し、取り出した
既知レコードの内の関連種部の値が「付帯情報」である
レコードの既知度を調べる(ステップS17)。ここ
で、既知度が15以下であった場合、利用者にとって付
帯情報が必要であると決定し(ステップS18)、終了
する。
【0050】関連種部の値が「付帯情報」であるレコー
ドの既知度が15より大きい場合、その専門用語に関す
るすべての情報が利用者にとって既知であり、どの関連
種の情報も必要ないと決定し(ステップS19)、終了
する。
【0051】図7は、定義情報が必要な場合の処理(ス
テップS7)の手順を示したフローチャートである。ま
ず、該専門用語をキー属性値とし、関連種属性値が「定
義情報」である関連情報の取り出しが関連情報管理部に
指示される(ステップS21)。ここで、定義情報が存
在したか否かを判断する(ステップS22)。定義情報
の取り出しに失敗した場合、利用者は該専門用語につい
て未知のままであるので、該専門用語をキーとし、関連
種を「定義情報」、更新モードを「未知」とした知識状
態の更新の指示が知識状態管理部に対して行なわれる。
その結果、定義情報の既知度が0に更新される(ステッ
プS23)。
【0052】関連情報の取り出しに成功した場合、該関
連情報を関連情報リストに追加(ステップS24)した
後、該専門用語をキーとし、関連種を「定義情報」、更
新モードを「既知」とした知識状態の更新の指示が知識
状態管理部に対して行なわれる。つまり、定義情報は利
用者に対して提示されることになるので、「既知」にな
るのである。その結果、定義情報の既知度が30に更新
される(ステップS25)。
【0053】詳細情報が必要な場合、付帯情報が必要な
場合の処理も、図7のフローチャートと同様の手順であ
る。ただし、「定義情報」の部分が、それぞれ、「詳細
情報」、「付帯情報」になる。
【0054】次に、文書作成部13,23について説明
する。文書作成部13,23は、追加情報抽出部から第
1の文書と後述する関連情報リストを受けとり、第1の
文書の適当な位置に、関連情報を追加することによっ
て、第2の文書を生成する。
【0055】図8は、文書作成部での第2の文書作成の
手順を示したフローチャートである。最初に、関連情報
リストが空かどうかが調べられる(ステップS31)。
関連情報リストが空であれば、第2の文書は完成であ
り、処理は終了する。関連情報リストが空でなければ、
関連情報がリストから取り出される(ステップS3
2)。このとき、取り出された関連情報はリストから削
除される。
【0056】次に、第1の文書の中で、関連情報のキー
属性の値と同じ文字列が出現する位置(正確には、マッ
チした文字列の再後尾の位置)を調べる(ステップS3
3)。該当する文字列が複数ある場合、最初に出現した
位置が採用される。
【0057】次に、関連情報のデータ型属性を調べる
(ステップS34)。データ型属性の値が文字列型でな
ければ、関連情報の本体データを前記文字列の位置の注
釈とする(ステップS38)。
【0058】データ型属性の値が文字列であれば、関連
情報の関連種属性の値が調べられる(ステップS3
5)。関連種属性の値が「定義情報」であった場合、本
体データの内容を括弧でくくり、ステップS33で検出
した位置に置き(ステップS37)、関連情報リストの
チェック(ステップS31)に戻る。
【0059】関連種属性の値が「詳細情報」であった場
合、本体データの長さが調べられる(ステップS3
6)。本体データの長さが20文字以下であった場合、
本体データの内容を括弧でくくり、ステップS33で検
出した位置に置き(ステップS37)、関連情報リスト
のチェック(ステップS31)に戻る。本体データの長
さが20文字より多かった場合、本体データを前記位置
の注釈とし(ステップS38)、関連情報リストのチェ
ックに戻る。 関連種属性の値が「付帯情報」であった
場合、本体データをステップS33で検出した位置の注
釈とし(ステップS38)、関連情報リストのチェック
(ステップS31)に戻る。
【0060】なお、この例の注釈処理(ステップS3
8)は、注釈を置く位置に注記号を置き、文書の後尾
に、該注記号とともに関連情報を置く処理である。ここ
で、以上のような文書処理装置の追加情報抽出部12に
第1の文書が入力された場合の各種情報の変化の様子に
ついて説明する。図9は文書編集部から送られる第1の
文書50を示す図である。このような第1の文書が入力
されると、専門用語リストの作成処理により、専門用語
リストが作成される。図10は作成された専門用語リス
ト51を示す図である。そして、この専門用語リスト5
1は空でないため、最初の専門用語「関連情報」が取り
出される。ここで、関連情報管理部40には図3に示す
関連情報が管理されており、知識状態管理部11には図
4に示す知識状態が管理されているものとする。
【0061】次に、「関連情報」をキー部に持つ既知レ
コードが取り出される。この場合、図4に示した既知レ
コードから、「関連情報」をキー部に持つ既知レコード
11a,11bが取り出される。図11は取り出された
2つの既知レコード11a,11bを示す図である。取
り出された既知レコードの内、関連種部の値が「定義情
報」である既知レコード11aの既知度は15より大き
く、関連種部の値が「詳細情報」である既知レコード1
1bの既知度は15以下であるので、利用者に必要なの
は、用語「関連情報」の「詳細情報」であると決定され
る。
【0062】そして、キー属性値が「関連情報」、関連
種属性値が「詳細情報」である関連情報の取り出しが関
連情報管理部に指示される。すると、図3に示した関連
情報からキー属性値が「関連情報」、関連種属性値が
「詳細情報」である関連情報がと取り出される。図12
は取り出された関連情報40bを示す図である。
【0063】図12に示す関連情報40bを関連情報リ
ストに追加した後、「関連情報」をキーとし、関連種を
「詳細情報」、更新モードを「既知」とした知識状態の
更新の指示が知識状態管理部に対して行なわれる。そし
て、専門用語リストのチェックに処理が戻る。
【0064】このような処理が専門用語リスト内の全て
の専門用語に対して行われる。その結果、関連情報リス
トが完成する。図13は作成された関連情報リスト52
を示す図である。図13では、キー属性が「関連情
報」、関連種属性が「詳細情報」である関連情報40b
と、キー属性が「知識状態」、関連種属性が「付帯情
報」である関連情報40eとがリストされている。この
時、知識状態管理部で管理されている知識状態が更新さ
れる。図14は更新された知識状態を示す図である。図
14は図4の知識状態から更新されたものである。更新
されたのは、キー部が「関連情報」、関連種部が「詳細
情報」である既知レコード11fと、キー部が「知識状
態」、関連種部が「付帯情報」である既知レコード11
gである。既知レコード11fは、既知度が10から3
0に変更されている。既知レコード11gは、既知度が
0から30に変更されている。このように、随時既知レ
コードの値が更新されることにより、利用者15の知識
状態がシミュレートされている。
【0065】なお、第1の文書50が図9に示すもので
あり、関連情報リスト52が図13のようであった場
合、図15に示すような第2の文書53が、文書作成部
13で作成される(アンダーラインのついた部分が第1
の文書に追加された部分である)。
【0066】利用者理解度予測部31は、以上のように
してシミュレートされた各利用者15,25の知識状態
を利用して、任意の専門用語に対する利用者の理解度を
予測する。以下に利用者の理解度予測方式について詳し
く説明する。
【0067】文書編集部32は、文書作成者が文書の編
集を行なう部分である。また、文書の文書作成者から文
書作成者入出力i/f33を通して文書の送信先の指定
を受けると、現在編集中の文書を指定された利用者毎の
追加情報抽出部12,22に送る。さらに、文書の編集
中に、利用者の指定とともに利用者理解度の予測の指示
が、文書作成者34から文書作成者入出力i/f33を
通して行なわれると、文書編集部32は現在編集中の文
書と指定された利用者のリストを利用者理解度予測部3
1に送る。
【0068】利用者理解度予測部31は、特定の用語
や、特定の文書に対する利用者の理解の状況を予測する
機能を持っている。文書作成者は、利用者理解度予測部
による理解度の予測結果を文書作成者入出力i/f33
を通して見て、編集中の文書を、より利用者に理解しや
すいように改定することができる。
【0069】さらに、利用者理解度予測部31内の専門
用語抽出部31aは、文書を解析し、該文書に含まれる
専門用語を抽出する。用語理解度予測部31bは、専門
用語抽出部で抽出された用語に対して、該用語の利用者
の理解度を予測する。
【0070】本実施例では、文書編集部から理解度予測
の指示とともに文書と利用者のリストが送られると、そ
の文書中の専門用語に対して、どの程度の利用者がどの
ぐらい該専門用語をしっているかを予測する。予測は、
該用語に対する定義情報、詳細情報、付帯情報それぞれ
について指定された利用者群の理解度の予測を行う。理
解度の予測は、既知度が21以上の高度既知者、既知度
11以上20以下あるいは該当する既知レコードを持た
ない既知者、既知度10以下の未知者、それぞれの割合
を計算する事によって行われる。
【0071】そのため、利用者理解度予測部31は記憶
部を含んでおり、そこに、専門用語記憶領域(文字
列)、用語ごとの定義情報、詳細情報、付帯情報それぞ
れの、高度既知者数(0以上の整数値)、既知者数(0
以上の整数値)、未知者数(0以上の整数値)、高度既
知者割合(0から100までの整数値)、既知者割合
(0から100までの整数値)、未知者割合(0から1
00までの整数値)、の各記憶領域を持っている。
【0072】図16は、利用者理解度予測部で行なわれ
る特定の用語に対する理解度の予測の手順を示したフロ
ーチャートである。利用者理解度予測部に文書、利用者
リストとともに理解度指示が入力されると、まず、専門
用語抽出部31aで、文書中の専門用語のリストが作ら
れる(ステップS41)。そのために、専門用語抽出部
31aは、文書中の文を分割する形態素解析部と、一般
用語の名詞辞書を持っている。専門用語抽出部31a
は、形態素解析の結果抽出された名詞を一般用語の名詞
辞書で調べ、そこになかったものを専門用語と判断す
る。
【0073】次に専門用語リストが空かどうかが調べら
れる(ステップS42)。リストが空の場合は、処理は
終了する。リストが空でなかった場合、リストから用語
を取り出し、用語の記憶領域に記憶する(ステップS4
3)。このとき、取り出した用語は、リストから削除さ
れる。
【0074】次に、用語理解度予測部31bで、取り出
した用語に対する利用者リストで指定された利用者の理
解度の予測が行われ(ステップS44)、そののち、専
門用語リストのチェック(ステップS42)にもどる。
【0075】図17は、用語理解度予測部31bで行わ
れる用語に対する理解度の予測の手順を示したフローチ
ャートである。まず、用語に対する定義情報の理解度の
予測が行われる(ステップS51)。次に、用語に対す
る詳細情報の理解度の予測が行われる(ステップS5
2)。最後に、用語に対する付帯情報の理解度の予測が
行われ、処理が終了する(ステップS53)。
【0076】図18は、用語理解度予測部で行われる用
語に対する定義情報の理解度予測の手順を示したフロー
チャートの前半を示す図である。まず、該用語の定義情
報の高度既知者数、既知者数、未知者数の各記憶領域に
0を記憶する(ステップS61)。次に、利用者リスト
の最初の利用者を選択する(ステップS62)。選択し
た利用者の知識状態管理部から、処理中の用語に対する
定義情報の既知レコードを取り出す(ステップS6
3)。ここで、既知レコードが取り出せたか否かを判断
し(ステップS64)、既知レコードが取り出せなけれ
ば、選択された利用者は処理中の用語の定義情報につい
て知っているものとして、その用語の定義情報の既知者
数の記憶領域に記憶されている値を+1する(ステップ
S68)。
【0077】ステップS64において既知レコードが取
り出せた場合、該既知レコードの既知度を調べる(ステ
ップS65)。既知度が21以上の場合、該利用者は該
用語の定義情報についてよく知っていると判断し、該用
語の定義情報の高度既知者数の記憶領域に記憶されてい
る値を+1する(ステップS66)。既知度が11以上
20以下の場合、該利用者は該用語の定義情報について
知っていると判断し、該用語の定義情報の既知者数の記
憶領域に記憶されている値を+1する(ステップS6
8)。既知度が10以下の場合、該利用者は該用語の定
義情報について知らないと判断し、該用語の定義情報の
未知者数の記憶領域に記憶されている値を+1する(ス
テップS67)。
【0078】次に、利用者リストにつぎの利用者がある
かどうかが調べられる(ステップS69)。利用者があ
れば、その利用者を選択して(ステップS70)、既知
レコードの取り出し(ステップS63)に移る。次の利
用者がなければ、予測データの作成処理を開始する。
【0079】図19は、用語理解度予測部で行われる用
語に対する定義情報の理解度予測の手順を示したフロー
チャートの後半を示す図である。これは、図18のステ
ップS69の判断において、次の利用者がないとされた
場合に実行される予測データの作成処理である。次の利
用者がなければ、定義情報の高度既知者割合の記憶領域
に、「定義情報の高度既知者数÷利用者数×100」の
結果を記憶する(ステップS71)。次に、定義情報の
既知者割合の記憶領域に、「定義情報の既知者数÷利用
者数×100」の結果を記憶する(ステップS72)。
最後に、定義情報の未知者割合の記憶領域に、「定義情
報の未知者数÷利用者数×100」の結果を記憶し(ス
テップS73)、終了する。
【0080】用語の詳細情報の理解度予測の処理、用語
の付帯情報の理解度予測の処理も図18、図19の処理
とほぼ同様である。違うのは、用語の詳細情報の理解度
予測の処理では、図18、図19の手順の「定義情報」
のところが「詳細情報」であること、用語の付帯情報の
理解度予測の処理では、図18、図19の手順の「定義
情報」のところが「付帯情報」であることである。
【0081】以上のようにして、利用者の理解度を予測
することができる。つまり、利用者理解度予測部31
は、文書作成者入出力i/f33から、理解度予測の対
象とする利用者のリスト、理解度を調べる用語ととも
に、用語の理解度予測の指示が入力されると、指定され
た用語についての各種情報が、指定された利用者リスト
に記載されている利用者にどの程度理解されているかを
計算する。そして、このとき指定された用語に対して、
用語理解度予測部31bが図17に示す手順の理解度予
測を行う。
【0082】図20は、利用者理解度予測部がもつ記憶
部の内部の例を示す図である。図20は、4つの専門用
語について理解度の予測が行われた結果である。図20
では、各専門用語に関する関連情報の格納領域として、
定義情報110、詳細情報120、および付帯情報13
0の格納領域が設けられている。各関連情報の格納領域
は、高度既知者、既知者、および未知者の項目に分けら
れている。さらに各項目には、任意の用語に対する該当
者の数と、その該当者数が全体の人数に占める割合との
値を格納できる。
【0083】この例では、「関連情報」、「知識状
態」、「追加情報」、「関連情報管理部」という4種類
の専門用語に関する20人分の予測データ101〜10
4が格納されている。
【0084】「関連情報」に関する予測データ101
は、定義情報に対する高度既知者が10人(50%)、
既知者が7人(35%)、未知者が3人(15%)であ
る。詳細情報に対する高度既知者が7人(35%)、既
知者が8人(40%)、未知者が5人(25%)であ
る。付帯情報に対する高度既知者が0人(0%)、既知
者が7人(35%)、未知者が13人(65%)であ
る。
【0085】「知識状態」に関する予測データ102
は、定義情報に対する高度既知者が17人(85%)、
既知者が3人(15%)、未知者が0人(0%)であ
る。詳細情報に対する高度既知者が10人(50%)、
既知者が8人(40%)、未知者が2人(10%)であ
る。付帯情報に対する高度既知者が5人(25%)、既
知者が4人(20%)、未知者が11人(55%)であ
る。
【0086】「追加情報」に関する予測データ103
は、定義情報に対する高度既知者が8人(40%)、既
知者が9人(45%)、未知者が3人(15%)であ
る。詳細情報に対する高度既知者が0人(0%)、既知
者が14人(70%)、未知者が6人(60%)であ
る。付帯情報に対する高度既知者が0人(0%)、既知
者が8人(40%)、未知者が12人(60%)であ
る。
【0087】「関連情報管理部」に関する予測データ1
04は、定義情報に対する高度既知者が0人(0%)、
既知者が5人(25%)、未知者が15人(75%)で
ある。詳細情報に対する高度既知者が0人(0%)、既
知者が3人(15%)、未知者が17人(85%)であ
る。付帯情報に対する高度既知者が0人(0%)、既知
者が0人(0%)、未知者が20人(100%)であ
る。
【0088】図20を見ると、用語「知識状態」の定義
情報、詳細情報については、利用者はほぼ知っているこ
とがわかる。これに対し、用語「関連情報管理部」の各
情報は、利用者がほとんど知らず、文書本文中に用語
「関連情報管理部」についての説明を入れるか、関連情
報管理部に用語「関連情報管理部」についての情報を登
録しなければ、利用者に理解してもらえないことがわか
る。
【0089】
【発明の効果】以上説明したように、第1の発明では、
任意の用語に対する利用者の理解度を示す情報を、利用
者理解度予測手段が複数の知識状態管理手段から収集
し、収集した情報の統計をとるようにしたため、文書の
作成者は、任意の用語に対して、利用者がどの程度理解
できるかを利用者理解度予測手段の統計結果から予測す
ることができる。
【0090】また、第2の発明では、用語抽出手段3に
文書が入力されると、その文書から所定の用語を抽出
し、抽出された用語に関する各利用者の理解度を示す情
報を収集し、統計をとるようにしたため、文書の作成者
が、作成したか、あるいは作成中の文書中に登場する特
定の用語に対して、利用者がどの程度理解できるかを利
用者理解度予測手段の統計結果から総合的に予測するこ
とができる。
【0091】また、第3の発明では、利用者を、用語の
理解度に基づいて複数のグル−プに振り分け、各グル−
プに含まれる利用者の割合を算出することにより、利用
者を統計的に分類したため、文書の作成者は、対象とな
っている用語に対する利用者の理解度がどのように分散
しているのかを容易に認識することができる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明を実施するための文書処理装置の具体例
を示す構成図である。
【図3】関連情報管理部に管理されている関連情報の例
を示す図である。
【図4】知識状態管理部で管理されている既知レコード
の例を示す図である。
【図5】第1の文書が追加情報抽出部に入力された場合
の関連情報の抽出と知識状態の更新の手順を示したフロ
ーチャートである。
【図6】条件絞り込み部で行われる関連種の決定の手順
をフローチャートで示したものである。
【図7】定義情報が必要な場合の処理の手順を示したフ
ローチャートである。
【図8】文書作成部での第2の文書作成の手順を示した
フローチャートである。
【図9】文書編集部から送られる第1の文書を示す図で
ある。
【図10】作成された専門用語リストを示す図である。
【図11】取り出された2つの既知レコードを示す図で
ある。
【図12】取り出された関連情報を示す図である。
【図13】作成された関連情報リストを示す図である。
【図14】更新された知識状態を示す図である。
【図15】作成された第2の文書を示す図である。
【図16】利用者理解度予測部で行なわれる文書に対す
る理解度の予測の手順を示したフローチャートである。
【図17】用語理解度予測部で行われる用語に対する理
解度の予測の手順を示したフローチャートである。
【図18】用語理解度予測部で行われる用語に対する定
義情報の理解度予測の手順を示したフローチャートの前
半を示す図である。
【図19】用語理解度予測部で行われる用語に対する定
義情報の理解度予測の手順を示したフローチャートの後
半を示す図である。
【図20】利用者理解度予測部がもつ記憶部の内部の例
を示す図である。
【符号の説明】
1a,1b,1c 知識状態管理手段 2 文書 3 用語抽出手段 3a 用語 4 利用者理解度予測手段 4a 記憶部 11,21 知識状態管理部 12,22 追加情報抽出部 13,23 文書作成部 14,24 利用者入出力i/f 15,25 利用者 31 利用者理解度予測部 31a 専門用語抽出部 31b 用語理解度予測部 32 文書編集部 33 文書作成者入出力i/f 34 文書作成者 40 関連情報管理部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/21

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 利用者に提供する文書の作成を補助する
    文書処理装置において、 複数の利用者ごとに設けられ、用語に対する利用者の理
    解度を管理する知識状態管理手段と、 任意の用語に対する各利用者の理解度を示す情報を前記
    知識状態管理手段から収集し、収集した情報の統計をと
    る利用者理解度予測手段と、 を有することを特徴とする文書処理装置。
  2. 【請求項2】 入力された文書から所定の用語を抽出す
    る用語抽出手段をさらに有し前記利用者理解度予測手段
    は、前記用語抽出手段が抽出した用語に対する利用者の
    理解度に関する情報を収集することを特徴とする請求項
    1記載の文書処理装置。
  3. 【請求項3】 前記利用者理解度予測手段は、利用者
    を、用語に対する理解度に基づいて複数のグル−プに振
    り分け、各グル−プに含まれる利用者の割合を算出する
    ことを特徴とする請求項1記載の文書処理装置。
JP01553496A 1996-01-31 1996-01-31 文書処理装置 Expired - Lifetime JP3428272B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01553496A JP3428272B2 (ja) 1996-01-31 1996-01-31 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01553496A JP3428272B2 (ja) 1996-01-31 1996-01-31 文書処理装置

Publications (2)

Publication Number Publication Date
JPH09212491A JPH09212491A (ja) 1997-08-15
JP3428272B2 true JP3428272B2 (ja) 2003-07-22

Family

ID=11891484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01553496A Expired - Lifetime JP3428272B2 (ja) 1996-01-31 1996-01-31 文書処理装置

Country Status (1)

Country Link
JP (1) JP3428272B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100076938A1 (en) * 2007-01-12 2010-03-25 Nec Corporation Protocol mismatch detection system, protocol mismatch detection method, and protocol mismatch detection program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03156664A (ja) * 1989-11-15 1991-07-04 Mitsubishi Electric Corp 漢字変換方式
JP3288738B2 (ja) * 1991-12-13 2002-06-04 キヤノン株式会社 自然言語処理装置及び方法
US5446559A (en) * 1992-10-05 1995-08-29 Hewlett-Packard Company Method and apparatus for scanning and printing
JPH06342425A (ja) * 1993-05-31 1994-12-13 Canon Inc 文書処理装置
US5359514A (en) * 1993-08-03 1994-10-25 International Business Machines Corporation Method and apparatus for facilitating comprehension of on-line documents

Also Published As

Publication number Publication date
JPH09212491A (ja) 1997-08-15

Similar Documents

Publication Publication Date Title
US5729751A (en) Document assembly system with assembly logic
US5652880A (en) Apparatus and method for storing, retrieving and presenting objects with rich links
US6044384A (en) Document processing apparatus
JP2957702B2 (ja) 関係データベーススキーマを生成する意味オブジェクトモデリングシステム
US7395498B2 (en) Apparatus and method for evaluating web pages
JP3488525B2 (ja) ヘルプ画面表示方法およびヘルプ画面表示装置
JP3702414B2 (ja) 情報検索支援方法、コンピュータ読み取り可能な記憶媒体および情報検索装置
KR101799448B1 (ko) 질의 응답형 질병분류코드 제공 시스템
JP2024101977A (ja) 求職者検索システム、情報処理方法及びプログラム
Agosti An overview of hypertext
JPH07152771A (ja) 利用者情報管理装置、情報フィルタ、情報分類装置、情報再生装置、情報検索装置及び仮名漢字変換装置
US6016498A (en) Object oriented architecture with bidirectional linking of relationships between objects
JP4931114B2 (ja) データ表示装置、データ表示方法及びデータ表示プログラム
JPH11136276A (ja) 電子掲示板システムおよび電子掲示板システムを構築するプログラムを記録した記録媒体
JP2806867B2 (ja) ドキュメントデータベースの構築方法、表示方法、及び表示装置
JPWO2019167281A1 (ja) 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム
JP3428272B2 (ja) 文書処理装置
US20040006567A1 (en) Decision support system using narratives for detecting patterns
JP3752717B2 (ja) 文書処理装置
JP5439028B2 (ja) 情報検索装置、情報検索方法、およびプログラム
US5715442A (en) Data unit group handling apparatus
Kashyap et al. Insights on Hindi WordNet coming from the IndoWordNet
JP3580004B2 (ja) 文書処理装置および文書処理方法
JP3465615B2 (ja) 検索方法ならびに装置及び同方法がプログラムされ記録された記録媒体
JP2000099516A (ja) 情報管理装置、共同作業支援システム、情報管理方法及び情報管理プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090516

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100516

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120516

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140516

Year of fee payment: 11

EXPY Cancellation because of completion of term