JPH0793334A - 文書に対する読者の理解度を高める方法及び装置 - Google Patents

文書に対する読者の理解度を高める方法及び装置

Info

Publication number
JPH0793334A
JPH0793334A JP6064278A JP6427894A JPH0793334A JP H0793334 A JPH0793334 A JP H0793334A JP 6064278 A JP6064278 A JP 6064278A JP 6427894 A JP6427894 A JP 6427894A JP H0793334 A JPH0793334 A JP H0793334A
Authority
JP
Japan
Prior art keywords
word
reader
document
words
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6064278A
Other languages
English (en)
Inventor
George C Manthuruthil
ジー・シー・マンスルシル
Shrikant N Parikh
シュリンカント・エヌ・パリック
Hari N Reddy
ハリ・エヌ・レッディ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0793334A publication Critical patent/JPH0793334A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 オンライン文書の理解度を高める方法又は装
置を提供する。 【構成】 計算機システム上で読まれる文書の理解度を
改善する。読者が文書を読むのを止めオンライン又は印
刷されたもので単語の意味を引かなくても済むように、
本発明は、読者が未知の単語を既知の単語に自動的に変
換する。文書中の各単語を計算機上で維持している既知
の単語一覧と照合することによって、読みそのものを単
純化すると共に文書に対する読者の理解度を改善する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はオンライン文書に対する
読者の理解度を高める方法及び装置に関する。
【0002】
【従来の技術】ライブラリのような遠隔データベースを
計算機のオンラインでアクセスしたり文書を計算機を使
って検討したりするようになって、資料を理解するため
に頻繁に辞書やシソーラスを引かざるを得なくなってい
る。単語の意味を理解するためにオンラインの参考文献
又は印刷された参考文献のいずれかを参照する必要があ
るときにはいつでも、うんざりしながらその努力をす
る。読んでいる資料が利用者の読力をかなり超えている
場合には、理解度もかなり低下する。したがって、平均
水準以上の語彙や一般的でない語彙を含んだ文書を中断
せずに読者が理解できるようにするよりよい機構が必要
となる。
【0003】
【発明が解決しようとする課題】本発明は、従来の技術
の問題点を本質的に減少させるか又は除去するような形
で、オンライン文書の理解度を高める方法又は装置を提
供する。本発明は、計算機システムが読者に既知の単語
を自動的に提供するようにする。
【0004】
【課題を解決するための手段】本発明は、一つの面で
は、計算機システム上にある文書の理解度を改善する方
法を提供する。文書中のすべての単語は、未知の単語の
一覧表を作成するために調べられる。すべての単語が計
算機システムで管理されている既知の単語の一覧表と比
較され、未知の単語が決められる。その後、未知の単語
は、読者が既知の同義語で補足される。そして、未知の
単語にその同義語を付けた文書が読者に表示される。
【0005】本発明の技術的な利点は、未知の単語を調
べるのに印刷された辞書やシソーラスも、オンラインの
辞書やシソーラスも最早使う必要がないことである。文
書の読者には、既に変換されたものが提示されるので、
参照のために常に文書から離れたり戻ったりする必要が
なくなる。
【0006】
【実施例】図1は、本発明を実施するのに使用できるデ
ータ処理システム8の概略図である。図に示すとおり、
データ処理システムはローカル・エリア・ネットワーク
(LAN)10及び32のようなネットワークを複数個
含んでいてもよく、それぞれのLANは独立の計算機1
2及び30をそれぞれ複数台含んでいてもよい。勿論、
当業者であれば、ホスト・プロセッサに連結された複数
台の知的ワークステーション(IWS)がそれぞれのネ
ットワークで利用できることが理解できるであろう。こ
のようなデータ処理システムでは一般的なことである
が、それぞれの独立の計算機は、記憶装置14や印字装
置、出力装置16に連結されている。
【0007】データ処理システム8には主計算機18の
ような主計算機が更に複数台含まれていることがあり、
それらが通信リンク22を介してLAN10に接続され
ていることが多い。更に、主計算機18は、LAN10
の遠隔記憶装置として働く記憶装置20に接続されるこ
ともある。同様に、LAN10は、通信リンク24を介
して、サブシステム制御装置・通信制御装置26及び通
信リンク34を経由して、ゲートウエイ・サーバ28に
接続される。ゲートウエイ・サーバ28は、LAN32
とLAN10とを接続する働きをする独立の計算機か又
は知的ワーク・ステーションであることが多い。
【0008】LAN32及びLAN10に関しては、複
数の文書又は資源オブジェクトが記憶装置20に格納さ
れていてもよく、計算機がそれらの格納された資源オブ
ジェクトを資源管理者又は蔵書サービスとして制御して
いてもよい。勿論、当業者であれば、主計算機18がL
AN10と距離的に遠く離れた場所にあってもよいこと
が理解できようし、同様に、LAN10もLAN32と
遠く離れた場所にあってもよいことが理解できよう。例
えば、LAN32はカルフォルニア州にあるが、LAN
10はテキサス州にあり、主計算機はニューヨークにあ
ってもよい。
【0009】図2は、本発明の全体的な概念を示した流
れ図である。ブロック40で、文書が計算機システムに
入力され、事務文書ファイル(Business Document Fil
e、以下、BDFファイルと呼ぶ。)1が生成される。
ブロック42で、文書は、理解度モジュールを通して処
理される。すなわち、入力された文書を検討し、解析
し、語幹の語(すなわち、the(その)、a(一つの)、
and(及び)など)を取り除き、語彙ファイルを調べ、
利用者が知らない単語を変換する。ブロック42の理解
度モジュールで変換処理が終わると、ブロック40で入
力された文書は、変換付きの事務文書ファイル2(以
下、BDFファイル2と呼ぶ。)として出力される。こ
のように本発明を利用することによって、利用者は、単
語がすべて既知の単語に変換された文書を読むことがで
き、単語の意味を辞書で調べる必要もなく理解すること
ができる。
【0010】本発明を適切に利用するためには、計算機
システムに二つのデータベースを導入する必要がある。
最初のデータベースは、事務シソーラス・ファイル(Bu
siness Thesaurus File,以下、BTFファイルと呼
ぶ。)である。BTFファイルは、利用者が関心をもつ
特定業務に関する用語の完全な貯蔵庫である。BTFフ
ァイルのそれぞれの項目は、単語とその単語に関連する
同義語の組とからなる。
【0011】2番目のデータベースは、個人語彙ファイ
ル(Personal Vocabulary File、以下、PVFファイル
と呼ぶ。)である。PVFファイルは、利用者が既知で
あるか又は出会ったことのある単語の貯蔵庫である。P
VFファイルは、単語を人手で入れたり削除したりでき
るようにテキスト・ファイルとして管理できる。PVF
ファイルは、幾つかの方法で初期設定できる。PVFフ
ァイルへの入力は、単純な電子エディタ若しくはワード
処理ソフトウェアを使って人手で行うか又はデータを直
接入力できる対話パネルで行える。別の方法としては、
適正に習熟した水準にある標準的な事務用データベース
も、PVFファイルの初期設定に使用できる。例えば、
習熟度がレベル10の語彙データベースを、PVFファ
イルの初期設定に使用できる。更に別の方法としては、
所定の期間に出会ったすべての単語をPVFファイルに
入れ、適切な調整を行う用にしてもよい。
【0012】図3、図4、図5、図6及び図7は、本発
明を例示した流れ図である。最初の図3では、本発明の
プロセスは50から始まり、続いてブロック52で入力
文書が読まれる。入力文書は、ブロック54で解析され
る。ブロック56で、文書中の単語が本プロセスによっ
て取り出される。すなわち、文書中のそれぞれの単語が
次々と調べられる。ブロック58で 出現回数設定パラ
メタ(以下、回数パラメタと呼ぶ。)が読まれ、ブロッ
ク60で経過期間設定パラメタ(以下、期間パラメタと
呼ぶ。)が読まれる。これらのパラメタは、システムの
利用者が付加的に設定し、指標を設定するのに使われ
る。特に、回数パラメタは、特定の単語の意味を利用者
が理解したとみなすには、何回その単語が現れなければ
ならないかを本プロセスに教えるために使われる。期間
パラメタは、単語が最後に現れてからどれだけ期間が経
過しているかを(予め定められた期間を使って)示すの
に使う。このように、利用者が期間パラメタに設定され
た期間より長い期間に亘って特定の単語を見ていないな
らば、利用者は、最早その単語の意味を憶えていないと
みなされる。
【0013】次に判断ブロック62で、文書中の最後の
単語であるかどうかが決められる。判断ブロック62が
“はい”の場合、ブロック64で作業終了が示される。
判断ブロック62が“いいえ”の場合、ブロック66で
次の単語が読まれる。
【0014】判断ブロック68で、次の単語が語幹の語
(すなわち、a, an(一つ)、and(および)、the(そ
の)など)であるかどうかが決められる。判断ブロック
68が“はい”の場合、その単語は、BDFファイル2
(すなわち、変換がすべて終わった時点で利用者が読む
ために提示される事務文書ファイル)に印字される。判
断ブロック68が“いいえ”の場合、判断ブロック72
で、その単語がPVF中にあるかどうかが(すなわち、
利用者が既知の単語であるかどうかが)決められる。判
断ブロック72が“はい”の場合、その単語は、PVF
単語として処理される(すなわち、既知の単語には、適
切な出会い標識が付けられる。)。
【0015】判断ブロック72が“いいえ”の場合、判
断ブロック76で、その単語がBTF中にあるかどうか
が決められる。判断ブロック76が“はい”の場合、ブ
ロック78で、その単語は、BTF単語(すなわち、そ
の単語は利用者の水準以上のものと見なされ、同義語が
提示される。)として処理される。判断ブロック76が
“いいえ”の場合、ブロック80で、その単語は未知の
ものと見なされ、変換が完全に終わった時点で表示する
ためにBDFファイル2に強調されて印字される。ブロ
ック70、ブロック74、ブロック78又はブロック8
0に続いて、本プロセスは前記の判断ブロック62に戻
る。
【0016】図4では、図3のブロック74に示したP
VF単語としての処理をより詳細に示す。判断ブロック
82で、その単語が利用者に既知であるかどうかが決め
られる。判断ブロック82が“いいえ”の場合、本プロ
セスは、結合子Aに進み、その内容は図5で詳細に説明
する。判断ブロック82が“はい”の場合、PVFファ
イルは、ブロック84で更新される経過期間欄をもつ。
判断ブロック86で、この経過期間欄は、先に説明した
期間パラメタと比較される。判断ブロック86で、経過
期間欄が期間パラメタより大きくもなく、等しくもない
と決まった場合、その単語は、ブロック88でBDFフ
ァイル2に強調せずに印字される。判断ブロック86
で、経過期間欄が期間パラメタより大きいか又は等しい
と決まった場合、ブロック90で、既知単語標識がN
(いいえの意味)に設定される。ブロック90で既知単
語標識をNに設定することによって、その単語は利用者
が知らない新しい単語として表される。ブロック92
で、この単語の出現回数欄がゼロに設定される(すなわ
ち、初出として扱われる。)。
【0017】判断ブロック94で、この単語が BTF
ファイルであるかどうかが決められる。判断ブロック9
4が“はい”の場合、その単語は、図7で詳細に説明す
るとおりBTF単語として処理される。判断ブロック9
4が“いいえ”の場合、その単語は、ブロック98でB
DFファイル2に(未知の単語であることを示すため
に)強調して印字される。ブロック88、ブロック96
又はブロック98の後、本プロセスは、判断ブロック6
2に戻る。
【0018】図5では、図4の判断ブロック82が“い
いえ”の場合の結合子A以降について詳細に説明する。
判断ブロック102で、PVFファイルの経過期間欄が
期間パラメタより小さいかどうかが決められる。判断ブ
ロック102が“いいえ”の場合、本プロセスは、結合
子Bに進む。これを図6で詳細に説明する。判断ブロッ
ク102が“はい”の場合、判断ブロック104でPV
Fファイルの出現回数欄が回数パラメタより小さいかど
うかが決められる。判断ブロック104が“いいえ”の
場合、既知単語標識が(利用者が設定した期間パラメタ
及び回数パラメタを満たしたことを示す)Yに設定され
る。ブロック108で、PVFファイルの出現回数欄が
今回の出現を示すために増やされる。ブロック110
で、その単語は、強調せずに印字される。
【0019】判断ブロック104が“はい”の場合、判
断ブロック112で、その単語がBTFファイルにある
かどうかが決められる。判断ブロック112が“はい”
の場合、図7で説明するBTF単語としてブロック11
4で処理される。判断ブロック112が“いいえ”の場
合、その単語は、ブロック116でPVFファイルから
削除され、次にブロック118で強調されて印字され
る。ブロック110、ブロック114又はブロック11
8の後、120で本プロセスは、図3の判断ブロック6
2に戻る。
【0020】図6では、図5の判断ブロック102が
“いいえ”の場合の結合子B以降について説明する。ブ
ロック122で、PVFファイルの出現回数欄及び経過
期間欄が共にゼロに設定される。その後、判断ブロック
124で、その単語がBTFファイルにあるかどうかが
決められる。判断ブロック124が“はい”の場合、そ
の単語は、図7で引き続き説明するBTF単語として処
理される。判断ブロック124が“いいえ”の場合、ブ
ロック128でその単語がPVFファイルから削除され
る。その後、その単語は、ブロック130で強調されて
印字される。ブロック126又はブロック130の次
に、本プロセスは、図3の判断ブロック62に戻る。
【0021】図7では、図3のブロック78のBTF単
語としての処理について詳細に説明する。ブロック14
0で、その単語は、強調して印字される。ブロック14
2で、その単語の少なくとも一つの同義語の同義語標識
欄がN(“いいえ”)に設定される。次にブロック14
4で、その単語の同義語の組が読まれる。判断ブロック
146で、その単語の同義語で更に処理すべきものがあ
るかどうかが決められる。判断ブロック146が“は
い”の場合、次の同義語がブロック148で取り出され
る。次に判断ブロック150で、その同義語がPVFフ
ァイルにあるかどうかが決められる。判断ブロック15
0が“いいえ”の場合、本プロセスは、ブロック146
に戻る。判断ブロック150が“はい”の場合、少なく
とも一つの同義語標識欄がブロック152でY(“は
い”)に設定される。次にブロック154で、その同義
語がBDFファイル2に印字され、その後判断ブロック
146に戻る。
【0022】判断ブロック146が“いいえ”の場合、
判断ブロック156で、既知同義語標識欄がY(“は
い”)に設定されているかどうかが決められる。判断ブ
ロック156が“いいえ”の場合、本プロセスは、15
8で図3の判断ブロック62に戻る。判断ブロック15
6が“はい”の場合、判断ブロック160で、この単語
がPVFファイルにあるかどうかが決められる。判断ブ
ロック160が“いいえ”の場合、ブロック162でそ
の単語の記録がPVFファイル中に生成される。判断ブ
ロック160が“はい”の場合又はブロック162の次
の場合、ブロック164で出現回数欄が増やされ、経過
期間欄がゼロに設定される。その後、本プロセスは、1
58で図3の判断ブロック62に戻る。
【0023】例として、1993年1月1日から始め、
本プロセスの利用者が期間パラメタを12カ月に設定
し、回数パラメタを2に設定したとする。利用者の個人
語彙ファイル(PVF)は、次のとおりである。
【0024】
【表1】 単語 単 語 既知 経過期間 出現回数 番号 単語か 1 properly Y 0 0 2 known Y 0 0 3 name Y 0 0 4 given Y 0 0 5 tell Y 0 0 6 former Y 0 0 7 day Y 0 0 8 good Y 0 0 9 housewife Y 0 0 10 country Y 0 0 11 husband Y 0 0 12 village Y 0 0 13 market Y 0 0 14 habitual Y 0 0 15 liking Y 0 0 16 tarry Y 0 0 17 romantics Y 0 0 18 always Y 0 0 19 fall Y 0 0 20 love Y 0 0 21 candy Y 0 0 22 child Y 0 0 23 guest Y 0 0 24 last Y 0 0 ただし、一つの文書に同じ単語が複数回現れても、記録
上は1回として扱う。
【0025】開始日にBDFファイルとして入力された
文章の一部を次に示す。 "...properly known by the neme of Tarry Town. The
name was given,we are told, in the former days, by
the good housewives of thecountry, by the inveter
ate propensity of their husbands to lingerabout th
eir village tavern on market days..." (日本語訳「〜長居町の名前でよく知られている。その
名前は、過ぎ去りし日に、その土地の善良な主婦たち
が、市場が開いている日に夫達が村の居酒屋で管を巻く
という常習的な愛着心にちなんで付けたと聞いてい
る」。
【0026】この文章が本プロセスで変換され次のとお
り出力される。 "...properly known as the name of Tarry Town. The
name was given,we are told, in the former days, by
the good housewives of thecountry, by the inveter
ate {HABITUAL} propensity {LIKING} oftheir husband
s to linger {TARRY} about their village tavern onm
arket days..." (日本語訳「〜長居町の名前でよく知られている。その
名前は、過ぎ去りし日に、その土地の善良な主婦達が、
市場が開いている日に夫達が村の居酒屋で管を巻く{長
居する}という常習的{習慣的}な愛着{好む}心にち
なんで付けたと聞いている」。
【0027】この変換処理の結果として、PVFファイ
ルは、次のとおり変更される。
【0028】
【表2】 単語 単 語 既知 経過期間 出現回数 番号 単語か 1 properly Y 0 1 2 known Y 0 1 3 name Y 0 1 4 given Y 0 1 5 tell Y 0 1 6 former Y 0 1 7 day Y 0 1 8 good Y 0 1 9 housewife Y 0 1 10 country Y 0 1 11 husband Y 0 1 12 village Y 0 1 13 market Y 0 1 14 habitual Y 0 1 15 liking Y 0 1 16 tarry Y 0 1 17 romantics Y 0 0 18 always Y 0 0 19 fall Y 0 0 20 love Y 0 0 21 candy Y 0 0 22 child Y 0 0 23 guest Y 0 0 24 last Y 0 0 25 inveterate N 0 1 26 propensity N 0 1 27 linger N 0 1 上の例に続き、1993年3月1日に次の文章が入力さ
れた。 "...Inveterate romantics are always falling in lov
e." "...The last guests lingered until 2 a.m." "...Children have a propensity for candy." (日本語訳 「〜常習的にロマンチックな人は、常に愛に落ちる。」 「〜最後の客は夜中の2時まで管を巻いた。」 「〜子供達はお菓子に愛着心をもつ。」) これの変換結果として次のものが出力された。 "...Inveterate {HABITUAL} are always falling in lo
ve." "...The last guests lingered {TARRIED} until 2 a.
m." "...Children have a propensity {LIKING} for cand
y." (日本語訳 「〜常習的{習慣的}にロマンチックな人は、常に愛に
落ちる。」 「〜最後の客は夜中の2時まで管を巻いた{長居し
た}。」 「〜子供達はお菓子に愛着{好む}心をもつ。」) 上の変換の結果、PVFファイルは、次のとおり変更さ
れる。
【0029】
【表3】 単語 単 語 既知 経過期間 出現回数 番号 単語か 1 properly Y 2 1 2 known Y 2 1 3 name Y 2 1 4 given Y 2 1 5 tell Y 2 1 6 former Y 2 1 7 day Y 2 1 8 good Y 2 1 9 housewife Y 2 1 10 country Y 2 1 11 husband Y 2 1 12 village Y 2 1 13 market Y 2 1 14 habitual Y 2 1 15 liking Y 2 1 16 tarry Y 2 1 17 romantics Y 0 1 18 always Y 0 1 19 fall Y 0 1 20 love Y 0 1 21 candy Y 0 1 22 child Y 0 1 23 guest Y 0 1 24 last Y 0 1 25 inveterate N 0 2 26 propensity N 0 2 27 linger N 0 2 上の例に続き、1993年4月1日に次の文章が入力さ
れた。 "...properly known by the name of Tarry Town. The
name was given,we are told, in the former days, by
the good housewives of thecountry, by the inveter
ate propensity of their husbands to lingerabout th
eir village tavern on market days..." (日本語訳「〜長居町の名前でよく知られている。その
名前は、過ぎ去りし日に、その土地の善良な主婦たち
が、市場が開いている日に夫達が村の居酒屋で管を巻く
という常習的な愛着心にちなんで付けたと聞いてい
る。」)これを変換すると、次の文章が得られる。 "...properly known by the name of Tarry Town. The
name was given,we are told, in the former days, by
the good housewives of thecountry, by the inveter
ate propensity of their husbands to lingerabout th
eir village tavern on market days..." (日本語訳「〜長居町の名前でよく知られている。その
名前は、過ぎ去りし日に、その土地の善良な主婦たち
が、市場が開いている日に夫達が村の居酒屋で管を巻く
という常習的な愛着心にちなんで付けたと聞いてい
る。」すなわち、何も変更されていない。
【0030】この文章入力の結果、PVFファイルは、
次のとおりになる。
【0031】
【表4】 単語 単 語 既知 経過期間 出現回数 番号 単語か 1 properly Y 0 2 2 known Y 0 2 3 name Y 0 2 4 given Y 0 2 5 tell Y 0 2 6 former Y 0 2 7 day Y 0 2 8 good Y 0 2 9 housewife Y 0 2 10 country Y 0 2 11 husband Y 0 2 12 village Y 0 2 13 market Y 0 2 14 habitual Y 1 2 15 liking Y 1 2 16 tarry Y 0 2 17 romantics Y 0 1 18 always Y 0 1 19 fall Y 0 1 20 love Y 0 1 21 candy Y 0 1 22 child Y 0 1 23 guest Y 0 1 24 last Y 0 1 25 inveterate N 0 3 26 propensity N 0 3 27 linger N 0 3 このように、入力としての文章中の単語は、システム・
パラメタを満たしており、利用者には既知と見なされ変
換の必要がないことが判る。
【0032】更に、上の例に続き、1994年6月1日
に次の文章が入力された。
【0033】"...Inveterate romantics are always fa
lling in love." (日本語訳「〜常習的にロマンチックな人は、常に愛に
落ちる。」変換の結果、文章は次のとおりになる。
【0034】"...Inveterate {HABITUAL} are always f
alling in love." (日本語訳「〜常習的{習慣的}にロマンチックな人
は、常に愛に落ちる。」この変換の結果、PVFファイ
ルは、次のとおりになる。
【0035】
【表5】 単語 単 語 既知 経過期間 出現回数 番号 単語か 1 properly Y 14 0 2 known Y 14 0 3 name Y 14 0 4 given Y 14 0 5 tell Y 14 0 6 former Y 14 0 7 day Y 14 0 8 good Y 14 0 9 housewife Y 14 0 10 country Y 14 0 11 husband Y 14 0 12 village Y 14 0 13 market Y 14 0 14 habitual Y 14 0 15 liking Y 14 0 16 tarry Y 14 0 17 romantics Y 0 0 18 always Y 0 0 19 fall Y 0 0 20 love Y 0 0 21 candy Y 14 0 22 child Y 14 0 23 guest Y 14 0 24 last Y 14 0 25 inveterate N 0 1 26 propensity N 14 0 27 linger N 14 0 上のPVFファイルから判るように、経過期間が期間パ
ラメタより大きくなった結果、以前に既知と判断されて
いた文章中の単語が再び利用者に未知となってしまって
いる。そのため、単語は前のとおりに変換され、適切な
調整がPVFファイルに行われる。
【0036】
【発明の効果】本発明によって、利用者は、自分に未知
の単語を既知の単語に変換できる個人語彙ファイル(P
VF)の常に更新されたものをもつことができる。これ
は、検討するように与えられた文書を利用者が今までよ
りも遥かに容易に読んで理解できるようにする。本発明
は、オンラインの辞書やシソーラス又は印刷された辞書
やシソーラスを使う必要性をなくしたり大幅に減らす。
【図面の簡単な説明】
【図1】本発明に従ったデータ処理システムの構成例で
ある。
【図2】本発明の大局的な概念を例示した図である。
【図3】本発明のプロセスを示した流れ図である。
【図4】本発明のプロセスを示した流れ図である。
【図5】本発明のプロセスを示した流れ図である。
【図6】本発明のプロセスを示した流れ図である。
【図7】本発明のプロセスを示した流れ図である。
【符号の説明】
40 文書の入力(BDFファイル) 42 理解度モジュール 44 文書BDFファイル2の出力
───────────────────────────────────────────────────── フロントページの続き (72)発明者 シュリンカント・エヌ・パリック アメリカ合衆国テキサス州、メスキート、 コリエル・ウエイ 4013番地 (72)発明者 ハリ・エヌ・レッディ アメリカ合衆国テキサス州、コリヴィル、 キャリッジ・ドライブ 6609番地

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】計算機システム上にある文書に対して読者
    の理解度を改善する方法であって、 文書中のすべての単語のうちで読者が知らない未知の単
    語を自動的に判別し、 前記未知の単語に読者が知っている同義語を自動的に補
    足し、 読者の検討のために前記未知の単語に隣接して前記同義
    語を付けた文書を自動的に表示する、 段階からなる方法。
  2. 【請求項2】前記判別する段階は、前記全ての単語を計
    算機システム上で維持されている既知の単語の一覧表と
    自動的に比較する段階を含む請求項1の方法。
  3. 【請求項3】前記補足する段階は、前記同義語を得るた
    めに計算機システム上で維持されているシソーラスをア
    クセスする段階を含む請求項1の方法。
  4. 【請求項4】前記同義語を計算機システム上の既知の単
    語の一覧表と自動的に比較し、既知の場合にだけ前記同
    義語を読者に表示する段階を更に含む請求項3の方法。
  5. 【請求項5】計算機システム上にある読者が既知の単語
    の一覧表を自動的に維持する段階を更に含む請求項1の
    方法。
  6. 【請求項6】前記維持する段階は、前記既知の単語を定
    義するために少なくとも一つのパラメタを定め、出現し
    たすべての単語を前記パラメタと突き合わせ、前記突合
    せの記録を維持する段階を含む請求項5の方法。
  7. 【請求項7】前記記録を前記パラメタと自動的に比較
    し、前記の少なくとも一つのパラメタを満たしたときに
    は前記未知の単語を既知のものとする段階を更に有する
    請求項6の方法。
  8. 【請求項8】計算機上にある文書に対して読者の理解度
    を改善する計算機システムであって、 文書中のすべての単語のうちで読者が知らない未知の単
    語を自動的に判別する手段と、 前記未知の単語に読者が知っている同義語を自動的に補
    足する手段と、 読者の検討のために前記未知の単語に隣接して前記同義
    語を付けた文書を自動的に表示する手段と、 からなる計算機システム。
  9. 【請求項9】前記判別手段は、前記のすべての単語を計
    算機上で維持されている既知の単語の一覧表と自動的に
    比較する手段を含む請求項8の計算機システム。
  10. 【請求項10】前記補足手段は、前記同義語を得るため
    に計算機上で維持されているシソーラスをアクセスする
    ための手段を含む請求項8の計算機システム。
  11. 【請求項11】前記同義語を計算機上の既知の単語の一
    覧表と自動的に比較し、既知の場合にだけ前記同義語を
    読者に表示する手段を更にふくむ請求項10の計算機シ
    ステム。
  12. 【請求項12】計算機上にある読者が既知の単語の一覧
    表を自動的に維持する手段を更に含む請求項8の計算機
    システム。
  13. 【請求項13】前記維持手段は、前記既知の単語を定義
    するために少なくとも一つのパラメタを定める手段と、
    出現したすべての単語を前記パラメタと突き合わせる手
    段と、前記突合せの記録を維持する手段とを含む請求項
    12の計算機システム。
  14. 【請求項14】前記記録を前記パラメタと自動的に比較
    し、前記の少なくとも一つのパラメタを満たしたときに
    は前記未知の単語を既知のものとする手段を更に有する
    請求項13の計算機システム。
JP6064278A 1993-08-03 1994-04-01 文書に対する読者の理解度を高める方法及び装置 Pending JPH0793334A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/101,606 US5359514A (en) 1993-08-03 1993-08-03 Method and apparatus for facilitating comprehension of on-line documents
US101606 1993-08-03

Publications (1)

Publication Number Publication Date
JPH0793334A true JPH0793334A (ja) 1995-04-07

Family

ID=22285529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6064278A Pending JPH0793334A (ja) 1993-08-03 1994-04-01 文書に対する読者の理解度を高める方法及び装置

Country Status (3)

Country Link
US (1) US5359514A (ja)
EP (1) EP0637804A3 (ja)
JP (1) JPH0793334A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212491A (ja) * 1996-01-31 1997-08-15 Fuji Xerox Co Ltd 文書処理装置
WO2008084686A1 (ja) * 2007-01-12 2008-07-17 Nec Corporation プロトコル翻訳システム、プロトコル翻訳方法およびプロトコル翻訳プログラム
WO2008084687A1 (ja) * 2007-01-12 2008-07-17 Nec Corporation プロトコル不一致検出システム、プロトコル不一致検出方法およびプロトコル不一致検出プログラム
JP2008217067A (ja) * 2007-02-28 2008-09-18 Toshiba Corp 情報提示装置、プログラム及び情報提示方法
JP2014010565A (ja) * 2012-06-28 2014-01-20 Canon Marketing Japan Inc 電子書籍端末、情報処理方法、プログラム
JP2016045796A (ja) * 2014-08-25 2016-04-04 Kddi株式会社 相手方ユーザからの対話文章に対して支援情報を明示する端末、プログラム及び方法

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3161942B2 (ja) * 1995-06-14 2001-04-25 シャープ株式会社 訳振り機械翻訳装置
EP0810534B1 (en) * 1996-05-13 2003-03-19 Oki Electric Industry Co., Ltd. Document display system and electronic dictionary
US6154757A (en) * 1997-01-29 2000-11-28 Krause; Philip R. Electronic text reading environment enhancement method and apparatus
JP3466857B2 (ja) * 1997-03-06 2003-11-17 株式会社東芝 辞書更新方法および辞書更新システム
CA2302206A1 (en) * 1997-08-26 1999-03-04 Alan Gregory Method of organizing words and their synonyms
US20020069047A1 (en) * 2000-12-05 2002-06-06 Pinky Ma Computer-aided language learning method and system
US7284191B2 (en) 2001-08-13 2007-10-16 Xerox Corporation Meta-document management system with document identifiers
US6778979B2 (en) 2001-08-13 2004-08-17 Xerox Corporation System for automatically generating queries
US6928425B2 (en) * 2001-08-13 2005-08-09 Xerox Corporation System for propagating enrichment between documents
US6732090B2 (en) 2001-08-13 2004-05-04 Xerox Corporation Meta-document management system with user definable personalities
US20050022114A1 (en) * 2001-08-13 2005-01-27 Xerox Corporation Meta-document management system with personality identifiers
US6820075B2 (en) 2001-08-13 2004-11-16 Xerox Corporation Document-centric system with auto-completion
US7133862B2 (en) * 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
US7117432B1 (en) 2001-08-13 2006-10-03 Xerox Corporation Meta-document management system with transit triggered enrichment
DE10157487C1 (de) * 2001-11-23 2003-06-18 Sgl Carbon Ag Faserverstärkter Verbundkörper für Schutzpanzerungen, seine Herstellung und Verwendungen
JP4301102B2 (ja) * 2004-07-22 2009-07-22 ソニー株式会社 音声処理装置および音声処理方法、プログラム、並びに記録媒体
US7627816B2 (en) * 2005-04-12 2009-12-01 International Business Machines Corporation Method for providing a transient dictionary that travels with an original electronic document
US20080070202A1 (en) * 2006-08-31 2008-03-20 Fisher Jason B Reading Comprehension System and Associated Methods
US8700384B1 (en) 2008-06-30 2014-04-15 Amazon Technologies, Inc. Providing progressive language conversion for digital content on an electronic device
US20110313756A1 (en) * 2010-06-21 2011-12-22 Connor Robert A Text sizer (TM)
US8744855B1 (en) 2010-08-09 2014-06-03 Amazon Technologies, Inc. Determining reading levels of electronic books
US9116654B1 (en) 2011-12-01 2015-08-25 Amazon Technologies, Inc. Controlling the rendering of supplemental content related to electronic books
US8943404B1 (en) 2012-01-06 2015-01-27 Amazon Technologies, Inc. Selective display of pronunciation guides in electronic books
US10409903B2 (en) * 2016-05-31 2019-09-10 Microsoft Technology Licensing, Llc Unknown word predictor and content-integrated translator
US11163959B2 (en) * 2018-11-30 2021-11-02 International Business Machines Corporation Cognitive predictive assistance for word meanings
US11880416B2 (en) * 2020-10-21 2024-01-23 International Business Machines Corporation Sorting documents according to comprehensibility scores determined for the documents
US11263392B1 (en) * 2021-01-12 2022-03-01 Vmware, Inc. Providing user-specific previews within text

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04174069A (ja) * 1990-08-29 1992-06-22 Ricoh Co Ltd 言語理解支援装置
JP3082446B2 (ja) * 1992-07-15 2000-08-28 富士ゼロックス株式会社 多重画像形成装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4384329A (en) * 1980-12-19 1983-05-17 International Business Machines Corporation Retrieval of related linked linguistic expressions including synonyms and antonyms
US4456973A (en) * 1982-04-30 1984-06-26 International Business Machines Corporation Automatic text grade level analyzer for a text processing system
JPS61105671A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 自然言語処理装置
US4773039A (en) * 1985-11-19 1988-09-20 International Business Machines Corporation Information processing system for compaction and replacement of phrases
JPS63261467A (ja) * 1987-04-20 1988-10-28 Hitachi Ltd 翻訳方法および装置
US5256067A (en) * 1990-04-25 1993-10-26 Gildea Patricia M Device and method for optimal reading vocabulary development
US5283737A (en) * 1990-09-21 1994-02-01 Prolab Software Inc. Mechanism for generating linguistic expressions based on synonyms and rules derived from examples
JPH04213164A (ja) * 1990-11-19 1992-08-04 Ricoh Co Ltd 辞書引き方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04174069A (ja) * 1990-08-29 1992-06-22 Ricoh Co Ltd 言語理解支援装置
JP3082446B2 (ja) * 1992-07-15 2000-08-28 富士ゼロックス株式会社 多重画像形成装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212491A (ja) * 1996-01-31 1997-08-15 Fuji Xerox Co Ltd 文書処理装置
WO2008084686A1 (ja) * 2007-01-12 2008-07-17 Nec Corporation プロトコル翻訳システム、プロトコル翻訳方法およびプロトコル翻訳プログラム
WO2008084687A1 (ja) * 2007-01-12 2008-07-17 Nec Corporation プロトコル不一致検出システム、プロトコル不一致検出方法およびプロトコル不一致検出プログラム
JP5187521B2 (ja) * 2007-01-12 2013-04-24 日本電気株式会社 プロトコル不一致検出システム、プロトコル不一致検出方法およびプロトコル不一致検出プログラム
JP5246415B2 (ja) * 2007-01-12 2013-07-24 日本電気株式会社 プロトコル翻訳システム、プロトコル翻訳方法およびプロトコル翻訳プログラム
JP2008217067A (ja) * 2007-02-28 2008-09-18 Toshiba Corp 情報提示装置、プログラム及び情報提示方法
JP2014010565A (ja) * 2012-06-28 2014-01-20 Canon Marketing Japan Inc 電子書籍端末、情報処理方法、プログラム
JP2016045796A (ja) * 2014-08-25 2016-04-04 Kddi株式会社 相手方ユーザからの対話文章に対して支援情報を明示する端末、プログラム及び方法

Also Published As

Publication number Publication date
US5359514A (en) 1994-10-25
EP0637804A2 (en) 1995-02-08
EP0637804A3 (en) 1995-08-23

Similar Documents

Publication Publication Date Title
JPH0793334A (ja) 文書に対する読者の理解度を高める方法及び装置
US10169310B2 (en) Rich text handling for a web application
EP0914637A1 (en) Document producing support system
US20060206806A1 (en) Text summarization
US20080104037A1 (en) Automated scheme for identifying user intent in real-time
US8135694B2 (en) Augmenting the contents of an electronic document with data retrieved from a search
JPH10171758A (ja) バーコードを用いたwwwのファイル閲覧システム
EP1247174A2 (en) Any-to-any component computing system
US10922494B2 (en) Electronic communication system with drafting assistant and method of using same
WO1996016374A1 (fr) Systeme de base de donnees partage par une pluralite d'appareils clients, procede de mise a jour de donnees et application a un processeur de caracteres
EP1318466A2 (en) Apparatus for interpreting electronic legal documents
JPS60103848A (ja) 複数言語が使用できるノ−ド間メツセ−ジ伝送方法
US20010032077A1 (en) Compare
US20230359827A1 (en) Representing Confidence in Natural Language Processing
US7207003B1 (en) Method and apparatus in a data processing system for word based render browser for skimming or speed reading web pages
JP2002258738A (ja) 語学学習支援システム
WO2005048120A1 (en) Text summarization
PaulVogt Dictionary of Statistics & Methodology
US11372852B2 (en) Named entity extraction in automated chat assistant
CN101082910A (zh) 例句显示装置和例句显示方法
JPH02297157A (ja) 文章要約装置
Grzybek Semiotics of history—historical cultural semiotics?
JP3858901B2 (ja) 言語自動翻訳システム
Gao A Quantitative Lexical Study on Commercial English.
JPH11167566A (ja) 出力機器適合型一括テキスト変換方法、装置および記録媒体