JPH08235181A - オンライン辞書およびこれを利用した読解支援装置 - Google Patents

オンライン辞書およびこれを利用した読解支援装置

Info

Publication number
JPH08235181A
JPH08235181A JP7039673A JP3967395A JPH08235181A JP H08235181 A JPH08235181 A JP H08235181A JP 7039673 A JP7039673 A JP 7039673A JP 3967395 A JP3967395 A JP 3967395A JP H08235181 A JPH08235181 A JP H08235181A
Authority
JP
Japan
Prior art keywords
context
word
meaning
routine
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7039673A
Other languages
English (en)
Inventor
Yoshiki Niwa
芳樹 丹羽
Yoshihiko Nitta
義彦 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7039673A priority Critical patent/JPH08235181A/ja
Publication of JPH08235181A publication Critical patent/JPH08235181A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 文脈に応じた適訳を語義表示部の先頭に表示
することにより少ない労力でかつ迅速に適訳を知ること
ができるようにすること。 【構成】 入力手段1、表示手段2、計算手段3、およ
び記憶手段4、5、6を有する計算機上で稼働する。辞
書引きする単語に多義性がある場合には多義解消ルーチ
ン422が語義決定文脈パターン52と例文データベー
ス53および文脈間の類似度を判定するルーチンなどを
用いて当該文脈に置ける単語の意味を判定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はオンラインの文書をディ
スプレー上で読む時に利用する辞書およびこれを利用し
た読解支援装置に関する。
【0002】
【従来の技術】従来の電子辞書は指定した単語に関する
記載事項を固定的に表示する。
【0003】
【発明が解決しようとする課題】単語は一般に複数の意
味を持ち、それらは文脈に依存する。単語に関する固定
的な辞書記載事項を表示するのでは、当該文脈における
最適の意味が先頭(もしくは上位)に表示されるとは限ら
ないので、場合によっては適訳を探し当てるまでに時間
と労力がかかることがある。
【0004】
【課題を解決するための手段】文脈中の単語の意味を判
定するために、語義判定用文脈パターンと文脈例のデー
タベース、および文脈間の類似度を判定するルーチンを
持ち、始めに語義判定用文脈リストと当該文脈の照合を
試み、適合するものがあればそれに対応する語義である
と判定し、それが無い場合には文脈例と当該文脈との類
似度を概類似度判定ルーチンにより判定し最も類似度の
高い文脈に置ける意味であると判定する多義解消機構を
備える。
【0005】
【作用】本発明では、文脈に応じて単語の意味の優先度
を決定する手段を利用することにより、指定された単語
の当該文脈における最適の意味が先頭(もしくは上位)に
表示される。したがって、指定した単語の当該文脈にお
ける適訳が語義表示部の先頭もしくは上位に表示される
ので、少ない労力、例えば語義表示部をスクロールする
量が少ない等、かつ迅速に適訳を知ることができるよう
になる。さらには、読書の効率化を計ることが出来る。
【0006】
【実施例】以下、本発明による文脈考慮型のオンライン
辞書の構成および使用の一実施例を図1に従って説明す
る。
【0007】本実施例では入力手段1、表示手段2、計
算プログラム実行手段(マイクロプロセッサ)3、計算プ
ログラム保持手段4、データ保持手段5、一時データ保
持手段(半導体メモリなど)6を有する計算機システム上
で稼働する。入力手段1は例えば、キーボード11、マ
ウス12あるいはペン入力手段13よりなる。表示手段
2は、後述するように各種の計算プログラムの機能が発
揮されるのに対応して、必要な表示エリア、例えば文書
表示エリア21、語義表示エリア22を形成され、位置
表示マーカ23が表示される。、計算プログラム実行手
段(マイクロプロセッサ)3は計算プログラム保持手段4
に保持される各種ルーチン、例えば、文書表示ルーチン
41、語義表示ルーチン42、辞書引きルーチン42
1、多義解消ルーチン422を所定のプログラムに従っ
て実行する。データ保持手段5には、例えば、見出し語
と意味を対として保持する通常の電子辞書51、語義決
定文脈パターン52、例文データベース53、単語ベク
トル辞書54が保持される。一時データ保持手段6に
は、例えば、文脈格納エリア61、文脈類似度格納エリ
ア62、読解対象文書エリア63が形成される。
【0008】利用者は読解の対象となる文書の内容を、
図の入力手段1あるいは電子データとして図示されてい
ない入力手段を使用して読解対象文書エリア63に保持
する。利用者が読解の対象となる文書を入力手段1で指
定すると、計算プログラム実行手段3は文書表示ルーチ
ン41を用いて表示手段2の中の文書表示エリア21に
必要な文書が表示され利用者はこれを読み始める。その
際に意味が良く分からない単語に遭遇した場合、画面上
の該当単語をペン入力手段13で指定したり、またはマ
ウス12などの入力手段を用いて位置表示マーカ23を
該当する単語上に持っていき、クリックなどの操作によ
り指定する。計算プログラム実行手段3は単語の指定に
対応して、語義表示ルーチン42を起動し語義表示エリ
ア22を当該単語の近辺の画面上に開き、辞書51に記
憶されている単語の意味がその画面上に表示される。こ
の際、本発明では、その単語が複数の意味を持つ場合に
は、前後の文脈を考慮に入れることによりその文脈にふ
さわしい意味を優先的に上位に表示することにより、利
用者が適訳を選択する労力を軽減する。その単語の意味
が一つの場合にはそれを表示するのは当然である。
【0009】以下、この文脈を考慮に入れて適訳を優先
的に表示する作業をいくつかの例を用いて説明する。
【0010】図3は「・・・with fuel tank capable of・・
・」という文脈で使われているtankの辞書引きを行
なった場合である。該当単語に位置表示マーカ23を当
て単語を指示すると、始めに辞書引きルーチン421に
よりtankの語義が引かれる。
【0011】図2にtankの語義を示す。この辞書の
例では、‘tank’に関する記載511は、意味1か
ら意味3までの語義を持つものとして定義されている。
これからtankが複数の意味を持つことが分かり、多
義解消ルーチン422が起動される。図4はこの多義解
消ルーチン422の構成を示したものであり、図に示す
ように、文脈切り出しルーチン4221、語義決定文脈
パターンとの照合ルーチン(以下単に照合ルーチンと呼
ぶ)4222、および例文との類似度計算ルーチン42
23とよりなる。多義解消ルーチン422は、始めに文
脈切り出しルーチン4221を起動して、指定された単
語tankの前後の文脈を一時データ保持手段6の中の
文脈格納エリア61に格納する。図5はその実行後の同
エリアの例である。左側のコラムの数字は指定された単
語との相対的な位置関係を示し、例えば「−2」の欄に
は指定された単語の2つ手前の単語「with」が格納
される。
【0012】続いて多義解消ルーチン422は照合ルー
チン4222を起動する。照合ルーチン4222は語義
決定文脈パターン52の中のtankに関するパターン
(図6)と、先に文脈格納エリア61に格納された、図
5に示すtankに関する文脈との照合を行なう。
【0013】ここで、語義決定文脈パターン52を図6
を例に説明する。
【0014】語義決定文脈パターンは定型句(イディオ
ム)として知られているものの他、新聞などの大量の文
書データから頻出するパターンを抽出して作成する。す
なわち、図6の例ではthink tankとtank topは通常イデ
ィオムとして知られているものであり、fuel tank途ant
i tank missailは新聞などの文書データに頻出するもの
を収集したものである。
【0015】この場合では、図5に示すtankに関す
る文脈は、語義決定文脈パターン52の上から3番目の
パターン「fuel tank」に適合するので、その
場合の意味番号‘tank’に関する辞書51の記載5
11の1番の意味が当該文脈における当該単語の意味で
あると判定する。
【0016】この例では、多義解消ルーチン422中の
例文との類似度計算ルーチン4223は使わなかった
が、これは語義決定文脈パターンの中に適合するものが
無い場合に使用される。その例は利用例の3として後に
示す。
【0017】上記の判定に従って、図7に示すように、
語義表示ルーチン42はtankの意味のうち1番の意
味「容器」を語義表示エリア22の先頭に表示する。そ
れ以外の意味も辞書記載の順に表示する。なお第1候補
の意味を決定するのに寄与した文脈、この場合では「f
uel tank」、は利用者にとって有益な情報なの
で、それを明示するためアンダーラインなどの文脈表示
マーカ24を表示する。最適な意味として判定された意
味の語義表示エリアにおける表示は、上記のように、最
上段に表示するほか、順序は変えず、着色もしくは字種
変更等、他の表記と区別しやすい異なった表記で強調し
てして表示するのも良い。
【0018】図8(a)は「・・・Mexico City think tan
k, says ・・・」という文脈で使われているtankの辞
書引きを行なった場合である。前の例と同様の動作を
し、文脈格納エリア61に図8(b)のような文脈が格
納される。続いて照合ルーチン4222は語義決定文脈
パターン52中のtankに関するパターン(図9
(b))と当該文脈(図8(b))の照合を行なう。こ
の場合では一番上のパターンに適合するが、この場合に
は意味記述欄には「Idiom」と記されており、これ
はイディオムとして辞書中にtankとは別の見出しとして
登録されていることを示す。従って辞書引きルーチン4
21が起動されて、図5に示す辞書51中の「thin
k tank」に関する記載事項が図9上(a)のよう
に語義表示エリア22に表示される。この場合にも意味
を決定するのに寄与した文脈(イディオム)、「thi
nk tank」、に文脈表示マーカ24が表示され
る。
【0019】図10(a)は「・・・for tank ammunition
and ・・・」という文脈で使われているtankの辞書引
きを行なった場合である。前の例と同様の動作をし、文
脈格納エリア61に図10(b)のような文脈が格納さ
れる。続いて照合ルーチン4222は語義決定文脈パタ
ーン52中のtankに関するパターン(図9(b))
と当該文脈(図10(b))を上位の規則から順に照合
する。この場合には適合するパターンが存在しないの
で、このままでは意味の判定ができない。そこで多義解
消ルーチン422は、さらに、図4に示す「例文との類
似度計算ルーチン」4223を起動し、当該文脈と最も
類似した例文から意味を推定する。
【0020】例文は「例文データベース」53に蓄えら
れている。図11は例文データベース中の「tank」
に関する部分531の一例を示したものである。各例文
データはどの単語に関する例文であるかを示す部分(一
番左)と例文の番号、その例文における当該単語の意味
の番号(利用する辞書51に記述されている意味番号)
からなっている。
【0021】類似度計算ルーチン4223はこれらの例
文と当該文脈(図10(b))の類似度を計算しその結
果を文脈類似度格納エリア62に順次格納する。図12
はその結果の一例である。この結果から最も類似度の高
い例文を選択する。この場合には5番の例文が一番類似
度が高いので、例文データベースのtankに関する例
文5(図11の5311)の意味番号2がこの場合のt
ankの意味として判定される。従って、図2に示す辞
書中のtankに関する記述511の意味番号2に相当
する部分「戦車」が、図13に示すように、語義表示エ
リア22の先頭に表示される。その他の意味は辞書見出
しの順で記述される。この場合には意味を決定するのに
寄与した文脈の範囲は特定できないので文脈表示マーカ
は表示されない。
【0022】文脈間の類似度を測る方法は色々とある
が、ここでは文脈を文脈ベクトルというベクトル(数値
列)の形に変換し、それら数値列間の類似度(ベクトルの
なす角度)で測る方法を示す。図14に示したように
「例文との類似度計算ルーチン」4223は「文脈ベク
トル作成ルーチン」42231と、「文脈ベクトルの類
似度計算ルーチン」42232とからなる。
【0023】文脈ベクトルの作成方法は色々とあるが、
ここではその一例として文脈を構成する単語のベクトル
の和を取る方法を用いる。図15に示したように、単語
ベクトル辞書54には各単語の意味を反映すると考えら
れる一定の長さの数値列(単語ベクトル)が格納されて
いる。単語ベクトルの作り方には色々あるが、一例とし
ては特開平6ー332935号「単語の数値列表現辞
書、その作成方法およびそれを使用した装置」に示され
ている方法で作成することができる。
【0024】一般に単語wの文脈C(後方にn単語まで
と前方にm単語まで)を「w(−n)・・・w(−2)
w(−1) w w(1) w(2) ・・・ w
(m)」とする。ここでw(−i)は単語wから見て後
方へi番目の単語w(i)は前方へi番目の単語を示
す。このとき、この文脈Cの文脈ベクトルはこれらの単
語のベクトルの和で計算される。ただしw自身の単語ベ
クトルは加えないものとする。すなわち、単語wの単語
ベクトルをWV[w]と書くことにすると、上記の文脈
のベクトルCV[C]は
【0025】
【数1】
【0026】で計算される。
【0027】このような計算を実行する文脈ベクトル作
成ルーチン42231を用いて現在着目している文脈
(図10(b)、C0と表示する)と各文脈例(図9
(b)、CE1,・・・,CE5と表示する)の文脈ベクト
ルを作成する。すなわちCV[C0]とCV[CE
1],・・・,CV[CE5]が計算される。そこで当該
文脈のベクトルCV[C0]と各文脈例の文脈ベクトル
の間の類似度を「文脈ベクトルの類似度計算ルーチン」
42232が計算して、文脈の類似度格納エリア62に
格納する。一般に二つの文脈ベクトルの類似度はそれら
のなす角度のコサインで計算される。従って二つの文脈
ベクトル(U、V)の間の類似度は
【0028】
【数2】
【0029】で計算される。
【0030】
【発明の効果】本発明により、指定した単語の当該文脈
における適訳が、語義表示部の先頭もしくは上位、ある
いは着色等の、使用者に見やすい形に表示されるので、
少ない労力で(例えば語義表示部をスクロールする量が
少なく済むように)かつ迅速に適訳を知ることができる
ようになる。
【図面の簡単な説明】
【図1】電子辞書の構成の一例を示す図。
【図2】辞書記載内容の一例を示す図。
【図3】利用例ー1の文書表示エリアにおける表示例を
示す図。
【図4】多義解消ルーチンの一例を示す図。
【図5】文脈格納エリアの一例を示す図。
【図6】語義決定文脈パターンの一例を示す図。
【図7】利用例ー1の文書表示エリアにおける表示例に
語義表示エリアを表示した例を示す図。
【図8】(a)は利用例ー2の文書表示エリアにおける
表示例を示す図、(b)は利用例ー2の文脈格納エリア
の例を示す図。
【図9】(a)は利用例ー2の文書表示エリアにおける
表示例に語義表示エリアを表示した例を示す図、(b)
は利用例ー2の語義決定文脈パターンの例を示す図。
【図10】(a)は利用例ー3の文書表示エリアにおけ
る表示例を示す図、(b)は利用例ー3の文脈格納エリ
アの例を示す図。
【図11】例文データベースの一例を示す図。
【図12】例文との類似度比較の一例を示す図。
【図13】利用例ー3の文書表示エリアにおける表示例
に語義表示エリアを表示した例を示す図。
【図14】例文との類似度計算ルーチンの一例を示す
図。
【図15】単語ベクトル辞書の一例を示す図。
【符合の説明】
1:入力手段、11:キーボード、12:マウス、1
3:ペン入力手段、2:表示手段、21:文書表示エリ
ア、22:語義表示エリア、23:位置表示マーカ、2
4:文脈表示マーカ、3:計算プログラム実行手段、
4:計算プログラム保持手段、41:文書表示ルーチ
ン、42:語義表示ルーチン、421:辞書引きルーチ
ン、422:多義解消ルーチン、4221:文脈切り出
しルーチン、4222:語義決定文脈パターンとの照合
ルーチン、4223:例文との類似度計算ルーチン、4
2231:文脈ベクトル作成ルーチン、42232:文
脈ベクトルの類似度計算ルーチン、5:データ保持手
段、51:辞書、52:語義決定文脈パターン、53:
例文データベース、54:単語ベクトル辞書、6:一時
データ保持手段、61:文脈格納エリア、62:文脈類
似度格納エリア。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】文脈中の単語の意味を判定するために、語
    義判定用文脈パターンと文脈例のデータベース、および
    文脈間の類似度を判定するルーチンを持ち、始めに語義
    判定用文脈リストと当該文脈の照合を試み、適合するも
    のがあればそれに対応する語義であると判定し、それが
    無い場合には文脈例と当該文脈との類似度を概類似度判
    定ルーチンにより判定し最も類似度の高い文脈に置ける
    意味であると判定する多義解消機構を有するとともに、
    適訳に近いものを優先的に又は他の表示と異なる表示に
    よって表示するオンライン辞書。
  2. 【請求項2】読解すべき文章を記憶する手段を備え、前
    記文章中の特定の単語に関し、文脈中の単語の意味を判
    定するために、語義判定用文脈パターンと文脈例のデー
    タベース、および文脈間の類似度を判定するルーチンを
    持ち、始めに語義判定用文脈リストと当該文脈の照合を
    試み、適合するものがあればそれに対応する語義である
    と判定し、それが無い場合には文脈例と当該文脈との類
    似度を概類似度判定ルーチンにより判定し最も類似度の
    高い文脈に置ける意味であると判定する多義解消機構を
    有するオンライン辞書を使用した読解支援装置。
JP7039673A 1995-02-28 1995-02-28 オンライン辞書およびこれを利用した読解支援装置 Pending JPH08235181A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7039673A JPH08235181A (ja) 1995-02-28 1995-02-28 オンライン辞書およびこれを利用した読解支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7039673A JPH08235181A (ja) 1995-02-28 1995-02-28 オンライン辞書およびこれを利用した読解支援装置

Publications (1)

Publication Number Publication Date
JPH08235181A true JPH08235181A (ja) 1996-09-13

Family

ID=12559627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7039673A Pending JPH08235181A (ja) 1995-02-28 1995-02-28 オンライン辞書およびこれを利用した読解支援装置

Country Status (1)

Country Link
JP (1) JPH08235181A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006501582A (ja) * 2002-09-30 2006-01-12 チャン,ニン−ピン 電子文書のテキスト情報に関するポインタにより瞬時に起動される2ヶ国語注釈
US7664628B2 (en) 2002-12-27 2010-02-16 Casio Computer Co., Ltd. Electronic dictionary with illustrative sentences
US8332753B2 (en) 2002-10-31 2012-12-11 Casio Computer Co., Ltd. Information displaying apparatus with word searching function and recording medium
JP2020161110A (ja) * 2019-03-25 2020-10-01 カシオ計算機株式会社 検索装置、検索方法、検索プログラム
CN112528635A (zh) * 2019-09-17 2021-03-19 卡西欧计算机株式会社 检索装置、检索方法、及记录介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006501582A (ja) * 2002-09-30 2006-01-12 チャン,ニン−ピン 電子文書のテキスト情報に関するポインタにより瞬時に起動される2ヶ国語注釈
JP2008152798A (ja) * 2002-09-30 2008-07-03 Ning-Ping Chan 電子文書のテキスト情報に関するポインタにより瞬時に起動される2ヶ国語注釈
US8332753B2 (en) 2002-10-31 2012-12-11 Casio Computer Co., Ltd. Information displaying apparatus with word searching function and recording medium
US7664628B2 (en) 2002-12-27 2010-02-16 Casio Computer Co., Ltd. Electronic dictionary with illustrative sentences
JP2020161110A (ja) * 2019-03-25 2020-10-01 カシオ計算機株式会社 検索装置、検索方法、検索プログラム
CN112528635A (zh) * 2019-09-17 2021-03-19 卡西欧计算机株式会社 检索装置、检索方法、及记录介质

Similar Documents

Publication Publication Date Title
US5734749A (en) Character string input system for completing an input character string with an incomplete input indicative sign
US5724457A (en) Character string input system
US20080189606A1 (en) Handheld electronic device including predictive accent mechanism, and associated method
CN110716991B (zh) 基于电子书的实体关联信息的展示方法及电子设备
JPH0773190A (ja) ペンベースコンピューターシステム用絵文字ネーミング
CN111428494A (zh) 专有名词的智能纠错方法、装置、设备及存储介质
JP2002132791A (ja) 地名情報抽出装置、その抽出方法及び抽出プログラムを記録した記録媒体、地図情報検索装置
JPH08235181A (ja) オンライン辞書およびこれを利用した読解支援装置
JPH1153394A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
CN111008519A (zh) 阅读页面的展示方法、电子设备及计算机存储介质
JP3958722B2 (ja) イメージデータ文書検索システム
JP2785692B2 (ja) 辞書検索表示装置
JP3371983B2 (ja) 不完全文字列と文字列の照合方法および装置
JP7554531B1 (ja) 新規呼出文字列登録プログラム、新規呼出文字列登録装置および新規呼出文字列登録方法
JPH07191986A (ja) 文章入力装置
JP4382343B2 (ja) 電子辞書及び電子辞書として機能させるためのプログラムを記録したコンピュータ読み取り可能な記憶媒体
JP2793992B2 (ja) 同音異義語認識装置
JPH04116763A (ja) 漢字読み変換方式
JP2005070856A (ja) 電子辞書における漢字熟語検索機能
JP3847801B2 (ja) 文字処理装置及びその処理方法
JP3184035B2 (ja) 単文節カナ漢字変換入力方式
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPH0731675B2 (ja) 仮名漢字相互変換装置
JPH07319908A (ja) 文書検索方法及び文書検索装置
JPH08329057A (ja) 文字列予測方法