JPH0855135A - 辞書引き装置 - Google Patents

辞書引き装置

Info

Publication number
JPH0855135A
JPH0855135A JP6212198A JP21219894A JPH0855135A JP H0855135 A JPH0855135 A JP H0855135A JP 6212198 A JP6212198 A JP 6212198A JP 21219894 A JP21219894 A JP 21219894A JP H0855135 A JPH0855135 A JP H0855135A
Authority
JP
Japan
Prior art keywords
dictionary
word
input
word string
idiom
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6212198A
Other languages
English (en)
Inventor
Mikito Hirata
幹人 平田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP6212198A priority Critical patent/JPH0855135A/ja
Publication of JPH0855135A publication Critical patent/JPH0855135A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 熟語が含まれていると考えられる語列を入力
するだけで、その語列中に実際に存在する熟語について
の辞書引き結果を得ることができ、然も、候補の熟語が
複数存在した場合には確度の高い順に辞書引き結果を提
示することができる辞書引き装置を提供する。 【構成】 利用者から辞書引き対象の語列が入力される
と、辞書検索手段2はその入力語列中の各語について、
辞書引き用の電子化された辞書1を引いて辞書内容を検
索する。次に優先度付け手段3は、検索された各語の辞
書内容に含まれる熟語の構成語と入力語列とを照合し、
入力語列中に全ての構成語が含まれている熟語を候補の
熟語として求め、且つ、求めた候補が複数存在した場合
には、例えば構成語数が多い熟語ほど高い優先度とする
優先度付けを行う。出力手段4は優先度付けされた順に
候補の熟語の情報をCRT5に表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は電子化された辞書を検索
する辞書引き装置に関し、特に熟語の辞書引きに好適な
辞書引き装置に関する。
【0002】
【従来の技術】一般に辞書としては紙に印刷されたもの
が古くから利用されてきたが、近年、紙辞書の内容を電
子化した電子化辞書を用いた辞書引き装置が普及しつつ
ある。このような辞書引き装置では、辞書の電子化の際
に語を見出し語として検索できるように加工してあり、
語を入力し検索を指示するだけで対応する辞書内容が画
面に表示される。このような辞書引き装置としては、例
えば「よろず引く之助」がある。なお、よろず引く之助
に関する文献としては、『EWS−UXソフトウェア
よろず引く之助利用の手引』(EMI84−1 199
3年12月初版日本電気株式会社発行)がある。
【0003】
【発明が解決しようとする課題】このように従来の辞書
引き装置では、検索したい語を入力することにより検索
を行わせるため、文中に含まれる複数の語からなる熟語
を辞書引きしたい場合、その熟語の中心となりそうな語
を選んでそれを辞書引き対象語として辞書引きし、引か
れた辞書内容の中から熟語の情報を捜す必要があった。
このため、熟語の辞書引き作業の効率が悪く、特に、利
用者自身が熟語の中心となり得る語を理解していること
が前提となるため熟語に関する知識に乏しい者には利用
できないという問題点があった。
【0004】なお、熟語そのものを見出し語として用意
してある電子化辞書の場合、熟語そのものを入力すれば
済むので、熟語の中心となり得る語を理解している必要
はない。しかしながら、利用者自身が熟語の構成語を理
解していることが必要となるため、やはり熟語に関する
知識の乏しい者には利用できない。例えば、英文中に
「made up hay into bundle
s」なる部分があってその意味が理解できないとき、
「made up into」が1つの熟語であること
を知っている者は良いが、熟語らしきものが存在するこ
とは何となくわかるがどの語で熟語が構成されているか
を知らない者は、熟語の構成語を推定して試行錯誤的に
辞書引きする必要があり、時間がかかる。特に英語のよ
うに、熟語の構成語が必ずしも連続して文中に現れない
言語の場合、不要な語(前述の例ではhay,bund
les)を取り除いて熟語の見出し語に整形する必要が
あるので、なおさら厄介である。
【0005】本発明はこのような従来の問題点を解決し
たものであり、その目的は、熟語が含まれていると考え
られる語列を入力するだけで、その語列中に実際に存在
する熟語についての辞書引き結果を得ることができ、然
も、候補の熟語が複数存在した場合には優先度付けして
辞書引き結果を提示することができる辞書引き装置を提
供することにある。
【0006】
【課題を解決するための手段】本発明の辞書引き装置は
上記の目的を達成するために、辞書引き対象の語列を入
力するための入力装置と、辞書引き結果を表示するため
の表示装置と、辞書引き用の電子化された辞書と、前記
入力装置から入力された語列中の各語について、その辞
書内容を前記辞書から検索する辞書検索手段と、該辞書
検索手段で検索された各語の辞書内容に含まれる熟語の
構成語と前記入力装置から入力された語列とを照合し、
前記入力語列中に全ての構成語が含まれている熟語を候
補の熟語として求め、且つ、求めた候補が複数存在した
場合には所定の規則に従って優先度付けする優先度付け
手段と、該優先度付け手段で優先度付けされた順に候補
の熟語の情報を前記表示装置に出力する出力手段とを備
えている。
【0007】本発明の好ましい実施例においては、優先
度付け手段は、候補の熟語の構成語数に基づき優先度付
けを行っている。
【0008】
【作用】本発明の辞書引き装置においては、入力装置か
ら辞書引き対象の語列が入力されると、辞書検索手段が
その入力語列中の各語について、辞書引き用の電子化さ
れた辞書を引いて辞書内容を検索し、次に優先度付け手
段が、検索された各語の辞書内容に含まれる熟語の構成
語と前記入力語列とを照合し、入力語列中に全ての構成
語が含まれている熟語を候補の熟語として求め、且つ、
求めた候補が複数存在した場合には、例えば構成語数が
多い熟語ほど高い優先度とする優先度付けを行う。そし
て、出力手段が、優先度付けされた順に候補の熟語の情
報を表示装置に出力する。
【0009】
【実施例】次に本発明の実施例について図面を参照して
詳細に説明する。
【0010】図1を参照すると、本発明の一実施例の辞
書引き装置は、英日辞書の辞書引きを行う装置であり、
辞書1と、辞書検索手段2と、優先度付け手段3と、出
力手段4と、表示装置たとえばCRT5と、入力装置た
とえばキーボード6およびマウス7とで構成されてい
る。なお、日英,日日等、任意の言語対での辞書引きに
対し本発明が適用可能なことは勿論のことである。
【0011】辞書1は辞書引き用の電子化された英日辞
書であり、原言語である英語の各見出し語毎に、訳語,
品詞,用例,熟語情報等の辞書内容を保持している。各
見出し語は原形だけでなく活用形も見出しになってお
り、活用形からも辞書内容が検索できる。熟語情報の格
納の仕方は幾つか考えられるが、本実施例においては、
熟語の情報は、熟語の中心となる語の辞書内容の中に、
副見出しとして格納されている。このような辞書1の構
成例を図2に示す。
【0012】図2では、語「make」を例にして、辞
書1中の関連する構成を例示している。辞書1は、イン
デクス部11とデータ部12とで構成されており、イン
デクス部11には活用形をも含む見出し語が格納され、
データ部12には対応する辞書内容が格納されている。
インデクス部11の各見出し語には、対応するデータ部
12内の辞書内容をポイントするポインタが付けられて
いる。辞書1に対する語の検索は、インデクス部11に
対して行われ、語がインデクス部11に登録されていれ
ば対応するデータ部12の辞書内容が引かれる。図2で
は、makeおよびその活用形であるmadeから、同
一の辞書内容が引かれる。データ部12の辞書内容中に
は、原形および訳語や用例等の一般によく見られる辞書
情報が格納されているとともに、その見出し語を含む熟
語に関する情報が格納されている。熟語の情報は、図2
に示すように、その構成語を並べた形の副見出しとその
辞書内容という形式で格納されている。
【0013】再び図1を参照すると、CRT5,キーボ
ード6およびマウス7は、辞書引きの対象となる語列の
入力と熟語引きの要求とを利用者から受け付け、また辞
書引き結果を利用者に提示する手段である。図3に入力
画面の一例を示す。利用者は、熟語として辞書引きした
い語列、すなわち熟語を含んでいると利用者が考える語
列を入力域51に入力する。この入力はキーボード6か
らの入力だけでなく、英文を別のエディタ等でCRT5
の画面に表示させて読んでいるときに、コピー&ペース
ト等で入力することもできる。この場合、通常は、熟語
の先頭の語から熟語の終わりの語と考える範囲をコピー
&ペーストで入力域51に入力すれば良い。勿論、余裕
を見て、更にその前後の語を含む広い範囲の語列を入力
しても構わない。図3の画面例では、「made up
hay into bundles」という語列を入
力している。利用者は、辞書引き対象の語列を入力した
後、熟語候補を検索する指示を行う。本実施例では、図
3に示すように入力画面に「熟語引き」というボタンを
表示してあるので、このボタンをマウス7でクリックす
れば良い。
【0014】図1の辞書検索手段2は、利用者から入力
された辞書引き対象の語列中の各語について辞書1に対
し辞書引きする手段である。辞書検索手段2は、辞書引
きして得た各語の辞書内容のうち、原形と熟語情報の部
分を取り出す。leavesのように、複数の原形(l
eave,leaf)を持つ場合は、両方の情報を取り
出す。また辞書1に登録されていない語の場合は、その
語を原形として熟語情報は空とする。図3の入力語列
「made up hay into bundle
s」に対して辞書検索手段2で取り出された情報例を図
4に示す。ここでは、先頭の語madeのみについて辞
書1に熟語情報が格納されていたものとしている。また
説明の便宜上、makeについて図2に示す3つの熟語
のみ考えている。辞書検索手段2は、入力語列および各
語について取り出された原形と熟語情報とを優先度付け
手段3に送る。
【0015】優先度付け手段3は、辞書検索手段2か
ら、入力語列および各語の原形と熟語情報を受け取る
と、その入力語列と熟語情報内の熟語見出しの構成語の
一致度を評価し、その一致度の順に熟語情報を並べ替え
て、出力手段4に送り出す手段である。具体的には、各
語の熟語情報に含まれる各熟語の見出しを取り出し、そ
の熟語見出しの構成語と入力語列とを比較し、一致度の
判定項目として以下に示す2項目を判定または計算す
る。
【0016】判定項目1:熟語の構成語がすべて入力語
列に含まれているか。含まれている場合は○を、含まれ
ていない場合は×を付与する。 判定項目2:熟語の構成語の数。数を示す整数を付与す
る。
【0017】優先度付け手段3は、熟語の構成語と入力
語列の一致を調べるとき、入力語列中の語形と一致しな
い場合でも、その語の原形と一致した場合は、一致とみ
なす。熟語候補としては、判定項目1が○のもののみ選
択し、その中での優先度付けは判定項目2の値が大きな
順とする。
【0018】図3および図4の例で説明すると、図4の
3つの熟語に対する上記の判定項目1および判定項目2
の結果は図5に示すものとなる。この例では、make
up forは判定項目1が×なので熟語候補からは
外される。また、makeup intoは判定項目2
の値がmake upより大きいので、makeup
into,make upの順で優先度付けされる。
【0019】なお、優先度付け手段3の処理において、
熟語の構成語が熟語見出しの順に入力語列に現れるもの
を優先したり、熟語の構成語が入力語列中で接近して出
現するもの、すなわち入力語列内に含まれる熟語の構成
語の先頭から最後までの範囲に入っている熟語の構成語
でない語の数が少ないものを優先する等の基準を追加す
るようにしても良い。
【0020】図1の出力手段4は、優先度付け手段3か
ら送られてきた優先度付きの熟語候補の情報をCRT5
に出力する手段である。図6に出力の画面例を示す。同
図に示すように、入力語列に含まれる熟語候補とその辞
書内容とが優先度順に表示されている。
【0021】次に図7および図8のフローチャートを参
照して、図1の辞書検索手段2および優先度付け手段3
の動作を、図2および図3の例にそって詳細に説明す
る。
【0022】図7を参照すると、辞書検索手段2は、先
ず図3に示した入力画面の入力域51に入力された辞書
引き対象の語列「made up hay into
bundles」を入力する(S1)。次に、入力語列
の先頭語madeに注目し(S2)、その語について辞
書1のインデクス部11を検索し(S3)、図2に示す
ように見出し語madeに付加されたポインタを辿って
データ部12中の辞書内容をロードする(S4,S
5)。そして、この辞書内容中から原形makeと熟語
の情報とを取り出す(S6)。
【0023】次に辞書検索手段2は、入力語列の次の語
upに注目し(S7)、辞書1のインデクス部11を検
索する(S3)。そして、インデクス部11の見出し語
upに対応するポインタを辿ってデータ部12から辞書
内容をロードし(S4,S5)、その中から原形upと
熟語情報とを取り出す(S6)。ここで、upの辞書内
容には熟語情報が格納されていないことを想定している
ので、熟語情報は空となる。以下、入力語列の残りの語
hay,into,bundlesについても同様の処
理が行われ、最後のbundlesを処理し終えると
(S8でYES)、図4に示したように、入力語列と、
各語について取り出した原形と熟語情報とを優先度付け
手段3に伝達する(S9)。
【0024】なお、辞書1のインデクス部11に該当す
る見出し語が登録されていない場合(S4でYES)、
前述したように、今回検索した語を原形として、熟語情
報は空とする(S10)。
【0025】次に図8を参照すると、優先度付け手段3
は、先ず辞書検索手段2から図4に示したような情報を
入力し(S11)、最初の原形makeに注目する(S
12)。
【0026】次に、現注目中の原形makeに対応する
熟語情報中の最初の熟語makeupに注目し(S1
3)、その構成語makeおよびupが入力語列「ma
deup hay into bundles」に存在
するか否かを調べる(S14,S15)。この場合、存
在するので(S16でYES)、注目中の熟語make
upに○の印を付け且つ構成語数2を格納する(S1
7)。他方、存在しなければ注目中の熟語に×の印を付
け且つ構成語数を格納する(S16でNO,S18)。
なお、×の印を付けた場合には前述したように候補から
外されるので構成語数の格納を省略しても良い。また、
ステップS15では、入力語列中に全ての構成語が含ま
れていることに加え、更にその構成語の入力語列中での
出現順序が熟語における出現順序通りになっているかを
判定するようにしても良い。
【0027】現注目中の原形makeの最初の熟語ma
ke upに対する処理を終えると、注目中の原形ma
keの次の熟語make up intoに注目し(S
19)、先の熟語make upと同様の処理を繰り返
す。現注目中の原形makeについては、この動作を最
後の熟語make up forまで繰り返す。
【0028】現注目中の原形makeについての全ての
熟語の処理を終えると(S20でYES)、次の原形u
pに注目し、原形makeの場合と同様の処理を実行す
る。これを、原形hay,into,bundleにつ
いて繰り返す。そして、最後の原形bundleに対す
る処理を終えると(S22でYES)、○の印が付いて
いる熟語の情報を、その構成語数の大きい順に優先度付
けして、出力手段4へ伝達する(S23)。
【0029】
【発明の効果】以上説明した本発明の辞書引き装置によ
れば、以下のような効果を得ることができる。
【0030】熟語が含まれていると考えられる語列を入
力するだけで、その語列中に実際に存在する熟語につい
ての辞書引き結果を得ることができるため、熟語に関す
る知識が十分でない利用者にとって熟語の辞書引き作業
が容易となる。
【0031】候補の熟語が複数存在した場合には、所定
の規則、たとえば候補の熟語の構成語数の大小に従って
確度の高い順に優先度が付与され、優先度順に辞書引き
結果が提示されるため、利用者はより確度の高いものか
ら順に辞書引き結果を参照することができる。
【0032】各語の活用形をも含めた見出し語毎にその
語の原形に対応するデータ部へのポインタを保持するイ
ンデクス部を備えた辞書の構成では、辞書引き対象とす
る語列中に活用形の語があっても、そのまま入力語列と
して入力することができ、利用者の負担が軽くなる。
【0033】入力語列中に全ての構成語が含まれている
ことに加え、更にその構成語の入力語列中での出現順序
が熟語における出現順序通りになっている熟語を候補の
熟語とすることにより、候補の熟語の精度をより高める
ことができる。
【図面の簡単な説明】
【図1】本発明の一実施例の辞書引き装置のブロック図
である。
【図2】辞書の構成例を示す図である。
【図3】辞書引き時の入力画面の例を示す図である。
【図4】辞書検索手段から優先度付け手段に伝達される
情報の例を示す図である。
【図5】優先度付け手段3で熟語の判定項目を評価した
結果の例を示す図である。
【図6】辞書引き時の出力画面の例を示す図である。
【図7】辞書検索手段の処理例を示すフローチャートで
ある。
【図8】優先度付け手段の処理例を示すフローチャート
である。
【符号の説明】
1…辞書 2…辞書検索手段 3…優先度付け手段 4…出力手段 5…CRT 6…キーボード 7…マウス 11…インデクス部 12…データ部 51…辞書引き対象の語列の入力域

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 辞書引き対象の語列を入力するための入
    力装置と、 辞書引き結果を表示するための表示装置と、 辞書引き用の電子化された辞書と、 前記入力装置から入力された語列中の各語について、そ
    の辞書内容を前記辞書から検索する辞書検索手段と、 該辞書検索手段で検索された各語の辞書内容に含まれる
    熟語の構成語と前記入力装置から入力された語列とを照
    合し、前記入力語列中に全ての構成語が含まれている熟
    語を候補の熟語として求め、且つ、求めた候補が複数存
    在した場合には所定の規則に従って優先度付けする優先
    度付け手段と、 該優先度付け手段で優先度付けされた順に候補の熟語の
    情報を前記表示装置に出力する出力手段とを備えること
    を特徴とする辞書引き装置。
  2. 【請求項2】 前記優先度付け手段は、候補の熟語の構
    成語数に基づき優先度付けすることを特徴とする請求項
    1記載の辞書引き装置。
  3. 【請求項3】 前記辞書は、語の原形毎にその語を含む
    熟語の情報を保持するデータ部と、各語の活用形をも含
    めた見出し語毎にその語の原形に対応する前記データ部
    へのポインタを保持するインデクス部とから構成されて
    いることを特徴とする請求項2記載の辞書引き装置。
  4. 【請求項4】 前記優先度付け手段は、前記入力語列中
    に全ての構成語が含まれていることに加え、更にその構
    成語の前記入力語列中での出現順序が熟語における出現
    順序通りになっている熟語を候補の熟語として求めるこ
    とを特徴とする請求項3記載の辞書引き装置。
JP6212198A 1994-08-12 1994-08-12 辞書引き装置 Pending JPH0855135A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6212198A JPH0855135A (ja) 1994-08-12 1994-08-12 辞書引き装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6212198A JPH0855135A (ja) 1994-08-12 1994-08-12 辞書引き装置

Publications (1)

Publication Number Publication Date
JPH0855135A true JPH0855135A (ja) 1996-02-27

Family

ID=16618550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6212198A Pending JPH0855135A (ja) 1994-08-12 1994-08-12 辞書引き装置

Country Status (1)

Country Link
JP (1) JPH0855135A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5932062A (ja) * 1982-08-17 1984-02-21 Casio Comput Co Ltd 熟語サ−チ方式
JPS59132071A (ja) * 1983-08-22 1984-07-30 Sharp Corp 電子式翻訳装置
JPS63228375A (ja) * 1987-03-18 1988-09-22 Brother Ind Ltd 電子辞書

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5932062A (ja) * 1982-08-17 1984-02-21 Casio Comput Co Ltd 熟語サ−チ方式
JPS59132071A (ja) * 1983-08-22 1984-07-30 Sharp Corp 電子式翻訳装置
JPS63228375A (ja) * 1987-03-18 1988-09-22 Brother Ind Ltd 電子辞書

Similar Documents

Publication Publication Date Title
US5541838A (en) Translation machine having capability of registering idioms
US5257186A (en) Digital computing apparatus for preparing document text
US5864788A (en) Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
US5495413A (en) Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
EP1576462B1 (en) Electronic dictionary with example sentences
JPH06119405A (ja) 画像検索装置
EP0357344B1 (en) Computer assisted language translating machine
JPH06259420A (ja) 文章編集支援装置
JPH1097530A (ja) 日付変換方法および日付変換機能を備えた文書処理装置並びに文書処理プログラムを記録した記録媒体
JPH0576067B2 (ja)
JPH08272822A (ja) 文書登録装置及び文書検索装置
JPH0855135A (ja) 辞書引き装置
JPH0236019B2 (ja)
JPH08305726A (ja) 情報検索装置
JPS61248160A (ja) 文書情報登録方式
JP2004213309A (ja) 情報表示制御装置及びプログラム
JPS6175952A (ja) 文書入力処理方式
JP3210842B2 (ja) 情報処理装置
JPS6057422A (ja) 文書目次索引作成装置
JP2871300B2 (ja) 機械翻訳装置
JP3408830B2 (ja) 日本語文構文解析装置
JPH08278982A (ja) 類似語または類似文章の検索方法
JPH0561902A (ja) 機械翻訳システム
JPH08272782A (ja) 文書検索装置
JPH0377169A (ja) 文書調査方法及び装置並びに文書処理装置

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070725

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080725

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080725

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090725

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees