JP3025847B2 - 電子化辞書検索方法 - Google Patents

電子化辞書検索方法

Info

Publication number
JP3025847B2
JP3025847B2 JP2305964A JP30596490A JP3025847B2 JP 3025847 B2 JP3025847 B2 JP 3025847B2 JP 2305964 A JP2305964 A JP 2305964A JP 30596490 A JP30596490 A JP 30596490A JP 3025847 B2 JP3025847 B2 JP 3025847B2
Authority
JP
Japan
Prior art keywords
word
character string
search
information
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2305964A
Other languages
English (en)
Other versions
JPH04178767A (ja
Inventor
一 内野
保雄 坂間
諭 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2305964A priority Critical patent/JP3025847B2/ja
Publication of JPH04178767A publication Critical patent/JPH04178767A/ja
Application granted granted Critical
Publication of JP3025847B2 publication Critical patent/JP3025847B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) この発明は、電子化された言語対照辞書の検索方法に
関し、特に目的とする訳語・用例を効率よく取得するこ
とができる電子化辞書検索方法に関するものである。
(従来の技術) 電子技術の発達により、コンピュータを用いて第1の
自然言語を第2の自然言語に翻訳する自動翻訳装置が実
用段階にある。このような自然翻訳装置では、コンピュ
ータ上に電子化言語辞書を設け、第1の自然言語がキー
ボード等により入力されると、対応する第2の自然言語
を電子化言語辞書から検索して出力する。
この第1の自然言語を第2の自然言語に翻訳する際に
用いるコンピュータ上に記憶された電子化言語対照辞書
の、従来の電子化辞書検索方法としては、基本的な単語
(以後キー単語という)が指定された時、その訳語・語
釈文・用例をすべて検索して表示器上に表示する方法が
広く行われている。そして、この後利用者は、入力した
キー単語に対して表示された結果を目視確認することに
より、目的とする訳語を選択している。
(発明が解決しようとする課題) ところが、従来の技術では、訳語の使い方を確認する
ために辞書を検索した時も、キー単語に対するすべての
情報が表示されることになるため、目的とする情報に到
達するまでに手間がかかるという問題がある。また、語
釈文が長かったり、用例が多数示されていたりすると、
見落としが生じ易いという問題もある。
この発明は上記従来技術の欠点を解消することを課題
とし、その目的とするところは、検索情報絞り込み用の
文字列を指定することにより、目的とする情報を簡単に
取り出すことが可能な電子化辞書検索方法を提供するこ
とにある。また、この発明の別の目的は検索情報絞り込
み用の文字列に含まれる単語の単語属性を利用すること
により、語釈文に長さや用例の多少にかかわらず、関連
のある情報を洩れなく取り出すことが可能で、目的とす
る情報に到達するまでに手間取ることがない電子化辞書
検索方法を提供することにある。
〔発明の構成〕
(課題を解決するための手段) 上記目的を達成するこの発明の電子化辞書検索方法
は、第1の自然言語を第2の自然言語に翻訳する際に用
いるコンピュータ上に記憶された電子化言語対照辞書の
検索方法であって、その第1の形態では、指定されたキ
ー単語に対する訳語・語釈文・用例のデータを電子化言
語対照辞書から取り出す段階と、検索情報絞り込み用の
文字列が指定された時、取り出したデータ及び検索情報
絞り込み用の文字列を対象に第1の自然言語の処理系に
より形態素解析を行う段階と、語釈文に検索情報絞り込
み用の文字列が含まれている場合はその語釈文と該当す
る訳語・用例を取り出す第1の動作、用例の第1の自然
言語に検索情報絞り込み用の文字列が含まれている場合
はその語釈文と該当する訳語・用例を取り出す第2の動
作、の2つの動作の両方を行うことによって絞り込んだ
検索結果を表示する段階と、を備えていることを特徴と
している。
また、第2の形態では、形態素解析を行う段階におい
て、検索情報絞り込み用の文字列に含まれる単語の単語
属性を検出し、この単語属性を自動的に絞り込み用の情
報として使用することを特徴としている。
(作用) この電子化辞書検索方法の第1の形態によれば、検索
情報絞り込み用の文字列を指定することにより、取り出
したデータ及び検索情報絞り込み用の文字列を対照に形
態素解析機能により単語単位で照合が行われ、指定され
た文字列が単語をまたがって偶然現れるような場合にも
誤抽出が防止される。
また、この電子化辞書検索方法の第2の形態によれ
ば、検索情報絞り込み用の文字列に含まれる単語の単語
属性を使用して検索が行われ、語釈文に長さや用例の多
少にかかわらず、関連のある適切な情報を洩れなく取り
出される。
(実施例) 以下、この発明を実施例により図面を参照しつつ詳細
に説明する。
第1図は、この発明を適用した電子化辞書検索システ
ムの基本ブロック図である。図において、1は入力部、
2は辞書検索部、3は電子化言語対照辞書、4は形態素
解析部、5は絞り込み部、6は出力部を示している。こ
の電子化辞書検索システムは、例えば、電子計算機上に
構成されるもので、入力部1はキーボード、辞書検索部
2と形態素解析部4と絞り込み部5はCPU上のプログラ
ム、電子化言語対照辞書3は外部記憶装置、出力部6は
ディスプレイなどに対応する。
以上のような構成のシステムにおいては、入力部1か
ら第1の自然言語のキー単語が入力されると、辞書検索
部2が電子化言語対照辞書3からキー単語に対応する第
2の自然言語のデータが検索され、形態素解析部4にお
いて、取り出したデータ及び検索情報絞り込み用の文字
列を対象に形態素解析機能により単語単位で照合が行わ
れ、絞り込み部5において、検索情報絞り込み用の文字
列に含まれる単語の単語属性を使用して検索が行われ、
出力部6に検索情報が出力される。
この単語属性とは、例えば、「彼」、「社長」、「労
働者」などを≪人≫という分類で包括させるものであ
り、絞り込み用の情報として直接指定できるものであ
る。
次に、第1図のシステムにおけるこの動作を、キー単
語として「群れ」が入力部1から読み込まれた場合につ
いて説明する。このときに、辞書検索部2が電子化言語
対照辞書3を検索して第2図のような検索結果を得たと
する。そして、この検索結果に対して、形態素解析部4
で単語分割した後、入力部1から種々の情報絞り込み用
の文字列が読み込まれた場合の、この発明の電子化辞書
検索方法における出力情報について説明する。
(1) 「人」が指定された時の動作 このときは、検索結果の語釈文の第2行が単語「人」
を含んでいることが形態素解析の結果から分かるので、
第2図に示す検索結果に対して、語釈文と該当する訳語
・用例を取り出す第1の動作が行われ、語釈文がない一
般的な訳語である第1行と、絞り込んだ結果としての第
2行と表示する。すなわち、第3図のような画面が表示
される。用例の語釈文と該当する訳語・用例を取り出す
第2の動作では表示すべきものは見つからない。
(2) 「獣」が指定された時の動作 このときは、検索結果の語釈文の第3行と第4行が単
語「獣」を含んでいることが形態素解析の結果から分か
るので、第2図に示す検索結果に対して、語釈文と該当
する訳語・用例を取り出す第1の動作が行われ、語釈文
がない一般的な訳語である第1行と、絞り込んだ結果と
しての第3行と第4行を表示する。さらに、形態解析結
果から、「獣」の単語属性が≪哺乳類の動物≫である点
が判定され、第2図の検索結果に対して用例の語釈文と
該当する訳語・用例を取り出す第2の動作が行なわれ
る。すなわち、第10行の用例の「虎」も≪哺乳類の動物
≫であるので、併せて抽出されることになる。この結
果、第4図のような画面が表示される。
(3) 「労働者」が指定された時の動作 このときは、検索結果の語釈文には単語「労働者」が
含まれていないことが形態素解析の結果から分かる。ま
た、「労働者」を形態素解析した結果から、「労働者」
は≪人≫の単語属性を持つことが分かる。そこで、今度
は検索結末の語釈文の単語分割結果から≪人≫の単語属
性を持つ単語が含まれる部分を捜す。この結果、前述し
た第1の動作により第2行の「人」と「暴徒」がそれぞ
れ≪人≫単語属性を持っているので、一般的な語釈であ
る第1行と絞り込んだ結果としての第2行とを表示す
る。前述の第2の動作では表示すべきものは見つからな
いので、この場合も最初の例と同じ検索結果、すなわ
ち、第3図のような画面が表示されることになる。
前述の例においてはキー単語「群れ」を指定した後、
絞り込み用文字列を指定するものとして説明したが、
「(人の)群れ」にようにキー単語及び絞り込み用情報
を同時に入力したときも、同様の効果を得ることができ
る。
このように、この発明の電子化辞書検索方法によれ
ば、形態素解析機能により、単語単位で照合が行われる
ため、指定された文字列が単語をまたがって偶然現れる
ような場合にも誤抽出を防ぐことができる。例えば、
「は握」を指定したときに、「彼は握力が強い」のよう
な誤抽出をすることが無くなる。
〔発明の効果〕
以上のように、この発明の電子化辞書検索方法によれ
ば、キー単語以外の文字列を指定するだけで、目的とす
る情報を簡単に取り出すことができるばかりでなく、関
連のある情報を漏れなく取り出すことができる。また、
形態素解析機能により、誤抽出を防ぐことができるばか
りでなく、単語属性を使って関連ある情報まで抽出でき
る。
【図面の簡単な説明】
第1図は、この発明を適用した電子化辞書検索システム
の基本ブロック図、 第2図は、キー単語“群れ”に対する電子化言語対照辞
書の検索結果の例を示す画面図、 第3図は第2図のような検索結果の後に、入力部から或
る情報絞り込み用の文字列が読み込まれた場合の出力情
報を示す画面図、 第4図は第2図のような検索結果の後に、入力部から別
の情報絞り込み用の文字列が読み込まれた場合の出力情
報を示す画面図である。 1……入力部、 2……辞書検索部、 3……電子化言語対照辞書、 4……形態素解析部、 5……絞り込み部、 6……出力部。
フロントページの続き (56)参考文献 特開 平1−31227(JP,A) 特開 平2−189680(JP,A) 特開 平2−165276(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/20 - 17/30 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】第1の自然言語を第2の自然言語に翻訳す
    る際に用いるコンピュータ上に記憶された電子化言語対
    照辞書の検索方法であって、 指定されたキー単語に対する訳語・語釈文・用例のデー
    タを電子化言語対照辞書から取り出す段階と、 検索情報絞り込み用の文字列が指定された時、取り出し
    たデータ及び検索情報絞り込み用の文字列を対象に第1
    の自然言語の処理系により形態素解析を行う段階と、 語釈文に検索情報絞り込み用の文字列が含まれている場
    合はその語釈文と該当する訳語・用例を取り出す第1の
    動作、用例の第1の自然言語に検索情報絞り込み用の文
    字列が含まれている場合はその語釈文と該当する訳語・
    用例を取り出す第2の動作、の2つの動作の両方を行う
    ことによって絞り込んだ検索結果を表示する段階と、を
    備えたことを特徴とする電子化辞書検索方法。
  2. 【請求項2】形態素解析を行う段階において、検索情報
    絞り込み用の文字列に含まれる単語の単語属性を検出
    し、この単語属性を自動的に絞り込み用の情報として使
    用することを特徴とする請求項1に記載の電子化辞書検
    索方法。
JP2305964A 1990-11-14 1990-11-14 電子化辞書検索方法 Expired - Fee Related JP3025847B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2305964A JP3025847B2 (ja) 1990-11-14 1990-11-14 電子化辞書検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2305964A JP3025847B2 (ja) 1990-11-14 1990-11-14 電子化辞書検索方法

Publications (2)

Publication Number Publication Date
JPH04178767A JPH04178767A (ja) 1992-06-25
JP3025847B2 true JP3025847B2 (ja) 2000-03-27

Family

ID=17951422

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2305964A Expired - Fee Related JP3025847B2 (ja) 1990-11-14 1990-11-14 電子化辞書検索方法

Country Status (1)

Country Link
JP (1) JP3025847B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07141381A (ja) * 1993-11-19 1995-06-02 Sharp Corp 電子辞書表示装置

Also Published As

Publication number Publication date
JPH04178767A (ja) 1992-06-25

Similar Documents

Publication Publication Date Title
US6055528A (en) Method for cross-linguistic document retrieval
JP2783558B2 (ja) 要約生成方法および要約生成装置
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
JP2002197104A (ja) 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
CN111460095A (zh) 问答处理方法、装置、电子设备及存储介质
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
US20080312908A1 (en) Systems and methods for normalization of linguistic structures
JP3281639B2 (ja) 文書検索システム
JP5073349B2 (ja) 専門用語抽出装置、方法及びプログラム
JP3025847B2 (ja) 電子化辞書検索方法
Klang et al. Linking, searching, and visualizing entities in wikipedia
WO2015177861A1 (ja) 教師データ作成装置及び方法
JPH11143902A (ja) n−gramを用いた類似文書検索方法
JP7117168B2 (ja) 情報処理装置および情報処理方法
CN109284364B (zh) 一种用于语音连麦互动的互动词汇更新方法及装置
CN113918804A (zh) 商品信息检索系统及方法
KR0160919B1 (ko) 동사정보를 이용한 한국어 자연어 질의 정보검색 방법
JP3686312B2 (ja) 訳語検索方法、訳語検索装置及び訳語検索プログラムを記録した記録媒体
JP5187187B2 (ja) 体験情報検索システム
JPH0343662B2 (ja)
JP2840258B2 (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JP2830097B2 (ja) 文章検索方式
JPS6175952A (ja) 文書入力処理方式
KR20020015100A (ko) 웹 브라우저를 이용한 정보 검색 시스템
Singh et al. Extracting Data Elements from Punjabi Language query

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees