JPH07141381A - Electronic dictionary display device - Google Patents

Electronic dictionary display device

Info

Publication number
JPH07141381A
JPH07141381A JP5290451A JP29045193A JPH07141381A JP H07141381 A JPH07141381 A JP H07141381A JP 5290451 A JP5290451 A JP 5290451A JP 29045193 A JP29045193 A JP 29045193A JP H07141381 A JPH07141381 A JP H07141381A
Authority
JP
Japan
Prior art keywords
word
thesaurus
dictionary
similarity
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5290451A
Other languages
Japanese (ja)
Inventor
Kazuhiro Tsubaki
和弘 椿
Taro Morishita
太朗 森下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP5290451A priority Critical patent/JPH07141381A/en
Publication of JPH07141381A publication Critical patent/JPH07141381A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To display contents in accordance with the order of semantic distance to a retrieval keyword by using a thesaurus for the retrieval keyword inputted in a natural language. CONSTITUTION:An input means 1 is the keyboard to input an inquiry text including a marked keyword. A storage means 2 is the floppy disk/ROM or the like where the thesaurus is stored. A temporary storage means 3 temporarily stores inputted information in a RAM, a hard disk, a floppy disk, or the like. An input character string analysis means 4 subjects the inquiry text to morpheme analysis and syntax analysis to segment a word for thesaurus collation. A data exchanging means 5 sends the keyword to a dictionary retrieval device and receives dictionary information corresponding to the keyword from the dictionary retrieval device.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、電子辞書表示装置に関
し、より詳細には、電子辞書の検索内容の表示におい
て、予め用意されているシソーラスを利用して、マーキ
ングされた見出し語を含む問い合わせ文と類似した語義
順に、辞書情報を並べ替えて表示する電子辞書表示装置
に関する。例えば、電子辞書,データベースシステム,
情報想起システムなどに適用されるものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an electronic dictionary display device, and more particularly, to an inquiry including a marked entry word by using a thesaurus prepared in advance in displaying search contents of an electronic dictionary. The present invention relates to an electronic dictionary display device that rearranges and displays dictionary information in a word sense order similar to a sentence. For example, electronic dictionary, database system,
It is applied to information recall systems.

【0002】[0002]

【従来の技術】従来の電子辞書表示装置について記載し
た公知文献としては、例えば、特開昭55−13186
9号公報がある。この公報のものは、単語と該単語に関
連する情報との組を複数組記憶する記憶手段と、文字入
力キーの操作により前記単語を入力すると、該入力内容
に基づいて、前記入力単語に関連する情報を出力するも
のである。
2. Description of the Related Art As a known document describing a conventional electronic dictionary display device, for example, Japanese Patent Laid-Open No. 55-13186.
There is No. 9 publication. According to this publication, when a word is input by operating a character input key and a storage means for storing a plurality of sets of a word and information related to the word, the word is associated with the input word based on the input content. The information to be output is output.

【0003】電子辞書システムのみならず、紙の辞書に
おいても、意味不明の単語の訳語を調べる場合、語義で
区分された辞書情報を先頭から調べることになる。ここ
で、語義とは、アラビア数字やアルファベットで区分さ
れた訳語・用例・語法・用法・成句・語源等で構成され
る段落/文章のことである。このため、動詞のように語
義や用例が多い場合には、電子辞書システムにおいては
ディスプレイに表示される辞書情報が少ないために、訳
語を調べるのはかなりの労力が必要になる。
[0003] When looking up a translated word of a word whose meaning is unknown not only in the electronic dictionary system but also in a paper dictionary, the dictionary information divided by the word meaning is searched from the beginning. Here, the word meaning is a paragraph / sentence composed of a translated word, an example, a usage, a usage, a phrase, a etymology, etc., which is divided by an Arabic numeral or an alphabet. For this reason, when there are many word meanings and examples such as verbs, the dictionary information displayed on the display is small in the electronic dictionary system, so that it takes a considerable amount of labor to look up the translated word.

【0004】例えば、句“meet our request”中の単語
“meet”の意味は、“応じる/満たす”である。一般に
よく使用されている辞典においては、“meet”の語義は
他動詞だけで約7,8個程度(訳語は約20前後)あ
り、“応じる”の意味の語義は最後もしくはその一つ手
前の語義の区分に掲載されている。このため、辞書情報
をすべて表示する電子辞書の場合には、“応じる/満た
す”の訳語を見つけるためには、他の語義/訳語/用例
等を含む文章数十行前後を画面を見ながらスクロールす
る必要がある。また、訳語のみを表示する電子辞書にお
いても、それほどスクロールする必要はないものの、数
行はディスプレイの画面をスクロールする必要がある。
For example, the meaning of the word "meet" in the phrase "meet our request" is "accept / satisfy". In commonly-used dictionaries, the meaning of "meet" is about 7,8 transitive verbs only (translations are about 20), and the meaning of "respond" is the last or the previous meaning. It is listed in the section. For this reason, in the case of an electronic dictionary that displays all dictionary information, in order to find the translated word "accept / satisfy", scroll around tens of sentences including other meanings / translations / examples while looking at the screen. There is a need to. Further, even in an electronic dictionary that displays only translated words, it is necessary to scroll the screen of the display for several lines, although it is not necessary to scroll that much.

【0005】これに対して、電子辞書の中には、複数の
検索キーワードによって用例を検索する条件検索が用意
されているものがあるが、キーワードとインデックスの
照合は完全マッチであるため、余計な例文をも検索して
しまう。例えば、一般的な用例として“meet the deman
d of the age”(時代の要求に応じる)が辞書に登録さ
れているが、照合は検索キーワードとインデックスの完
全マッチのため、先の句“meet our request”の場合で
は、“meet”,“our”,“request”を検索キーワードと
しても、インデックスの“meet”にしかマッチしない。
On the other hand, some electronic dictionaries are provided with a conditional search for searching an example using a plurality of search keywords, but since the matching of the keyword and the index is a perfect match, it is unnecessary. I will also search for example sentences. For example, “meet the deman” is a common example.
"d of the age" (according to the demands of the age) is registered in the dictionary, but since the matching is a perfect match between the search keyword and the index, in the case of the previous phrase "meet our request", "meet", " Even if our ”and“ request ”are used as search keywords, they only match the index“ meet ”.

【0006】このため、“meet”にマッチするすべての
例文が表示される。この中から、“meet our request”
と見比べて、“meet the demand of the age”が最も意
味的に近いことを見つけることもかなりの労力が必要に
なる。うまく意味的に近い例文を探せたとしても、あま
り例文の訳語が適切でない場合には、その例文の含まれ
る語義内の訳語や例文や用法等を見出し語で検索し、か
つ表示された辞書情報の中から探し直す必要がある。
Therefore, all the example sentences matching "meet" are displayed. From this, “meet our request”
In comparison, finding the closest “meet the demand of the age” is also a lot of work. Even if you can find an example sentence that is close to the meaning well, if the translated word of the example sentence is not appropriate, search the translated word in the meaning of the example sentence, the example sentence, the usage, etc. with the entry word, and display the dictionary information. It is necessary to search again from inside.

【0007】[0007]

【発明が解決しようとする課題】前述のように、従来の
電子辞書表示装置における辞書情報の語義は使用頻度の
高いもの順に並んでいる。しかしながら、ユーザの引き
たい単語の語義は使用頻度の少ないものが多い。という
のも、使用頻度の高い語義はユーザが覚えてしまうた
め、辞書を見る必要がなくなるためである。
As described above, the word meanings of the dictionary information in the conventional electronic dictionary display device are arranged in descending order of frequency of use. However, the meaning of the word desired by the user is often infrequently used. This is because the meaning of frequently used words is remembered by the user, and it is not necessary to look at the dictionary.

【0008】現在の電子辞書では、表示画面が小さいに
もかかわらず、辞書情報を忠実に表示しようとしている
ため、使用頻度の高いもの順に並んだ語義から見る必要
が生じる。見出し語のみの検索キーワードでは情報量が
不足しており、どの語義がユーザの探したいものかを特
定することは難しい。
In the current electronic dictionaries, although the display screen is small, the dictionary information is to be displayed faithfully. Therefore, it is necessary to see the word meanings arranged in descending order of frequency of use. The amount of information is insufficient for a search keyword including only headwords, and it is difficult to specify which word meaning the user wants to search.

【0009】しかしながら、ユーザの調べたい単語は、
ユーザが訳そうと思ったり、あるいは意味を知りたい文
からとられたものであり、その文の句/節の情報を利用
すれば、ユーザの知りたい語義を検索する手がかりにな
る。文の句/節の情報を利用した検索方法の一つとし
て、複数検索キーワードによる用例の条件検索がある
が、条件検索による検索では、検索される例文数が多
い。このため、適切な訳語を調べるのに労力がかかるの
と、その例文の含まれる語義情報を場合によっては調べ
直す必要があることが問題点である。
However, the word that the user wants to look up is
It is taken from a sentence that the user intends to translate or want to know the meaning, and the phrase / clause information of the sentence can be used as a clue for searching the meaning of the word that the user wants to know. As one of the search methods using the phrase / clause information of the sentence, there is a conditional search of an example using a plurality of search keywords. However, in the search by the conditional search, a large number of example sentences are searched. For this reason, it is troublesome to look up an appropriate translated word, and it is necessary to check the word meaning information included in the example sentence again in some cases.

【0010】本発明は、このような実情に鑑みてなされ
たもので、電子辞書の検索内容の表示において、予め用
意されているシソーラスを利用して、マーキングされた
見出し語を含む問い合わせ文に意味的に近い語義が最初
に表示されるように、辞書情報を語義単位に並べ替えて
表示するようにした電子辞書表示装置を提供することを
目的としている。
The present invention has been made in view of such a situation, and in displaying the retrieval contents of the electronic dictionary, the meaning of the inquiry sentence including the marked headword is utilized by using a thesaurus prepared in advance. It is an object of the present invention to provide an electronic dictionary display device in which dictionary information is rearranged and displayed in units of word meanings so that the word meanings closer to each other are displayed first.

【0011】[0011]

【課題を解決するための手段】本発明は、上記目的を達
成するめに、(1)マーキングされた見出し語を含む問
い合わせ文を入力する入力手段と、シソーラスを記憶す
る記憶手段と、処理データの途中結果や制御の途中結果
を一時的に記憶する一時記憶手段と、問い合わせ文から
シソーラス照合用の単語を切り出す入力文字列解析手段
と、問い合わせ文中の見出し語を外部の辞書検索装置へ
送り、検索された見出し語に対応する辞書情報を受けと
るデータ交換手段と、辞書の例文からシソーラス照合用
の単語を切り出す例文単語抽出手段と、シソーラスを用
いて切り出されたシソーラス照合用の単語間の類似度を
計算する類似度計算手段と、類似度の高い順に辞書情報
を並べ換える並び換え手段と、並べ換えた辞書情報を表
示する表示手段と、前記各手段を制御する制御手段とか
ら成り、シソーラスを用いることにより、問い合わせ文
に意味的に近い語義が最初に表示されるように辞書情報
を並べ替えて表示すること、更には、(2)前記辞書情
報内の例文を類似度の高い順に並び換えて表示すること
を特徴としたものである。
In order to achieve the above object, the present invention provides (1) input means for inputting an inquiry sentence including a marked headword, storage means for storing a thesaurus, and processing data. Temporary storage means for temporarily storing intermediate results and intermediate results of control, input character string analysis means for extracting words for thesaurus matching from the inquiry sentence, and sending headwords in the inquiry sentence to an external dictionary search device for retrieval Data exchange means for receiving dictionary information corresponding to the identified headwords, example sentence word extraction means for extracting words for thesaurus matching from example sentences in the dictionary, and similarity between thesauri matching words extracted using the thesaurus A similarity calculation means for calculating, a sorting means for sorting the dictionary information in descending order of similarity, and a display means for displaying the sorted dictionary information. And a control means for controlling each of the above means, wherein the thesaurus is used to rearrange and display the dictionary information so that the semantics close to the inquiry sentence are displayed first, and (2) It is characterized in that the example sentences in the dictionary information are rearranged and displayed in descending order of similarity.

【0012】[0012]

【作用】制御手段によって、シソーラスがフロッピーデ
ィスクやROM等の記憶手段から入力手段により一時記
憶手段に記憶される。また、マーキングされた見出し語
を含む問い合わせ文の入力が入力手段により行われ、一
時記憶手段に記憶される。次に、マーキングされた見出
し語を含む問い合わせ文を形態素解析・構文解析して、
シソーラス照合用の単語が切り出され、前記一時記憶手
段に記憶される。次に、問い合わせ文に含まれる見出し
語に対応する辞書情報の検索が本装置と接続された辞書
検索装置によって行われる。辞書検索装置は、見出し語
に対して、電子化された辞書から見出し語に対応する辞
書情報を検索するものである。そして、検索された見出
し語の辞書情報が前記一時記憶手段に記憶される。次
に、例文単語抽出手段によって、辞書情報中の例文を形
態素解析・構文解析し、その例文からシソーラス照合用
の単語を切り出す。切り出された単語は前記一時記憶手
段に記憶される。次に、類似度計算手段により記憶され
ている問い合わせ文と例文から切り出されたシソーラス
照合用の単語の照合をシソーラスを用いて行い、類似度
を計算する。次に、並べ換え手段により計算された類似
度の高い順に語義単位に辞書情報を並べ換える。あるい
は辞書情報内の例文を類似度の高い順に並び換えて例文
以外を削除する。次に、並べ換えた辞書情報を表示手段
により表示を行う。
The control means causes the thesaurus to be stored in the temporary storage means by the input means from the storage means such as a floppy disk or ROM. Further, the inquiry sentence including the marked headword is input by the input unit and stored in the temporary storage unit. Next, morphological analysis / syntactic analysis of the inquiry sentence including the marked headword,
The thesaurus matching word is cut out and stored in the temporary storage means. Next, the dictionary information corresponding to the entry word included in the inquiry sentence is searched by the dictionary search device connected to this device. The dictionary retrieval device retrieves the dictionary information corresponding to the entry word from the electronic dictionary for the entry word. Then, the dictionary information of the searched entry word is stored in the temporary storage means. Next, the example sentence word extracting unit morphologically and syntactically analyzes the example sentence in the dictionary information, and cuts out a word for thesaurus matching from the example sentence. The cut out words are stored in the temporary storage means. Next, the thesaurus is used to compare the inquiry sentence stored by the similarity calculating unit with the words cut out from the example sentence for thesaurus matching, and the similarity is calculated. Next, the dictionary information is rearranged in word sense units in descending order of similarity calculated by the rearrangement means. Alternatively, the example sentences in the dictionary information are rearranged in the descending order of similarity, and the other than the example sentences are deleted. Next, the sorted dictionary information is displayed by the display means.

【0013】[0013]

【実施例】実施例について、図面を参照して以下に説明
する。図1は、本発明による電子辞書表示装置の構成図
で、図中、1は入力手段、2は記憶手段、3は一時記憶
手段、4は入力文字列解析手段、5はデータ交換手段、
6は例文単語抽出手段、7は類似度計算手段、8は並べ
替え手段、9は表示手段、10は制御手段である。
Embodiments will be described below with reference to the drawings. FIG. 1 is a block diagram of an electronic dictionary display device according to the present invention, in which 1 is an input means, 2 is a storage means, 3 is a temporary storage means, 4 is an input character string analysis means, 5 is a data exchange means,
Reference numeral 6 is an example sentence word extracting unit, 7 is a similarity calculating unit, 8 is a rearranging unit, 9 is a displaying unit, and 10 is a controlling unit.

【0014】入力手段1は、マーキングされた見出し語
を含む問い合わせ文を入力するためのキーボード等であ
る。記憶手段2は、シソーラスを記憶するフロッピーデ
ィスク/ROM等である。一時記憶手段3は、入力され
た情報をRAM,ハードディスク,フロッピーディスク
などへ一時的に記憶する。入力文字列解析手段4は、問
い合わせ文を形態素解析・構文解析して、シソーラス照
合用の単語を切り出す。データ交換手段5は、辞書検索
装置へ見出し語を送り、辞書検索装置から見出し語に対
応する辞書情報をもらう。
The input means 1 is a keyboard or the like for inputting an inquiry sentence including a marked headword. The storage means 2 is a floppy disk / ROM or the like for storing the thesaurus. The temporary storage means 3 temporarily stores the input information in a RAM, a hard disk, a floppy disk, or the like. The input character string analysis unit 4 morphologically / syntactically analyzes the inquiry sentence and cuts out a word for thesaurus matching. The data exchange means 5 sends the entry word to the dictionary search device, and receives the dictionary information corresponding to the entry word from the dictionary search device.

【0015】例文単語抽出手段6は、辞書情報中の例文
を形態素解析・構文解析し、その例文中からシソーラス
照合用の単語を切り出す。類似度計算手段7は、問い合
わせ文から切り出された単語と、例文から切り出された
単語との照合をシソーラスを用いて行い、シソーラス上
での類似度を計算する。並べ替え手段8は、辞書情報を
その類似度の高い順に並べ替える。表示手段9は、入力
された問い合わせ文や並べ替えられた辞書情報を文字情
報として表示するためのCRT(Cathode RayTube)な
どである。制御手段10は、前記各手段を制御するCP
U(中央処理装置)などである。
The example sentence word extracting means 6 morphologically and syntactically analyzes the example sentence in the dictionary information, and cuts out a word for thesaurus matching from the example sentence. The similarity calculation means 7 matches the words cut out from the inquiry sentence with the words cut out from the example sentence using a thesaurus to calculate the similarity on the thesaurus. The rearrangement means 8 rearranges the dictionary information in descending order of similarity. The display means 9 is a CRT (Cathode RayTube) or the like for displaying the input inquiry text and the sorted dictionary information as character information. The control means 10 is a CP that controls each of the above means.
U (central processing unit).

【0016】図2は、本発明による電子辞書表示装置の
動作を説明するための機能モジュールを示す図である。
図中、11はデータ前処理モジュール、12は入力文字
列解析モジュール、13はデータ変換モジュール、14
は例文単語切り出しモジュール、15は類似度計算モジ
ュール、16は並べ替えモジュール、17は表示モジュ
ールである。
FIG. 2 is a diagram showing functional modules for explaining the operation of the electronic dictionary display device according to the present invention.
In the figure, 11 is a data preprocessing module, 12 is an input character string analysis module, 13 is a data conversion module, and 14 is a data conversion module.
Is an example sentence word cutout module, 15 is a similarity calculation module, 16 is a rearrangement module, and 17 is a display module.

【0017】データ前処理モジュール11は、シソーラ
スの読み込み及びマーキングされた見出し語を含む問い
合わせ文を入力する。入力文字列解析モジュール12
は、問い合わせ文シソーラス照合用の単語を切り出す。
データ交換モジュール13は、問い合わせ文に含まれる
見出し語を辞書検索装置へ送り、辞書検索装置で検索さ
れた見出し語に対応する辞書情報を受けとる。例文単語
切り出しモジュール14は、見出し語に対応する辞書情
報中の例文を形態素解析・構文解析してシソーラス照合
用の単語を切り出す。類似度計算モジュール15は、シ
ソーラスを用いて問い合わせ文から切り出された単語
と、例文から切り出された単語間の類似度を数値化す
る。並べ替えモジュール16は、計算結果を基に、類似
度の高い順に辞書情報を並べ替える。表示モジュール1
7は、並べ替えられた辞書情報を表示する。以後、これ
らの各モジュールごとに具体的に説明を行う。
The data preprocessing module 11 inputs the inquiry sentence including the thesaurus reading and the marked entry word. Input character string analysis module 12
Cuts out words for query sentence thesaurus matching.
The data exchange module 13 sends the entry word included in the inquiry sentence to the dictionary search device, and receives the dictionary information corresponding to the entry word searched by the dictionary search device. The example sentence word slicing module 14 morphologically and syntactically analyzes the example sentence in the dictionary information corresponding to the entry word, and slices a word for thesaurus matching. The similarity calculation module 15 digitizes the similarity between the words cut out from the inquiry sentence and the words cut out from the example sentence using a thesaurus. The rearrangement module 16 rearranges the dictionary information in descending order of similarity based on the calculation result. Display module 1
7 displays the sorted dictionary information. Hereinafter, each of these modules will be specifically described.

【0018】データ前処理モジュール11は、予め記憶
手段に記憶されたシソーラスを一時記憶手段に蓄える。
また、マーキングされた見出し語を含む問い合わせ文の
入力を支援し、一時記憶手段へ蓄える。図3は、市販の
類語辞書から作成したシソーラスの一部をトリー構造で
表現したものである。シソーラスの末端は、辞書情報に
具体的に出てくる単語名称であり、中間ノードは中間概
念を表現したものである。また、トップノードは空ノー
ドになっている。
The data preprocessing module 11 stores the thesaurus previously stored in the storage means in the temporary storage means.
Also, it supports the input of the inquiry sentence including the marked headword and stores it in the temporary storage means. FIG. 3 shows a part of a thesaurus created from a commercially available thesaurus in a tree structure. The end of the thesaurus is a word name that appears specifically in the dictionary information, and the intermediate node expresses an intermediate concept. Also, the top node is an empty node.

【0019】問い合わせ文の入力は、自然言語で表現さ
れる文字列で行う。しかしながら、単語一個ずつを入力
しても構わない。但し、その際には、どの単語が見出し
語になるかをユーザが指定する必要がある。マーキング
された見出し語を含む問い合わせ文の入力例を下記に示
す。見出し語の指定方法は、単語の後ろに特殊な記号!
を付加する等、見出し語となるキーワードを本装置が識
別可能であれば、その方法は問わない。以後、“meet o
ur request”の検索例を基に説明する。
The inquiry sentence is input by a character string expressed in natural language. However, you may input one word at a time. However, in that case, the user needs to specify which word is the headword. The following is an example of inputting a query containing the marked headword. To specify the entry word, use a special symbol after the word!
Any method can be used as long as the apparatus can identify a keyword serving as a headword, such as adding. After that, “meet o
It will be explained based on the search example of "ur request".

【0020】入力例:meet! our request 入力文字列解析モジュール12では、見出し語指定のマ
ークにより見出し語を識別し、“meet”を切り出す。そ
して、問い合わせ文の形態素解析・構文解析が行われ、
見出し語以外のシソーラス照合用の名詞の単語が切り出
される。単語切り出しは、下記の規則により行われる。
Input example: meet! In our request input character string analysis module 12, the headword is identified by the mark for designating the headword, and “meet” is cut out. Then, the morphological analysis / syntactic analysis of the inquiry sentence is performed,
The words of nouns for thesaurus matching other than headwords are cut out. Word extraction is performed according to the following rules.

【0021】・見出し語が他動詞で入力文字列が文/句
/節の場合には、他動詞の目的語となる名詞の切り出し ・見出し語が自動詞で入力文字列が文の場合には、主語
の切り出し ・見出し語が名詞で入力文字列が句/節の場合、前置詞
が見出し語を含む名詞句に隣接していれば、その前置詞
に隣接する名詞句の名詞,前置詞が隣接してなくて、見
出し語に直接連体修飾する、あるいは、される名詞があ
れば、その名詞の切り出し ・見出し語が形容詞の場合には、形容詞のかかる名詞の
切り出し ・見出し語がbe動詞,冠詞,接頭辞,接尾辞,接続詞,
助動詞,間投詞,代名詞,前置詞,副詞,関係詞の場合
には、照合用の単語切り出しは行わない
When the headword is a transitive verb and the input character string is a sentence / phrase / section, the noun that is the object of the transitive verb is cut out. Cutout ・ If the entry word is a noun and the input character string is a phrase / clause, and if the preposition is adjacent to the noun phrase containing the entry word, the noun or preposition of the noun phrase adjacent to that preposition is not adjacent, If there is a noun that is directly or adornment modified to the headword, cut out that noun.-If the headword is an adjective, cut out the noun to which the adjective is applied.-The headword is a be verb, article, prefix, or suffix. Rhyme, conjunction,
In the case of auxiliary verbs, interjections, pronouns, prepositions, adverbs, and relatives, words are not cut out for matching.

【0022】この例“meet! our request”では、“mee
t”が他動詞であり、その目的語である単語“request”
が切り出されることになる。もし、切り出された名詞が
複数形の場合には、単数形に変換され、人称名詞で3人
称の場合には1人称へ変換される。これは、シソーラス
の容量を減らすためである。また、入力された見出し語
が“met”のように変化している場合には、その原形を
見出し語にする。同様に、名詞の複数形の場合には、基
本的には単数形が、形容詞の変化形の場合には、その原
形が見出し語になる。
In this example "meet! Our request", "mee!
"t" is a transitive verb and its object is the word "request"
Will be cut out. If the cut out noun has a plural form, it is converted to a singular form, and if it is a personal noun to be a third person, it is converted to a first person. This is to reduce the capacity of the thesaurus. When the input headword changes like "met", its original form is used as the headword. Similarly, in the case of plural nouns, the singular form is basically used, and in the case of adjectives, the original form is the headword.

【0023】データ交換モジュール13では、入力され
た見出し語“meet”を辞書検索装置へ送り、辞書検索装
置で検索された見出し語に対応する辞書情報(図4)を
受けとる。図4では、簡単のために辞書情報を語義と例
文のみにしてある。図中の18は語義の区分を示す番号
である。
The data exchange module 13 sends the input headword "meet" to the dictionary search device and receives dictionary information (FIG. 4) corresponding to the headword searched by the dictionary search device. In FIG. 4, only the word meanings and example sentences are used as dictionary information for simplicity. Reference numeral 18 in the figure is a number indicating the meaning division.

【0024】次に、例文単語切り出しモジュール14に
より辞書情報の例文の形態素解析・構文解析が行われ、
見出し語以外のシソーラス照合用の名詞が入力文字列解
析モジュールと同様の処理で切り出される。例えば、例
文“I am to meet her in the office”に対しては、見
出し語“meet”が他動詞であるため、目的語である名詞
“her”が切り出される。しかしながら、“her”は3人
称であるので、1人称の“she”で切り出される。切り
出された名詞が複数形の場合には、同様に単数形に変換
される。
Next, the example sentence word cutout module 14 performs morphological analysis / syntactic analysis of the example sentence of the dictionary information,
Nouns for thesaurus matching other than headwords are cut out by the same processing as the input character string analysis module. For example, for the example sentence “I am to meet her in the office”, the noun “her” that is the object is cut out because the entry word “meet” is a transitive verb. However, since "her" is in the third person, it is cut out by "she" in the first person. If the cut out noun has a plural form, it is similarly converted into a singular form.

【0025】類似度計算モジュール15は、一時記憶手
段に蓄えられたシソーラスを用いて、切り出された単語
同士の照合を行い、類似度計算を行う。類似度は基本的
にはシソーラス上での距離で計算する。つまり、シソー
ラス上での類似度はシソーラス上で、検索キーワードと
切り出した単語とが完全マッチ(シソーラスの末端から
一つ上のノードで照合が成功する場合)ならば、その距
離である1の逆数を類似度とする。部分マッチ(シソー
ラスの末端から二個以上のノードで照合が成功する場
合)の場合は、シソーラスの端末から照合の成功する中
間ノードまでの距離(2つの隣接する上位下位ノード間
の距離を1とする)の逆数を類似度とする。例えば、図
3のシソーラスにおいて、“you”と“friend”は、末
端ノードから4個目の中間ノード“人称”でマッチする
ので、類似度は1/4=0.25になる。
The similarity calculation module 15 compares the cut-out words with each other using the thesaurus stored in the temporary storage means to calculate the similarity. The similarity is basically calculated by the distance on the thesaurus. In other words, the similarity on the thesaurus is the reciprocal of 1 which is the distance if the search keyword and the extracted word are a perfect match on the thesaurus (when matching is successful at the node one level above the end of the thesaurus). Is the similarity. In the case of a partial match (when matching is successful in two or more nodes from the end of the thesaurus), the distance from the terminal of the thesaurus to the intermediate node where matching is successful (the distance between two adjacent upper and lower nodes is 1). The reciprocal of) is the similarity. For example, in the thesaurus of FIG. 3, since "you" and "friend" match at the fourth intermediate node "personal" from the end node, the similarity is 1/4 = 0.25.

【0026】図5は、図2における類似度計算モジュー
ルの類似度計算処理フローを示す図である。以下、各ス
テップに従って、順に説明する。step1 :照合単語組合せ処理により、問い合わせ文と例
文から切り出された単語の組み合わせを例文ごとに作成
する。問い合わせ文から切り出された単語“request”
と例文“I am to meet her in the office”から切り出
された単語“she”の組合せが作成される。すべての例
文ごとに組合せが作成される。もし、例文が“I am to
meet her and him in the office”の場合には、切り出
される単語は“she”,“he”になるため、組合せは、
“request”と“she”,“request”と“he”の2個作ら
れる。
FIG. 5 is a diagram showing a similarity calculation processing flow of the similarity calculation module in FIG. Hereinafter, each step will be described in order. step1 : By the matching word combination process, a combination of the words cut out from the inquiry sentence and the example sentence is created for each example sentence. The word "request" extracted from the query
And the word “she” cut out from the example sentence “I am to meet her in the office” is created. A combination is created for every example sentence. If the example sentence is "I am to
In the case of “meet her and him in the office”, the words that are cut out are “she” and “he”, so the combination is
Two are made: "request" and "she", "request" and "he".

【0027】step2:次に、組合せ類似度計算処理によ
り、作成された組合せの類似度が計算される。“reques
t”と“she”,“request”と“he”の類似度は、それぞ
れ1/5=0.2になる。step3 :次に、例文類似度計算処理により、例文ごとの
類似度が計算される。この計算は、例文ごとに作成され
た組合せの類似度の平均をとることになる。例文“I am
to meet her in the office”の場合は、作成された組
合せは、“request”と“she”のみであるから、0.2
になる。例文“Iam to meet her and him in the offic
e”の場合は、作成された組合せは、“request”と“sh
e”及び“request”と“he”の2個あり、それぞれの類
似度は0.2であるから、例文ごとの類似度はその平均
0.2になる。
[0027] step2: Then, by combining the similarity calculation processing, the similarity of the combination created is calculated. “Reques
The similarity between “t” and “she” and “request” and “he” is 1/5 = 0.2, respectively. Step 3 : Next, the similarity of each example sentence is calculated by the example sentence similarity calculation process. This calculation will take the average of the similarities of the combinations created for each example sentence.
In the case of “to meet her in the office”, the created combination is only “request” and “she”, so 0.2
become. Example sentence “I am to meet her and him in the offic
In case of "e", the created combination is "request" and "sh"
Since there are two "e" and "request" and "he", and the degree of similarity of each is 0.2, the average degree of similarity for each example sentence is 0.2.

【0028】step4:次に、語義類似度計算処理によ
り、語義ごとの類似度が計算される。この計算は、語義
に含まれる例文の類似度の平均になる。図4の語義1
は、例文“I am to meet her in the office”と例文
“He met a friend”を含むために、各例文の類似度
は、それぞれ0.2のため、語義ごとの類似度は0.2に
なる。
[0028] step4: Next, the semantic similarity calculation processing, similarities of each semantic is calculated. This calculation is the average of the similarities of the example sentences included in the word sense. Meaning 1 of FIG.
Contains the example sentence “I am to meet her in the office” and the example sentence “He met a friend”, the similarity of each example sentence is 0.2, so the similarity of each word sense is 0.2. Become.

【0029】図6は、例文から切り出された単語とその
類似度を例文ごと、及び語義ごとに示す図で、図中、2
3は例文、24は切り出された単語、25は例文別類似
度、26は語義別類似度、27は語義の区分を示す境界
線である。類似度は値が大きいほど類似していることに
なる。
FIG. 6 is a diagram showing the words cut out from the example sentences and the degrees of similarity for each example sentence and for each word meaning. In FIG.
3 is an example sentence, 24 is a cut-out word, 25 is a similarity degree by example sentence, 26 is a similarity degree by word sense, and 27 is a boundary line indicating a division of word sense. The greater the value of the similarity, the more similar.

【0030】並べ替えモジュール16では、辞書情報を
表示するために辞書情報を並べ替える。並べ替えた結果
は、一時記憶手段に記憶される。この場合は、図6の語
義ごとの類似度の計算結果から図4における語義は、
4,3,1,2の順に並べ替えられる。また、例文を類似
度の高い順に並び替える場合には、例文別の類似度を基
に単純に降順に並び替えるだけであり、“meet the dem
and of the age”,“I met the criticism with a smil
e”,“I cannot meet your wishes”,“I am tomeet he
r in the office”,“He met a friend”,“I'll meet
you at the busstop”,“Our company's taxi meets yo
u at the hotel”,“She met the misfortune”の順に
なる。
The rearrangement module 16 rearranges the dictionary information in order to display the dictionary information. The rearranged result is stored in the temporary storage means. In this case, the word meaning in FIG. 4 is calculated from the similarity calculation result for each word meaning in FIG.
They are rearranged in the order of 4, 3, 1, 2. Also, when the example sentences are sorted in descending order of similarity, they are simply sorted in descending order based on the similarity of each example sentence.
and of the age ”,“ I met the criticism with a smil
e ”,“ I cannot meet your wishes ”,“ I am to meet he
r in the office ”,“ He met a friend ”,“ I'll meet
you at the busstop ”,“ Our company's taxi meets yo
u at the hotel ”, then“ She met the misfortune ”.

【0031】表示モジュール17では、表示を行う。図
7は、類似度の高い順に辞書情報を表示した場合の表示
イメージを示しており、図8は、例文を類似度の高い順
に並び替える場合の表示イメージである。
The display module 17 displays. FIG. 7 shows a display image when the dictionary information is displayed in descending order of similarity, and FIG. 8 is a display image when the example sentences are rearranged in descending order of similarity.

【0032】[0032]

【発明の効果】以上の説明から明らかなように、本発明
によると、以下のような効果がある。 (1)自然言語で入力した検索キーワードに対してシソ
ーラスを利用することにより、検索キーワードに意味的
に近い内容から順に表示できる点にある。これにより、
ユーザは不要な辞書情報を見ることが少なくなり、訳語
を探すことが容易になる。 (2)また、ユーザが表示の内容の指定をできるように
拡張を容易に行うことができ、ユーザの必要とする辞書
の情報のみを効率的に表示できる。すなわち、例えば、
下記のような表示モードを設けることにより、ユーザは
欲しい情報をより早く得ることができる。 ・類似度の高い順に訳語を並び換えて表示 ・類似度の高い順に訳語と例文のみを表示 ・類似度の最も高い訳語のみを表示 ・類似度の最も高い例文のみを表示 ・類似度の最も高い語義のみを表示 ・類似度の最も高い訳語と例文のみを表示 (3)また、自然言語で検索キーワードを入力するため
に、OCR(Optical Character Reader:光字文字読取
装置)を使って紙上の自然言語を読みとり、辞書引きの
際の検索キーワードとして利用することが容易に行え
る。さらに、電子化されたテキストに対して訳を知りた
い自然言語の句/フレーズ等を表す範囲を指定して、そ
のバッファを取り込み、辞書引きの際の検索キーワード
として利用することが容易に行える。
As is apparent from the above description, the present invention has the following effects. (1) By using a thesaurus for search keywords input in natural language, the contents can be displayed in order from the contents that are semantically close to the search keywords. This allows
The user rarely sees unnecessary dictionary information, and it becomes easy to search for a translated word. (2) Further, the expansion can be easily performed so that the user can specify the display content, and only the information of the dictionary required by the user can be efficiently displayed. That is, for example,
By providing the following display modes, the user can obtain the desired information faster.・ Display translated words in order of highest similarity ・ Display only translated words and example sentences in order of highest similarity ・ Display only translated words with highest similarity ・ Display only example sentences with highest similarity ・ Highest similarity Display only the word meaning ・ Display only the translated words and example sentences with the highest degree of similarity (3) Also, to enter search keywords in natural language, use OCR (Optical Character Reader) It is easy to read a language and use it as a search keyword when looking up a dictionary. Further, it is possible to easily specify a range representing a natural language phrase / phrase or the like to be translated for the digitized text, import the buffer, and use it as a search keyword when looking up the dictionary.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明による電子辞書表示装置の一実施例を説
明するための構成図である。
FIG. 1 is a configuration diagram for explaining an embodiment of an electronic dictionary display device according to the present invention.

【図2】本発明による電子辞書表示装置の動作を説明す
るための機能モジュールを示す図である。
FIG. 2 is a diagram showing functional modules for explaining the operation of the electronic dictionary display device according to the present invention.

【図3】本発明におけるシソーラスの例である。FIG. 3 is an example of a thesaurus according to the present invention.

【図4】本発明における辞書情報の例である。FIG. 4 is an example of dictionary information according to the present invention.

【図5】図2における類似度計算モジュールの類似度計
算処理フローを示す図である。
5 is a diagram showing a similarity calculation processing flow of a similarity calculation module in FIG.

【図6】本発明における例文から切り出された単語例と
例文別の類似度例及び語義別の類似度例を示す図であ
る。
FIG. 6 is a diagram showing a word example cut out from an example sentence according to the present invention, a similarity example for each example sentence, and a similarity example for each word meaning.

【図7】本発明における類似度の高い順に並び換えた辞
書情報の表示例を示す図である。
FIG. 7 is a diagram showing a display example of dictionary information sorted in descending order of similarity according to the present invention.

【図8】本発明における類似度の高い順に並び換えた例
文の表示例を示す図である。
FIG. 8 is a diagram showing a display example of example sentences rearranged in descending order of similarity according to the present invention.

【符号の説明】[Explanation of symbols]

1…入力手段、2…記憶手段、3…一時記憶手段、4…
入力文字列解析手段、5…データ交換手段、6…例文単
語抽出手段、7…類似度計算手段、8…並べ替え手段、
9…表示手段、10…制御手段。
1 ... Input means, 2 ... Storage means, 3 ... Temporary storage means, 4 ...
Input character string analysis means, 5 ... data exchange means, 6 ... example sentence word extraction means, 7 ... similarity calculation means, 8 ... rearrangement means,
9 ... Display means, 10 ... Control means.

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 マーキングされた見出し語を含む問い合
わせ文を入力する入力手段と、シソーラスを記憶する記
憶手段と、処理データの途中結果や制御の途中結果を一
時的に記憶する一時記憶手段と、問い合わせ文からシソ
ーラス照合用の単語を切り出す入力文字列解析手段と、
問い合わせ文中の見出し語を外部の辞書検索装置へ送
り、検索された見出し語に対応する辞書情報を受けとる
データ交換手段と、辞書の例文からシソーラス照合用の
単語を切り出す例文単語抽出手段と、シソーラスを用い
て切り出されたシソーラス照合用の単語間の類似度を計
算する類似度計算手段と、類似度の高い順に辞書情報を
並べ換える並び換え手段と、並べ換えた辞書情報を表示
する表示手段と、前記各手段を制御する制御手段とから
なり、シソーラスを用いることにより、問い合わせ文に
意味的に近い語義が最初に表示されるように辞書情報を
並べ替えて表示することを特徴とする電子辞書表示装
置。
1. An input unit for inputting an inquiry sentence including a marked headword, a storage unit for storing a thesaurus, and a temporary storage unit for temporarily storing an intermediate result of processing data or an intermediate result of control. An input character string analysis means for extracting a word for thesaurus matching from a query sentence,
A data exchange means for sending the headword in the inquiry sentence to an external dictionary search device and receiving dictionary information corresponding to the searched headword, an example sentence word extracting means for cutting out a word for thesaurus matching from the example sentence of the dictionary, and a thesaurus. A similarity calculation means for calculating the similarity between the words for thesaurus matching cut out by using the sorting means, a sorting means for sorting the dictionary information in descending order of similarity, a display means for displaying the sorted dictionary information, and An electronic dictionary display device comprising control means for controlling each means, and by using a thesaurus, the dictionary information is rearranged and displayed so that a word meaning semantically close to the inquiry sentence is displayed first. .
【請求項2】 前記辞書情報内の例文を類似度の高い順
に並び換えて表示することを特徴とする請求項1記載の
電子辞書表示装置。
2. The electronic dictionary display device according to claim 1, wherein the example sentences in the dictionary information are rearranged and displayed in descending order of similarity.
JP5290451A 1993-11-19 1993-11-19 Electronic dictionary display device Pending JPH07141381A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5290451A JPH07141381A (en) 1993-11-19 1993-11-19 Electronic dictionary display device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5290451A JPH07141381A (en) 1993-11-19 1993-11-19 Electronic dictionary display device

Publications (1)

Publication Number Publication Date
JPH07141381A true JPH07141381A (en) 1995-06-02

Family

ID=17756203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5290451A Pending JPH07141381A (en) 1993-11-19 1993-11-19 Electronic dictionary display device

Country Status (1)

Country Link
JP (1) JPH07141381A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944507A (en) * 1995-07-26 1997-02-14 Fuji Xerox Co Ltd Matching device
JP2004206552A (en) * 2002-12-26 2004-07-22 Casio Comput Co Ltd Information display control device and its program
US7403889B2 (en) 2002-12-26 2008-07-22 Casio Computer Co., Ltd. Electronic dictionary with example sentences

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03276367A (en) * 1990-03-26 1991-12-06 A T R Jido Honyaku Denwa Kenkyusho:Kk Instance-oriented machine translation system
JPH04178767A (en) * 1990-11-14 1992-06-25 Nippon Telegr & Teleph Corp <Ntt> Electronic dictionary retrieval method
JPH05204968A (en) * 1992-01-13 1993-08-13 Nec Corp Translated word selector

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03276367A (en) * 1990-03-26 1991-12-06 A T R Jido Honyaku Denwa Kenkyusho:Kk Instance-oriented machine translation system
JPH04178767A (en) * 1990-11-14 1992-06-25 Nippon Telegr & Teleph Corp <Ntt> Electronic dictionary retrieval method
JPH05204968A (en) * 1992-01-13 1993-08-13 Nec Corp Translated word selector

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944507A (en) * 1995-07-26 1997-02-14 Fuji Xerox Co Ltd Matching device
JP2004206552A (en) * 2002-12-26 2004-07-22 Casio Comput Co Ltd Information display control device and its program
US7403889B2 (en) 2002-12-26 2008-07-22 Casio Computer Co., Ltd. Electronic dictionary with example sentences

Similar Documents

Publication Publication Date Title
US6957213B1 (en) Method of utilizing implicit references to answer a query
JP4544674B2 (en) A system that provides information related to the selected string
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US6167370A (en) Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
US5303150A (en) Wild-card word replacement system using a word dictionary
JP2742115B2 (en) Similar document search device
US20050203900A1 (en) Associative retrieval system and associative retrieval method
JPH0724056B2 (en) Computer-based morphological text analysis method
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPH0644296A (en) Machine translating system
Ekmekcioglu et al. Stemming and n-gram matching for term conflation in Turkish texts
JPH05314166A (en) Electronic dictionary and dictionary retrieval device
US5978798A (en) Apparatus for and method of accessing a database
JPH07141381A (en) Electronic dictionary display device
JPS60254367A (en) Sentence analyzer
Pantelia ‘Noûs, INTO CHAOS’: THE CREATION OF THE THESAURUS OF THE GREEK LANGUAGE
JPH07134720A (en) Method and device for presenting relative information in sentence preparing system
Yahia et al. An intelligent algorithm for Arabic soundex function using intuitionistic fuzzy logic
JPH0950435A (en) Translation device
JPH0821031B2 (en) Language analyzer
JP4262529B2 (en) Full-text search device, method, program, and recording medium
JPH09101951A (en) Document retrieving device
JPH0954781A (en) Document retrieving system
JPH0816910B2 (en) Language analyzer
JPH03161865A (en) Method for retrieving document