JP2000268035A - Semantic dictionary registering device - Google Patents

Semantic dictionary registering device

Info

Publication number
JP2000268035A
JP2000268035A JP11067563A JP6756399A JP2000268035A JP 2000268035 A JP2000268035 A JP 2000268035A JP 11067563 A JP11067563 A JP 11067563A JP 6756399 A JP6756399 A JP 6756399A JP 2000268035 A JP2000268035 A JP 2000268035A
Authority
JP
Japan
Prior art keywords
dictionary
semantic
information
semantic information
entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11067563A
Other languages
Japanese (ja)
Inventor
Hiromi Nakaiwa
浩巳 中岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11067563A priority Critical patent/JP2000268035A/en
Publication of JP2000268035A publication Critical patent/JP2000268035A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a semantic dictionary registering device for automatically giving semantic information to an input dictionary entry while utilizing the information of a dictionary entry, to which the semantic information is already given, in a semantic dictionary. SOLUTION: This semantic dictionary registering device is provided with a dictionary data storage part 2 for storing dictionary entries composed of dictionary records, indexes of the dictionary records and semantic information of dictionary records as dictionary data, a synonym dictionary entry semantic information retrieving part 3 for confirming whether the dictionary entry of synonym to the dictionary record of the input dictionary entry and the index of the dictionary record is stored in the dictionary data storage part 2 or not and extracting the semantic information of the synonym dictionary entry when it is stored and an input dictionary entry registering part 10 for applying the semantic information of the synonym dictionary entry as the semantic information of the input dictionary entry when the semantic information of the synonym dictionary entry is extracted by the synonym dictionary entry semantic information retrieving part 3 and registering it into the dictionary data storage part 2.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、単語の意味情報を
格納した単語辞書を作成する装置である意味辞書登録装
置に関し、自然言語処理システムや情報検索システムや
機械翻訳システムなどに適用し得るものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a semantic dictionary registration device for creating a word dictionary storing semantic information of words, and is applicable to a natural language processing system, an information retrieval system, a machine translation system, and the like. It is.

【0002】[0002]

【従来の技術】従来は、自然言語処理システムや文書検
索システムや機械翻訳システムなどで用いる意味辞書を
構築する場合、意味辞書の内容を熟知した専門家によ
り、新規に登録する意味辞書の辞書エントリーの内容を
検討して、その内容に適切な意味情報を人手で付与し登
録するのが一般的である。しかしながら、この意味情報
の辞書エントリーへの付与は、辞書エントリーの内容と
付与する意味情報の内容とをよく理解していないと困難
である。よって、不足する辞書エントリーの拡充や利用
者がその利用目的に応じて利用者辞書として辞書エント
リーを登録する際にも、辞書エントリーや意味情報の内
容を熟知した専門家による作業が必要となり、多大な費
用と手間がかかっていた。
2. Description of the Related Art Conventionally, when constructing a semantic dictionary used in a natural language processing system, a document search system, a machine translation system, or the like, a dictionary entry of a semantic dictionary newly registered by an expert who is familiar with the contents of the semantic dictionary. It is common practice to examine the contents and manually add and register appropriate semantic information to the contents. However, it is difficult to assign this semantic information to the dictionary entry unless the contents of the dictionary entry and the contents of the semantic information to be added are well understood. Therefore, when a dictionary entry is expanded or a user registers a dictionary entry as a user dictionary according to the purpose of use, it requires work by an expert who is familiar with the dictionary entries and the contents of semantic information. Cost and effort.

【0003】このような意味辞書登録手法の一つとし
て、意味辞書の専門家により頭の中にある意味情報を決
定するための意味情報決定ルールを書き出し、それを用
いて辞書エントリーの内容を参照して意味情報を付与す
る手法がある。この手法では、意味情報付与の際に意味
情報決定ルールの中に書き出された専門家の意味情報付
与のノウハウが直接活用できるので、意味辞書の専門家
でなくても効率的で正確な意味情報の付与が期待でき
る。しかしながら、この意味情報決定ルールの作成は専
門家による人手作業となるため、正確な付与フロー作成
には多大な費用と手間がかかる点、人手作業により意味
情報決定ルールを作成しているのでルールの中に誤りや
不整合などが含まれる可能性があり、それにより付与し
た意味情報の精度が低下してしまう点で問題があった。
As one of the semantic dictionary registration methods, a semantic dictionary expert writes a semantic information determination rule for determining semantic information in the mind, and uses the rule to refer to the contents of the dictionary entry. There is a method of adding semantic information. In this method, the expertise of assigning semantic information written in the semantic information decision rule at the time of assigning semantic information can be directly utilized, so that even a non-semantic dictionary expert can efficiently and precisely Provision of information can be expected. However, since the creation of this semantic information determination rule is a manual operation by an expert, it takes a great deal of cost and time to create an accurate assignment flow, and the semantic information determination rule is created by a manual operation. There is a possibility that errors and inconsistencies may be included in the information, which causes a problem in that the accuracy of the assigned semantic information is reduced.

【0004】また、単語がどのような意味を持つかを、
その単語が自然言語文の中でどのような単語と現れてい
るかの傾向を大規模な自然言語文の文集(以下コーパス
と呼ぶ)の中から自動的に調べ、同じような単語と共起
する単語が同じ意味を持つと認定して同義語情報を自動
的に抽出する装置が知られている(特開平9−1204
01号公報)。しかしながら、このようにして自動的に
抽出された同義語の単語の集合は、直接自然言語処理シ
ステムや文書検索システムや機械翻訳システムのなかで
各種条件として活用している意味情報の体系と直接的な
関連はないため、同じグループに入っている単語である
ことから、辞書エントリーに登録すべき辞書情報が直接
決定できるわけではない点で問題があった。さらに、辞
書エントリーには、通常、単語表記以外に個々のシステ
ムで活用する様々な情報が付与されているが、本装置で
は単語表記だけを手がかりにして同義語の単語の集合を
自動的にグループ化しているため、辞書エントリーの単
語表記以外の情報も考慮した意味情報の付与は困難であ
る点で問題があった。
[0004] Also, what meaning a word has,
Automatically checks the tendency of the word to appear in natural language sentences from a large-scale natural language sentence collection (hereinafter referred to as a corpus) and co-occurs with similar words There is known an apparatus for automatically extracting synonym information by recognizing that words have the same meaning (Japanese Patent Laid-Open No. 9-1204).
No. 01). However, the set of synonym words automatically extracted in this way is directly related to the semantic information system used as various conditions in natural language processing systems, document search systems, and machine translation systems. Since there is no relevant relationship, since the words belong to the same group, there is a problem in that the dictionary information to be registered in the dictionary entry cannot be directly determined. Furthermore, in addition to the word notation, various information used in individual systems is usually added to the dictionary entry. However, this device automatically groups a set of synonym words using only the word notation as a clue. Therefore, there is a problem in that it is difficult to add semantic information in consideration of information other than the word notation of the dictionary entry.

【0005】[0005]

【発明が解決しようとする課題】上記の従来の単語の意
味情報を格納した単語辞書を作成する装置である意味辞
書登録装置では、辞書エントリーに意味情報を新規に登
録するには、意味辞書の辞書エントリーと意味情報の内
容を良く理解した専門家により付与する必要があるため
多大な費用と手間がかかるという問題点がある。また、
意味辞書の専門家が書き出した意味情報決定ルールよっ
て意味情報を付与する手法では、正確な付与フロー作成
には多大な費用と手間がかかる点、意味情報決定ルール
には誤りや不整合などが含まれる可能性があるためそれ
により付与した意味情報の精度が低下してしまう点で問
題である。さらに、単語の意味をコーパス中でその単語
と共起する単語の傾向を自動調査して同義語情報を自動
抽出し、単語の意味情報を付与する装置では、抽出され
た同義語の単語の集合は辞書エントリー中の意味情報と
直接的な関連が無い点、辞書エントリー中の単語表記以
外の情報を活用していないため辞書エントリーの単語表
記以外の情報も考慮した意味情報の付与は困難である点
で問題である。
In the above-described conventional meaning dictionary registering device which is a device for creating a word dictionary storing the meaning information of words, in order to newly register the meaning information in the dictionary entry, the meaning of the meaning dictionary is changed. There is a problem that a great deal of cost and labor are required because the dictionary entry and the contents of the semantic information need to be assigned by a well-understood expert. Also,
In the method of assigning semantic information based on semantic information decision rules written by a semantic dictionary expert, creating an accurate assignment flow requires a great deal of cost and labor, and the semantic information decision rules include errors and inconsistencies. This is a problem in that the accuracy of the assigned semantic information is reduced due to the possibility that the semantic information may be given. Furthermore, in a device for automatically examining the tendency of words that co-occur with the word in the corpus and automatically extracting synonym information, and adding the meaning information of the word, a set of extracted synonym words is used. Is not directly related to the semantic information in the dictionary entry, and does not utilize information other than the word notation in the dictionary entry, so it is difficult to assign semantic information in consideration of information other than the word notation in the dictionary entry That is a problem.

【0006】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、意味辞書中の既に意味
情報が付与されている辞書エントリーの情報を利用し
て、意味情報の付与対象である入力辞書エントリーと類
義の意味辞書中の辞書エントリーを抽出し、その辞書エ
ントリーに付与されている意味情報を入力辞書エントリ
ーの意味情報として付与する意味辞書登録装置を提供す
ることを目的とする。
The present invention has been made in view of the above points, and solves the above-mentioned conventional problems. The present invention utilizes the information of a dictionary entry to which semantic information has already been assigned in a semantic dictionary, and uses the information of the semantic information. It is an object of the present invention to provide a semantic dictionary registration device which extracts a dictionary entry in an input dictionary entry and a synonymous semantic dictionary to be assigned, and assigns semantic information assigned to the dictionary entry as semantic information of the input dictionary entry. Aim.

【0007】[0007]

【課題を解決するための手段】本発明は、上記目的の達
成のためになされたもので、請求項1記載の発明では、
少なくとも辞書レコードと、該辞書レコードの見出し
と、該辞書レコードの意味情報とからなる辞書エントリ
ーを辞書データとして格納する辞書データ格納手段と、
入力辞書エントリーの辞書レコードと該辞書レコードの
見出しと類義する辞書エントリーが辞書データ格納手段
に格納されているか否かを確認し、格納されている場合
には該類義する辞書エントリーの意味情報を抽出する類
義辞書エントリー意味情報検索手段と、前記類義辞書エ
ントリー意味情報検索手段により類義する辞書エントリ
の意味情報が抽出された場合、入力辞書エントリーの意
味情報として、類義する辞書エントリーの意味情報を付
与し、前記辞書データ格納手段に登録する入力辞書エン
トリー登録手段を備えることを特徴とする意味辞書登録
装置である。
SUMMARY OF THE INVENTION The present invention has been made to achieve the above object.
Dictionary data storage means for storing at least a dictionary record, a dictionary entry including the heading of the dictionary record, and semantic information of the dictionary record as dictionary data;
It is checked whether or not the dictionary record of the input dictionary entry and the dictionary entry synonymous with the heading of the dictionary record are stored in the dictionary data storage means. If stored, the semantic information of the synonymous dictionary entry is stored. Synonym dictionary entry semantic information searching means for extracting the synonymous dictionary entry, and when the synonym dictionary entry semantic information searching means extracts semantic information of the synonymous dictionary entry, the synonymous dictionary entry And an input dictionary entry registering means for registering the dictionary information in the dictionary data storage means.

【0008】また、請求項2記載の発明では、請求項1
記載の発明において、少なくとも、辞書レコード及び見
出し中の情報で意味情報を決定するための条件である意
味情報決定条件と、その意味情報決定条件を満たす辞書
エントリーに付与する意味情報からなる意味情報決定ル
ールを格納する意味情報決定ルール格納手段を含み、前
記類義辞書エントリー意味情報検索手段は、入力辞書エ
ントリーに対する類義する辞書エントリーの意味情報を
抽出する際に、該意味辞書決定ルールの該意味決定条件
と該入力エントリーの辞書レコード及び又は見出しとを
照合し、照合する意味決定条件が存在する場合には該意
味決定条件に対応する意味情報を類義する辞書エントリ
ーの意味情報として抽出することを特徴とするものであ
る。
[0008] According to the second aspect of the present invention, in the first aspect,
In the invention described above, at least a semantic information determination condition that is a condition for determining semantic information based on information in a dictionary record and a heading, and a semantic information determination that includes semantic information to be given to a dictionary entry satisfying the semantic information determination condition A semantic information determining rule storing means for storing a rule; wherein the synonym dictionary entry meaning information searching means extracts the meaning of the semantic dictionary determining rule when extracting the semantic information of the synonymous dictionary entry with respect to the input dictionary entry. The determination condition is compared with the dictionary record and / or heading of the input entry, and if there is a meaning determination condition to be matched, the semantic information corresponding to the meaning determination condition is extracted as the semantic information of the synonymous dictionary entry. It is characterized by the following.

【0009】また、請求項3記載の発明では、請求項2
記載の発明において、前記辞書データ格納手段に格納さ
れている各辞書エントリーの辞書レコード及び又は見出
しに対して付与されている意味情報の傾向を自動分析
し、辞書レコード及び又は見出し中で意味情報を決定す
るための条件である意味情報決定条件を自動抽出し、該
意味情報決定条件と、該意味情報決定条件を満たす辞書
エントリーに付与する意味情報からなる意味情報決定ル
ールとして前記意味情報決定ルール格納手段に登録する
意味情報決定ルール獲得手段を含むことを特徴とするも
のである。
According to the third aspect of the present invention, there is provided the second aspect.
In the described invention, the tendency of semantic information given to dictionary records and / or headings of each dictionary entry stored in the dictionary data storage means is automatically analyzed, and the semantic information is stored in the dictionary records and / or headings. A semantic information determination condition that is a condition for determination is automatically extracted, and the semantic information determination rule is stored as a semantic information determination rule including the semantic information determination condition and the semantic information to be assigned to a dictionary entry satisfying the semantic information determination condition. And means for acquiring semantic information determination rules to be registered in the means.

【0010】また、請求項4記載の発明では、請求項
1,2又は3記載の発明において、入力辞書エントリー
に特定の意味情報を付与する場合に必ず含まれていなけ
ればならない入力辞書エントリーの辞書レコード及び見
出し中の情報である意味情報決定必須条件と、該特定の
意味情報からなる意味情報決定必須ルールを格納する意
味情報決定必須ルール格納手段を含み、前記類義辞書エ
ントリー意味情報検索手段は、入力辞書エントリーに対
する類義する辞書エントリーの意味情報を抽出する際
に、該意味辞書決定必須ルールの該意味決定必須条件と
該入力エントリーの辞書レコード及び又は見出しとを照
合し、照合する意味決定必須条件に対応する意味情報の
中から類義する辞書エントリーの意味情報を抽出するこ
とを特徴とするものである。
According to a fourth aspect of the present invention, in the first, second or third aspect of the invention, a dictionary of input dictionary entries which must be included when specific semantic information is added to the input dictionary entries. A semantic information determination essential condition that is information in a record and a heading; and a semantic information determination essential rule storage unit that stores a semantic information determination essential rule including the specific semantic information. When extracting the semantic information of the dictionary entry to be synonymous with the input dictionary entry, the semantic determination essential condition of the semantic dictionary determination essential rule is matched with the dictionary record and / or heading of the input entry, and the semantic determination to be matched is performed. It extracts semantic information of synonymous dictionary entries from semantic information corresponding to essential conditions. That.

【0011】また、請求項5記載の発明では、請求項4
記載の発明において、前記辞書データ格納手段に格納さ
れている各辞書エントリーの辞書レコード及び又は見出
しに対して付与されている意味情報の傾向を自動分析
し、辞書レコード及び又は見出し中で特定の意味情報が
付与されている場合に必ず含まれていなければならない
条件である意味情報決定必須条件を自動抽出し、該意味
情報決定必須条件と、該特定の意味情報からなる意味情
報決定必須ルールとして前記意味情報決定必須ルール格
納手段に登録する意味情報決定必須ルール獲得手段を含
むことを特徴とするものである。
Further, according to the invention described in claim 5, according to claim 4,
In the described invention, the tendency of semantic information given to dictionary records and / or headings of each dictionary entry stored in the dictionary data storage means is automatically analyzed, and a specific meaning in the dictionary records and / or headings is specified. Automatically extract semantic information determination essential condition, which is a condition that must be included when information is added, and define the semantic information determination essential condition and the semantic information determination essential rule consisting of the specific semantic information as described above. It is characterized by including semantic information determination essential rule acquisition means registered in the semantic information determination essential rule storage means.

【0012】また、請求項6記載の発明では、請求項
1,2,3,4又は5記載の発明において、前記辞書デ
ータ格納手段は、各辞書エントリーの辞書レコードの見
出しは単語情報を含んでおり、単語情報の間の意味的な
距離情報である単語間意味距離を算出する意味距離計算
手段を含み、前記類義辞書エントリー意味情報検索手段
は、入力辞書エントリーの辞書レコードと該辞書レコー
ドの見出しと類義する辞書エントリーが辞書データ格納
手段に格納されているか否かを確認する際に、該入力辞
書エントリーの辞書レコードの見出し中の単語情報と、
前記辞書データ格納手段に格納されている辞書エントリ
ーの辞書レコードの見出し中の単語情報との間の単語間
意味距離を該意味距離計算手段により算出し、該単語間
意味距離を参照して、類義する辞書エントリーの意味情
報を抽出することを特徴とするものである。
According to a sixth aspect of the present invention, in the first, second, third, fourth or fifth aspect of the invention, the dictionary data storage means includes a dictionary record heading of each dictionary entry containing word information. A synonym dictionary entry semantic information search unit that calculates a semantic distance between words that is semantic distance information between word information; When confirming whether a dictionary entry synonymous with a heading is stored in the dictionary data storage means, word information in the heading of the dictionary record of the input dictionary entry,
The inter-word semantic distance between the word information in the heading of the dictionary record of the dictionary entry stored in the dictionary data storage unit is calculated by the semantic distance calculating unit, and the inter-word semantic distance is referred to, It is characterized by extracting the semantic information of the defined dictionary entry.

【0013】また、請求項7記載の発明では、請求項
1,2,3,4,5又は6記載の発明において、前記辞
書データ格納手段は、各辞書エントリーの辞書レコード
の中に、該辞書レコードの見出し及び該辞書レコードの
意味情報に対応する単語情報を含んでおり、単語情報の
間の意味的な距離情報である単語間意味距離を算出する
意味距離計算手段を含み、前記類義辞書エントリー意味
情報検索手段は、入力辞書エントリーの辞書レコード及
び該辞書レコードの見出しと類義する辞書エントリーが
辞書データ格納手段に格納されているか否かを確認する
際に、該入力辞書エントリーの辞書レコード中の単語情
報と、前記辞書データ格納手段に格納されている辞書エ
ントリーの該辞書レコード中の単語情報との間の単語間
意味距離を該意味距離計算手段により算出し、該単語間
意味距離を参照して、類義する辞書エントリーの意味情
報を抽出することを特徴とするものである。
According to a seventh aspect of the present invention, in the first, second, third, fourth, fifth or sixth aspect, the dictionary data storage means stores the dictionary data in the dictionary record of each dictionary entry. The synonym dictionary includes word information corresponding to record headings and semantic information of the dictionary record, and includes semantic distance calculating means for calculating inter-word semantic distance that is semantic distance information between the word information. The entry semantic information search unit is configured to check whether a dictionary record of the input dictionary entry and a dictionary entry synonymous with a heading of the dictionary record are stored in the dictionary data storage unit. The meaning distance between words between the word information in the word and the word information in the dictionary record of the dictionary entry stored in the dictionary data storage means is defined as the meaning distance. Calculated by the calculation means, with reference to said word between semantic distance, it is characterized in that to extract semantic information of the dictionary entries to be synonymous.

【0014】また、請求項8記載の発明では、請求項6
又は7記載の発明において、同じ意味及び又は類義の意
味を持つ単語情報をグループ化したシソーラスを格納す
るシソーラス格納手段を含み、前記意味距離計算手段
は、単語情報の間の単語間意味距離を算出する際に、両
方の単語情報が該シソーラス格納手段に格納されている
シソーラス中で同じグループに入っているか否かを参照
して、該単語情報の間の単語間意味距離を算出すること
を特徴とするものである。
Further, according to the invention described in claim 8, according to claim 6,
Or the invention according to claim 7, further comprising: a thesaurus storage means for storing a thesaurus in which word information having the same meaning and / or synonymous meaning is grouped, wherein the semantic distance calculation means calculates the inter-word semantic distance between the word information. When calculating, it is referred to whether or not both word information belong to the same group in the thesaurus stored in the thesaurus storage means, and calculate the inter-word semantic distance between the word information. It is a feature.

【0015】また、請求項9記載の発明では、請求項8
記載の発明において、前記シソーラス格納手段は、シソ
ーラス中の単語情報の各グループ間の意味的関係である
概念関係情報及び又は各グループ中で共通の意味を持つ
複数のグループで束ねた関係である上位概念関係情報を
含んでおり、前記意味距離計算手段は、単語情報の間の
単語間意味距離を算出する際に、両方の単語情報が該シ
ソーラス格納手段に格納されているシソーラス中で同じ
グループに入っているか否かに加えて、別のグループに
入っている場合には、両グループにはどのような概念意
味関係情報及び又は上位概念関係情報があるかも参照し
て、該単語情報の間の単語間意味距離を算出することを
特徴とするものである。
According to the ninth aspect of the present invention, the eighth aspect of the present invention provides
In the described invention, the thesaurus storage means stores conceptual relationship information that is a semantic relationship between groups of word information in the thesaurus and / or a higher-order relationship that is a bundle of a plurality of groups having a common meaning in each group. When the semantic distance calculating means calculates the inter-word semantic distance between the word information, both of the word information belong to the same group in the thesaurus stored in the thesaurus storage means. If they are in another group in addition to whether or not they are included, refer to what kind of conceptual semantic relation information and / or superordinate conceptual relation information exists in both groups, It is characterized in that a meaning distance between words is calculated.

【0016】また、請求項10記載の発明では、請求項
8又は9記載の発明において、前記辞書データ格納手段
は、各辞書エントリーの辞書レコードの見出しの単語情
報として第一言語の単語情報を含んでおり、各辞書エン
トリーの辞書レコードの単語情報として、該辞書レコー
ドの見出しに対応する第二言語の単語情報を含んでいる
ことを特徴とするものである。
According to a tenth aspect of the present invention, in the invention of the eighth or ninth aspect, the dictionary data storage means includes word information of a first language as word information of a heading of a dictionary record of each dictionary entry. And that the word information of the dictionary record of each dictionary entry includes word information of the second language corresponding to the heading of the dictionary record.

【0017】また、請求項11記載の発明では、請求項
1,2,3,4,5,6,7,8,9又は10記載の発
明において、前記意味情報決定ルール格納手段は、前記
類義辞書エントリー意味情報検索手段により抽出された
類義する辞書エントリーの意味情報を表示する手段を含
んでいることを特徴とするものである。
In the invention according to claim 11, in the invention according to claims 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10, the means for storing semantic information determination rules may include: It is characterized by including a means for displaying the meaning information of the synonymous dictionary entries extracted by the meaning dictionary entry meaning information search means.

【0018】以上の構成によれば、本発明の意味辞書登
録装置においては、辞書データ格納手段は、少なくとも
辞書レコードと、該辞書レコードの見出しと、該辞書レ
コードの意味情報とからなる辞書エントリーを辞書デー
タとして格納する。これから以下の手段によって辞書デ
ータ格納手段に格納する辞書エントリーに意味情報が付
与される。
According to the above configuration, in the semantic dictionary registration device of the present invention, the dictionary data storage means stores a dictionary entry including at least a dictionary record, a heading of the dictionary record, and semantic information of the dictionary record. Store as dictionary data. From now on, semantic information is added to the dictionary entries stored in the dictionary data storage means by the following means.

【0019】類義辞書エントリー意味情報検索手段は、
入力辞書エントリーの辞書レコードと該辞書レコードの
見出しと類義する辞書エントリーが辞書データ格納手段
に格納されているか否かを確認し、格納されている場合
には類義する辞書エントリーの意味情報を抽出すること
ができる。入力辞書エントリー登録手段は、類義辞書エ
ントリー意味情報検索手段と、前記類義辞書エントリー
意味情報検索手段により類義する辞書エントリの意味情
報が抽出された場合、入力辞書エントリーの意味情報と
して、該類義する辞書エントリーの意味情報を付与し、
前記辞書データ格納手段に登録することができる。これ
により、意味情報が未付与である入力辞書エントリーに
対して、事前に意味情報が付与済みの辞書エントリーを
参考にして、今まで辞書エントリーに付与した意味情報
の付与結果を反映させた意味情報を付与することができ
る。
The synonym dictionary entry semantic information search means includes:
It is checked whether or not the dictionary record of the input dictionary entry and the dictionary entry synonymous with the heading of the dictionary record are stored in the dictionary data storage means. If stored, the semantic information of the synonymous dictionary entry is determined. Can be extracted. The input dictionary entry registering means, when the synonym dictionary entry meaning information searching means and the meaning information of the synonymous dictionary entry are extracted by the synonym dictionary entry meaning information searching means, as the meaning information of the input dictionary entry, Attach semantic information of synonymous dictionary entries,
It can be registered in the dictionary data storage means. As a result, for the input dictionary entry to which no semantic information has been added, the semantic information that reflects the result of adding the semantic information that has been added to the dictionary entry with reference to the dictionary entry to which the semantic information has been added in advance. Can be provided.

【0020】また、意味情報決定ルール格納手段は、少
なくとも、辞書レコード及び見出し中の情報で意味情報
を決定するための条件である意味情報決定条件と、その
意味情報決定条件を満たす辞書エントリーに付与する意
味情報からなる意味情報決定ルールを格納することがで
きる。類義辞書エントリー意味情報検索手段は、入力辞
書エントリーに対する類義する辞書エントリーの意味情
報を抽出する際に、該意味辞書決定ルールの該意味決定
条件と該入力エントリーの辞書レコード及び又は見出し
とを照合し、照合する意味決定条件が存在する場合には
該意味決定条件に対応する意味情報を類義する辞書エン
トリーの意味情報として抽出することができる。これに
より、事前に意味情報が付与済みの辞書エントリーだけ
ではなく、入力辞書エントリーの情報を用いて意味情報
を決定するための意味情報決定ルールも活用して、入力
辞書エントリーの意味情報を決定することができ、特に
意味情報を決定する上で特に効果的と思われる条件を意
味情報決定ルールに記述すれば、効率的にかつ正確に意
味情報が入力辞書エントリーに付与できる。
Further, the semantic information determination rule storage means includes at least a semantic information determination condition that is a condition for determining semantic information based on the information in the dictionary record and the index, and a dictionary entry that satisfies the semantic information determination condition. Can be stored. The synonym dictionary entry semantic information search means, when extracting the semantic information of a dictionary entry synonymous with the input dictionary entry, compares the semantic determination condition of the semantic dictionary determination rule with the dictionary record and / or heading of the input entry. If there is a semantic determination condition to be collated and collated, semantic information corresponding to the semantic determining condition can be extracted as semantic information of a synonymous dictionary entry. As a result, the semantic information of the input dictionary entry is determined by utilizing not only the dictionary entry to which the semantic information has been added in advance but also the semantic information determination rule for determining the semantic information using the information of the input dictionary entry. If a condition considered particularly effective in determining semantic information is described in the semantic information determination rule, semantic information can be efficiently and accurately added to the input dictionary entry.

【0021】また、意味情報決定ルール獲得手段は、前
記辞書データ格納手段に格納されている各辞書エントリ
ーの辞書レコード及び又は見出しに対して付与されてい
る意味情報の傾向を自動分析し、辞書レコード及び又は
見出し中で意味情報を決定するための条件である意味情
報決定条件を自動抽出し、該意味情報決定条件と、該意
味情報決定条件を満たす辞書エントリーに付与する意味
情報からなる意味情報決定ルールとして前記意味情報決
定ルール格納手段に登録することができる。これによ
り、入力辞書エントリーの意味情報を決定する際に活用
する意味情報決定ルールとして、辞書データ格納手段中
の意味情報が付与済みの辞書エントリーの付与傾向を反
映した、意味情報を決定する上で効果的な条件が自動的
に得られるので、人手による意味情報決定ルールの作成
作業が無くても、効率的にかつ正確に意味情報が入力辞
書エントリーに付与できる。
Further, the semantic information determination rule acquiring means automatically analyzes the tendency of the semantic information given to the dictionary record and / or the index of each dictionary entry stored in the dictionary data storage means, and And / or automatically extracting a semantic information determination condition that is a condition for determining semantic information in the heading, and determining the semantic information including the semantic information determination condition and the semantic information to be assigned to a dictionary entry satisfying the semantic information determination condition. It can be registered as a rule in the semantic information determination rule storage means. Thereby, as a semantic information determination rule used when determining the semantic information of the input dictionary entry, the semantic information in the dictionary data storage means reflects the tendency of the dictionary entries to which the semantic information has been added. Since an effective condition is automatically obtained, semantic information can be efficiently and accurately added to the input dictionary entry without manual creation of a semantic information determination rule.

【0022】また、意味情報決定必須ルール格納手段
は、入力辞書エントリーに特定の意味情報を付与する場
合に必ず含まれていなければならない入力辞書エントリ
ーの辞書レコード及び見出し中の情報である意味情報決
定必須条件と、該特定の意味情報からなる意味情報決定
必須ルールを格納することができる。類義辞書エントリ
ー意味情報検索手段は、入力辞書エントリーに対する類
義する辞書エントリーの意味情報を抽出する際に、該意
味辞書決定必須ルールの該意味決定必須条件と該入力エ
ントリーの辞書レコード及び又は見出しとを照合し、照
合する意味決定必須条件に対応する意味情報の中から類
義する辞書エントリーの意味情報を抽出することができ
る。これにより、入力辞書エントリーの特徴から付与し
てはならない意味情報が、類義辞書エントリーの検索結
果や意味情報決定ルールの判定結果により、偶然誤って
付与されることが回避できるとともに、このように付与
してはならない意味情報を類義辞書エントリーの検索や
意味情報決定ルールの判定の際に事前に排除できるので
効率的に意味情報を付与することができる。
Further, the semantic information determination essential rule storage means stores the dictionary information of the input dictionary entry and the semantic information determination information which is included in the index, which must be included when specific semantic information is given to the input dictionary entry. An essential condition and a semantic information determination essential rule composed of the specific semantic information can be stored. The synonym dictionary entry semantic information searching means, when extracting the semantic information of the dictionary entry to be synonymous with the input dictionary entry, the semantic dictionary essential condition, the semantic essential condition, the dictionary record of the input entry and / or the heading And the semantic information of the synonymous dictionary entry can be extracted from the semantic information corresponding to the meaning determination essential condition to be compared. As a result, it is possible to prevent the semantic information that should not be given from the characteristics of the input dictionary entry from being accidentally given due to the search result of the synonym dictionary entry or the determination result of the semantic information determination rule. Semantic information that should not be added can be excluded in advance when searching for a synonym dictionary entry or determining a semantic information determination rule, so that semantic information can be efficiently added.

【0023】また、意味情報決定必須ルール獲得手段
は、前記辞書データ格納手段に格納されている各辞書エ
ントリーの辞書レコード及び又は見出しに対して付与さ
れている意味情報の傾向を自動分析し、辞書レコード及
び又は見出し中で特定の意味情報が付与されている場合
に必ず含まれていなければならない条件である意味情報
決定必須条件を自動抽出し、該意味情報決定必須条件
と、該特定の意味情報からなる意味情報決定必須ルール
として前記意味情報決定必須ルール格納手段に登録する
ことができる。これにより、入力辞書エントリーの意味
情報を決定する際に活用する意味情報決定必須ルールと
して、辞書データ格納手段中の意味情報が付与済みの辞
書エントリーの属性値に対する必須条件の傾向を反映し
た、意味情報を決定する上で効果的な条件が自動的に得
られるので、人手による意味情報決定必須ルールの作成
作業が無くても、効率的にかつ正確に付与してはならな
い意味情報を排除して意味情報が入力辞書エントリーに
付与できる。
Further, the semantic information determination essential rule acquiring means automatically analyzes the tendency of the semantic information given to the dictionary record and / or heading of each dictionary entry stored in the dictionary data storage means, and Automatically extract the semantic information determination essential condition, which is a condition that must be included when specific semantic information is given in the record and / or heading, and the semantic information determination essential condition and the specific semantic information Can be registered in the semantic information determination essential rule storage means. Thereby, as a semantic information determination essential rule utilized when determining the semantic information of the input dictionary entry, the semantic information in the dictionary data storage means reflects the tendency of the essential condition for the attribute value of the dictionary entry to which the semantic information has been added. Effective conditions for determining information are automatically obtained, so even if there is no manual work to create rules for determining semantic information, it is necessary to eliminate semantic information that must not be given efficiently and accurately. Semantic information can be added to the input dictionary entry.

【0024】また、辞書データ格納手段は、各辞書エン
トリーの辞書レコードの見出しは単語情報を含むことが
できる。意味距離計算手段は、単語情報の間の意味的な
距離情報である単語間意味距離を算出することができ
る。類義辞書エントリー意味情報検索手段は、入力辞書
エントリーの辞書レコードと該辞書レコードの見出しと
類義する辞書エントリーが辞書データ格納手段に格納さ
れているか否かを確認する際に、該入力辞書エントリー
の辞書レコードの見出し中の単語情報と、前記辞書デー
タ格納手段に格納されている辞書エントリーの辞書レコ
ードの見出し中の単語情報との間の単語間意味距離を該
意味距離計算手段により算出し、該単語間意味距離を参
照して、類義する辞書エントリーの意味情報を抽出する
ことができる。これにより、入力辞書エントリーと類義
な辞書データ格納手段中の辞書エントリーを検索する際
に、両者の辞書エントリーの見出し中の単語情報が一致
しているか否かの情報だけではなく、一致していない場
合でも両者の単語情報が意味的にどのくらい近いかの情
報も活用することができるので、類義な辞書エントリー
をより正確に検索して意味情報を付与することができ
る。
In the dictionary data storing means, the heading of the dictionary record of each dictionary entry may include word information. The semantic distance calculation means can calculate the inter-word semantic distance that is the semantic distance information between the word information. The synonym dictionary entry semantic information searching means, when confirming whether or not a dictionary record of the input dictionary entry and a dictionary entry synonymous with the heading of the dictionary record are stored in the dictionary data storage means, The inter-word semantic distance between the word information in the heading of the dictionary record and the word information in the heading of the dictionary record of the dictionary entry stored in the dictionary data storage means is calculated by the semantic distance calculating means, By referring to the inter-word semantic distance, semantic information of synonymous dictionary entries can be extracted. Thus, when searching for the input dictionary entry and the dictionary entry in the synonymous dictionary data storage means, not only information on whether or not the word information in the headings of both dictionary entries match, but also match. Even in the case where there is no word information, information on how close the two word information are in meaning can be used, so that a similar dictionary entry can be more accurately searched and semantic information can be added.

【0025】また、辞書データ格納手段は、各辞書エン
トリーの辞書レコードの中に、該辞書レコードの見出し
と該辞書レコードの意味情報に対応する単語情報を含む
ことができる。意味距離計算手段は、単語情報の間の意
味的な距離情報である単語間意味距離を算出することが
できる。類義辞書エントリー意味情報検索手段は、入力
辞書エントリーの辞書レコード及び該辞書レコードの見
出しと類義する辞書エントリーが辞書データ格納手段に
格納されているか否かを確認する際に、該入力辞書エン
トリーの辞書レコード中の単語情報と、前記辞書データ
格納手段に格納されている辞書エントリーの該辞書レコ
ード中の単語情報との間の単語間意味距離を該意味距離
計算手段により算出し、該単語間意味距離を参照して、
類義する辞書エントリーの意味情報を抽出することがで
きる。これにより、入力辞書エントリーと類義な辞書デ
ータ格納手段中の辞書エントリーを検索する際に、両者
の辞書エントリー中の単語情報が一致しているか否かの
情報だけではなく、一致していない場合でも両者の単語
情報が意味的にどのくらい近いかの情報も活用すること
ができるので、類義な辞書エントリーをより正確に検索
して意味情報を付与することができる。
Further, the dictionary data storage means can include word information corresponding to the heading of the dictionary record and the semantic information of the dictionary record in the dictionary record of each dictionary entry. The semantic distance calculation means can calculate the inter-word semantic distance that is the semantic distance information between the word information. The synonym dictionary entry semantic information searching means, when confirming whether the dictionary record of the input dictionary entry and the dictionary entry synonymous with the heading of the dictionary record are stored in the dictionary data storage means, The inter-word semantic distance between the word information in the dictionary record and the word information in the dictionary record of the dictionary entry stored in the dictionary data storage unit is calculated by the semantic distance calculation unit. Referring to the semantic distance,
It is possible to extract the meaning information of synonymous dictionary entries. Thus, when searching for a dictionary entry in the dictionary data storage means that is similar to the input dictionary entry, not only information on whether or not the word information in both dictionary entries match, However, since it is possible to utilize information on how close the word information is in meaning, both meanings can be more accurately searched for synonymous dictionary entries and semantic information can be added.

【0026】また、シソーラス格納手段は、同じ意味及
び又は類義の意味を持つ単語情報をグループ化したシソ
ーラスを格納することができる。意味距離計算手段は、
単語情報の間の単語間意味距離を算出する際に、両方の
単語情報が該シソーラス格納手段に格納されているシソ
ーラス中で同じグループに入っているか否かを参照し
て、該単語情報の間の単語間意味距離を算出することが
できる。これにより、入力辞書エントリーと類義な辞書
データ格納手段中の辞書エントリーを検索する際に、両
者の辞書エントリー中の単語情報及び又は辞書エントリ
ーの見出し中の単語情報の意味的な近さを算出する際
に、シソーラス中の単語のグループの情報に基づくこと
ができ、その同一グループに含まれている単語情報を確
認することができるので、意味的近さを算出する際の基
準の根拠が明確になるとともに、利用するシソーラスと
して特定分野向きのものを選んだり、特定分野コーパス
から自動抽出されたシソーラスを選ぶなどによって、分
野の特性を反映した、意味情報を付与することができ
る。
Further, the thesaurus storage means can store a thesaurus in which word information having the same meaning and / or synonymous meaning is grouped. Meaning distance calculation means,
When calculating the inter-word semantic distance between the word information, it is determined whether or not both word information belong to the same group in the thesaurus stored in the thesaurus storage means. Can be calculated. Thereby, when searching the input dictionary entry and the dictionary entry in the synonymous dictionary data storage means, the word information in both dictionary entries and / or the semantic closeness of the word information in the heading of the dictionary entry are calculated. In doing so, it can be based on the information of the group of words in the thesaurus, and the word information included in the same group can be confirmed, so the basis of the criteria for calculating the semantic closeness is clear At the same time, semantic information reflecting the characteristics of the field can be given by selecting a thesaurus to be used for a specific field or selecting a thesaurus automatically extracted from the specific field corpus.

【0027】また、シソーラス格納手段は、シソーラス
中の単語情報の各グループ間の意味的関係である概念関
係情報及び又は各グループ中で共通の意味を持つ複数の
グループで束ねた関係である上位概念関係情報を含むこ
とができる。意味距離計算手段は、単語情報の間の単語
間意味距離を算出する際に、両方の単語情報が該シソー
ラス格納手段に格納されているシソーラス中で同じグル
ープに入っているか否かに加えて、別のグループに入っ
ている場合には、両グループにはどのような概念意味関
係情報及び又は上位概念関係情報があるかも参照して、
該単語情報の間の単語間意味距離を算出することができ
る。これにより、入力辞書エントリーと類義な辞書デー
タ格納手段中の辞書エントリーを検索する際に、両者の
辞書エントリー中の単語情報及び又は辞書エントリーの
見出し中の単語情報の意味的な近さを算出する際に、両
者の単語情報がシソーラス中の同じグループに入ってい
るか否かだけではなく、同じグループに入っていなくて
もお互いの単語情報が入っている両グループ間の関係情
報をもとに意味的近さを算出することができるので、類
義な辞書エントリーをより正確に検索して意味情報を付
与することができるとともに、利用するシソーラスとし
てグループ間の関係情報を特定分野向きに設定している
ものを選んだり、特定分野コーパスから自動抽出された
グループ間の関係情報が付与されたシソーラスを選ぶな
どによって、分野の特性を反映した、意味情報を付与す
ることができる。
Further, the thesaurus storage means stores conceptual relation information that is a semantic relation between groups of word information in the thesaurus and / or superordinate concepts that are a relation bundled by a plurality of groups having a common meaning in each group. Relationship information can be included. When calculating the inter-word semantic distance between the word information, the semantic distance calculation means includes, in addition to whether or not both word information are in the same group in the thesaurus stored in the thesaurus storage means, If they belong to another group, also refer to what concept semantic relationship information and / or superordinate concept relationship information exists in both groups,
The inter-word meaning distance between the word information can be calculated. Thereby, when searching the input dictionary entry and the dictionary entry in the synonymous dictionary data storage means, the word information in both dictionary entries and / or the semantic closeness of the word information in the heading of the dictionary entry are calculated. In doing so, not only does the word information of both groups belong to the same group in the thesaurus, but also based on the relationship information between the two groups that contain each other's word information even if they do not belong to the same group. Since it is possible to calculate semantic closeness, it is possible to search for similar dictionary entries more accurately and to add semantic information, and to set related information between groups as a thesaurus to be used for specific fields. Field, or select a thesaurus to which information on the relationship between groups is automatically extracted from a specific field corpus. To reflect the, it is possible to impart a meaning information.

【0028】また、辞書データ格納手段は、各辞書エン
トリーの辞書レコードの見出しの単語情報として第一言
語の単語情報を含んでおり、各辞書エントリーの辞書レ
コードの単語情報として、該辞書レコードの見出しに対
応する第二言語の単語情報を含むことができる。これに
より、機械翻訳用の辞書等で第一言語の単語とそれに対
応する第二言語の単語が辞書エントリー中に含まれてい
る場合には、2種類の言語の中での単語の近さを別々に
計算することができ、これら2種類の言語の意味の特性
を活かしたより正確な意味情報を付与することができる
とともに、片方の言語の単語からは単語間意味距離が算
出できない場合でも別の言語の単語の単語間意味距離に
もとづき類義の辞書エントリーを検索することができる
ので、辞書データ格納手段中の辞書エントリー数が少な
い場合や付与されている辞書エントリーが少ない意味情
報を付与する場合などでも、入力辞書エントリーに対す
る意味情報がより適切に付与できる。
The dictionary data storage means includes word information of the first language as the word information of the heading of the dictionary record of each dictionary entry, and stores the heading of the dictionary record as the word information of the dictionary record of each dictionary entry. May be included in the second language. Thus, when a word in the first language and a corresponding word in the second language are included in a dictionary entry in a dictionary for machine translation, etc., the closeness of the word in the two languages is determined. They can be calculated separately, and more accurate semantic information can be given by making use of the semantic characteristics of these two languages, and even if the inter-word semantic distance cannot be calculated from words in one language, another Since similar dictionary entries can be searched based on the semantic distance between words of the language, when the number of dictionary entries in the dictionary data storage unit is small or when semantic information with few dictionary entries is given In such a case, the semantic information for the input dictionary entry can be more appropriately given.

【0029】また、意味情報決定ルール格納手段は、類
義辞書エントリー意味情報検索手段により抽出された類
義する辞書エントリーの意味情報を表示することができ
る。これにより、ユーザーが入力辞書エントリーに登録
する意味情報の内容を確認することができると共に、適
宜修正等を行うことも可能となる。
Further, the semantic information determination rule storage means can display the meaning information of the synonymous dictionary entries extracted by the synonym dictionary entry meaning information searching means. As a result, the user can confirm the contents of the semantic information registered in the input dictionary entry, and can make appropriate corrections and the like.

【0030】[0030]

【発明の実施の形態】以下に、本発明の一実施の形態に
ついて図面により説明する。本実施の形態では、意味辞
書は機械翻訳システム用の構文意味辞書であり、第一の
自然言語が日本語、第二の自然言語が英語であるとす
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below with reference to the drawings. In the present embodiment, it is assumed that the semantic dictionary is a syntactic and semantic dictionary for a machine translation system, and the first natural language is Japanese and the second natural language is English.

【0031】図1は、本発明の一実施の形態の意味辞書
登録装置の基本ブロック構成を示す。同図に示す意味辞
書登録装置は、入力辞書エントリー読み込み部1、辞書
データ格納部2、類義辞書エントリー意味情報検索部
3、意味情報決定ルール格納部4、意味情報決定ルール
獲得部5、意味情報決定必須ルール格納部6、意味情報
決定必須ルール獲得部7、意味距離計算部8、シソーラ
ス格納部9、入力辞書エントリー登録部10より構成さ
れる。
FIG. 1 shows a basic block configuration of a meaning dictionary registration device according to an embodiment of the present invention. The meaning dictionary registration device shown in FIG. 1 includes an input dictionary entry reading unit 1, a dictionary data storage unit 2, a synonym dictionary entry meaning information search unit 3, a meaning information determination rule storage unit 4, a meaning information determination rule acquisition unit 5, a meaning. It comprises an information determination essential rule storage unit 6, a semantic information determination essential rule acquisition unit 7, a semantic distance calculation unit 8, a thesaurus storage unit 9, and an input dictionary entry registration unit 10.

【0032】入力辞書エントリー読み込み部1は、入力
辞書レコードと入力辞書レコードの見出しからなり意味
情報は付与されていない入力辞書エントリーを入力す
る。なお、入力辞書レコードの見出し中には第一の自然
言語である日本語の単語情報が含まれており、入力辞書
レコード中にはその日本語の単語情報に対応する第二の
自然言語である英語の単語情報が含まれている。
The input dictionary entry reading unit 1 inputs an input dictionary entry which is made up of an input dictionary record and a heading of the input dictionary record and to which no semantic information is added. It should be noted that the heading of the input dictionary record contains Japanese word information that is the first natural language, and the input dictionary record contains the second natural language corresponding to the Japanese word information. Contains English word information.

【0033】辞書データ格納部2は、辞書レコードと、
辞書レコードの見出しと、その辞書レコードに対する既
に付与済みの意味情報からなる辞書エントリーを複数エ
ントリー格納している。なお、各辞書エントリー中に
は、辞書レコードの見出し中に第一の自然言語である日
本語の単語情報が含まれており、辞書レコード中にはそ
の日本語の単語情報に対応する第二の自然言語である英
語の単語情報が含まれている。
The dictionary data storage unit 2 stores a dictionary record,
A plurality of dictionary entries each including a heading of a dictionary record and semantic information already assigned to the dictionary record are stored. In each dictionary entry, the word information of the first natural language, Japanese, is included in the heading of the dictionary record, and the second word corresponding to the Japanese word information is included in the dictionary record. Contains word information of English, which is a natural language.

【0034】類義辞書エントリー意味情報検索部3は、
入力辞書エントリー読み込み部1で読み込まれた意味情
報は付与されていない入力辞書エントリーを対象に、辞
書データ格納部2に格納している辞書エントリー中か
ら、入力辞書エントリーと類義の辞書エントリーを検索
し、その類義の辞書エントリーに付与されている意味情
報を入力辞書エントリーの意味情報として付与する。類
義辞書エントリー意味情報検索部3は、辞書データ検索
部31、意味情報決定必須ルール照合部32、意味情報
決定ルール照合部33、類義辞書エントリー決定部34
から構成される。
The synonym dictionary entry meaning information search unit 3
For the input dictionary entries read by the input dictionary entry reading unit 1 and to which no semantic information is assigned, search the dictionary entries stored in the dictionary data storage unit 2 for the input dictionary entries and the similar dictionary entries. Then, the semantic information assigned to the dictionary entry having the same meaning is assigned as the semantic information of the input dictionary entry. The synonym dictionary entry semantic information search unit 3 includes a dictionary data search unit 31, a semantic information determination essential rule matching unit 32, a semantic information determination rule matching unit 33, and a synonym dictionary entry determining unit 34.
Consists of

【0035】類義辞書エントリー意味情報検索部3の辞
書データ検索部31は、意味情報決定必須ルール照合部
32が指定した辞書エントリーへの条件を満たす辞書エ
ントリーの集合を辞書データ格納部2から検索する。意
味情報決定必須ルール照合部32は、入力辞書エントリ
ー読み込み部1で読み込まれた入力辞書エントリーと、
意味情報決定必須ルール格納部6に格納されている意味
情報決定必須ルール中の各ルールの意味情報決定必須条
件とを照合し、入力辞書エントリー中の情報と矛盾しな
い意味情報決定必須ルールの集合を抽出し、その抽出さ
れた個々の意味情報決定必須ルールで指定している意味
情報である意味情報候補をキーにして辞書データ検索部
31により、辞書エントリー内の情報がキーとなる意味
情報を持つ辞書エントリーの集合である類義辞書エント
リー候補を辞書データ格納部2から検索する。
The dictionary data search unit 31 of the synonym dictionary entry meaning information search unit 3 searches the dictionary data storage unit 2 for a set of dictionary entries that satisfy the condition for the dictionary entry specified by the semantic information determination essential rule matching unit 32. I do. The semantic information determination essential rule matching unit 32 includes: an input dictionary entry read by the input dictionary entry reading unit 1;
The rule of the semantic information determination essential rule stored in the semantic information determination required rule storage unit 6 is checked against the semantic information determination essential condition of each rule, and a set of semantic information determination essential rules that do not contradict the information in the input dictionary entry. The dictionary data search unit 31 uses the extracted semantic information candidate, which is the semantic information specified by the extracted semantic information determination essential rule, as a key, and the information in the dictionary entry has the semantic information as a key. The dictionary data storage unit 2 searches for a dictionary entry candidate that is a set of dictionary entries.

【0036】意味情報決定ルール照合部33は、入力辞
書エントリー及び意味情報決定必須ルール照合部32で
得られた意味情報候補と、意味情報決定ルール格納部4
に格納されている意味情報決定ルール中の各ルールの内
容とを照合し、入力辞書エントリー中の情報と矛盾せず
意味情報候補が選択される意味情報決定ルールの集合を
抽出し、意味情報候補中の意味情報の種類別に、その意
味情報を含む意味情報決定ルールに付与されたルール確
度に基づき、意味情報別の確度である意味情報確度を計
算する。類義辞書エントリー決定部34は、入力辞書エ
ントリーと意味情報決定必須ルール照合部32で得られ
た類義辞書エントリー候補中の各辞書エントリーとを、
両辞書エントリーの内容がどれくらい一致しているか、
両辞書エントリー及び両辞書エントリーの見出し中に含
まれている単語情報同士を意味距離計算部8に入力しそ
の結果計算されたどのくらい意味的に近いかの結果に基
づき、両辞書エントリー間の類義度を計算し、意味情報
決定ルール照合部33で得られた意味情報別の確度であ
る意味情報確度も加味して、類義辞書エントリーを決定
し、その類義辞書エントリーの意味情報を抽出する。
The semantic information determination rule matching unit 33 includes a semantic information candidate obtained by the input dictionary entry and the semantic information determination essential rule matching unit 32 and a semantic information determination rule storage unit 4.
Is compared with the contents of each rule in the semantic information determination rules stored in, and a set of semantic information determination rules from which semantic information candidates are selected without being inconsistent with the information in the input dictionary entry is extracted. Based on the rule certainty assigned to the semantic information determination rule including the semantic information, the semantic information certainty, which is the certainty of each semantic information, is calculated for each type of the semantic information in the table. The synonym dictionary entry determining unit 34 determines the input dictionary entry and each dictionary entry in the synonym dictionary entry candidates obtained by the semantic information determination essential rule matching unit 32,
How closely the contents of both dictionary entries match
The two dictionary entries and the word information included in the headings of the two dictionary entries are input to the semantic distance calculation unit 8, and the similarity between the two dictionary entries is determined based on the result of how much semantically calculated as a result. The degree is calculated, and the semantic dictionary entry is determined in consideration of the semantic information certainty obtained for each semantic information obtained by the semantic information determination rule matching unit 33, and the semantic information of the synonym dictionary entry is extracted. .

【0037】意味情報決定ルール格納部4は、辞書レコ
ード及び見出し中の情報で意味情報を決定するための条
件である意味情報決定条件と、その意味情報決定条件を
満たす辞書エントリーに付与する意味情報とからなる意
味情報決定ルールを複数ルール格納している。なお、個
々の意味情報決定ルールにはそのルールの信頼性を示す
ルール確度が付与されている。
The semantic information determination rule storage unit 4 stores a semantic information determination condition which is a condition for determining semantic information based on the information in the dictionary record and the index, and a semantic information to be assigned to a dictionary entry satisfying the semantic information determination condition. Are stored in plural rules. It should be noted that each of the semantic information determination rules is given a rule certainty indicating the reliability of the rule.

【0038】意味情報決定ルール獲得部5は、辞書エン
トリー分析部51、意味情報決定ルール抽出部52、意
味情報決定ルール登録部53からなる。
The semantic information decision rule acquiring unit 5 comprises a dictionary entry analyzing unit 51, a semantic information decision rule extracting unit 52, and a semantic information decision rule registration unit 53.

【0039】意味情報決定ルール獲得部5の辞書エント
リー分析部51は辞書データ格納部2に格納されている
各辞書エントリーの辞書レコード及び辞書レコードの見
出しの中の情報に対する意味情報の種類の相関関係を自
動分析する。意味情報決定ルール抽出部52は、辞書エ
ントリー分析部51で得られた分析結果を元に、辞書レ
コード及び見出し中で意味情報を決定するための条件で
ある意味情報決定条件をその条件の統計的な確度情報と
ともに自動抽出しする。意味情報決定ルール登録部53
は、意味情報決定ルール抽出部52でえられた該意味情
報決定条件と、その意味情報決定条件を満たす辞書エン
トリーに付与する意味情報を元に、意味情報決定ルール
として意味情報決定ルール格納部4に登録する。
The dictionary entry analysis unit 51 of the semantic information determination rule acquiring unit 5 is configured to perform a correlation between the type of the semantic information with respect to the dictionary record of each dictionary entry stored in the dictionary data storage unit 2 and the information in the headings of the dictionary record. Is automatically analyzed. Based on the analysis result obtained by the dictionary entry analysis unit 51, the semantic information determination rule extraction unit 52 converts a semantic information determination condition, which is a condition for determining semantic information in a dictionary record and a headline, into a statistical condition of the condition. Automatically extract with accurate information. Semantic information determination rule registration unit 53
Is based on the semantic information determining condition obtained by the semantic information determining rule extracting unit 52 and the semantic information to be given to the dictionary entry satisfying the semantic information determining condition, as a semantic information determining rule storage unit 4 Register with.

【0040】意味情報決定必須ルール格納部6は、入力
辞書エントリーに特定の意味情報を付与する場合に必ず
含まれていなければならない入力辞書エントリーの辞書
レコード及び見出し中の情報である意味情報決定必須条
件と、該特定の意味情報からなる意味情報決定必須ルー
ルを格納している。
The semantic information determination essential rule storage unit 6 stores the dictionary information of the input dictionary entry which must be included when specific semantic information is given to the input dictionary entry, and the semantic information determination essential information which is information in the index. A condition and a semantic information determination essential rule including the specific semantic information are stored.

【0041】意味情報決定必須ルール獲得部7は、辞書
エントリー分析部71、意味情報決定必須ルール抽出部
72、意味情報決定必須ルール登録部73からなる。
The semantic information determination essential rule acquisition unit 7 includes a dictionary entry analysis unit 71, a semantic information determination essential rule extraction unit 72, and a semantic information determination essential rule registration unit 73.

【0042】意味情報決定必須ルール獲得部7の辞書エ
ントリー分析部71は、辞書データ格納手段2に格納さ
れている各辞書エントリーの辞書レコード及び見出しに
対して付与されている意味情報の傾向を自動分析する。
意味情報決定必須ルール抽出部72は、辞書エントリー
分析部71で得られた分析結果を元に、辞書レコード及
び見出し中で特定の意味情報が付与されている場合に必
ず含まれていなければならない条件である意味情報決定
必須条件を自動抽出する。意味情報決定必須ルール登録
部73は、意味情報決定必須ルール抽出部72でえられ
た意味情報決定必須条件と、特定の意味情報を元に、意
味情報決定必須ルールとして意味情報決定必須ルール格
納部6に登録する。
The dictionary entry analysis section 71 of the semantic information determination essential rule acquisition section 7 automatically determines the tendency of the semantic information given to the dictionary records and headings of each dictionary entry stored in the dictionary data storage means 2. analyse.
Based on the analysis result obtained by the dictionary entry analysis unit 71, the semantic information determination essential rule extraction unit 72 specifies a condition that must be included when specific semantic information is given in the dictionary record and the heading. Is automatically extracted. Based on the semantic information determination essential condition obtained by the semantic information determination essential rule extraction unit 72 and the specific semantic information, the semantic information determination required rule storage unit 73 stores Register in 6.

【0043】意味距離計算部8は、単語情報対入力部8
1、シソーラス検索部82、単語間距離計算部83から
なる。
The semantic distance calculation unit 8 includes a word information pair input unit 8
1, a thesaurus search unit 82 and an inter-word distance calculation unit 83

【0044】意味距離計算部8の単語情報対入力部81
は、入力辞書エントリーの見出し中の単語情報と、辞書
データ格納部2に格納されている辞書エントリー中の見
出し中の単語情報の対、又は、入力辞書エントリーの中
の単語情報と、辞書データ格納部2に格納されている辞
書エントリー中の単語情報の対を入力する。シソーラス
検索部82は、単語情報対入力部81で入力された単語
情報の対をキーにシソーラス格納部9に格納されている
シソーラスを検索し、個々の単語情報を含んでいる、同
じ意味及び又は類義の意味を持つ単語情報をグループの
種類及びその個々の単語情報を含んでいるグループ間の
意味的関係情報を抽出する。単語間距離計算部83は、
シソーラス検索部82で得られた単語情報の対を含んで
いるグループの種類及びグループ間の意味的関係情報を
元に、両単語情報が一致しているか否か、一致していな
い場合にはシソーラス中の同じグループ内に有るか否
か、同じシソーラス中の同じグループ内にない場合には
両グループ間にはどのような意味的関係があるかから、
両単語情報間の意味的距離を計算する。
Word information pair input unit 81 of semantic distance calculation unit 8
Is a pair of the word information in the heading of the input dictionary entry and the word information in the heading of the dictionary entry stored in the dictionary data storage unit 2, or the word information in the input dictionary entry and the dictionary data storage A pair of word information in the dictionary entry stored in the section 2 is input. The thesaurus search unit 82 searches for a thesaurus stored in the thesaurus storage unit 9 using the pair of word information input by the word information pair input unit 81 as a key, and includes the same meaning and / or the same including individual word information. The word information having the meaning of the synonym is extracted from the type of the group and the semantic relation information between the groups including the individual word information. The inter-word distance calculation unit 83
Based on the type of the group including the pair of word information obtained by the thesaurus search unit 82 and the semantic relation information between the groups, it is determined whether the two word information match or not. If they are not in the same group in the same thesaurus, and if they are not in the same group in the same thesaurus, there is a semantic relationship between the two groups,
Calculate the semantic distance between both word information.

【0045】シソーラス格納部9は、同じ意味及び又は
類義の意味を持つ単語情報をグループ化した単語カテゴ
リ情報と、単語情報の各グループ間の意味的関係である
概念関係情報からなるシソーラスを格納している。
The thesaurus storage unit 9 stores a thesaurus composed of word category information in which word information having the same meaning and / or synonymous meaning is grouped and conceptual relation information which is a semantic relation between each group of word information. are doing.

【0046】入力辞書エントリー登録部10は、類義辞
書エントリー意味情報検索部3により類義する辞書エン
トリの意味情報が抽出された場合、入力辞書エントリー
の意味情報として、この類義する辞書エントリーの意味
情報を付与し、辞書データ格納部2に登録する。
When the synonym dictionary entry meaning information search unit 3 extracts the meaning information of the synonymous dictionary entry, the input dictionary entry registration unit 10 determines the meaning of the synonymous dictionary entry as the meaning information of the input dictionary entry. The semantic information is added and registered in the dictionary data storage 2.

【0047】図2は、本発明の一実施の形態の辞書デー
タ格納部に格納された辞書データの辞書エントリーの例
を示す。辞書データは、例えば、日英機械翻訳システム
で用いられる日英構文意味変換辞書があり、その日英構
文意味変換辞書には、辞書エントリーとして、見出しに
は日本語の動詞表記が登録されており、辞書エントリー
には、その日本語動詞の助詞のパターンが付けられてお
り、つまり、例えば動詞「獲得する」については
“「S」(主体、名詞)「が」(助詞)「O1」(直接目
的語、名詞)「を」(助詞)”という動詞パターンが、
動詞「抑える」については“「S」(主体、名詞)
「が」(助詞)「O1」(直接目的語、名詞)「を」(助
詞)”という助詞パターンが、動詞「付ける」について
は“「S」(主体、名詞)「が」(助詞)「O1」(直接
目的語、名詞)「を」(助詞)「O2」(間接目的語、名
詞)「に」(助詞)”という助詞パターンが、動詞「統
合する」については“「S」(主体、名詞)「が」(助
詞)「O1」(直接目的語、名詞)「を」(助詞)「O2」
(間接目的語、名詞)「に」(助詞)”という助詞パタ
ーンが、動詞「直結する」については“「S」(主体、
名詞)「が」(助詞)「O1」(直接目的語、名詞)
「を」(助詞)「O2」(間接目的語、名詞)「に」(助
詞)”という助詞パターンが日本語のスロットに記入さ
れており、その動詞を見出し語として動詞を中心とした
動詞の英語訳語を検索すると共に、その動詞の意味情報
を検索するように記入されている。
FIG. 2 shows an example of dictionary entries of dictionary data stored in the dictionary data storage unit according to one embodiment of the present invention. The dictionary data includes, for example, a Japanese-English syntactic translation dictionary used in a Japanese-English machine translation system. In the Japanese-English syntactic translation dictionary, Japanese verb expressions are registered as headings as dictionary entries, The dictionary entry is given the particle pattern of the Japanese verb. For example, for the verb "Acquire,""S" (subject, noun) "ga" (particle) "O1" (direct purpose Words, nouns) "O" (particles) "
For the verb “suppress”, use “S” (subject, noun)
The particle pattern "ga" (particle) "O1" (direct object, noun) "wo" (particle), and the verb "attach" is "S" (subject, noun) "ga" (particle) " The particle pattern "O1" (direct object, noun) "wo" (particle) "O2" (indirect object, noun) "ni" (particle) is "S" (subject) for the verb "integrate" , Noun) "ga" (particle) "O1" (direct object, noun) "wo" (particle) "O2"
(Indirect object, noun) The particle pattern "ni" (particle) is "S" (subject,
Noun) "ga" (particle) "O1" (direct object, noun)
A particle pattern of "wo" (particle), "O2" (indirect object, noun) "ni" (particle) "is written in a Japanese slot, and the verb is used as a headword. It is written to search for English translations and to search for semantic information of the verb.

【0048】さらに動詞の格要素の意味を示す選択条件
が記されている。例えば、動詞「獲得する」について
は、その助詞パターン(SがO1を)に示されている格要
素の意味に関しては“S acquire O1”という英語で訳
し、意味情報が“SがO1を貰う,買う”である場合に
は、Sが“主体”の意味を持ちO1には制約が無いことを
示している。また、動詞「抑える」については、その助
詞パターン(SがO1を)に示されている格要素の意味に
関しては、“S control O1”という英語で訳し、意味情
報が“SがO1の属性を変化させる”である場合には、Sが
“主体”の意味を持ちO1が“価格”の意味を持つという
制約があることを示している。また、動詞「付ける」に
ついては、その助詞パターン(SがO1をO2に)に示され
ている格要素の意味に関しては、“S attach O1 to O
2”という英語で訳し、意味情報が“SがO1をO2と結合動
作する”である場合には、制約が無いことを示してい
る。
Further, a selection condition indicating the meaning of the case element of the verb is described. For example, for the verb “acquire”, the meaning of the case element shown in the particle pattern (S is O1) is translated in English as “S acquire O1,” and the semantic information is “S gets O1. In the case of "buy", it indicates that S has the meaning of "subject" and O1 has no restriction. For the verb “suppress”, the meaning of the case element indicated in the particle pattern (S is O1) is translated into English as “S control O1”, and the semantic information is “S is the attribute of O1. In the case of “change”, it indicates that there is a constraint that S has the meaning of “subject” and O1 has the meaning of “price”. As for the verb “attach”, the meaning of the case element shown in the particle pattern (S is O1 to O2) is “S attach O1 to O
When translated in English as “2”, and the semantic information is “S combines O1 with O2”, it indicates that there is no restriction.

【0049】また、動詞「統合する」については、その
助詞パターン(SがO1をO2に)に示されている格要素の
意味に関しては、”S combine O1 into O2”という英語
で訳し、意味情報が “SがO1をO2と結合動作する”で
ある場合には、Sが“主体”の意味を持ちO1及びO2には
制約が無いことを示している。
The verb "integrate" is translated into English as "S combine O1 into O2" for the meaning of the case element shown in the particle pattern (S is O1 to O2), and the semantic information is obtained. Is "S joins O1 and O2", it means that S has the meaning of "subject" and that there are no restrictions on O1 and O2.

【0050】また、動詞「直結する」については、その
助詞パターン(SがO1をO2に)に示されている格要素の
意味に関しては、“S link O1 directly to O2”という
英語で訳し、意味情報が“SがO1をO2と結合動作する”
である場合には、Sが“主体”の意味を持ちO1及びO2に
は制約が無いことを示している。
As for the verb “directly connected”, the meaning of the case element indicated in the particle pattern (S is O1 to O2) is translated into English as “S link O1 directly to O2”. Information says "S works with O1 and O2"
Indicates that S has the meaning of "subject" and that O1 and O2 have no restrictions.

【0051】次に、図1の基本ブロック構成の意味辞書
登録装置の処理手順について説明する。ここでは、図3
に示す入力辞書エントリーを例にとって、本処理の手順
を説明する。
Next, the processing procedure of the semantic dictionary registration device having the basic block configuration shown in FIG. 1 will be described. Here, FIG.
The procedure of this processing will be described with reference to the input dictionary entry shown in FIG.

【0052】まず、入力辞書エントリー読み込み部1
は、入力辞書レコードと入力辞書レコードの見出しから
なり意味情報は付与されていない辞書エントリーを入力
する。この入力辞書エントリーは、意味辞書登録装置に
よって意味情報を付与するために用いるものである。図
3の入力辞書エントリーの例では、図2の日英機械翻訳
システムで用いられる日英構文意味変換辞書の辞書デー
タと同種の情報が格納されており、見出しには日本語の
動詞表記が登録されており、入力辞書エントリーには、
その日本語動詞の助詞のパターンが付けられている。具
体的には、例えば図3の動詞「入手する」については
“「S」(主体、名詞)「が」(助詞)「O1」(直接目
的語、名詞)「を」(助詞)”という動詞パターンがさ
れており、その動詞の動詞の格要素の意味を示す選択条
件としては、その助詞パターン(SがO1を)に示されて
いる格要素の意味に関して、“S get O1”という英語で
訳す場合には、Sが“主体”の意味を持ちO1が“具体
物”の意味を持つという制約があることを示している。
ただし、図3の入力辞書エントリーには、図2の辞書エ
ントリーでは付与されているような意味情報が付与され
ておらず、不明を示す“?”の状態となっている。
First, the input dictionary entry reading unit 1
Inputs a dictionary entry which is made up of an input dictionary record and a heading of the input dictionary record and has no semantic information. This input dictionary entry is used to assign semantic information by the semantic dictionary registration device. In the example of the input dictionary entry in FIG. 3, the same type of information as the dictionary data of the Japanese-English syntactic translation dictionary used in the Japanese-English machine translation system in FIG. 2 is stored, and the Japanese verb notation is registered in the heading. And the input dictionary entry contains
The Japanese verb particle pattern is attached. More specifically, for example, the verb “obtain” in FIG. 3 is composed of the verb “S” (subject, noun) “ga” (particle) “O1” (direct object, noun) “o” (particle) ” As a selection condition indicating the meaning of the case element of the verb of the verb, the meaning of the case element shown in the particle pattern (S is O1) is expressed in English as “S get O1”. In the case of translation, it indicates that there is a constraint that S has the meaning of "subject" and O1 has the meaning of "concrete".
However, the input dictionary entry of FIG. 3 does not have the semantic information provided in the dictionary entry of FIG. 2 and is in a state of “?” Indicating unknown.

【0053】入力された意味情報が付与されていない入
力辞書エントリーは、類義辞書エントリー意味情報検索
部3によって、辞書データ格納部2に格納している辞書
エントリー中から、入力辞書エントリーと類義の辞書エ
ントリーを検索し、その類義の辞書エントリーに付与さ
れている意味情報を入力辞書エントリーの意味情報とし
て付与する。
The input dictionary entry to which the input semantic information is not assigned is searched by the synonym dictionary entry semantic information search unit 3 from the dictionary entries stored in the dictionary data storage unit 2 and the input dictionary entry. Of the dictionary entry, and the semantic information assigned to the dictionary entry having the same meaning is added as the semantic information of the input dictionary entry.

【0054】類義辞書エントリー意味情報検索部3で
は、まず、意味情報決定必須ルール照合部32によっ
て、入力辞書エントリーと、意味情報決定必須ルール格
納部6に格納されている意味情報決定必須ルール中の各
ルールの意味情報決定必須条件とを照合し、入力辞書エ
ントリー中の情報と矛盾しない意味情報決定必須ルール
の集合を抽出し、その抽出された個々の意味情報決定必
須ルールで指定している意味情報である意味情報候補を
キーにして辞書データ検索部31により、辞書エントリ
ー内の情報がキーとなる意味情報を持つ辞書エントリー
の集合である類義辞書エントリー候補を辞書データ格納
部2から検索する。
In the synonym dictionary entry semantic information search unit 3, first, the semantic information determination essential rule matching unit 32 checks the input dictionary entry and the semantic information determination essential rules stored in the semantic information determination essential rule storage unit 6. Of the rules in the input dictionary entry, and a set of semantic information mandatory rules that do not contradict the information in the input dictionary entry is specified. The extracted individual semantic information mandatory rules are specified. The dictionary data search unit 31 searches the dictionary data storage unit 2 for a synonymous dictionary entry candidate that is a set of dictionary entries having meaning information whose key is the information in the dictionary entry, using the semantic information candidate that is the semantic information as a key. I do.

【0055】この意味情報決定必須ルール格納部6に格
納されている意味情報決定必須ルールは、図1に示す意
味辞書登録装置の一実施の形態では、意味情報決定必須
ルール獲得部7により、辞書データ格納部に格納されて
いる意味情報が付与済みの各辞書エントリー情報を分析
して、意味情報決定必須ルールを自動作成し、意味情報
決定必須ルール格納部6に格納する。この意味情報決定
必須ルールの獲得手順を図1の基本ブロック構成図を用
いて説明する。
The semantic information mandatory rule stored in the semantic information essential rule storage unit 6 is used by the semantic information essential rule acquisition unit 7 in the embodiment of the semantic dictionary registration apparatus shown in FIG. The dictionary entry information to which the semantic information stored in the data storage unit has been added is analyzed, and a semantic information determination essential rule is automatically created and stored in the semantic information determination essential rule storage unit 6. The procedure for acquiring the semantic information determination essential rule will be described with reference to the basic block diagram of FIG.

【0056】まず、辞書エントリー分析部71により、
辞書データ格納手段2に格納されている各辞書エントリ
ーの辞書レコード及び見出しに対して付与されている意
味情報の傾向を自動分析する。例えば、図2に示す辞書
データでは、図4のように、各辞書エントリーを意味情
報の種類別に分類して、同じ意味情報を持つ辞書エント
リーの必須条件が抽出しやすいように加工する。
First, the dictionary entry analysis unit 71
The tendency of the semantic information given to the dictionary record and the index of each dictionary entry stored in the dictionary data storage means 2 is automatically analyzed. For example, in the dictionary data shown in FIG. 2, as shown in FIG. 4, each dictionary entry is classified according to the type of semantic information, and processed so that essential conditions of dictionary entries having the same semantic information can be easily extracted.

【0057】次に、意味情報決定必須ルール抽出部72
により、辞書エントリー分析部71で得られた分析結果
を元に、辞書レコード及び見出し中で特定の意味情報が
付与されている場合に必ず含まれていなければならない
条件である意味情報決定必須条件を自動抽出する。例え
ば、図4に示す、辞書エントリー分析部71で得られた
分析結果からは、同じ意味情報を持つ辞書エントリーの
全てで持つ同じ特徴を意味情報決定必須条件として抽出
する方法が考えられる。具体的には、日本語のスロット
中の情報をみると、意味情報が“SがO1をO2と結合動作
する”の場合には、全ての日本語のスロットが“SがO1
をO2に”となっていること、意味情報が“SがO1を貰
う,買う”か“SがO1の属性を変化させる”の場合に
は、全ての日本語のスロットが“SがO1を”となってい
ること、から、図4中の太字で示されているこれら組が
意味情報決定必須条件の1つとして自動抽出される。
Next, the semantic information determination essential rule extraction unit 72
Accordingly, based on the analysis result obtained by the dictionary entry analysis unit 71, the semantic information determination essential condition, which is a condition that must be included when specific semantic information is given in the dictionary record and the heading, is included. Automatically extract. For example, from the analysis result obtained by the dictionary entry analysis unit 71 shown in FIG. 4, a method of extracting the same feature possessed by all dictionary entries having the same semantic information as a semantic information determination essential condition can be considered. Specifically, looking at the information in the Japanese slots, if the semantic information is “S operates in combination with O1 and O2”, all the Japanese slots have “S is O1
To "O2", and if the semantic information is "S will get or buy O1" or "S will change the attribute of O1", then all Japanese slots will have "S ", These sets shown in bold in FIG. 4 are automatically extracted as one of the semantic information determination essential conditions.

【0058】次に、意味情報決定必須ルール登録部73
により、意味情報決定必須ルール抽出部72で得られた
意味情報に対する意味情報決定必須条件を、意味情報決
定必須ルールとして意味情報決定必須ルール格納部6に
登録する。例えば、図4中で太字で示されている意味情
報決定必須条件からは、図5に示すような、意味情報決
定必須ルールが作成され、意味情報決定必須ルール格納
部6に登録する。
Next, the semantic information determination essential rule registration unit 73
Thus, the semantic information determination essential condition for the semantic information obtained by the semantic information determination essential rule extraction unit 72 is registered in the semantic information determination essential rule storage unit 6 as a semantic information determination essential rule. For example, a semantic information determination essential rule as shown in FIG. 5 is created from the semantic information determination essential conditions shown in bold in FIG. 4 and registered in the semantic information determination essential rule storage unit 6.

【0059】ここで説明した実施の形態では、意味情報
決定必須ルールは、辞書データ格納手段2に格納されて
いる辞書データから自動的に抽出したが、例えば、意味
情報決定必須ルールを人手によって作成し、人間が付与
する際に頭の中で思い浮かべる必須条件を、本意味辞書
登録装置で活用する形態も可能である。また、辞書デー
タから自動的に抽出した意味情報決定必須ルールと人手
で作成した意味情報決定必須ルールの両方を意味情報決
定必須ルールとして活用する形態も可能である。
In the embodiment described here, the semantic information determination essential rule is automatically extracted from the dictionary data stored in the dictionary data storage means 2. For example, the semantic information determination essential rule is manually created. However, it is also possible to adopt a form in which essential conditions that are imagined by humans when they are given to the mind are utilized in the present semantic dictionary registration device. In addition, a form in which both the semantic information determination essential rule automatically extracted from the dictionary data and the manually created semantic information determination essential rule are utilized as the semantic information determination essential rule is also possible.

【0060】以上の様な意味情報決定必須ルール獲得部
7の処理により作成された、図5に示す意味情報決定必
須ルールを例として用いて、図3に示す入力辞書エント
リーに対する意味情報決定必須ルール照合部32の処理
を説明する。
Using, as an example, the semantic information determination essential rule shown in FIG. 5 created by the processing of the semantic information determination essential rule acquisition unit 7 as described above, the semantic information determination essential rule for the input dictionary entry shown in FIG. The processing of the matching unit 32 will be described.

【0061】まず、入力辞書エントリーは、意味情報決
定必須ルール中の各ルールの意味情報決定必須条件と照
合され、入力辞書エントリー中の情報と矛盾しない意味
情報決定必須ルールの集合が抽出され、その抽出された
個々の意味情報決定必須ルールで指定している意味情報
である意味情報候補が抽出される。例えば、図3の入力
辞書エントリーに対しては、日本語のスロットが“SがO
1を”であるため、この入力辞書エントリー中のものと
矛盾しない“SがO1を貰う,買う”と“SがO1の属性を変
化させる”の意味情報が意味情報候補として抽出され
る。
First, the input dictionary entry is checked against the semantic information decision essential condition of each rule in the semantic information decision essential rule, and a set of semantic information decision essential rules that are consistent with the information in the input dictionary entry is extracted. The semantic information candidates that are the semantic information specified by the extracted semantic information determination essential rules are extracted. For example, for the input dictionary entry of FIG.
Since “1” is “1”, the semantic information of “S receives and buys O1” and “S changes the attribute of O1” that are consistent with those in the input dictionary entry are extracted as semantic information candidates.

【0062】次に、その意味情報候補をキーにして辞書
データ検索部31により、辞書エントリー内の情報がキ
ーとなる意味情報を持つ辞書エントリーの集合である類
義辞書エントリー候補を辞書データ格納部2から検索す
る。例えば、図3の入力辞書エントリーに対しては、意
味情報候補として“SがO1を貰う,買う”と“SがO1の属
性を変化させる”の2種類が抽出されているので、図2
の辞書データの中から、この意味情報を持つ図6に示す
辞書エントリーが類義辞書エントリー候補として抽出さ
れる。
Next, using the semantic information candidate as a key, the dictionary data search unit 31 stores a synonymous dictionary entry candidate which is a set of dictionary entries having meaning information whose key is information in the dictionary entry. Search from 2. For example, for the input dictionary entry of FIG. 3, two types of semantic information candidates, “S receives and buys O1” and “S changes the attribute of O1,” are extracted.
6, the dictionary entry shown in FIG. 6 having this semantic information is extracted as a synonymous dictionary entry candidate.

【0063】意味情報決定必須ルール照合部32で得ら
れた意味情報候補及び類義辞書エントリー候補を利用し
て、意味情報決定ルール照合部33では、入力辞書エン
トリー中の情報及び意味情報候補と、意味情報決定ルー
ル格納部4に格納されている意味情報決定ルール中の各
ルールの内容とを照合し、意味情報候補中の意味情報別
の確度である意味情報確度を計算する。
Using the semantic information candidate and the synonym dictionary entry candidate obtained by the semantic information determination essential rule collating unit 32, the semantic information determining rule collating unit 33 extracts the information in the input dictionary entry and the semantic information candidate. The contents of each of the semantic information determination rules stored in the semantic information determination rule storage unit 4 are compared with each other, and the semantic information accuracy, which is the accuracy of each semantic information in the semantic information candidate, is calculated.

【0064】この意味情報決定ルール格納部4に格納さ
れている意味情報決定ルールは、図1に示す意味辞書登
録装置の一実施の形態では、意味情報決定ルール獲得部
5により、辞書データ格納部2に格納されている意味情
報が付与済みの各辞書エントリー情報を分析して、意味
情報決定ルールを自動作成し、意味情報決定ルール格納
部4に格納する。この意味情報決定ルールの獲得手順を
図1の基本ブロック構成図を用いて説明する。
The semantic information determination rule stored in the semantic information determination rule storage unit 4 is stored in the dictionary data storage unit 5 by the semantic information determination rule acquisition unit 5 in one embodiment of the semantic dictionary registration device shown in FIG. 2 is analyzed to automatically create a semantic information determination rule and store it in the semantic information determination rule storage unit 4. The procedure for acquiring the semantic information determination rule will be described with reference to the basic block diagram of FIG.

【0065】まず、辞書エントリー分析部51により、
辞書データ格納手段2に格納されている各辞書エントリ
ーの辞書レコード及び見出しに対して付与されている意
味情報の傾向を自動分析する。例えば、図2に示す辞書
データでは、意味情報決定必須ルール獲得部7の辞書エ
ントリー分析部71の場合と同様に、図4のように、各
辞書エントリーを意味情報の種類別に分類して、同じ意
味情報を持つ辞書エントリーの条件が抽出しやすいよう
に加工する。
First, the dictionary entry analysis unit 51
The tendency of the semantic information given to the dictionary record and the index of each dictionary entry stored in the dictionary data storage means 2 is automatically analyzed. For example, in the dictionary data shown in FIG. 2, as in the case of the dictionary entry analysis unit 71 of the semantic information determination essential rule acquisition unit 7, as shown in FIG. Processing is performed so that dictionary entry conditions having semantic information can be easily extracted.

【0066】次に、意味情報決定ルール抽出部52によ
り、辞書エントリー分析部51で得られた分析結果を元
に、辞書レコード及び見出し中で意味情報を決定するた
めの条件である意味情報決定条件をその条件の統計的な
確度情報とともに自動抽出しする。例えば、図4に示
す、辞書エントリー分析部51で得られた分析結果から
は、日本語のスロットと意味制約のスロットの情報を意
味情報決定条件として活用するとすると、図7のよう
に、各意味情報の種類の種類別に辞書エントリー中の各
特徴に対する出現頻度を集計して、辞書エントリー中の
特徴を意味情報決定条件とし、特徴別に集計した意味情
報が付与されている辞書エントリーの出現頻度を確度情
報として、ルール化する。なお、図7に示す例は、確度
情報を意味情報別確度情報とした場合を示すものであっ
て、図4の分析結果において、意味情報“SがO1を貰
う,買う”については特徴値“Sが”、“O1を”、“S:
主体”、および“O1:意味制約なし”に対する出現頻度
がそれぞれ「1」であり、意味情報“SがO1の属性を変
化させる”については特徴値“Sが”、“O1を”、“S:
主体”および“O1:価格”に対する出現頻度がそれぞれ
「1」であり、そして、意味情報“SがO1をO2と結合動
作する”については特徴値“Sが”、“O1を”および“O
2に”に対する出現頻度がそれぞれ「3」、“S:主体”
に対する出現頻度が「2」、“S:意味制約なし”に対
する出現頻度が「1」、“O1:意味制約なし”および
“O2:意味制約なし”に対する出現頻度がそれぞれ
「3」であることを示している。
Next, the semantic information determination rule extraction unit 52 uses the analysis result obtained by the dictionary entry analysis unit 51 to determine the semantic information in the dictionary record and the heading. Is automatically extracted together with the statistical accuracy information of the condition. For example, based on the analysis result obtained by the dictionary entry analysis unit 51 shown in FIG. 4, if the information of the Japanese slot and the slot of the semantic constraint is used as the semantic information determination condition, as shown in FIG. The frequency of appearance for each feature in the dictionary entry is tabulated for each type of information, and the features in the dictionary entry are used as semantic information determination conditions. Make rules as information. Note that the example shown in FIG. 7 shows a case in which the accuracy information is the accuracy information for each semantic information. In the analysis result of FIG. 4, the semantic information “S receives O1 and buys” is a feature value “ "S", "O1", "S:
The appearance frequencies of “subject” and “O1: no semantic constraint” are each “1”, and the characteristic values “S”, “O1”, and “S” for the semantic information “S changes the attribute of O1” :
The appearance frequencies for the "subject" and "O1: price" are each "1", and the characteristic values "S", "O1", and "O" for the semantic information "S operates O1 in combination with O2".
The appearance frequency for “2” is “3” and “S: subject” respectively.
Is "2", the appearance frequency for "S: no semantic constraint" is "1", and the appearance frequency for "O1: no semantic constraint" and "O2: no semantic constraint" is "3", respectively. Is shown.

【0067】次に、意味情報決定ルール登録部53によ
り、意味情報決定ルール抽出部52で得られた意味情報
に対する意味情報決定条件を、意味情報決定ルールとし
て意味情報決定ルール格納部4に登録する。例えば、意
味情報決定ルール抽出部52により作成された図7に示
すような意味情報決定ルールが、意味情報決定ルール格
納部4に登録される。
Next, the semantic information decision rule registration unit 53 registers the semantic information decision condition for the semantic information obtained by the semantic information decision rule extraction unit 52 as a semantic information decision rule in the semantic information decision rule storage unit 4. . For example, a semantic information determination rule as shown in FIG. 7 created by the semantic information determination rule extraction unit 52 is registered in the semantic information determination rule storage unit 4.

【0068】ここで説明した実施の形態では、意味情報
決定ルールは、辞書データ格納手段2に格納されている
辞書データから自動的に抽出したが、例えば、意味情報
決定ルールを人手によって作成し、人間が付与する際に
頭の中で思い浮かべる選択条件を、本意味辞書登録装置
で活用する形態も考えられる。また、辞書データから自
動的に抽出した意味情報決定ルールと人手で作成した意
味情報決定ルールの両方を意味情報決定ルールとして活
用する形態も考えられる。
In the embodiment described here, the semantic information determination rule is automatically extracted from the dictionary data stored in the dictionary data storage means 2. For example, the semantic information determination rule is created manually. It is also conceivable that the semantic dictionary registration device utilizes a selection condition that is imagined by a human when he or she gives it. Further, a form in which both the semantic information determination rule automatically extracted from the dictionary data and the manually created semantic information determination rule are used as the semantic information determination rule is also conceivable.

【0069】以上の様な意味情報決定ルール獲得部5の
処理により作成された、図7に示す意味情報決定ルール
を例として用いて、図3に示す入力辞書エントリーに対
する意味情報決定ルール照合部33の処理を説明する。
Using, as an example, the semantic information determination rule shown in FIG. 7 created by the processing of the semantic information determination rule acquisition unit 5 as described above, the semantic information determination rule matching unit 33 for the input dictionary entry shown in FIG. Will be described.

【0070】まず、入力辞書エントリー及び意味情報決
定必須ルール照合部32で得られた意味情報候補は、意
味情報決定ルール中の各ルールの内容と照合され、入力
辞書エントリー中の情報と矛盾せず意味情報候補が選択
される意味情報決定ルールの集合を抽出する。例えば、
図3に示す入力辞書エントリー及び図6に示す“SがO1
を貰う,買う”と“SがO1の属性を変化させる”の意味
情報候補と、図7の意味情報決定ルールとを照合する
と、図7中の太字で示した部分が、矛盾せず意味情報候
補が選択される意味情報決定ルールとして抽出される。
First, the semantic information candidates obtained by the input dictionary entry and semantic information determination essential rule collation unit 32 are collated with the contents of each rule in the semantic information determination rule, and are consistent with the information in the input dictionary entry. A set of semantic information determination rules from which semantic information candidates are selected is extracted. For example,
The input dictionary entry shown in FIG. 3 and "S is O1" shown in FIG.
When the semantic information candidates of “get and buy” and “S changes the attribute of O1” are compared with the semantic information determination rule of FIG. 7, the parts shown in bold in FIG. The candidate is extracted as a semantic information determination rule to be selected.

【0071】次に、意味情報候補中の意味情報の種類別
に、その意味情報を含む意味情報決定ルールに付与され
たルール確度情報に基づき、意味情報別の確度である意
味情報確度を計算する。例えば、2種類の意味情報候補
“SがO1を貰う,買う”と“SがO1の属性を変化させる”
の意味情報確度は、例えば、図7中の太字で示した部分
の確度情報の和の全体の和に対する割合を意味情報確度
として計算すると、図8のように、“SがO1を貰う,買
う”,“SがO1の属性を変化させる”はともに確度情報
の和は3となるため、意味情報確度はともに0.5とな
る。
Next, for each type of semantic information in the semantic information candidates, the semantic information certainty, which is the certainty for each semantic information, is calculated based on the rule certainty information given to the semantic information determination rule including the semantic information. For example, two types of semantic information candidates "S gets O1 and buys it" and "S changes the attribute of O1"
For example, when the ratio of the sum of the accuracy information of the portions shown in bold in FIG. 7 to the total sum is calculated as the semantic information accuracy, as shown in FIG. 8, “S receives O1 and buys it. "And" S change the attribute of O1 ", the sum of the accuracy information is 3, and the semantic information accuracy is both 0.5.

【0072】意味情報決定必須ルール照合部32で得ら
れた類義辞書エントリー候補と、意味情報決定ルール照
合部33で得られた類義情報確度と、入力辞書エントリ
ーとを利用して、類義辞書エントリー決定部34では、
まず、入力辞書エントリー中の単語情報と、類義辞書エ
ントリー候補の各辞書エントリー中の単語情報とを意味
距離計算部8に入力し、その結果計算された両単語情報
がどのくらい意味的に近いかの結果に基づき、入力辞書
エントリーに対する類義辞書エントリー候補の各辞書エ
ントリーの類義度を計算する。例えば、図3に示す入力
辞書エントリーと図6に示す類義辞書エントリー候補か
らは、両者の辞書エントリーの見出しスロットの日本語
単語同士と、英語スロットの英語単語同士を意味距離計
算部8に入力する場合、図9に示す単語対が意味距離計
算部8に入力されて各々の単語対の単語間意味距離が計
算される。なお、この図9の例では、意味の類義性は、
類義辞書エントリーの決定での有効性が期待できる動詞
単語のみを入力単語として計算した。
Using the synonym dictionary entry candidate obtained by the semantic information determination essential rule matching unit 32, the synonym information accuracy obtained by the semantic information determination rule matching unit 33, and the input dictionary entry, In the dictionary entry determination unit 34,
First, the word information in the input dictionary entry and the word information in each dictionary entry of the synonymous dictionary entry candidates are input to the semantic distance calculation unit 8, and how much the two word information calculated as a result is semantically close to each other. Based on the result of the above, the similarity of each dictionary entry of the similar dictionary entry candidate with respect to the input dictionary entry is calculated. For example, from the input dictionary entry shown in FIG. 3 and the synonym dictionary entry candidates shown in FIG. 6, Japanese words in the heading slots of both dictionary entries and English words in the English slot are input to the semantic distance calculation unit 8. In this case, the word pairs shown in FIG. 9 are input to the semantic distance calculation unit 8, and the inter-word semantic distance of each word pair is calculated. In the example of FIG. 9, the similarity of meaning is
Only verb words that are expected to be effective in determining thesaurus entries are calculated as input words.

【0073】この意味距離計算部8の処理手順を図1の
基本ブロック構成図を用いて説明する。
The processing procedure of the semantic distance calculator 8 will be described with reference to the basic block diagram of FIG.

【0074】まず、意味距離計算部8の単語情報対入力
部81は、入力辞書エントリー中の単語情報と、類義辞
書エントリー候補の各辞書エントリー中の単語情報との
対を入力する。例えば、図9の例では、日本語単語情報
対2種類と英語単語対2種類が入力される。
First, the word information pair input unit 81 of the semantic distance calculation unit 8 inputs a pair of word information in an input dictionary entry and word information in each dictionary entry of a synonym dictionary entry candidate. For example, in the example of FIG. 9, two types of Japanese word information pairs and two types of English word pairs are input.

【0075】次に、シソーラス検索部82では、単語情
報対入力部81で入力された単語情報の対をキーにシソ
ーラス格納部9に格納されているシソーラスを検索し、
個々の単語情報を含んでいる、同じ意味及び又は類義の
意味を持つ単語情報のグループの種類及びその個々の単
語情報を含んでいるグループ間の意味的関係情報を抽出
する。
Next, the thesaurus search unit 82 searches for a thesaurus stored in the thesaurus storage unit 9 using the word information pair input by the word information pair input unit 81 as a key.
The type of the word information group including the individual word information and having the same meaning and / or a similar meaning, and the semantic relationship information between the groups including the individual word information are extracted.

【0076】シソーラス検索部82で検索するシソーラ
ス格納部9に格納されているシソーラスは、同じ意味及
び又は類義の意味を持つ単語情報をグループ化した単語
カテゴリ情報と、単語情報の各グループ間の意味的関係
である概念関係情報及び又は各グループ中で共通の意味
を持つ複数のグループで束ねた関係である上位概念関係
情報からなる。
The thesaurus stored in the thesaurus storage unit 9 searched by the thesaurus search unit 82 includes word category information in which word information having the same meaning and / or synonymous meaning is grouped, and word group information between each group of word information. Consisting of conceptual relationship information that is a semantic relationship and / or superordinate conceptual relationship information that is a relationship bundled by a plurality of groups having a common meaning in each group.

【0077】例えば、図9の入力単語対の例では、日本
語の単語対と、英語の単語対が入力されるので、日本語
用シソーラスと英語用シソーラスの2種類が、シソーラ
ス格納部9に格納されていることになる。
For example, in the example of the input word pair shown in FIG. 9, a Japanese word pair and an English word pair are input, so that two types of thesaurus for Japanese and English are stored in the thesaurus storage unit 9. It will be stored.

【0078】図10は、本発明の一実施の形態のシソー
ラス格納部9に格納された日本語用シソーラスの例を示
す。日本語用シソーラスは、例えば、同じ意味及び又は
類義の意味を持つ単語情報をグループ化した意味カテゴ
リ、その意味カテゴリを示す意味カテゴリ名、意味カテ
ゴリ間の意味的関係である概念関係情報、例えば、意味
カテゴリが別の意味カテゴリを意味的に包含している、
つまり、ある意味カテゴリが別の意味カテゴリの上位概
念となっている場合の意味カテゴリ間の関係を示す上位
概念関係情報からなる。
FIG. 10 shows an example of a Japanese thesaurus stored in the thesaurus storage 9 according to one embodiment of the present invention. The thesaurus for Japanese is, for example, a semantic category in which word information having the same meaning and / or a synonymous meaning is grouped, a semantic category name indicating the semantic category, and conceptual relationship information that is a semantic relationship between the semantic categories, for example, , A semantic category semantically encompasses another semantic category,
That is, it is composed of superordinate concept relation information indicating a relation between semantic categories when a certain semantic category is a superordinate concept of another semantic category.

【0079】図10の日本語用シソーラス中では、“<
>”の中の単語が意味カテゴリ名を示し、その直下に記
述してある“[]”の中の単語がこの意味カテゴリのグ
ループの中に入る単語のリストを示す。“[]”の中に
“・・・”が入っている場合は、この単語カテゴリに入
る単語のリストの表示を省略していることを示す。ま
た、単語カテゴリの上に別の意味カテゴリと線でつなが
っている場合は、上の意味カテゴリが下の意味カテゴリ
の上位概念であることを示す。また、“[]”の直下に
“・・・・”が有る場合は、その意味カテゴリは、複数
の別の意味カテゴリの上位概念となっているが、図の中
では省略していることを示す。
In the thesaurus for Japanese in FIG. 10, "<
The words in “>” indicate the meaning category name, and the words in “[]” described immediately below indicate the list of words included in the group of the meaning category. Contains a word "...", indicating that the display of the list of words included in this word category is omitted, and a line above the word category is connected to another semantic category. Indicates that the upper semantic category is a superordinate concept of the lower semantic category.If there is "...." immediately below "[]", the semantic category indicates a plurality of different semantic categories. Although it is a superordinate concept of the category, it indicates that it is omitted in the figure.

【0080】具体的に図10の日本語用シソーラスの内
容の一部を説明すると、<取得>という意味カテゴリに
は“入手する”と“獲得する”という単語が共にはいっ
ており、この<取得>の意味カテゴリの上位概念は<取
引>の意味カテゴリであり、この<取引>の意味カテゴ
リの上位概念は<行為>の意味カテゴリであることを示
す。
More specifically, a part of the contents of the thesaurus for Japanese in FIG. 10 will be described. In the semantic category of <acquisition>, the words "acquire" and "acquire" are both included. The superordinate concept of the semantic category of <> is a semantic category of <transaction>, and the superordinate concept of the semantic category of <transaction> is a semantic category of <act>.

【0081】シソーラス検索部82の処理手順につい
て、図9の入力単語対の内、日本語の単語対をキーに、
この図10の日本語用シソーラスを検索する場合を例に
とって説明する。まず、入力単語対として“入手する”
と“獲得する”をキーに図10の日本語用シソーラスを
検索すると、“入手する”、“獲得する”ともに、<取
得>という同じ意味カテゴリに含まれていることから、
シソーラス検索部82の検索結果として、例えば、“入
手する”の“獲得する”意味カテゴリはともに「<取得
>」、カテゴリ間距離は「0」が出力される。次に、入
力単語対として“入手する”と“抑える”をキーに図1
0の日本語用シソーラスを検索すると、“入手する”は
<取得>の、“抑える”は<規制>の意味カテゴリに含
まれており、両カテゴリ間の共通の上位概念である<行
為>までは、<取得>が2段、<規制>が4段、上位概
念をさかのぼる必要があることから、シソーラス検索部
82の検索結果として、例えば、“入手する”の意味カ
テゴリとして「<取得>」が、“抑える”の意味カテゴ
リとして「<規制>」が出力され、カテゴリ間距離とし
ては、両者の共通の上位概念にさかのぼるまでの段数の
和である「6」が出力される。
The processing procedure of the thesaurus retrieving unit 82 is described by using a Japanese word pair as a key among the input word pairs shown in FIG.
The case of searching for the Japanese thesaurus in FIG. 10 will be described as an example. First, "get" as an input word pair
When the Japanese thesaurus shown in FIG. 10 is searched using “and” as the key, both “to get” and “to get” are included in the same semantic category of <get>.
As a search result of the thesaurus search unit 82, for example, both “<acquire>” and “acquire” meaning categories of “acquire” are output and “0” is output as the inter-category distance. Next, using “acquire” and “suppress” as keys as input word pairs, FIG.
When a Japanese thesaurus of 0 is searched, “acquire” is included in the semantic category of “acquire”, and “suppress” is included in the semantic category of <regulation>, and up to <act>, which is a common superordinate concept between the two categories. Since <acquisition> needs to be traced back to the upper concept with two levels of <acquisition> and four levels of <regulation>, the search result of the thesaurus retrieval unit 82 may be, for example, "<acquisition>" However, “<Regulation>” is output as the semantic category of “suppress”, and “6”, which is the sum of the number of steps up to the common superordinate concept, is output as the inter-category distance.

【0082】図11は、本発明の一実施の形態のシソー
ラス格納部9に格納された英語用シソーラスの例を示
す。英語用シソーラスは、例えば、同じ意味及び又は類
義の意味を持つ単語情報をグループ化した意味カテゴ
リ、意味カテゴリ間の意味的関係である概念関係情報、
例えば、意味カテゴリが別の意味カテゴリを意味的に包
含している、つまり、ある意味カテゴリが別の意味カテ
ゴリの上位概念となっている場合の意味カテゴリ間の関
係を示す上位概念関係情報からなる。
FIG. 11 shows an example of an English thesaurus stored in the thesaurus storage unit 9 according to an embodiment of the present invention. The thesaurus for English is, for example, a semantic category in which word information having the same meaning and / or a synonymous meaning is grouped, conceptual relation information that is a semantic relation between the semantic categories,
For example, when the semantic category semantically includes another semantic category, that is, upper semantic relation information indicating a relation between semantic categories when a certain semantic category is a superordinate concept of another semantic category. .

【0083】例えば、図11の英語用シソーラス中で
は、“[]”の中の単語が同じ意味カテゴリの中に入る単
語のリストを示す。“[]”の中に“・・・”が入って
いる場合は、この単語カテゴリに入る単語のリストの表
示を省略していることを示す。また、単語カテゴリの上
に別の意味カテゴリと線でつながっている場合は、上の
意味カテゴリが下の意味カテゴリの上位概念であること
を示す。“・・・・”が有る場合は、その意味カテゴリ
は、複数の別の意味カテゴリの上位概念となっている
が、図の中では省略していることを示す。
For example, in the English thesaurus of FIG. 11, words in "[]" indicate a list of words included in the same semantic category. When "..." is included in "[]", it indicates that the display of the list of words included in this word category is omitted. When a word category is connected to another semantic category by a line, it indicates that the upper semantic category is a superordinate concept of the lower semantic category. When there is "...", it means that the semantic category is a superordinate concept of a plurality of different semantic categories, but is omitted in the figure.

【0084】具体的に図11の英語用シソーラスの内容
の一部を説明すると、“control”と“operate”は同一
の意味カテゴリに入っており、この“control”と“ope
rate”の意味カテゴリの上位概念は“manipulate”の入
つている意味カテゴリであり、この“manipulate”の意
味カテゴリの上位概念は“handle”と“palm”の入って
いる意味カテゴリであり、さらに、この“handle”と
“palm”の意味カテゴリの上位概念は“touch”の入っ
ている意味カテゴリであり、この“touch”の意味カテ
ゴリには上位概念がないことを示す。
To explain a part of the contents of the English thesaurus in FIG. 11, "control" and "operate" belong to the same semantic category.
The superordinate concept of the semantic category of "rate" is a semantic category containing "manipulate", and the superordinate concept of the semantic category of "manipulate" is a semantic category containing "handle" and "palm". The superordinate concept of the semantic category of “handle” and “palm” is a semantic category including “touch”, which indicates that the semantic category of “touch” has no superordinate concept.

【0085】シソーラス検索部82の処理手順につい
て、図9の入力単語対の内、英語の単語対をキーに、こ
の図11の英語用シソーラスを検索する場合を例にとっ
て説明する。まず、入力単語対として“get”と“acqui
re”をキーに図11の英語用シソーラスを検索すると、
“get”と“acquire”はともに、同じ意味カテゴリに含
まれていることから、シソーラス検索部82の検索結果
として例えば、“get”と“acquire”の意味カテゴリと
してともに「[get,acquire]」が、カテゴリ間距離と
しては「0」が出力される。次に、入力単語対として
“get”と“control”をキーに図11の英語用シソーラ
スを検索すると、“get”と“control”には共通の上位
概念の意味カテゴリが存在しないことから、シソーラス
検索部82の検索結果として例えば、“get”の意味カ
テゴリとして「[get,acquire]」が、“control”の意
味カテゴリとして「[control,operate]」が出力さ
れ、カテゴリ間距離としては「無限大」が出力される。
The processing procedure of the thesaurus retrieving unit 82 will be described by taking as an example a case where the English thesaurus shown in FIG. 11 is retrieved by using an English word pair as a key among the input word pairs shown in FIG. First, “get” and “acqui
Searching for the English thesaurus in Fig. 11 using "re" as a key,
Since both “get” and “acquire” are included in the same semantic category, as the search results of the thesaurus search unit 82, for example, both “[get, acquire]” as the semantic categories of “get” and “acquire” However, “0” is output as the distance between categories. Next, when the English thesaurus of FIG. 11 is searched using “get” and “control” as input word pairs, there is no common upper-level semantic category for “get” and “control”. For example, “[get, acquire]” is output as the semantic category of “get” and “[control, operate]” is output as the semantic category of “control” as the search result of the search unit 82, and “infinity” is set as the inter-category distance. "Large" is output.

【0086】ここで説明した実施の形態では、シソーラ
ス格納部9の格納されたシソーラスとして日本語用シソ
ーラスと英語用シソーラスを活用したが、日本語用シソ
ーラスとしては、従来より開示されている既存の日本語
シソーラス(例えば、「日本語語彙大系」、岩波書店、
1997)を活用することができ、英語用シソーラスと
しては、従来より開示されている既存の英語シソーラ
ス、(例えば、“Word Net-An Electronic Lexical Dat
abase”、MIT Press、1998)を活用することができ
る。また、もちろん日本語と英語のシソーラスの両方を
活用する形態ではなく、どちらか片方、もしくは他言語
のシソーラスを活用する形態も考えられる。さらに、こ
こで説明した実施の形態では、シソーラスとして、すで
に完成されたものを用いたが、従来より開示されている
既存のシソーラス作成装置(例えば、特開平9−120
401号公報)を活用することにより、コーパスから自
動抽出されたそのコーパス向きのシソーラスを活用する
形態も考えられる。
In the embodiment described above, a Japanese thesaurus and an English thesaurus are used as the thesauri stored in the thesaurus storage unit 9. However, as the Japanese thesaurus, a conventional thesaurus disclosed conventionally is used. Japanese thesaurus (for example, “Japanese vocabulary system”, Iwanami Shoten,
1997) can be used, and as an English thesaurus, an existing English thesaurus previously disclosed (for example, “Word Net-An Electronic Lexical Dat
abase ", MIT Press, 1998). Of course, it is also possible to use a thesaurus in one or the other language instead of using both Japanese and English thesauruses. Further, in the embodiment described here, a completed thesaurus is used as the thesaurus. However, an existing thesaurus creation device disclosed in the related art (for example, Japanese Unexamined Patent Application Publication No. 9-120) is used.
U.S. Pat. No. 401) may utilize a corpus-oriented thesaurus automatically extracted from the corpus.

【0087】シソーラス検索部82で得られた単語情報
の対を含んでいるグループの種類及びグループ間の意味
的関係情報を元に、単語間距離計算部83では、両単語
情報が一致しているか否か、一致していない場合にはシ
ソーラス中の同じグループ内に有るか否か、同じシソー
ラス中の同じグループ内にない場合には両グループ間に
はどのような意味的関係があるかから、両単語情報間の
意味的距離を計算する。
Based on the type of group including the pair of word information obtained by the thesaurus search unit 82 and the semantic relationship information between groups, the inter-word distance calculation unit 83 determines whether the two word information match. No, if they do not match, they are in the same group in the thesaurus, or if they are not in the same group in the thesaurus, because there is a semantic relationship between both groups, Calculate the semantic distance between both word information.

【0088】単語間距離計算部83について、例えば、
図9の日本語及び英語の単語対をシソーラス検索部82
に入力し、得られた結果から、具体的に単語間距離を計
算する手順について説明する。図9の単語対を入力した
例では、シソーラス検索部82からは、カテゴリ間距離
として、両者の単語が属する意味カテゴリ間の関係の数
を距離として計算しているが、単語間距離計算部83で
の計算方法としては、例えば、図12に示すような単語
間距離計算ルールにより計算できる。具体的には、入力
単語対が一致する場合を「0」、一致しないが両入力単
語が同じ意味カテゴリに入りカテゴリ間距離が「0」の
場合を「0.2」、カテゴリ間距離が「1」の場合を
「0.4」、カテゴリ間距離が「2」から「4」までの
場合を「0.6」、カテゴリ間距離が「5」以上の場合
を「0.8」、カテゴリ間距離が「無限大」の場合を
「1」として計算することができる。
For the word-to-word distance calculation unit 83, for example,
The Japanese and English word pairs shown in FIG.
, And a procedure for specifically calculating the inter-word distance from the obtained result will be described. In the example in which the word pair in FIG. 9 is input, the number of relationships between the semantic categories to which both words belong is calculated as the distance between categories from the thesaurus search unit 82, but the distance between word calculation unit 83 Can be calculated according to, for example, an inter-word distance calculation rule as shown in FIG. Specifically, "0" indicates that the input word pair matches, "0.2" indicates that the input word pair does not match but both input words fall into the same semantic category and the inter-category distance is "0", and the inter-category distance is "0". “1” is “0.4”, the distance between categories is “2” to “4” is “0.6”, and the distance between categories is “5” or more is “0.8”. The case where the distance is “infinity” can be calculated as “1”.

【0089】図12の単語間距離計算ルール用いて、図
9の具体的な単語対の単語間距離を計算すると、まず、
日本語単語対“入手する”と“獲得する”からは、シソ
ーラス検索部82の出力としてカテゴリ間距離は「0」
という結果が得られており、“入手する”と“獲得す
る”は同じ単語ではないので、単語間距離として「0.
2」が出力される。また、日本語単語対“入手する”と
“抑える”からは、シソーラス検索部82の出力として
カテゴリ間距離は「6」という結果がえられており、
“入手する”と“抑える”は同じ単語ではないので、単
語間距離として「0.8」が出力される。また、英語単
語対“get”と“acquire”からは、シソーラス検索部8
2の出力としてカテゴリ間距離は「0」という結果がえ
られており、“get”と“acquire”は同じ単語ではない
ので、単語間距離として「0.2」が出力される。ま
た、英語単語対“get”と“control”からは、シソーラ
ス検索部82の出力としてカテゴリ間距離は「無限大」
という結果がえられており、“get”と“control”は同
じ単語ではないので、単語間距離として「1」が出力さ
れる。
When the inter-word distance of the specific word pair in FIG. 9 is calculated using the inter-word distance calculation rule of FIG. 12, first,
From the Japanese word pair “get” and “get”, the distance between categories is “0” as the output of the thesaurus search unit 82.
Is obtained, and since "acquire" and "acquire" are not the same word, "0.
2 "is output. Further, from the Japanese word pair “acquire” and “suppress”, the result of the inter-category distance “6” is obtained as an output of the thesaurus search unit 82.
Since “acquire” and “suppress” are not the same word, “0.8” is output as the inter-word distance. The English word pair “get” and “acquire” can be used in a thesaurus search unit 8
As the output of 2, the result that the inter-category distance is “0” is obtained, and “get” and “acquire” are not the same word, so “0.2” is output as the inter-word distance. From the English word pair “get” and “control”, the distance between categories is “infinity” as an output of the thesaurus search unit 82.
Since "get" and "control" are not the same word, "1" is output as the inter-word distance.

【0090】以上の結果、意味距離計算部8により、例
えば、図9の個々の単語対に対しては、図13に示す様
に単語間距離が結果として付与され、この結果が類義辞
書エントリー決定部34に送られる。
As a result, the inter-word distance is given by the semantic distance calculation unit 8 to each word pair in FIG. 9, for example, as shown in FIG. It is sent to the decision unit 34.

【0091】類義辞書エントリー決定部34では、この
意味距離計算部8により得られた単語間距離と、意味情
報決定ルール照合部33により得られた意味情報別の確
度である意味情報確度も加味して、類義辞書エントリー
を決定する。
The synonym dictionary entry determination unit 34 also takes into account the inter-word distance obtained by the semantic distance calculation unit 8 and the semantic information accuracy, which is the accuracy of each semantic information obtained by the semantic information determination rule matching unit 33. To determine the thesaurus entry.

【0092】単語間距離と意味情報確度を用いた、入力
辞書エントリーに対する類義辞書エントリー候補中の個
々の辞書エントリーの類義度計算方法としては、例え
ば、個々の辞書エントリーの意味情報に対する意味情報
確度をPm、個々の辞書エントリー中の意味距離計算部8
により単語間距離を計算した単語の数がN個の場合、単
語間距離を計算した単語中i番目の単語に対する単語間
距離をDwi(i=1〜N)とすると、この辞書エントリーと
入力辞書エントリーの類義度Pは、例えば、下式により
計算することができる。
As a method of calculating the degree of synonym of each dictionary entry in the synonym dictionary entry candidate for the input dictionary entry using the inter-word distance and the degree of semantic information accuracy, for example, the semantic information for the semantic information of each dictionary entry is used. The accuracy is Pm, and the semantic distance calculation unit 8 in each dictionary entry
If the number of words for which the inter-word distance has been calculated is N, the inter-word distance for the i-th word in the words for which the inter-word distance has been calculated is Dwi (i = 1 to N). The similarity P of the entry can be calculated by, for example, the following formula.

【0093】[0093]

【数1】 (Equation 1)

【0094】この式を用いて、図3の入力辞書エントリ
ーと図6の類義辞書エントリー候補中の個々の辞書エン
トリーとの間の類義度Pを、意味距離計算部8により得
られた図13に示す様に単語間距離と、意味距離計算部
8により得られた図8の意味情報確度を用いて計算す
る。まず、入力辞書エントリーと見出しが「獲得する」
の辞書エントリーとの類義度Pは、意味情報確度Pmが図
8より「0.5」、単語間距離を計算した単語数Nが
「2」、2種類の単語間距離は日本語の単語間距離Dw1
が「0.2」、英語の単語間距離Dw2が「0.2」であ
ることから、類義度Pの値は「0.3」が得られる。ま
た、入力辞書エントリーと見出しが「抑える」の辞書エ
ントリーとの類義度Pは、意味情報確度Pmが図8より
「0,5」、単語間距離を計算した単語数Nが「2」、
2種類の単語間距離は日本語の単語間距離Dw1が「0.
8」、英語の単語間距離Dw2が「1」であることから、
類義度Pの値は「−0,4」が得られる。個々で得られ
た各辞書エントリーの入力辞書エントリーとの類義度
は、図14の様に、類義辞書エントリー候補中の各辞書
エントリーに付与される。
Using this equation, the semantic degree P between the input dictionary entry of FIG. 3 and each dictionary entry in the synonym dictionary entry candidates of FIG. As shown in FIG. 13, the calculation is performed using the inter-word distance and the semantic information accuracy of FIG. First, input dictionary entries and headings are "acquired"
8, the semantic information accuracy Pm is “0.5” from FIG. 8, the number of words N calculated for the inter-word distance is “2”, and the two types of inter-word distance are Japanese words. Distance Dw1
Is "0.2" and the English word-to-word distance Dw2 is "0.2", so that the value of the similarity P is "0.3". The similarity degree P between the input dictionary entry and the dictionary entry whose heading is “suppress” is as follows: the semantic information accuracy Pm is “0, 5” from FIG. 8, the number of words N for which the inter-word distance is calculated is “2”,
For the two types of inter-word distances, the Japanese inter-word distance Dw1 is "0.
8 ”, since the English word distance Dw2 is“ 1 ”,
As the value of the similarity P, “−0, 4” is obtained. The degree of synonym of each dictionary entry and the input dictionary entry obtained individually is given to each dictionary entry in the synonym dictionary entry candidates as shown in FIG.

【0095】この類義度の計算結果に基づき、類義辞書
エントリー候補の中から、類義辞書エントリーを決定す
る。例えば、図3の入力辞書エントリーと図6の類義辞
書エントリー候補からは、図14の類義辞書エントリー
候補の内、類義度Pの値のもっとも高い、見出しが「獲
得する」の辞書エントリーの1エントリーが、類義辞書
エントリーとして決定される(図15)。
Based on the result of the calculation of the degree of synonym, a synonym dictionary entry is determined from the synonym dictionary entry candidates. For example, from the input dictionary entries of FIG. 3 and the synonym dictionary entry candidates of FIG. 6, among the synonym dictionary entry candidates of FIG. Is determined as a synonym dictionary entry (FIG. 15).

【0096】そして、最後に、入力辞書エントリー登録
部10により、個々で決定された類義辞書エントリーの
意味情報を、入力辞書エントリーの意味情報として付与
し、最終的に意味情報が付与された入力辞書エントリー
が、辞書データ格納部2に辞書データ中の一エントリー
として登録される。例えば、図15の類義辞書エントリ
ーからは、意味情報“SがO1を貰う,買う”が抽出さ
れ、それが図16のように、図3の入力辞書エントリの
意味情報として付与されて、この意味情報が付与された
入力辞書エントリは、辞書データ格納部2中の図2のよ
うな辞書データに新たな辞書エントリーとして登録され
る。
Finally, the input dictionary entry registration unit 10 gives the semantic information of the individually determined synonym dictionary entries as the semantic information of the input dictionary entry. The dictionary entry is registered in the dictionary data storage unit 2 as one entry in the dictionary data. For example, the semantic information “S receives O1 or buys” is extracted from the synonym dictionary entry of FIG. 15, and it is added as the semantic information of the input dictionary entry of FIG. The input dictionary entry to which the semantic information is added is registered as a new dictionary entry in the dictionary data in the dictionary data storage unit 2 as shown in FIG.

【0097】なお、図1に示す一実施の形態のここでの
説明においては、入力辞書エントリーに対する類似辞書
エントリーを辞書データから1エントリー選択し、その
類義辞書エントリーに付与されている意味情報を入力辞
書エントリーとして付与したが、入力辞書エントリーに
対する類似辞書エントリーを、意味情報の種類別に考
え、同じ意味情報を含む複数エントリーを類似辞書エン
トリーとして選択して、その意味情報を入力辞書エント
リーに付与することも可能であるし、具体的な類似辞書
エントリーを決めずに、辞書データの情報を参照して入
力辞書エントリーの意味情報として適切な意味情報を付
与することも可能である。
In the description of the embodiment shown in FIG. 1, one entry similar to the input dictionary entry is selected from the dictionary data, and the semantic information assigned to the similar dictionary entry is selected. Although assigned as an input dictionary entry, similar dictionary entries to the input dictionary entry are considered for each type of semantic information, a plurality of entries including the same semantic information are selected as similar dictionary entries, and the semantic information is assigned to the input dictionary entry. It is also possible to add appropriate semantic information as the semantic information of the input dictionary entry by referring to the information of the dictionary data without determining a specific similar dictionary entry.

【0098】また、入力辞書エントリー登録部10に表
示機能を持たせ、新規登録する入力辞書エントリーを意
味情報とともにユーザに提示することにより、ユーザー
が確認したうえで辞書データ格納部2に登録することも
可能である。また、ユーザが表示内容を確認し、適宜変
更を加えて辞書データ格納部2に登録することも可能で
ある。
The input dictionary entry registration unit 10 is provided with a display function, and the input dictionary entry to be newly registered is presented to the user together with the semantic information, so that the user can confirm it and register it in the dictionary data storage unit 2. Is also possible. Further, the user can confirm the display contents, make appropriate changes, and register them in the dictionary data storage unit 2.

【0099】本発明は、上記の実施の形態に限定される
ことなく、特許請求の範囲内で種々変更または応用が可
能である。
The present invention is not limited to the above embodiment, but can be variously modified or applied within the scope of the claims.

【0100】また、図1に示す本発明による意味辞書登
録装置においては、入力辞書エントリー読み込み部1、
類義辞書エントリー意味情報検索部3、意味情報決定ル
ール獲得部5、意味情報決定必須ルール獲得部7、意味
距離計算部8、および入力辞書エントリー登録部10の
各部は、コンピュータおよびその周辺装置と、そのコン
ピュータによって実行されるプログラムとによって実現
することができ、また、辞書データ格納部2、意味情報
決定ルール格納部4、意味情報決定必須ルール格納部
6、およびシソーラス格納部9の各部は、そのコンピュ
ーターに直接、あるいは通信回線を介して接続されてい
る記憶装置を用いて実現することができる。この場合、
コンピュータによって実行されるプログラムは、所定の
記憶媒体または通信回線を介して頒布することが可能で
ある。
In the semantic dictionary registration device according to the present invention shown in FIG.
The synonym dictionary entry semantic information search unit 3, semantic information determining rule obtaining unit 5, semantic information determining essential rule obtaining unit 7, semantic distance calculating unit 8, and input dictionary entry registering unit 10 include a computer and its peripheral devices. Each of the dictionary data storage unit 2, the semantic information determination rule storage unit 4, the semantic information determination essential rule storage unit 6, and the thesaurus storage unit 9 can be realized by a program executed by the computer. It can be realized using a storage device connected directly to the computer or via a communication line. in this case,
The program executed by the computer can be distributed via a predetermined storage medium or a communication line.

【0101】[0101]

【発明の効果】本発明の意味辞書登録装置によれば、入
力辞書エントリーを読み込み、この入力辞書エントリー
は、すでに意味情報が付与済みの入力辞書エントリーか
らなる辞書データ格納部の辞書データと比較し、その辞
書データ中で入力辞書エントリーと類義の辞書エントリ
ーを検索し、その類義の辞書エントリーに付与されてい
る意味情報を入力辞書エントリーの意味情報として付与
する。これにより、意味情報が未付与である入力辞書エ
ントリーに対して、事前に意味情報が付与済みの辞書エ
ントリーを参考にして、今まで辞書エントリーに付与し
た意味情報の付与結果を反映させた意味情報を付与する
ことができる。
According to the semantic dictionary registration device of the present invention, an input dictionary entry is read, and this input dictionary entry is compared with dictionary data in a dictionary data storage section composed of input dictionary entries to which semantic information has already been added. Then, in the dictionary data, a dictionary entry and a synonymous dictionary entry are searched, and semantic information assigned to the synonymous dictionary entry is assigned as semantic information of the input dictionary entry. As a result, for the input dictionary entry to which no semantic information has been added, the semantic information that reflects the result of adding the semantic information that has been added to the dictionary entry with reference to the dictionary entry to which the semantic information has been added in advance. Can be provided.

【0102】また、辞書エントリーの情報の中で特定の
意味情報を決定するための条件及び又は必須条件を記述
した意味情報決定ルール及び又は意味情報決定必須ルー
ルを格納し、入力辞書エントリーに対する類義する辞書
エントリーの意味情報を抽出する際に、意味辞書決定ル
ール及び又は意味情報決定必須ルールと入力エントリー
の内容とを照合し、照合する条件及び必須条件の意味情
報を持つ辞書データ格納部の辞書データ中の辞書エント
リーを、類義する辞書エントリーとして抽出することが
できる。これにより、効果的にかつ正確に類義する辞書
エントリーが選択でき、意味情報が入力辞書エントリー
に付与できる。
Further, a semantic information determination rule and / or a semantic information determination essential rule which describes a condition and / or an essential condition for determining specific semantic information in the information of the dictionary entry are stored, and a synonym for the input dictionary entry is stored. When extracting the semantic information of the dictionary entry to be compared, the semantic dictionary determination rule and / or the semantic information determination essential rule are compared with the contents of the input entry, and the dictionary of the dictionary data storage unit having the condition to be matched and the semantic information of the essential condition Dictionary entries in the data can be extracted as synonymous dictionary entries. As a result, a dictionary entry that is effectively and accurately synonymous can be selected, and semantic information can be added to the input dictionary entry.

【0103】また、意味情報決定ルール及び又は意味情
報決定必須ルールは、辞書データ格納手段に格納されて
いる各辞書エントリーに付与されている意味情報の傾向
を自動分析し、意味情報決定ルール及び又は意味情報決
定必須ルールを自動抽出することができる。これによ
り、入力辞書エントリーの意味情報を決定する際に活用
する意味情報決定ルール及び又は意味情報決定必須ルー
ルとして、意味情報が付与済みの辞書エントリーの付与
傾向を反映した意味情報を決定する上で効果的な条件が
自動的に得られるので、人手による意味情報決定ルール
及び又は意味情報決定必須ルールの作成作業が無くて
も、効率的にかつ正確に意味情報が入力辞書エントリー
に付与できる。
The semantic information determination rule and / or the semantic information determination essential rule automatically analyze the tendency of the semantic information assigned to each dictionary entry stored in the dictionary data storage means, and perform the semantic information determination rule and / or the semantic information determination rule. Semantic information determination required rules can be automatically extracted. Thereby, as a semantic information determination rule utilized when determining the semantic information of the input dictionary entry and / or a semantic information determination essential rule, in determining the semantic information reflecting the assignment tendency of the dictionary entry to which the semantic information has been assigned. Since the effective conditions are automatically obtained, the semantic information can be efficiently and accurately added to the input dictionary entry even if there is no manual creation of the semantic information determination rule and / or the semantic information determination essential rule.

【0104】また、辞書データ格納手段は、各辞書エン
トリーは単語情報を含むことができる。意味距離計算手
段は、単語情報の間の意味的な距離情報である単語間意
味距離を算出するごとができる。類義辞書エントリー意
味情報検索手段は、入力辞書エントリーと類義する辞書
エントリーが辞書データ格納手段に格納されているか否
かを確認する際に、入力辞書エントリーの単語情報と、
辞書データ格納手段中の辞書エントリーの単語情報との
間の単語間意味距離を算出し、この単語間意味距離を参
照して、類義する辞書エントリーの意味情報を抽出する
ことができる。これにより、入力辞書エントリーと類義
な辞書エントリーに検索に、両者の辞書エントリーの単
語情報が一致しているかだけでなく、両者の単語情報が
意味的にどのくらい近いかの情報も活用することができ
るので、類義な辞書エントリーをより正確に検索して意
味情報を付与することができる。
In the dictionary data storage means, each dictionary entry can include word information. The semantic distance calculating means can calculate the inter-word semantic distance which is the semantic distance information between the word information. Synonym dictionary entry semantic information searching means, when checking whether a dictionary entry synonymous with the input dictionary entry is stored in the dictionary data storage means, word information of the input dictionary entry,
The inter-word semantic distance between the word information of the dictionary entry in the dictionary data storage means is calculated, and by referring to the inter-word semantic distance, the semantic information of the synonymous dictionary entry can be extracted. This makes it possible to search not only for input dictionary entries and similar dictionary entries, but also for information on how close the word information of both dictionary entries is in meaning, as well as whether the word information in both dictionary entries match. Since it is possible, similar dictionary entries can be searched more accurately and semantic information can be added.

【0105】また、シソーラス格納手段は、同じ意味及
び又は類義の意味を持つ単語情報をグループ化したシソ
ーラス及び又は各グループ間の意味的関係である概念関
係情報を格納することができる。意味距離計算手段は、
単語情報の間の単語間意味距離を算出する際に、両方の
単語情報がシソーラス中で同じグループに入っているか
否か、別のグループの場合、グループ間にどのような意
味的関係情報があるかを参照して、該単語情報の間の単
語間意味距離を算出することができる。これにより、入
力辞書エントリーと単語情報の意味的な近さを算出する
際に、シソーラス中の単語のグループの情報及び又はグ
ループ間の関係情報に基づくことができ、意味的近さを
算出する際の基準の根拠が明確になるとともに、利用す
るシソーラスとして特定分野向きのものを選んだり、特
定分野コーパスから自動抽出されたシソーラスを選ぶな
どによって、分野の特性を反映した、意味情報を付与す
ることができる。
Further, the thesaurus storage means can store a thesaurus obtained by grouping word information having the same meaning and / or synonymous meaning and / or conceptual relationship information which is a semantic relationship between the groups. Meaning distance calculation means,
When calculating the inter-word semantic distance between word information, whether or not both word information are in the same group in the thesaurus, and if there is another group, what kind of semantic relationship information exists between groups The inter-word semantic distance between the pieces of word information can be calculated with reference to FIG. Thereby, when calculating the semantic closeness between the input dictionary entry and the word information, it can be based on the information of the group of the words in the thesaurus and / or the relation information between the groups. Clarify the grounds for the criteria of the standard, and add semantic information that reflects the characteristics of the field by selecting a thesaurus for use in a specific field as a thesaurus to be used or selecting a thesaurus automatically extracted from a specific field corpus Can be.

【0106】また、辞書データ格納手段は、各辞書エン
トリーの辞書レコードの見出しの単語情報として第一言
語の単語情報を含んでおり、各辞書エントリーの辞書レ
コードの単語情報として、該辞書レコードの見出しに対
応する第二言語の単語情報を含むことができる。これに
より、機械翻訳用の辞書等では、2種類の言語の意味の
特性を活かしたより正確な意味情報を付与することがで
きるとともに、片方の言語の単語からは単語間意味距離
が算出できない場合でも別の言語の単語の単語間意味距
離にもとづき類義の辞書エントリーを検索することがで
きるので、辞書データ格納手段中の辞書エントリー数が
少ない場合や付与されている辞書エントリーが少ない意
味情報を付与する場合などでも、入力辞書エントリーに
対する意味情報がより適切に付与できる。
Further, the dictionary data storage means includes the first language word information as the word information of the heading of the dictionary record of each dictionary entry, and stores the heading of the dictionary record as the word information of the dictionary record of each dictionary entry. May be included in the second language. As a result, in a dictionary for machine translation or the like, more accurate semantic information can be provided by making use of the characteristics of the meanings of the two languages, and even if the inter-word semantic distance cannot be calculated from words in one language. A dictionary entry with a similar meaning can be searched based on the semantic distance between words of words in different languages, so if the number of dictionary entries in the dictionary data storage unit is small or if there is a small number of dictionary entries, meaning information is added. In such a case, the semantic information for the input dictionary entry can be given more appropriately.

【0107】また、意味情報決定ルール格納手段は、類
義辞書エントリー意味情報検索手段により抽出された類
義する辞書エントリーの意味情報を表示することができ
る。これにより、ユーザーが入力辞書エントリーに登録
する意味情報の内容を確認することができると共に、適
宜修正等を行うことも可能となる。
Further, the semantic information determination rule storage means can display the meaning information of the synonymous dictionary entries extracted by the synonym dictionary entry meaning information searching means. As a result, the user can confirm the contents of the semantic information registered in the input dictionary entry, and can make appropriate corrections and the like.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の一実施の形態の意味辞書登録装置の
基本ブロック構成図である。
FIG. 1 is a basic block configuration diagram of a meaning dictionary registration device according to an embodiment of the present invention.

【図2】 本発明の一実施の形態の辞書データの辞書エ
ントリーを示す図である。
FIG. 2 is a diagram showing dictionary entries of dictionary data according to an embodiment of the present invention.

【図3】 本発明の一実施の形態の入力辞書エントリー
を示す図である。
FIG. 3 is a diagram showing an input dictionary entry according to an embodiment of the present invention.

【図4】 本発明の一実施の形態の辞書データを意味情
報別に分類した辞書エントリーを示す図である。
FIG. 4 is a diagram illustrating dictionary entries in which dictionary data according to an embodiment of the present invention is classified according to semantic information;

【図5】 本発明の一実施の形態の意味情報決定必須ル
ールのエントリーを示す図である。
FIG. 5 is a diagram showing entries of semantic information determination essential rules according to the embodiment of the present invention.

【図6】 本発明の一実施の形態の類義辞書エントリー
候補を示す図である。
FIG. 6 is a diagram showing synonym dictionary entry candidates according to the embodiment of the present invention.

【図7】 本発明の一実施の形態の意味情報決定ルール
のエントリーを示す図である。
FIG. 7 is a diagram showing entries of a semantic information determination rule according to an embodiment of the present invention.

【図8】 本発明の一実施の形態の意味情報候補に対す
る意味情報確度を示す図である。
FIG. 8 is a diagram illustrating semantic information accuracy for a semantic information candidate according to an embodiment of the present invention.

【図9】 本発明の一実施の形態の意味距離計算部に入
力する単語対を示す図である。
FIG. 9 is a diagram illustrating word pairs input to a semantic distance calculation unit according to an embodiment of the present invention.

【図10】 本発明の一実施の形態の日本語用シソーラ
スを示す図である。
FIG. 10 is a diagram showing a Japanese thesaurus according to an embodiment of the present invention.

【図11】 本発明の一実施の形態の英語用シソーラス
を示す図である。
FIG. 11 is a diagram showing an English thesaurus according to one embodiment of the present invention.

【図12】 本発明の一実施の形態の単語間距離計算ル
ールを示す図である。
FIG. 12 is a diagram showing a rule for calculating the distance between words according to an embodiment of the present invention.

【図13】 本発明の一実施の形態の意味距離計算部に
入力した単語対に対する単語間距離を示す図である。
FIG. 13 is a diagram illustrating a word-to-word distance for a word pair input to a semantic distance calculation unit according to an embodiment of the present invention;

【図14】 本発明の一実施の形態の類義辞書エントリ
ー候補に対する類義度を示す図である。
FIG. 14 is a diagram showing a similarity degree for a similarity dictionary entry candidate according to an embodiment of the present invention.

【図15】 本発明の一実施の形態の類義辞書エントリ
ーを示す図である。
FIG. 15 is a diagram showing a synonym dictionary entry according to an embodiment of the present invention.

【図16】 本発明の一実施の形態の意味情報が付与さ
れた入力辞書エントリーを示す図である。
FIG. 16 is a diagram illustrating an input dictionary entry to which semantic information is added according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 入力辞書エントリー読み込み部 2 辞書データ格納部 3 類義辞書エントリー意味情報検索部 31 辞書データ検索部 32 意味情報決定必須ルール照合部 33 意味情報決定ルール照合部 34 類義辞書エントリー決定部 4 意味情報決定ルール格納部 5 意味情報決定ルール獲得部 51 辞書エントリー分析部 52 意味情報決定ルール抽出部 53 意味情報決定ルール登録部 6 意味情報決定必須ルール格納部 7 意味情報決定必須ルール獲得部 71 辞書エントリー分析部 72 意味情報決定必須ルール抽出部 73 意味情報決定必須ルール登録部 8 意味距離計算部 81 単語情報対入力部 82 シソーラス検索部 83 単語間距離計算部 9 シソーラス格納部 10 入力辞書エントリー登録部 DESCRIPTION OF SYMBOLS 1 Input dictionary entry reading part 2 Dictionary data storage part 3 Synonym dictionary entry semantic information search part 31 Dictionary data search part 32 Semantic information determination essential rule matching part 33 Semantic information determination rule matching part 34 Synonym dictionary entry determining part 4 Semantic information Decision rule storage unit 5 semantic information decision rule acquisition unit 51 dictionary entry analysis unit 52 semantic information decision rule extraction unit 53 semantic information decision rule registration unit 6 semantic information decision essential rule storage unit 7 semantic information decision essential rule acquisition unit 71 dictionary entry analysis Part 72 semantic information determination essential rule extraction part 73 semantic information determination essential rule registration part 8 semantic distance calculation part 81 word information pair input part 82 thesaurus search part 83 inter-word distance calculation part 9 thesaurus storage part 10 input dictionary entry registration part

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 少なくとも辞書レコードと、該辞書レコ
ードの見出しと、該辞書レコードの意味情報とからなる
辞書エントリーを辞書データとして格納する辞書データ
格納手段と、 入力辞書エントリーの辞書レコードと該辞書レコードの
見出しと類義する辞書エントリーが辞書データ格納手段
に格納されているか否かを確認し、格納されている場合
には該類義する辞書エントリーの意味情報を抽出する類
義辞書エントリー意味情報検索手段と、 前記類義辞書エントリー意味情報検索手段により類義す
る辞書エントリの意味情報が抽出された場合、入力辞書
エントリーの意味情報として、該類義する辞書エントリ
ーの意味情報を付与し、前記辞書データ格納手段に登録
する入力辞書エントリー登録手段とを備えることを特徴
とする意味辞書登録装置。
1. A dictionary data storage means for storing, as dictionary data, a dictionary entry including at least a dictionary record, a heading of the dictionary record, and semantic information of the dictionary record, a dictionary record of an input dictionary entry, and the dictionary record A dictionary entry meaning information search for checking whether or not a dictionary entry synonymous with the heading of the dictionary entry is stored in the dictionary data storage means, and extracting the meaning information of the synonymous dictionary entry if it is stored Means, when the meaning information of the synonymous dictionary entry is extracted by the synonym dictionary entry meaning information searching means, the meaning information of the synonymous dictionary entry is given as the meaning information of the input dictionary entry; Input dictionary entry registration means for registering in a data storage means, a semantic dictionary registration characterized by comprising: Location.
【請求項2】 少なくとも、辞書レコード及び見出し中
の情報で意味情報を決定するための条件である意味情報
決定条件と、その意味情報決定条件を満たす辞書エント
リーに付与する意味情報からなる意味情報決定ルールを
格納する意味情報決定ルール格納手段を含み、 前記類義辞書エントリー意味情報検索手段は、 入力辞書エントリーに対する類義する辞書エントリーの
意味情報を抽出する際に、該意味辞書決定ルールの該意
味決定条件と該入力エントリーの辞書レコード及び又は
見出しとを照合し、照合する意味決定条件が存在する場
合には該意味決定条件に対応する意味情報を類義する辞
書エントリーの意味情報として抽出することを特徴とす
る請求項1記載の意味辞書登録装置。
2. A semantic information determination condition comprising at least a semantic information determination condition for determining semantic information based on information in a dictionary record and a heading, and semantic information to be assigned to a dictionary entry satisfying the semantic information determination condition. Means for storing semantic information determining rules for storing rules, wherein the synonym dictionary entry meaning information searching means extracts the meaning of the semantic dictionary determining rules when extracting the meaning information of the synonymous dictionary entries for the input dictionary entries. The determination condition is compared with the dictionary record and / or heading of the input entry, and if there is a meaning determination condition to be matched, the semantic information corresponding to the meaning determination condition is extracted as the semantic information of the synonymous dictionary entry. The semantic dictionary registration device according to claim 1, wherein:
【請求項3】 前記辞書データ格納手段に格納されてい
る各辞書エントリーの辞書レコード及び又は見出しに対
して付与されている意味情報の傾向を自動分析し、辞書
レコード及び又は見出し中で意味情報を決定するための
条件である意味情報決定条件を自動抽出し、該意味情報
決定条件と、該意味情報決定条件を満たす辞書エントリ
ーに付与する意味情報からなる意味情報決定ルールとし
て前記意味情報決定ルール格納手段に登録する意味情報
決定ルール獲得手段を含むことを特徴とする請求項2記
載の意味辞書登録装置。
3. A method for automatically analyzing the tendency of semantic information given to a dictionary record and / or a heading of each dictionary entry stored in the dictionary data storage means, and converting the semantic information in the dictionary record and / or the heading. A semantic information determination condition that is a condition for determination is automatically extracted, and the semantic information determination rule is stored as a semantic information determination rule including the semantic information determination condition and the semantic information to be assigned to a dictionary entry satisfying the semantic information determination condition. 3. A semantic dictionary registration apparatus according to claim 2, further comprising means for acquiring semantic information determination rules registered in said means.
【請求項4】 入力辞書エントリーに特定の意味情報を
付与する場合に必ず含まれていなければならない入力辞
書エントリーの辞書レコード及び見出し中の情報である
意味情報決定必須条件と、該特定の意味情報からなる意
味情報決定必須ルールを格納する意味情報決定必須ルー
ル格納手段を含み、 前記類義辞書エントリー意味情報検索手段は、 入力辞書エントリーに対する類義する辞書エントリーの
意味情報を抽出する際に、該意味辞書決定必須ルールの
該意味決定必須条件と該入力エントリーの辞書レコード
及び又は見出しとを照合し、照合する意味決定必須条件
に対応する意味情報の中から類義する辞書エントリーの
意味情報を抽出することを特徴とする請求項1,2又は
3記載の意味辞書登録装置。
4. An essential condition for determining semantic information, which is information in a dictionary record and a heading of an input dictionary entry that must be included when specific semantic information is given to an input dictionary entry, and the specific semantic information The semantic information determination essential rule storing means for storing a semantic information determination essential rule comprising: the synonym dictionary entry semantic information searching means, when extracting the semantic information of the synonymous dictionary entry for the input dictionary entry, The meaning determination essential condition of the semantic dictionary determination essential rule is compared with the dictionary record and / or heading of the input entry, and the semantic information of the synonymous dictionary entry is extracted from the semantic information corresponding to the semantic essential requirement to be matched. 4. The semantic dictionary registration device according to claim 1, wherein the registration is performed.
【請求項5】 前記辞書データ格納手段に格納されてい
る各辞書エントリーの辞書レコード及び又は見出しに対
して付与されている意味情報の傾向を自動分析し、辞書
レコード及び又は見出し中で特定の意味情報が付与され
ている場合に必ず含まれていなければならない条件であ
る意味情報決定必須条件を自動抽出し、該意味情報決定
必須条件と、該特定の意味情報からなる意味情報決定必
須ルールとして前記意味情報決定必須ルール格納手段に
登録する意味情報決定必須ルール獲得手段を含むことを
特徴とする請求項4記載の意味辞書登録装置。
5. A tendency of semantic information assigned to a dictionary record and / or a heading of each dictionary entry stored in the dictionary data storage means, and automatically analyzes a specific meaning in the dictionary record and / or the heading. Automatically extract semantic information determination essential condition, which is a condition that must be included when information is added, and define the semantic information determination essential condition and the semantic information determination essential rule consisting of the specific semantic information as described above. 5. The semantic dictionary registration device according to claim 4, further comprising a semantic information determination essential rule acquisition unit registered in the semantic information determination essential rule storage unit.
【請求項6】 前記辞書データ格納手段は、各辞書エン
トリーの辞書レコードの見出しは単語情報を含んでお
り、 単語情報の間の意味的な距離情報である単語間意味距離
を算出する意味距離計算手段を含み、 前記類義辞書エントリー意味情報検索手段は、 入力辞書エントリーの辞書レコードと該辞書レコードの
見出しと類義する辞書エントリーが辞書データ格納手段
に格納されているか否かを確認する際に、該入力辞書エ
ントリーの辞書レコードの見出し中の単語情報と、前記
辞書データ格納手段に格納されている辞書エントリーの
辞書レコードの見出し中の単語情報との間の単語間意味
距離を該意味距離計算手段により算出し、該単語間意味
距離を参照して、類義する辞書エントリーの意味情報を
抽出することを特徴とする請求項1,2,3,4又は5
記載の意味辞書登録装置。
6. The dictionary data storage means, wherein a heading of a dictionary record of each dictionary entry includes word information, and a semantic distance calculation for calculating an inter-word semantic distance, which is semantic distance information between the word information. Means for retrieving whether or not a dictionary record of the input dictionary entry and a dictionary entry synonymous with a heading of the dictionary record are stored in the dictionary data storage means. Calculating the meaning distance between words between the word information in the heading of the dictionary record of the input dictionary entry and the word information in the heading of the dictionary record of the dictionary entry stored in the dictionary data storage means. And calculating means for extracting meaning information of synonymous dictionary entries by referring to the meaning distance between words. 3, 4 or 5
Description dictionary registration device.
【請求項7】 前記辞書データ格納手段は、各辞書エン
トリーの辞書レコードの中に、該辞書レコードの見出し
及び該辞書レコードの意味情報に対応する単語情報を含
んでおり、 単語情報の間の意味的な距離情報である単語間意味距離
を算出する意味距離計算手段を含み、 前記類義辞書エントリー意味情報検索手段は、 入力辞書エントリーの辞書レコード及び該辞書レコード
の見出しと類義する辞書エントリーが辞書データ格納手
段に格納されているか否かを確認する際に、該入力辞書
エントリーの辞書レコード中の単語情報と、前記辞書デ
ータ格納手段に格納されている辞書エントリーの該辞書
レコード中の単語情報との間の単語間意味距離を該意味
距離計算手段により算出し、該単語間意味距離を参照し
て、類義する辞書エントリーの意味情報を抽出すること
を特徴とする請求項1,2,3,4,5又は6記載の意
味辞書登録装置。
7. The dictionary data storage means includes, in a dictionary record of each dictionary entry, word information corresponding to a heading of the dictionary record and semantic information of the dictionary record. A synonym dictionary entry semantic information search unit, the synonym dictionary entry semantic information search unit includes a dictionary record of an input dictionary entry and a dictionary entry synonymous with a heading of the dictionary record. When confirming whether or not the dictionary information is stored in the dictionary data storage means, the word information in the dictionary record of the input dictionary entry and the word information in the dictionary record of the dictionary entry stored in the dictionary data storage means The meaning distance between words is calculated by the meaning distance calculation means, and the meaning of the dictionary entry to be synonymous is calculated with reference to the meaning distance between words. The semantic dictionary registration device according to claim 1, 2, 3, 4, 5, or 6, wherein the taste information is extracted.
【請求項8】 同じ意味及び又は類義の意味を持つ単語
情報をグループ化したシソーラスを格納するシソーラス
格納手段を含み、 前記意味距離計算手段は、 単語情報の間の単語間意味距離を算出する際に、両方の
単語情報が該シソーラス格納手段に格納されているシソ
ーラス中で同じグループに入っているか否かを参照し
て、該単語情報の間の単語間意味距離を算出することを
特徴とする請求項6又は7記載の意味辞書登録装置。
8. A thesaurus storing means for storing a thesaurus in which word information having the same meaning and / or synonymous meaning is grouped, wherein said semantic distance calculating means calculates an inter-word semantic distance between word information. In this case, it is characterized by referring to whether or not both word information belong to the same group in the thesaurus stored in the thesaurus storage means, and calculating the inter-word semantic distance between the word information. The semantic dictionary registration device according to claim 6 or 7, wherein:
【請求項9】 前記シソーラス格納手段は、シソーラス
中の単語情報の各グループ間の意味的関係である概念関
係情報及び又は各グループ中で共通の意味を持つ複数の
グループで束ねた関係である上位概念関係情報を含んで
おり、 前記意味距離計算手段は、単語情報の間の単語間意味距
離を算出する際に、両方の単語情報が該シソーラス格納
手段に格納されているシソーラス中で同じグループに入
っているか否かに加えて、別のグループに入っている場
合には、両グループにはどのような概念意味関係情報及
び又は上位概念関係情報があるかも参照して、該単語情
報の間の単語間意味距離を算出することを特徴とする請
求項8記載の意味辞書登録装置。
9. The thesaurus storage means stores conceptual relation information, which is a semantic relation between groups of word information in the thesaurus, and / or higher-order relations, which are bundled in a plurality of groups having a common meaning in each group. When the semantic distance calculating means calculates the inter-word semantic distance between the word information, both the word information belong to the same group in the thesaurus stored in the thesaurus storage means. If they are in another group in addition to whether or not they are included, refer to what kind of conceptual semantic relation information and / or superordinate conceptual relation information exists in both groups, 9. The semantic dictionary registration device according to claim 8, wherein a semantic distance between words is calculated.
【請求項10】 前記辞書データ格納手段は、各辞書エ
ントリーの辞書レコードの見出しの単語情報として第一
言語の単語情報を含んでおり、各辞書エントリーの辞書
レコードの単語情報として、該辞書レコードの見出しに
対応する第二言語の単語情報を含んでいることを特徴と
する請求項8又は9記載の意味辞書登録装置。
10. The dictionary data storage means includes word information of a first language as word information of a heading of a dictionary record of each dictionary entry, and stores word information of the dictionary record as word information of a dictionary record of each dictionary entry. The semantic dictionary registration device according to claim 8 or 9, wherein word information of a second language corresponding to the headline is included.
【請求項11】 前記意味情報決定ルール格納手段は、
前記類義辞書エントリー意味情報検索手段により抽出さ
れた類義する辞書エントリーの意味情報を表示する手段
を含むことを特徴とする請求項1,2,3,4,5,
6,7,8,9又は10記載の意味辞書登録装置。
11. The semantic information determination rule storage means,
6. The apparatus according to claim 1, further comprising means for displaying semantic information of synonymous dictionary entries extracted by said synonym dictionary entry meaning information searching means.
A semantic dictionary registration device according to 6, 7, 8, 9 or 10.
JP11067563A 1999-03-12 1999-03-12 Semantic dictionary registering device Pending JP2000268035A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11067563A JP2000268035A (en) 1999-03-12 1999-03-12 Semantic dictionary registering device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11067563A JP2000268035A (en) 1999-03-12 1999-03-12 Semantic dictionary registering device

Publications (1)

Publication Number Publication Date
JP2000268035A true JP2000268035A (en) 2000-09-29

Family

ID=13348567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11067563A Pending JP2000268035A (en) 1999-03-12 1999-03-12 Semantic dictionary registering device

Country Status (1)

Country Link
JP (1) JP2000268035A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012063770A1 (en) 2010-11-10 2012-05-18 楽天株式会社 Related-word registration device, information processing device, related-word registration method, program for related-word registration device, and recording medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012063770A1 (en) 2010-11-10 2012-05-18 楽天株式会社 Related-word registration device, information processing device, related-word registration method, program for related-word registration device, and recording medium
US8606565B2 (en) 2010-11-10 2013-12-10 Rakuten, Inc. Related-word registration device, information processing device, related-word registration method, program for related-word registration device, and recording medium
US8738366B2 (en) 2010-11-10 2014-05-27 Rakuten, Inc. Related-word registration device, information processing device, related-word registration method, program for related-word registration device, and recording medium

Similar Documents

Publication Publication Date Title
US6876998B2 (en) Method for cross-linguistic document retrieval
US5418717A (en) Multiple score language processing system
EP0637805B1 (en) Context-sensitive method of finding information about a word in an electronic dictionary
US5895446A (en) Pattern-based translation method and system
KR101004515B1 (en) Method and system for retrieving confirming sentences
US7565281B2 (en) Machine translation
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US5109509A (en) System for processing natural language including identifying grammatical rule and semantic concept of an undefined word
US7376634B2 (en) Method and apparatus for implementing Q&amp;A function and computer-aided authoring
JP2855409B2 (en) Natural language processing method and system
JP3266246B2 (en) Natural language analysis apparatus and method, and knowledge base construction method for natural language analysis
US20050171757A1 (en) Machine translation
EP1703419A1 (en) Translation judgment device, method, and program
US20070073678A1 (en) Semantic document profiling
EP0530993A2 (en) An iterative technique for phrase query formation and an information retrieval system employing same
US20040254781A1 (en) Machine translation
JPH083815B2 (en) Natural language co-occurrence relation dictionary maintenance method
KR20040044176A (en) Statistical method and apparatus for learning translation relationships among phrases
GB2345358A (en) Estimating accuracy of an automatic language translation
JPH0424869A (en) Document processing system
Neumann et al. A shallow text processing core engine
Orphanos et al. POS disambiguation and unknown word guessing with decision trees
WO2015177861A1 (en) Device and method for generating training data
JP2000268035A (en) Semantic dictionary registering device
JPH11259524A (en) Information retrieval system, information processing method in information retrieval system and record medium

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050301