JPH06325018A - Device for supporting dictionary preparation and method thereof - Google Patents

Device for supporting dictionary preparation and method thereof

Info

Publication number
JPH06325018A
JPH06325018A JP5115864A JP11586493A JPH06325018A JP H06325018 A JPH06325018 A JP H06325018A JP 5115864 A JP5115864 A JP 5115864A JP 11586493 A JP11586493 A JP 11586493A JP H06325018 A JPH06325018 A JP H06325018A
Authority
JP
Japan
Prior art keywords
word
synonym
basic
unit
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5115864A
Other languages
Japanese (ja)
Inventor
Yutaka Shirai
豊 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5115864A priority Critical patent/JPH06325018A/en
Publication of JPH06325018A publication Critical patent/JPH06325018A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

PURPOSE:To provide the device and method for supporting dictionary preparation so as to efficiently preparing a synonym dictionary from an electronic Japanese dictionary which stores a lot of words. CONSTITUTION:Respective meaning explanation sentences stored in a Japanese dictionary part 1 are decomposed into meaning element word sets by a sentence decomposition part 3 and stored in a meaning element word set storage part 2 corresponding to index words, based on frequency information in the meaning element word set storage part 2, a basic word is extracted and stored in a basic word storage part 4 by a basic word extraction part 5, the respective index words in the meaning element word set storage part 2 are made correspondent to the basic words contained in those meaning element word sets inside the basic word storage part 4 by a synonym extraction part 7, and the index word set made correspondent to the same basic word by the synonym extraction part 7 is registered on a synonym storage part 6 respectively as synonyms by a synonym registration part 8.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、電子辞書の作成支援技
術に係わり、意味の類似した類義語を対応づけて記憶す
る電子類義語辞書の作成を、既存の電子国語辞書を利用
して効率的に行なう辞書作成支援技術装置及びその方法
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an electronic dictionary creation support technology, and efficiently creates an electronic synonym dictionary that stores synonyms having similar meanings in association with each other using an existing electronic Japanese dictionary. The present invention relates to a dictionary creation support technology device and method.

【0002】[0002]

【従来の技術】近年、国語辞書をはじめとする種々の辞
書が電子化され普及している。その一つに、意味の似通
った類義語を対応づけた類義語辞書がある。この類義語
辞書は、一つの単語表記から複数の類義語表記を参照で
きるため、文書作成時により有用に作用する電子辞書と
して注目を浴びつつある。しかし、その作成には各単語
間の類義性を検証するなど専門的な知識が要求されるた
め、専門家が全工程を行なわねばならず、多大な労力を
要する。この類義語辞書の作成支援に関する従来の技術
はないが、その登録技術には特開平01−183769
号公報に開示された単語登録方式がある。
2. Description of the Related Art In recent years, various dictionaries such as a national language dictionary have been digitized and become widespread. One of them is a synonym dictionary that associates synonyms with similar meanings. Since this synonym dictionary can refer to a plurality of synonym notations from one word notation, it is gaining attention as an electronic dictionary that works more effectively when creating a document. However, the preparation requires specialized knowledge, such as verifying the synonym between words, so that the expert must perform all the steps, which requires a great deal of labor. There is no conventional technique for supporting the creation of this synonym dictionary, but the registration technique is disclosed in Japanese Patent Laid-Open No. 01-183769.
There is a word registration method disclosed in Japanese Patent Publication.

【0003】その従来技術は、複数の類義語を一時に入
力登録する際の登録を効率化することに関するものであ
る。その技術は複数の類義語グループを一時に入力する
場合に以下の手順で登録を行なうことにある。(1)入
力された単語を各々調べ、既に辞書中に登録されている
かを判定する。(2)もし、既に登録されている場合、
その単語あるいは類義語集合の類義語として一括登録す
る。(3)もし、全て未登録語の場合、類義語として一
括登録する。この登録方式を応用して、類義語グループ
を大量に登録することにより類義語辞書の作成を支援す
ることが可能である。
[0003] The conventional technique relates to streamlining registration when a plurality of synonyms are input and registered at one time. The technique is to register in the following procedure when inputting a plurality of synonym groups at one time. (1) Each input word is examined to determine whether it is already registered in the dictionary. (2) If already registered,
Register as a synonym for the word or set of synonyms. (3) If all are unregistered words, they are collectively registered as synonyms. By applying this registration method, it is possible to support the creation of a synonym dictionary by registering a large number of synonym groups.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、上記従
来技術の登録方式を応用して類義語辞書を作成するため
には、大量の単語データを収集した上で、それらを類義
語グループに分類し登録しなければならず、多大な労力
を必要とするという課題を有している。本発明は従来の
かかる課題に鑑み、大量の単語を格納した電子国語辞書
から効率的に類義語辞書を作成することができる辞書作
成支援装置及びその方法を提供することを目的とする。
However, in order to create a synonym dictionary by applying the above-mentioned registration method of the prior art, it is necessary to collect a large amount of word data, classify them into synonym groups, and register them. It has a problem that it requires a lot of labor. The present invention has been made in view of the above problems, and it is an object of the present invention to provide a dictionary creation support apparatus and method capable of efficiently creating a synonym dictionary from an electronic Japanese dictionary that stores a large number of words.

【0005】[0005]

【課題を解決するための手段】上記目的を達成するた
め、請求項1に記載の発明は、見出し語とその意味説明
文とを対応づけて記憶する国語辞書部と、見出し語とそ
の意味説明文を単語単位に分解した意味素単語集合とを
対応づけて記憶する意味素単語集合記憶部と、国語辞書
部が記憶する各意味説明文を意味素単語集合に分解し見
出し語と対応付けて意味素単語集合記憶部に記憶する文
章分解部と、基本単語を記憶する基本単語記憶部と、意
味素単語集合記憶部が記憶する意味素単語集合の統計情
報に基づき基本的な意味を持ちかつ汎用度の高い基本単
語を抽出し基本単語記憶部に記憶する基本単語摘出部
と、類義語を記憶する類義語記憶部と、意味素単語集合
記憶部が記憶する各見出し語とその意味素単語集合中に
含まれる基本単語記憶部が記憶する基本単語とを対応付
ける類義語抽出部と、類義語抽出部が同一の基本単語に
対応付けた見出し語集合を各々類義語として類義語記憶
部に登録する類義語登録部とを備えたことを特徴とす
る。
In order to achieve the above object, the invention according to claim 1 relates to a national language dictionary section for storing a headword and its meaning explanation text in association with each other, and the headword and its meaning explanation. Semantic word set storage unit that stores the corresponding semantic word set by disassembling sentences into word units, and each meaning explanation sentence stored by the Japanese dictionary unit is decomposed into a semantic word set and associated with headwords. It has a basic meaning based on the sentence decomposition unit stored in the semantic word set storage unit, the basic word storage unit storing basic words, and the statistical information of the semantic word set stored in the semantic word set storage unit. A basic word extracting unit that extracts a highly versatile basic word and stores it in the basic word storage unit, a synonym storage unit that stores synonyms, and each headword and its semantic word set stored in the semantic word set storage unit Basic word memory included in Is provided with a synonym extraction unit for associating with a basic word stored by the synonym extraction unit, and a synonym registration unit for registering a set of entry words in which the synonym extraction unit is associated with the same basic word as synonyms in the synonym storage unit. .

【0006】請求項2に記載の発明は、請求項1の基本
単語摘出部を、意味素単語集合記憶部が記憶する意味素
単語集合の頻度情報に基づき基本的な意味を持ちかつ汎
用度の高い基本単語を抽出し基本単語記憶部に記憶する
基本単語抽出部に置き換えたことを特徴とする。請求項
3に記載の発明は、請求項1の基本単語記憶部と基本単
語摘出部とを、基本的な意味を持ちかつ汎用度の高い基
本単語を記憶する基本単語辞書部に置き換え、類義語抽
出部においては意味素単語集合記憶部が記憶する各見出
し語とその意味素単語集合中に含まれる基本単語辞書部
が記憶する基本単語とを対応付けるようにしたことを特
徴とする。
According to a second aspect of the present invention, the basic word extracting section of the first aspect has a basic meaning and has general versatility based on frequency information of the semantic word set stored in the semantic word set storage section. It is characterized in that a high basic word is extracted and replaced with a basic word extracting unit which is stored in a basic word storage unit. According to a third aspect of the present invention, the basic word storage section and the basic word extracting section of the first aspect are replaced with a basic word dictionary section that stores basic words having a basic meaning and a high degree of versatility to extract synonyms. The section is characterized in that each headword stored in the semantic word set storage section is associated with the basic word stored in the basic word dictionary section included in the semantic word set.

【0007】請求項4に記載の発明は、請求項1の基本
単語摘出部を、意味素単語集合記憶部が記憶する見出し
語と意味素単語集合とが再帰的に参照し合う単語を検出
し基本単語として基本単語記憶部に記憶する基本単語検
出部に置き換えたことを特徴とする。請求項5に記載の
発明は、請求項1の類義語登録部を、類義語抽出部が一
つの見出し語を複数の基本単語に対応付けた場合にその
主たる一つの基本単語のみに対応づけた上で同一の基本
単語に対応付けた見出し語集合を各々類義語として類義
語記憶部に登録する類義語重複検証登録部に置き換えた
ことを特徴とする。
According to a fourth aspect of the present invention, the basic word extracting section of the first aspect detects a word in which the headword stored in the semantic word set storage section and the semantic word set recursively refer to each other. It is characterized in that the basic word is replaced with a basic word detecting section which is stored in the basic word storage section. In the invention described in claim 5, when the synonym extraction part associates one headword with a plurality of basic words by the synonym extraction part, the synonym extraction part is associated with only one main basic word. It is characterized in that a set of headwords associated with the same basic word is replaced with a synonym duplication verification registration unit that registers each synonym as a synonym storage unit.

【0008】請求項6に記載の発明は、請求項1の類義
語登録部を、類義語抽出部が同一の基本単語に対応付け
た各見出し語集合を同一品詞ごと分類し各々類義語とし
て類義語記憶部に登録する類義語品詞別登録部に置き換
えたことを特徴とする。請求項7に記載の発明は、請求
項1の類義語登録部を、類義語抽出部が同一の一つの基
本単語に対応付けた見出し語集合と同一の複数の基本単
語に対応付けた見出し語集合とを区別して各々類義語と
して類義語記憶部に登録する類義語多重登録部に置き換
えたことを特徴とする。
According to a sixth aspect of the present invention, the synonym registration section of claim 1 classifies each headword set associated with the same basic word by the synonym extraction section by the same part-of-speech and stores them in the synonym storage section as synonyms. It is characterized in that it is replaced with the synonym part-of-speech registration section for registration. The invention according to claim 7 provides a synonym registration unit according to claim 1 and a synonym extraction unit that associates the same synonym extraction unit with one basic word and a plurality of identical basic words. Is distinguished and each is replaced with a synonym multiple registration unit that is registered as a synonym in the synonym storage unit.

【0009】請求項8〜14に記載の発明方法はそれぞ
れ請求項1〜7に対応している。
The invention methods described in claims 8 to 14 correspond to claims 1 to 7, respectively.

【0010】[0010]

【作用】請求項1に記載の発明によると、文章分解部が
国語辞書部の各意味説明文を意味素単語集合に分解し見
出し語と対応付けて意味素単語集合記憶部に記憶し、そ
の意味素単語の統計情報に基づき基本単語摘出部が基本
単語を抽出し基本単語記憶部に記憶し、類義語抽出部が
各見出し語とその意味素単語集合中に含まれる基本単語
とを対応付け、それらを類義語登録部が同一の基本単語
に対応付けた見出し語集合に分類し各々類義語として類
義語記憶部に登録する。
According to the first aspect of the invention, the sentence disassembling unit decomposes each meaning description in the Japanese dictionary into a semantic word set and stores it in the semantic word set storage unit in association with the headword. The basic word extraction unit extracts the basic word based on the statistical information of the semantic word and stores it in the basic word storage unit, and the synonym extraction unit associates each headword with the basic word included in the meaning word set, The synonym registration unit classifies them into headword sets associated with the same basic word, and registers each in the synonym storage unit as synonyms.

【0011】また、請求項2に記載の発明によると、基
本単語摘出部に換えて、基本単語抽出部が基本単語を頻
度情報にて抽出し、基本単語記憶部に記憶する。また、
請求項3に記載の発明によると、基本単語記憶部と基本
単語摘出部とに換えて、基本単語辞書部が基本的な意味
を持ちかつ汎用度の高い基本単語を記憶する。
According to the second aspect of the invention, instead of the basic word extracting unit, the basic word extracting unit extracts the basic word by the frequency information and stores it in the basic word storage unit. Also,
According to the third aspect of the present invention, the basic word storage unit and the basic word extracting unit are replaced by a basic word dictionary unit which stores basic words having a basic meaning and high versatility.

【0012】また、請求項4に記載の発明によると、基
本単語摘出部に換えて、基本単語検出部が、意味素単語
集合記憶部が記憶する見出し語と意味素単語集合とが再
帰的に参照し合う単語を検出し基本単語として基本単語
記憶部に記憶する。また、請求項5に記載の発明による
と、類義語登録部に換えて、類義語重複検証登録部が、
類義語抽出部が一つの見出し語を複数の基本単語に対応
付けた場合にその主たる一つの基本単語のみに対応づけ
た上で同一の基本単語に対応付けた見出し語集合を各々
類義語として類義語記憶部に登録する。
According to the invention of claim 4, instead of the basic word extraction unit, the basic word detection unit recursively sets the entry word and the semantic word set stored in the semantic word set storage unit. Words that refer to each other are detected and stored as basic words in the basic word storage unit. Further, according to the invention of claim 5, in place of the synonym registration unit, the synonym duplicate verification registration unit is
When the synonym extraction unit associates a headword with a plurality of basic words, the synonym storage unit associates only one of the main basic words and then associates the set of headwords with the same basic word as synonyms. Register with.

【0013】また、請求項6に記載の発明によると、類
義語登録部に換えて、類義語品詞別登録部が類義語抽出
部が同一の基本単語に対応付けた各見出し語集合を同一
品詞ごと分類し各々類義語として類義語記憶部に登録す
る。また、請求項7に記載の発明によると、類義語登録
部に換えて、類義語多重登録部が、類義語抽出部が同一
の一つの基本単語に対応付けた見出し語集合と同一の複
数の基本単語に対応付けた見出し語集合とを区別して各
々類義語として類義語記憶部に登録する。
According to the invention of claim 6, instead of the synonym registration unit, the synonym part-of-speech registration unit classifies each headword set associated with the same basic word by the synonym extraction unit by the same part-of-speech. Each is registered as a synonym in the synonym storage unit. According to the invention of claim 7, instead of the synonym registration unit, the synonym multiple registration unit creates a plurality of basic words that are the same as the headword set associated with the same basic word by the synonym extraction unit. The synonym words are registered in the synonym storage unit separately from the associated headword set.

【0014】[0014]

【実施例】以下、本発明の辞書作成支援装置の第1から
第6までの実施例について図を参照して説明する。 (第1実施例)図1に第1実施例における辞書作成支援
装置の構成を示す。図1において、1は国語辞書部で、
見出し語とその意味説明文とを対応づけて記憶する。こ
の辞書データは特別に加工されたものではなく、見出し
語表記と意味説明文が対応付けられているものであれ
ば、特に形態は問わない。2は意味素単語集合記憶部
で、見出し語とその意味説明文を単語単位に分解した意
味素単語集合とを対応づけて記憶する。意味素単語集合
は、意味説明文を単語単位に分解した自立語集合であ
る。したがって、助詞・助動詞などの付属語は含まれな
い。さらに、自立語でも「する」「こと」のように、意
味説明文において実質的に意味を持たないものや、見出
し語の意味の説明に関連性のないものは除く。3は文章
分解部で、国語辞書部1が記憶する各意味説明文を意味
素単語集合に分解し見出し語と対応付けて意味素単語集
合記憶部2に記憶する。4は基本単語記憶部で、基本単
語を記憶する。5は基本単語抽出部で、意味素単語集合
記憶部2が記憶する意味素単語集合の頻度情報に基づき
基本単語を抽出し基本単語記憶部4に記憶する。この場
合の頻度情報は全ての単語の意味素単語集合におけるも
のである。その頻度情報の高いものから基本単語として
抽出する。一般に国語辞書の意味説明文は、見出し語の
意味を分かり易く解説した文章により構成されている。
そのため、誰にでも広く理解できる単語が使われている
可能性が高い。ここで抽出する基本単語は分かり易い基
本的な単語である。6は類義語記憶部で、類義語を記憶
する。7は類義語抽出部で、意味素単語集合記憶部2が
記憶する各見出し語とその意味素単語集合中に含まれる
基本単語記憶部5が記憶する基本単語とを対応付ける。
8は類義語登録部で、類義語抽出部7が同一の基本単語
に対応付けた見出し語集合を各々類義語として類義語記
憶部6に登録する。意味説明文から抽出した意味素単語
集合中の各単語と見出し語は、当然似た意味を持つ。さ
らに、その中に出現頻度の高い基本単語を含んでいると
いうことは、同じ基本単語を意味素単語集合中に保持す
る見出し語が存在する可能性が高い。したがって、同一
の基本単語をその意味素単語集合中に持つことは、その
意味が似通っている類義語である場合が多い。この国語
辞書の特徴を利用して、本発明は類義語辞書を効率的に
作成する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The first to sixth embodiments of the dictionary creation support apparatus of the present invention will be described below with reference to the drawings. (First Embodiment) FIG. 1 shows the configuration of a dictionary creation support apparatus according to the first embodiment. In FIG. 1, 1 is a national language dictionary section,
The entry word and its meaning explanation are stored in association with each other. The dictionary data is not specially processed, and may have any form as long as the entry word notation and the meaning description are associated with each other. Reference numeral 2 denotes a semantic word set storage unit that stores a headword and a semantic word set obtained by decomposing the meaning explanation sentence into word units in association with each other. The semantic word set is an independent word set obtained by decomposing a meaning explanation into words. Therefore, auxiliary words such as particles and auxiliary verbs are not included. Furthermore, even independent words such as “do” and “koto” that do not have a substantial meaning in the meaning explanation or that are not relevant to the explanation of the meaning of the headword are excluded. Reference numeral 3 denotes a sentence decomposing unit that decomposes each meaning explanation sentence stored in the national language dictionary unit 1 into a semantic word group and stores it in the semantic word group storing unit 2 in association with a headword. A basic word storage unit 4 stores basic words. Reference numeral 5 denotes a basic word extraction unit, which extracts a basic word based on the frequency information of the semantic word set stored in the semantic word set storage unit 2 and stores it in the basic word storage unit 4. The frequency information in this case is in the semantic word set of all words. The words with the highest frequency information are extracted as basic words. Generally, the meaning explanation of a national language dictionary is composed of sentences that explain the meaning of a headword in an easy-to-understand manner.
Therefore, it is highly likely that the words will be widely understood by anyone. The basic words extracted here are basic words that are easy to understand. A synonym storage unit 6 stores synonyms. A synonym extraction unit 7 associates each headword stored in the semantic word set storage unit 2 with a basic word stored in the basic word storage unit 5 included in the semantic word set storage unit.
Reference numeral 8 denotes a synonym registration unit, in which the synonym extraction unit 7 registers the headword sets associated with the same basic word as synonyms in the synonym storage unit 6. Each word and headword in the semantic word set extracted from the semantic explanation have naturally similar meanings. Furthermore, the fact that a basic word with a high frequency of occurrence is included in it means that there is a high possibility that there is a headword that holds the same basic word in the semantic word set. Therefore, having the same basic word in the semantic word set is often a synonym with a similar meaning. The present invention efficiently creates a synonym dictionary by utilizing the features of this national language dictionary.

【0015】次に、以上のように構成された第1実施例
の基本動作について、図2のフローチャートを用いて説
明する。まず、文章分解部3が、国語辞書部1の意味説
明文を意味素単語集合に分解し、見出し語とその意味素
単語集合とを対応付けて、意味素単語集合記憶部2に記
憶する(ステップS1)。次に、基本単語抽出部5が、
意味素単語集合記憶部2における意味素単語集合の頻度
情報に基づき基本単語を抽出し基本単語記憶部4に記憶
する(ステップS2)。次に、類義語抽出部7が、見出
し語とその意味素単語集合中に含まれる基本単語とを対
応付ける(ステップS3)。最後に、類義語登録部8
が、類義語抽出部7が同じ基本単語に対応付けた見出し
語を類義語として類義語辞書部6に登録する(ステップ
S4)。
Next, the basic operation of the first embodiment configured as described above will be described with reference to the flow chart of FIG. First, the sentence disassembling unit 3 decomposes the meaning explanation sentence of the national language dictionary unit 1 into a set of semantic word groups, and associates the headword with the semantic word group thereof and stores them in the semantic word group storage unit 2 ( Step S1). Next, the basic word extraction unit 5
A basic word is extracted based on frequency information of the semantic word set in the semantic word set storage unit 2 and stored in the basic word storage unit 4 (step S2). Next, the synonym extraction unit 7 associates the entry word with the basic word included in the semantic word set (step S3). Finally, the synonym registration unit 8
However, the synonym extraction unit 7 registers the entry word associated with the same basic word as a synonym in the synonym dictionary unit 6 (step S4).

【0016】次に、図3に示すような内容を記憶した国
語辞書部1を例にとって動作を具体的に説明する。ステ
ップS1において文章分解部3は、国語辞書部1の意味
説明文を意味素単語集合に分解し、見出し語とその意味
素単語集合とを対応付けて意味素単語集合記憶部2に記
憶する。その意味素単語集合記憶部2の内容を図4に示
す。次のステップS2では基本単語抽出部5が、基本単
語として「求める」「走る」を抽出し基本単語記憶部4
に記憶する。「走る」「求める」は各々4つの単語の意
味素単語集合中に共通して含まれている。したがって、
国語辞書部1に記憶されている単語の中では、出現頻度
の高い単語であり、これらを基本的な意味を持ちかつ汎
用度の高い基本単語として抽出する。この際、用言はそ
の終止形が同一であれば同一単語として頻度を算定する
ものとする。例えば、「要望」の意味素単語集合が含む
「求め」は「求める」として数え上げられる。
Next, the operation will be specifically described by taking the national language dictionary unit 1 storing the contents as shown in FIG. 3 as an example. In step S1, the sentence decomposing unit 3 decomposes the meaning explanation sentence of the national language dictionary unit 1 into a set of semantic word groups, and stores the headword and the semantic word group thereof in the semantic word group storage unit 2 in association with each other. The contents of the semantic word set storage unit 2 are shown in FIG. In the next step S2, the basic word extraction unit 5 extracts “calculate” and “run” as basic words, and the basic word storage unit 4
Remember. “Run” and “seek” are commonly included in the semantic word set of four words. Therefore,
Among the words stored in the Japanese dictionary unit 1, the words that appear frequently are extracted, and these are extracted as basic words that have a basic meaning and are highly versatile. At this time, if the end forms are the same, the frequency is calculated as the same word. For example, the “request” included in the semantic word set of “request” is counted as “request”.

【0017】次のステップS3では類義語抽出部7が、
見出し語とその意味素単語集合中に含まれる基本単語と
を対応付ける。そして、ステップS4において類義語登
録部8は、類義語抽出部7が同じ基本単語「求める」
「書く」に対応付けた見出し語を類義語として類義語辞
書部6に登録する。その類義語記憶部6の内容を図5に
示す。
In the next step S3, the synonym extraction unit 7
Correspond the headword and the basic word included in the semantic word set. Then, in step S4, the synonym registration unit 8 causes the synonym extraction unit 7 to have the same basic word “calculate”.
The headword associated with "writing" is registered in the synonym dictionary unit 6 as a synonym. The contents of the synonym storage unit 6 are shown in FIG.

【0018】なお、この実施例の基本単語抽出部5で
は、意味素単語集合記憶部2に記憶されている意味素単
語集合の頻度情報を用いて基本単語を抽出したが、頻度
情報以外の正規分布情報、偏差値情報などの統計情報を
用いてもよい。 (第2実施例)次に、本発明の第2実施例における辞書
作成支援装置について説明する。この実施例の構成を示
す図6において、上記第1実施例と同様の機能を有する
構成要素については同一の参照番号を付して説明を省略
する。11は基本単語辞書部であり、予め基本的な意味
を持ちかつ汎用度の高い基本単語を記憶している。
In the basic word extraction unit 5 of this embodiment, the basic words are extracted using the frequency information of the semantic word set stored in the semantic word set storage unit 2, but the normal words other than the frequency information are extracted. Statistical information such as distribution information and deviation value information may be used. (Second Embodiment) Next, a dictionary creation support device according to a second embodiment of the present invention will be described. In FIG. 6 showing the configuration of this embodiment, the constituent elements having the same functions as those of the first embodiment are designated by the same reference numerals and the description thereof will be omitted. Reference numeral 11 denotes a basic word dictionary unit, which stores in advance basic words having a basic meaning and high versatility.

【0019】以上のように構成された第2実施例の基本
動作について、図7のフローチャートを用いて説明す
る。図7において上記第1実施例と同様のステップのも
のは、第1実施例と同一のステップ番号を付している。
まず、文章分解部3が、国語辞書部1の意味説明文を意
味素単語集合に分解し、見出し語とその意味素単語集合
とを対応付けて、意味素単語集合記憶部2に記憶する
(ステップS1)。次に、類義語抽出部7が、意味素単
語集合記憶部2が記憶する各見出し語とその意味素単語
集合中に含まれる基本単語辞書部11が記憶する基本単
語とを対応付ける(ステップS11)。基本単語辞書部
11は、例えば、「求める」「要求」「走る」などの基
本的な意味を持ちかつ汎用度の高い基本単語を記憶して
いる。最後に、類義語登録部8が、類義語抽出部7が同
じ基本単語に対応付けた見出し語を類義語として類義語
辞書部6に登録する(ステップS4)。
The basic operation of the second embodiment configured as described above will be described with reference to the flowchart of FIG. In FIG. 7, the same steps as those in the first embodiment have the same step numbers as those in the first embodiment.
First, the sentence disassembling unit 3 decomposes the meaning explanation sentence of the national language dictionary unit 1 into a set of semantic word groups, and associates the headword with the semantic word group thereof and stores them in the semantic word group storage unit 2 ( Step S1). Next, the synonym extraction unit 7 associates each headword stored in the semantic word set storage unit 2 with the basic word stored in the basic word dictionary unit 11 included in the semantic word set (step S11). The basic word dictionary unit 11 stores basic words that have basic meanings such as “ask”, “request”, and “run” and have high versatility. Finally, the synonym registration unit 8 registers the entry word associated with the same basic word by the synonym extraction unit 7 as a synonym in the synonym dictionary unit 6 (step S4).

【0020】(第3実施例)次に、本発明の第3実施例
における辞書作成支援装置について説明する。この実施
例の構成を示す図8において、上記第1実施例と同様の
機能を有する構成要素については同一の参照番号を付し
て説明を省略する。21は基本単語検出部であり、意味
素単語集合記憶部2が記憶する見出し語と意味素単語集
合とが再帰的に参照し合う単語を検出し基本単語として
基本単語記憶部4に記憶する。汎用的な国語辞書を用い
ると、意味素単語集合記憶部2が記憶する各意味素単語
も見出し語として存在し、その単語もまた意味素単語集
合に展開できる。国語辞書の意味説明文は見出し語をよ
り分かり易い単語を用いて説明するという特徴を持つた
め、意味素単語集合へ繰り返し展開すると、より分かり
易い単語へと推移すると考えられる。しかし、見出し語
が既に十分に分かり易い単語であると、同じ単語が再帰
的に展開される場合がある。したがって、このように意
味素単語集合への展開で再帰的に用いられ、見出し語と
意味素単語集合とが再帰的な参照関係を保持する単語
は、頻度が高く分かり易い基本単語である場合が多い。
この特徴を利用して、基本単語検出部21は基本単語を
抽出する。
(Third Embodiment) Next, a dictionary creation support device according to a third embodiment of the present invention will be described. In FIG. 8 showing the configuration of this embodiment, the constituent elements having the same functions as those of the first embodiment are designated by the same reference numerals and the description thereof will be omitted. Reference numeral 21 denotes a basic word detection unit, which detects a word in which the entry word stored in the semantic word set storage unit 2 and the semantic word set recursively refer to each other and stores it as a basic word in the basic word storage unit 4. If a general-purpose Japanese dictionary is used, each meaning word stored in the meaning word set storage unit 2 also exists as a headword, and that word can also be expanded into a meaning word set. Since the meaning explanation in the Japanese dictionary has the feature that the headword is explained by using the words that are easier to understand, it is considered that when it is repeatedly expanded to the set of semantic word, the words become easier to understand. However, if the entry word is already a sufficiently easy-to-understand word, the same word may be expanded recursively. Therefore, a word that is used recursively in the expansion into a semantic word set and has a recursive reference relationship between a headword and a semantic word set may be a basic word that is frequently and easily understood. Many.
Using this feature, the basic word detecting unit 21 extracts a basic word.

【0021】以上のように構成された第3実施例の基本
動作について、図9のフローチャートを用いて説明す
る。図9において上記第1実施例と同様のステップのも
のは、第1実施例と同一のステップ番号を付している。
まず、文章分解部3が、国語辞書部1の意味説明文を意
味素単語集合に分解し、見出し語とその意味素単語集合
とを対応付けて、意味素単語集合記憶部2に記憶する
(ステップS1)。次に、基本単語検出部21が意味素
単語集合記憶部2が記憶する見出し語と意味素単語集合
とが再帰的に参照し合う単語を検出し基本単語として基
本単語記憶部4に記憶する(ステップS21)。例え
ば、図10に示す意味素単語集合記憶部2の内容から
は、「求める」「要求」が基本単語として検出される。
次に、類義語抽出部7が、見出し語とその意味素単語集
合中に含まれる基本単語とを対応付ける(ステップS
3)。最後に、類義語登録部8が、類義語抽出部7が同
じ基本単語に対応付けた見出し語を類義語として類義語
辞書部6に登録する(ステップS4)。
The basic operation of the third embodiment configured as described above will be described with reference to the flowchart of FIG. In FIG. 9, steps having the same steps as those in the first embodiment have the same step numbers as those in the first embodiment.
First, the sentence disassembling unit 3 decomposes the meaning explanation sentence of the national language dictionary unit 1 into a set of semantic word groups, and associates the headword with the semantic word group thereof and stores them in the semantic word group storage unit 2 ( Step S1). Next, the basic word detection unit 21 detects a word in which the headword stored in the semantic word set storage unit 2 and the semantic word set recursively refer to each other, and stores the word as a basic word in the basic word storage unit 4 ( Step S21). For example, from the contents of the semantic word set storage unit 2 shown in FIG. 10, “request” and “request” are detected as basic words.
Next, the synonym extraction unit 7 associates the headword with the basic word included in the semantic word set (step S
3). Finally, the synonym registration unit 8 registers the entry word associated with the same basic word by the synonym extraction unit 7 as a synonym in the synonym dictionary unit 6 (step S4).

【0022】(第4実施例)次に、本発明の第4実施例
における辞書作成支援装置について説明する。図11は
第4実施例における辞書作成支援装置の構成図を示すも
のである。図11において、第1実施例と同様の機能を
有する構成要素については第1実施例と同一の参照番号
を付して説明を省略する。31は類義語重複検証登録部
で、類義語抽出部7が一つの見出し語を複数の基本単語
に対応付けた場合にその主たる一つの基本単語のみに対
応づけた上で同一の基本単語に対応付けた見出し語集合
を各々類義語として類義語記憶部6に登録する。意味素
単語集合中に複数の基本単語を含む場合がある。この場
合、その見出し語の意味を表す主たる単語のみに対応付
けて類義語記憶部6に記憶する。主たる単語は、意味素
単語集合に含まれる基本単語中で見出し語の意味に最も
関連深い単語である。例えば、「代筆」に対応する基本
単語としては「代わる」「書く」の2つ考えられるが、
「本人に代わって、書くこと」という意味により密接に
関連しているのは、「書く」である。そのため、類義語
重複検証登録部31は、「代筆」に対しては「書く」の
みを基本単語として対応付ける。概ね、意味説明文中で
より後方で使われている用言が、主たる基本単語になる
可能性が高い。特に、「代筆」の「書く」のように、文
末の「こと」に連接する連体形の用言になる場合が多
い。
(Fourth Embodiment) Next, a dictionary creation support device according to a fourth embodiment of the present invention will be described. FIG. 11 is a block diagram of the dictionary creation support device in the fourth embodiment. In FIG. 11, constituent elements having the same functions as those in the first embodiment are designated by the same reference numerals as those in the first embodiment, and the description thereof will be omitted. Reference numeral 31 is a synonym duplication verification registration unit which, when the synonym extraction unit 7 associates one headword with a plurality of basic words, associates it with only one main basic word and then associates it with the same basic word. Each entry word set is registered as a synonym in the synonym storage unit 6. In some cases, a plurality of basic words are included in the semantic word set. In this case, it is stored in the synonym storage unit 6 in association with only the main word representing the meaning of the headword. The main word is a word that is most closely related to the meaning of the headword among the basic words included in the semantic word set. For example, there are two possible basic words that correspond to "description", "alternate" and "writing."
More closely related to the meaning of "writing on behalf of the person" is "writing." Therefore, the synonym duplication verification registration unit 31 associates only “writing” with “description” as a basic word. In general, the denotation used later in the meaning explanation is likely to be the main basic word. In particular, it is often the case of the adjunct form, which is connected to the “thing” at the end of the sentence, such as “writing” in “description”.

【0023】以上のように構成された本発明の第4実施
例の基本動作について、図12のフローチャートを用い
て、以下に説明する。図12において第1実施例と同様
のステップのものは同一のステップ番号を付している。
まず、ステップS1、S2、S3と順次動作するが、第
1実施例と同一であるため、説明を省略する。その後、
類義語抽出部7が一つの見出し語を複数の基本単語に対
応付けた場合に、類義語重複検証登録部31がその主た
る一つの基本単語のみに対応づけた上で同一の基本単語
に対応付けた見出し語集合を各々類義語として類義語記
憶部6に登録する(ステップS31)。即ち、複数の基
本単語に対応付けられているかどうかを判定し、複数の
基本単語に対応付けられていない場合はそのまま登録
し、複数の基本単語に対応付けられている場合は主たる
基本単語のみに対応付けて登録する。例えば、図13に
示す複数の基本単語を意味素単語集合中に含む場合、図
14に示すような対応付けを行なう。図13に示す見出
し語は、各々2つの基本単語を意味素単語集合中に持
つ。いずれも文末の「こと」に連接する連体形の用言
が、主たる基本単語として対応付けられている。
The basic operation of the fourth embodiment of the present invention configured as above will be described below with reference to the flowchart of FIG. In FIG. 12, the same steps as those in the first embodiment have the same step numbers.
First, the operation is sequentially performed in steps S1, S2, and S3, but since it is the same as that of the first embodiment, the description thereof will be omitted. afterwards,
When the synonym extraction unit 7 associates one headword with a plurality of basic words, the synonym duplication verification registration unit 31 associates only one of the main basic words and then associates with the same basic word. The word sets are registered as synonyms in the synonym storage unit 6 (step S31). That is, it is determined whether or not it is associated with a plurality of basic words, if it is not associated with a plurality of basic words, it is registered as it is, if it is associated with a plurality of basic words, only the main basic word Correspond and register. For example, when a plurality of basic words shown in FIG. 13 are included in a set of semantic word, the correspondence shown in FIG. 14 is performed. The headwords shown in FIG. 13 each have two basic words in the set of semantic word. In each case, a noun in the adjunct form that is connected to the word “koto” at the end of the sentence is associated as the main basic word.

【0024】(第5実施例)次に、本発明の第5実施例
における辞書作成支援装置について説明する。図15は
第5実施例における辞書作成支援装置の構成図を示すも
のである。図15において第1実施例と同様の機能を有
する構成要素については第1実施例と同一の参照番号を
付して説明を省略する。41は類義語品詞別登録部で、
類義語抽出部7が同一の基本単語に対応付けた各見出し
語集合を同一品詞ごとに分類し各々類義語として類義語
記憶部6に登録する。
(Fifth Embodiment) Next, a dictionary creation support device according to a fifth embodiment of the present invention will be described. FIG. 15 shows a block diagram of the dictionary creation support device in the fifth embodiment. In FIG. 15, the components having the same functions as those in the first embodiment are designated by the same reference numerals as those in the first embodiment and the description thereof will be omitted. 41 is a synonym part-of-speech registration unit,
The synonym extraction unit 7 classifies each headword set associated with the same basic word for each same part-of-speech, and registers each synonym in the synonym storage unit 6.

【0025】以上のように構成された本発明の第5実施
例の基本動作について、図16のフローチャートを用い
て、以下に説明する。図16において第1実施例と同様
のステップのものは、第1実施例と同一のステップ番号
を付している。まず、ステップS1、S2、S3と順次
動作するが、第1実施例と同一であるため、説明を省略
する。その後、類義語抽出部7が同一の基本単語に対応
付けた各見出し語集合を、類義語品詞別登録部41が、
同一品詞ごとに分類し各々類義語として類義語記憶部6
に登録する(ステップS41)。例えば、図17に示す
複数の基本単語を意味素単語集合中に含む場合、図18
に示すような対応付けを行なう。この時、『請求』、
『要求』などのサ変名詞は動詞および名詞の両方の品詞
として用いられるので、両方に登録する。
The basic operation of the fifth embodiment of the present invention configured as above will be described below with reference to the flowchart of FIG. In FIG. 16, the same steps as those in the first embodiment have the same step numbers as those in the first embodiment. First, the operation is sequentially performed in steps S1, S2, and S3, but since it is the same as that of the first embodiment, the description thereof will be omitted. After that, the synonym extraction unit 7 associates each headword set associated with the same basic word with the synonym part-of-speech registration unit 41,
The synonym storage unit 6 is classified according to the same part-of-speech and is used as each synonym.
(Step S41). For example, in the case where a plurality of basic words shown in FIG.
Correspondence as shown in FIG. At this time, "billing",
Sahen nouns such as "request" are used as part of speech for both verbs and nouns, so both are registered.

【0026】(第6実施例)次に、本発明の第6実施例
における辞書作成支援装置について説明する。図19は
第6実施例における辞書作成支援装置の構成図を示すも
のである。図19において第1実施例と同様の機能を有
する構成要素については第1実施例と同一の参照番号を
付して説明を省略する。51は類義語多重登録部で、類
義語抽出部7が同一の一つの基本単語に対応付けた見出
し語集合と同一の複数の基本単語に対応付けた見出し語
集合とを区別して各々類義語として類義語記憶部6に登
録する。複数の基本単語を一つの基本意味素単語と考え
れば、その意味素単語に対しても類義語が存在する。そ
れを区別して記憶することにより、精度の高い類義語辞
書を作成することができる。
(Sixth Embodiment) Next, a dictionary creation support device according to a sixth embodiment of the present invention will be described. FIG. 19 shows a block diagram of the dictionary creation support device in the sixth embodiment. In FIG. 19, components having the same functions as those in the first embodiment are designated by the same reference numerals as those in the first embodiment, and the description thereof will be omitted. Reference numeral 51 denotes a synonym multiple registration unit, which distinguishes the headword set associated with the same basic word by the synonym extraction unit 7 from the headword set associated with the same plurality of basic words, and stores the synonym as a synonym storage unit. Register at 6. Considering a plurality of basic words as one basic semantic word, there are synonyms for the basic word. By storing them separately, it is possible to create a highly accurate synonym dictionary.

【0027】以上のように構成された本発明の第6実施
例の基本動作について、図20のフローチャートを用い
て、以下に説明する。図20において第1実施例と同様
のステップのものは、第1実施例と同一のステップ番号
を付している。まず、ステップS1、S2、S3と順次
動作するが、第1実施例と同一であるため、説明を省略
する。その後、類義語多重登録部51が、類義語抽出部
7が同一の一つの基本単語に対応付けた見出し語集合と
同一の複数の基本単語に対応付けた見出し語集合とを区
別して各々類義語として類義語記憶部6に登録する(ス
テップS51)。例えば、図21に示すような見出し語
と基本単語集合とを類義語抽出部7が対応づけた場合、
類義語多重登録部は図22のように類義語記憶部6に登
録する。図21に示す11個の見出し語は全て基本単語
「走る」をその意味素単語集合中に含んでいる。さら
に、そのうち5つの単語には「速く」を含んでいる。こ
の場合、「速く」「走る」を一つの意味素単語と考える
と、図22に示すように、2種類の類義語が生成され
る。
The basic operation of the sixth embodiment of the present invention configured as described above will be described below with reference to the flowchart of FIG. In FIG. 20, the same steps as those in the first embodiment are designated by the same step numbers as those in the first embodiment. First, the operation is sequentially performed in steps S1, S2, and S3, but since it is the same as that of the first embodiment, the description thereof will be omitted. After that, the synonym multiple registration unit 51 distinguishes between a set of headwords associated with the same basic word by the synonym extraction unit 7 and a set of headwords associated with the same plurality of basic words, and stores each synonym as a synonym. It is registered in the section 6 (step S51). For example, when the synonym extraction unit 7 associates an entry word and a basic word set as shown in FIG.
The synonym multiple registration unit registers in the synonym storage unit 6 as shown in FIG. The 11 headwords shown in FIG. 21 all include the basic word "run" in their semantic word set. In addition, five of these words include "fast". In this case, if "fast" and "run" are considered as one semantic word, two types of synonyms are generated as shown in FIG.

【0028】[0028]

【発明の効果】以上の説明から明らかなように、請求項
1に記載の発明によると、国語辞書部の各意味説明文を
意味素単語集合に分解し見出し語と対応付けて記憶し、
その意味素単語の統計情報に基づき基本単語を抽出して
記憶し、各見出し語とその意味素単語集合中に含まれる
基本単語とを対応付け、それらを同一の基本単語に対応
付けた見出し語集合に分類して各々類義語として登録す
るので、汎用的な国語辞書を用いて類義語データを効果
的に抽出し入力することができる。したがって、大量の
単語データを収集した上でそれらを類義語グループに分
類し登録するという従来技術に比べて、より効率的に類
義語辞書を作成することができ、その実用的効果は大き
い。。
As is apparent from the above description, according to the invention described in claim 1, each meaning explanation sentence in the Japanese dictionary is decomposed into a set of semantic word and stored in association with a headword,
A basic word is extracted and stored based on the statistical information of the semantic word, and each headword is associated with a basic word included in the set of semantic word, and the headword is associated with the same basic word. Since they are classified into sets and registered as synonyms, the synonym data can be effectively extracted and input using a general-purpose Japanese language dictionary. Therefore, a synonym dictionary can be created more efficiently, and its practical effect is large, as compared with the conventional technique in which a large amount of word data is collected and then classified and registered in a synonym group. .

【0029】また、請求項2に記載の発明によると、基
本単語を抽出するのにその頻度情報に基づいているので
効率的に抽出することができる。又、請求項3に記載の
発明によると基本単語辞書を用いることにより、基本単
語の抽出動作が不要であり、構成及び動作が簡単にな
る。また、請求項4に記載の発明によると、意味素単語
集合記憶部に記憶されている見出し語と意味素単語集合
とが再帰的に参照し合う単語を基本単語として抽出する
ことにより、より簡単に基本単語を抽出することができ
る。
Further, according to the invention described in claim 2, since the basic word is extracted based on the frequency information, it can be efficiently extracted. Further, according to the invention as set forth in claim 3, by using the basic word dictionary, the operation of extracting the basic word is unnecessary, and the configuration and the operation are simplified. Further, according to the invention described in claim 4, it is simpler by extracting as a basic word a word in which the entry word stored in the semantic word set storage unit and the semantic word set recursively refer to each other. Basic words can be extracted in.

【0030】また、請求項5に記載の発明によると、類
義語抽出部が一つの見出し語を複数の基本単語に対応付
けた場合にその主たる一つの基本単語のみに対応づけた
上で同一の基本単語に対応付けた見出し語集合を各々類
義語として類義語記憶部に登録するので、類義性の低い
単語を類義語として登録するのを避けることができる。
また、請求項6に記載の発明によると、類義語を同一品
詞ごと分類して登録するので利用価値が高くなる。ま
た、請求項7に記載の発明によると、類義語抽出部が同
一の一つの基本単語に対応付けた見出し語集合と同一の
複数の基本単語に対応付けた見出し語集合とを区別して
各々類義語として登録するので、複数の基本単語を共有
する類義語の検索が可能となり、精細に類義語を検出で
きて利用効率が向上する。
According to the fifth aspect of the invention, when the synonym extraction unit associates one headword with a plurality of basic words, it associates only one main basic word with the same basic word. Since the headword set associated with each word is registered as a synonym in the synonym storage unit, it is possible to avoid registering a word having a low synonym as a synonym.
Further, according to the invention described in claim 6, since the synonyms are classified by the same part of speech and registered, the utility value is increased. Further, according to the invention described in claim 7, the synonym extraction unit distinguishes between a set of headwords associated with the same basic word and a set of headwords associated with the same plurality of basic words as synonyms. Since the registration is performed, it becomes possible to search for synonyms that share a plurality of basic words, the synonyms can be detected finely, and usage efficiency is improved.

【0031】又、請求項8〜14に記載の発明方法にお
いても、上記請求項1〜7に記載の発明に対応する効果
を奏する。
Further, the invention methods described in claims 8 to 14 also have the effects corresponding to the inventions described in claims 1 to 7.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1実施例における辞書作成支援装置
の構成図である。
FIG. 1 is a configuration diagram of a dictionary creation support device according to a first embodiment of the present invention.

【図2】本発明の第1実施例における辞書作成支援動作
のフローチャートである。
FIG. 2 is a flowchart of a dictionary creation support operation in the first embodiment of the present invention.

【図3】本発明の第1実施例における国語辞書部の内容
の説明図である。
FIG. 3 is an explanatory diagram of contents of a national language dictionary unit according to the first embodiment of this invention.

【図4】本発明の第1実施例における意味素単語集合記
憶部の内容の説明図である。
FIG. 4 is an explanatory diagram of contents of a semantic word set storage unit in the first exemplary embodiment of the present invention.

【図5】本発明の第1実施例における類義語記憶部の内
容の説明図である。
FIG. 5 is an explanatory diagram of contents of a synonym storage unit according to the first embodiment of this invention.

【図6】本発明の第2実施例における辞書作成支援装置
の構成図である。
FIG. 6 is a configuration diagram of a dictionary creation support device according to a second embodiment of the present invention.

【図7】本発明の第2実施例における辞書作成支援動作
のフローチャートである。
FIG. 7 is a flowchart of a dictionary creation support operation in the second embodiment of the present invention.

【図8】本発明の第3実施例における辞書作成支援装置
の構成図である。
FIG. 8 is a configuration diagram of a dictionary creation support device according to a third embodiment of the present invention.

【図9】本発明の第3実施例における辞書作成支援動作
のフローチャートである。
FIG. 9 is a flowchart of a dictionary creation support operation in the third embodiment of the present invention.

【図10】本発明の第3実施例における意味素単語集合
記憶部の内容の説明図である。
FIG. 10 is an explanatory diagram of contents of a semantic word set storage unit according to the third exemplary embodiment of the present invention.

【図11】本発明の第4実施例における辞書作成支援装
置の構成図である。
FIG. 11 is a configuration diagram of a dictionary creation support device according to a fourth embodiment of the present invention.

【図12】本発明の第4実施例における辞書作成支援動
作のフローチャートである。
FIG. 12 is a flow chart of a dictionary creation support operation in the fourth embodiment of the present invention.

【図13】本発明の第4実施例における意味素単語集合
記憶部の内容の説明図である。
FIG. 13 is an explanatory diagram of contents of a semantic word set storage unit according to the fourth exemplary embodiment of the present invention.

【図14】本発明の第4実施例における類義語の説明図
である。
FIG. 14 is an explanatory diagram of synonyms in the fourth embodiment of the present invention.

【図15】本発明の第5実施例における辞書作成支援装
置の構成図である。
FIG. 15 is a configuration diagram of a dictionary creation support device in a fifth embodiment of the present invention.

【図16】本発明の第5実施例における辞書作成支援動
作のフローチャートである。
FIG. 16 is a flow chart of a dictionary creation support operation in the fifth embodiment of the present invention.

【図17】本発明の第5実施例における意味素単語集合
記憶部の内容の説明図である。
FIG. 17 is an explanatory diagram of contents of a semantic word set storage unit according to the fifth exemplary embodiment of the present invention.

【図18】本発明の第5実施例における類義語記憶部の
内容の説明図である。
FIG. 18 is an explanatory diagram of contents of a synonym storage unit in the fifth example of the present invention.

【図19】本発明の第6実施例における辞書作成支援装
置の構成図である。
FIG. 19 is a configuration diagram of a dictionary creation support device according to a sixth embodiment of the present invention.

【図20】本発明の第6実施例における辞書作成支援動
作のフローチャートである。
FIG. 20 is a flow chart of a dictionary creation support operation in the sixth embodiment of the present invention.

【図21】本発明の第6実施例における意味素単語集合
記憶部の内容の説明図である。
FIG. 21 is an explanatory diagram of contents of a semantic word set storage unit according to the sixth exemplary embodiment of the present invention.

【図22】本発明の第6実施例における類義語記憶部の
内容の説明図である。
FIG. 22 is an explanatory diagram of contents of a synonym storage unit in the sixth example of the present invention.

【符合の説明】[Explanation of sign]

1 国語辞書部 2 意味素単語集合記憶部 3 文章分解部 4 基本単語記憶部 5 基本単語抽出部 6 類義語記憶部 7 類義語抽出部 8 類義語登録部 11 基本単語辞書部 21 基本単語検出部 31 類義語重複検証登録部 41 類義語品詞別登録部 51 類義語多重登録部 1 Japanese dictionary unit 2 Semantic word set storage unit 3 Text decomposition unit 4 Basic word storage unit 5 Basic word extraction unit 6 Synonym storage unit 7 Synonym extraction unit 8 Synonym registration unit 11 Basic word dictionary unit 21 Basic word detection unit 31 Synonym duplication 31 Verification registration unit 41 Synonym part-of-speech registration unit 51 Synonym multiple registration unit

Claims (14)

【特許請求の範囲】[Claims] 【請求項1】 見出し語とその意味説明文とを対応づけ
て記憶する国語辞書部と、見出し語とその意味説明文を
単語単位に分解した意味素単語集合とを対応づけて記憶
する意味素単語集合記憶部と、国語辞書部が記憶する各
意味説明文を意味素単語集合に分解し見出し語と対応付
けて意味素単語集合記憶部に記憶する文章分解部と、基
本単語を記憶する基本単語記憶部と、意味素単語集合記
憶部が記憶する意味素単語集合の統計情報に基づき基本
的な意味を持ちかつ汎用度の高い基本単語を抽出し基本
単語記憶部に記憶する基本単語摘出部と、類義語を記憶
する類義語記憶部と、意味素単語集合記憶部が記憶する
各見出し語とその意味素単語集合中に含まれる基本単語
記憶部が記憶する基本単語とを対応付ける類義語抽出部
と、類義語抽出部が同一の基本単語に対応付けた見出し
語集合を各々類義語として類義語記憶部に登録する類義
語登録部とを備えたことを特徴とする辞書作成支援装
置。
1. A language dictionary unit that stores an entry word and its meaning explanation sentence in association with each other, and a semantic element that associates and stores an entry word and a semantic word set that decomposes the meaning explanation sentence into word units. A word set storage unit, a sentence decomposition unit that decomposes each meaning description stored in the Japanese dictionary unit into a semantic word set, associates it with a headword, and stores it in the semantic word set storage unit, and a basic unit that stores basic words A basic word extracting unit that extracts a basic word having a basic meaning and a high versatility based on the statistical information of the semantic word set stored in the word storage unit and the semantic word set storage unit and stores it in the basic word storage unit. A synonym storage unit that stores synonyms, a synonym extraction unit that associates each headword stored in the semantic word set storage unit with the basic word stored in the basic word storage unit included in the semantic word set, The synonym extraction unit A dictionary creation support device, comprising: a synonym registration unit for registering a set of headwords associated with the same basic word as synonyms in a synonym storage unit.
【請求項2】 基本単語摘出部を、意味素単語集合記憶
部が記憶する意味素単語集合の頻度情報に基づき基本的
な意味を持ちかつ汎用度の高い基本単語を抽出し基本単
語記憶部に記憶する基本単語抽出部に置き換えたことを
特徴とする請求項1記載の辞書作成支援装置。
2. A basic word extracting unit extracts a basic word having a basic meaning and a high versatility based on frequency information of a semantic word set stored in a semantic word set storage unit, and stores it in the basic word storage unit. The dictionary creation support device according to claim 1, wherein the dictionary creation support device is replaced with a basic word extraction unit to be stored.
【請求項3】 基本単語記憶部と基本単語摘出部とを、
基本的な意味を持ちかつ汎用度の高い基本単語を記憶す
る基本単語辞書部に置き換え、類義語抽出部においては
意味素単語集合記憶部が記憶する各見出し語とその意味
素単語集合中に含まれる基本単語辞書部が記憶する基本
単語とを対応付けるようにしたことを特徴とする請求項
1記載の辞書作成支援装置。
3. A basic word storage unit and a basic word extraction unit,
Replaced with a basic word dictionary that stores basic words that have a basic meaning and a high degree of versatility, and are included in each headword and its semantic word set stored in the semantic word set storage unit in the synonym extraction unit. 2. The dictionary creation support device according to claim 1, wherein the basic word dictionary unit associates the basic words with each other.
【請求項4】 基本単語摘出部を、意味素単語集合記憶
部が記憶する見出し語と意味素単語集合とが再帰的に参
照し合う単語を検出し基本単語として基本単語記憶部に
記憶する基本単語検出部に置き換えたことを特徴とする
請求項1記載の辞書作成支援装置。
4. A basic word extracting unit detects a word in which an entry word stored in a semantic word set storage unit and a semantic word set recursively refer to each other, and stores the word as a basic word in the basic word storage unit. The dictionary creation support device according to claim 1, wherein the dictionary creation support device is replaced with a word detection unit.
【請求項5】 類義語登録部を、類義語抽出部が一つの
見出し語を複数の基本単語に対応付けた場合にその主た
る一つの基本単語のみに対応づけた上で同一の基本単語
に対応付けた見出し語集合を各々類義語として類義語記
憶部に登録する類義語重複検証登録部に置き換えたこと
を特徴とする請求項1、2、3又は4記載の辞書作成支
援装置。
5. The synonym registration unit associates one headword with one basic word only when the synonym extraction unit associates one headword with a plurality of basic words, and then associates the synonym registration unit with the same basic word. 5. The dictionary creation support device according to claim 1, 2, 3 or 4, wherein the entry word set is replaced with a synonym duplicate verification registration unit that registers each synonym as a synonym in the synonym storage unit.
【請求項6】 類義語登録部を、類義語抽出部が同一の
基本単語に対応付けた各見出し語集合を同一品詞ごとに
分類し各々類義語として類義語記憶部に登録する類義語
品詞別登録部に置き換えたことを特徴とする請求項1、
2、3又は4記載の辞書作成支援装置。
6. The synonym registration unit is replaced with a synonym part-by-speech registration unit that classifies each headword set associated with the same basic word by the synonym extraction unit into the same synonym and registers each synonym in the synonym storage unit. Claim 1 characterized in that
The dictionary creation support device described in 2, 3, or 4.
【請求項7】 類義語登録部を、類義語抽出部が同一の
一つの基本単語に対応付けた見出し語集合と同一の複数
の基本単語に対応付けた見出し語集合とを区別して各々
類義語として類義語記憶部に登録する類義語多重登録部
に置き換えたことを特徴とする請求項1、2、3又は4
記載の辞書作成支援装置。
7. The synonym registration unit distinguishes between a set of headwords associated with one basic word having the same synonym extraction unit and a set of headwords associated with the same plurality of basic words, and stores each synonym as a synonym. 5. A synonym multiple registration unit registered in the department is replaced.
The dictionary creation support device described.
【請求項8】 見出し語とその意味説明文とを対応づけ
て記憶している国語辞書部における各意味説明文を意味
素単語集合に分解し見出し語と対応付けて意味素単語集
合記憶部に記憶する文章分解ステップと、意味素単語集
合記憶部が記憶する意味素単語集合の統計情報に基づき
基本的な意味を持ちかつ汎用度の高い基本単語を抽出し
て基本単語記憶部に記憶する基本単語摘出ステップと、
意味素単語集合記憶部が記憶する各見出し語とその意味
素単語集合中に含まれる基本単語とを対応付ける類義語
抽出ステップと、類義語抽出ステップが同一の基本単語
に対応付けた見出し語集合を各々類義語として類義語記
憶部に登録する類義語登録ステップとを備えたことを特
徴とする辞書作成支援方法。
8. A semantic word set in a national language dictionary section storing headwords and their meaning explanations in association with each other is decomposed into semantic word sets and associated with headwords in a semantic word set storage section. Based on the sentence decomposition step to be stored and the statistical information of the semantic word set stored in the semantic word set storage section, a basic word having a basic meaning and having high versatility is extracted and stored in the basic word storage section. A word extraction step,
A synonym extraction step of associating each headword stored in the semantic word set storage unit with a basic word included in the semantic word set, and a synonym extraction step in which the synonym extraction step is associated with the same basic word. And a synonym registration step of registering the synonym as a synonym storage unit.
【請求項9】 基本単語摘出ステップを、意味素単語集
合記憶部が記憶している意味素単語集合の頻度情報に基
づき基本的な意味を持ちかつ汎用度の高い基本単語を抽
出し基本単語記憶部に記憶する基本単語抽出ステップに
置き換えることを特徴とする請求項8記載の辞書作成支
援方法。
9. The basic word extracting step extracts a basic word having a basic meaning and high versatility based on frequency information of the semantic word set stored in the semantic word set storage unit, and stores the basic word. 9. The dictionary creation support method according to claim 8, which is replaced with a basic word extraction step stored in the section.
【請求項10】 基本的な意味を持ちかつ汎用度の高い
基本単語を記憶する基本単語辞書部を用いて基本単語摘
出ステップを省略し、類義語抽出ステップにおいては意
味素単語集合記憶部が記憶する各見出し語とその意味素
単語集合中に含まれる基本単語辞書部が記憶する基本単
語とを対応付けることを特徴とする請求項8記載の辞書
作成支援方法。
10. A basic word dictionary unit that stores a basic word having a basic meaning and a high degree of versatility is used, and the basic word extraction step is omitted, and the synonym word set storage unit stores the basic word extraction step. 9. The dictionary creation support method according to claim 8, wherein each headword is associated with a basic word stored in the basic word dictionary unit included in the set of meaning words.
【請求項11】 基本単語摘出ステップを、意味素単語
集合記憶部が記憶する見出し語と意味素単語集合とが再
帰的に参照し合う単語を検出し基本単語として基本単語
記憶部に記憶する基本単語検出ステップに置き換えるこ
とを特徴とする請求項8記載の辞書作成支援方法。
11. A basic word extracting step detects a word in which a headword stored in a semantic word set storage unit and a semantic word set recursively refer to each other, and stores the word as a basic word in the basic word storage unit. 9. The dictionary creation support method according to claim 8, which is replaced with a word detection step.
【請求項12】 類義語登録ステップを、類義語抽出ス
テップが一つの見出し語を複数の基本単語に対応付けた
場合にその主たる一つの基本単語のみに対応づけた上で
同一の基本単語に対応付けた見出し語集合を各々類義語
として類義語記憶部に登録する類義語重複検証登録ステ
ップに置き換えることを特徴とする請求項8、9、10
又は11記載の辞書作成支援方法。
12. The synonym registration step is such that when the synonym extraction step associates one headword with a plurality of basic words, it associates only one main basic word with the same basic word. 11. The synonym duplication verification registration step of registering each set of headwords as synonyms in the synonym storage unit.
Alternatively, the dictionary creation support method described in 11.
【請求項13】 類義語登録ステップを、類義語抽出ス
テップが同一の基本単語に対応付けた各見出し語集合を
同一品詞ごと分類し各々類義語として類義語記憶部に登
録する類義語品詞別登録ステップに置き換えることを特
徴とする請求項8、9、10又は11記載の辞書作成支
援方法。
13. The synonym registration step is replaced with a synonym part-by-speech registration step in which the synonym extraction step classifies each headword set associated with the same basic word by the same part of speech and registers each synonym as a synonym in the synonym storage part. The dictionary creation support method according to claim 8, 9, 10, or 11.
【請求項14】 類義語登録ステップを、類義語抽出ス
テップが同一の一つの基本単語に対応付けた見出し語集
合と同一の複数の基本単語に対応付けた見出し語集合と
を区別して各々類義語として類義語記憶に登録する類義
語多重登録ステップに置き換えることを特徴とする請求
項8、9、10又は11記載の辞書作成支援方法。
14. The synonym registration step is distinguished from a set of headwords associated with one basic word having the same synonym extraction step and a set of headwords associated with the same plurality of basic words, and each is stored as a synonym as a synonym. 12. The dictionary creation support method according to claim 8, 9, 10 or 11, wherein the method is replaced with a synonym multiple registration step of registering to.
JP5115864A 1993-05-18 1993-05-18 Device for supporting dictionary preparation and method thereof Pending JPH06325018A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5115864A JPH06325018A (en) 1993-05-18 1993-05-18 Device for supporting dictionary preparation and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5115864A JPH06325018A (en) 1993-05-18 1993-05-18 Device for supporting dictionary preparation and method thereof

Publications (1)

Publication Number Publication Date
JPH06325018A true JPH06325018A (en) 1994-11-25

Family

ID=14673044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5115864A Pending JPH06325018A (en) 1993-05-18 1993-05-18 Device for supporting dictionary preparation and method thereof

Country Status (1)

Country Link
JP (1) JPH06325018A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006040040A (en) * 2004-07-28 2006-02-09 Ntt Communications Kk Device, method, and program for video retrieval
JP2011175574A (en) * 2010-02-25 2011-09-08 Nippon Hoso Kyokai <Nhk> Document simplification device, simplification rule table creation device, and program
JP2017538198A (en) * 2014-11-20 2017-12-21 オラクル・インターナショナル・コーポレイション Automatic generation of context search string synonyms

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006040040A (en) * 2004-07-28 2006-02-09 Ntt Communications Kk Device, method, and program for video retrieval
JP2011175574A (en) * 2010-02-25 2011-09-08 Nippon Hoso Kyokai <Nhk> Document simplification device, simplification rule table creation device, and program
JP2017538198A (en) * 2014-11-20 2017-12-21 オラクル・インターナショナル・コーポレイション Automatic generation of context search string synonyms

Similar Documents

Publication Publication Date Title
Al‐Sughaiyer et al. Arabic morphological analysis techniques: A comprehensive survey
Drouin Term extraction using non-technical corpora as a point of leverage
US10296584B2 (en) Semantic textual analysis
JP4544674B2 (en) A system that provides information related to the selected string
Sedláček et al. A new Czech morphological analyser ajka
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
US7398196B1 (en) Method and apparatus for summarizing multiple documents using a subsumption model
KR100835706B1 (en) System and method for korean morphological analysis for automatic indexing
US20040128292A1 (en) Search data management
Neumann et al. A divide-and-conquer strategy for shallow parsing of German free texts
Alruily et al. Crime profiling for the Arabic language using computational linguistic techniques
JP2001084250A (en) Method and device for extracting knowledge from enormous document data and medium
Ando et al. Mostly-unsupervised statistical segmentation of Japanese kanji sequences
JPH06325018A (en) Device for supporting dictionary preparation and method thereof
Hathout et al. Webaffix: Discovering Morphological Links on the WWW
JP2006215850A (en) Apparatus and method for creating concept information database, program, and recording medium
Tapanainen et al. Dependency concordances
JPH10149370A (en) Document retrieval method and device using context information
JPS5856071A (en) Retrieval system by japanese
JP3416918B2 (en) Automatic keyword extraction method and device
JP2840258B2 (en) Method of creating bilingual dictionary and co-occurrence dictionary for machine translation system
JPH0322083A (en) Natural language processing device
JPH0773200A (en) Key word extracting method
JP2003067412A (en) Method for extracting feature item from data