JP4337940B2 - Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program - Google Patents
Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program Download PDFInfo
- Publication number
- JP4337940B2 JP4337940B2 JP2008201131A JP2008201131A JP4337940B2 JP 4337940 B2 JP4337940 B2 JP 4337940B2 JP 2008201131 A JP2008201131 A JP 2008201131A JP 2008201131 A JP2008201131 A JP 2008201131A JP 4337940 B2 JP4337940 B2 JP 4337940B2
- Authority
- JP
- Japan
- Prior art keywords
- synonym
- word
- synonym candidate
- candidate
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 67
- 238000000605 extraction Methods 0.000 claims description 95
- 239000000284 extract Substances 0.000 claims description 26
- 238000012790 confirmation Methods 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 6
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 239000004417 polycarbonate Substances 0.000 description 81
- 238000012545 processing Methods 0.000 description 48
- 229920000515 polycarbonate Polymers 0.000 description 41
- 238000010586 diagram Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、同義語辞書作成支援システム、同義語辞書作成支援方法および同義語辞書作成支援プログラムに関し、特にテキスト中から自動的に抽出した同義語の候補をユーザが編集できるシステム、同義語辞書作成支援方法および同義語辞書作成支援プログラムに関する。 The present invention relates to a synonym dictionary creation support system, a synonym dictionary creation support method, and a synonym dictionary creation support program, and in particular, a system that allows a user to edit synonym candidates automatically extracted from text, and synonym dictionary creation The present invention relates to a support method and a synonym dictionary creation support program.
本発明に関連する、この種の同義語辞書作成支援システムは、ユーザが入力した単語または文書データから異表記語や同義語の候補を自動的に抽出してユーザに提示することにより、ユーザが異表記辞書や同義語辞書を作成する手間を軽減するために用いられている。本発明に関連する同義語辞書作成支援システムの一例が、特許文献1、および、特許文献2に記載されている。
This type of synonym dictionary creation support system related to the present invention automatically extracts candidates for synonyms and synonyms from words or document data input by the user and presents them to the user. It is used to reduce the trouble of creating a different notation dictionary and synonym dictionary. An example of a synonym dictionary creation support system related to the present invention is described in
特許文献1に記載の辞書登録装置は、置換文字検出部と、複合語検出部と、出力部を有し、次のように動作する。すなわち、ユーザが入力した単語に対して、置換文字検出部が他の表記への置換(表記揺れ)が起こりうる箇所を検出するとともに、置換後の表記の候補を生成し、複合語検出部が複合語の単語の切れ目を検出するとともに、その位置に挿入されうる記号の候補を生成する。さらに、出力部がこれらの置換・挿入を組み合わせることによってできる異表記語の候補を生成し、辞書に登録する単語の候補としてユーザに提示する。
The dictionary registration apparatus described in
特許文献2に記載の同義語情報作成装置は、同義語候補抽出部と、表示・修正部を有し、次のように動作する。すなわち、同義語候補抽出部が同義関係にある単語の組を抽出し、一方の単語を他方の単語の同義語の候補とする。さらに、表示・修正部が、ユーザが選択した単語について、その単語に対する同義語の候補をユーザに表示し、ユーザが対話的に同義語の修正・追加を行った後に辞書に登録することができるようにする。
特許文献1、2に代表される、本発明に関連する同義語辞書作成支援システムは、いずれも、ユーザが指定する単語に対して、その単語と同義関係にある単語を、指定した単語に対する同義語の候補としてユーザに提示し、確認または修正させるというものであった。
The synonym dictionary creation support system related to the present invention represented by
以下では、ユーザが指定する単語を、その単語の同義語の候補に対する代表語と呼び、ユーザが代表語を選択して、その代表語に対する同義語の候補を確認・修正するという観点から、本発明に関連する同義語辞書作成支援システムの問題点および本発明の目的について記述する。 In the following, the word specified by the user is referred to as a representative word for the synonym candidate of the word, and from the viewpoint that the user selects a representative word and confirms / corrects the synonym candidate for the representative word. The problems of the synonym dictionary creation support system related to the invention and the object of the present invention will be described.
本発明に関連する同義語辞書作成支援システムの問題点は、ユーザが1つの単語を複数の異なる代表語に対する同義語として定義しないように支援することができないことである。複数の同義語を代表語に統一する目的で使用する同義語辞書を作成する場合、1つの単語に対して複数の異なる代表語を定義することはできないため、そのような同義語の候補が存在する場合、ユーザが候補を修正する必要がある。例えば、単語W1と単語W2の間、および、単語W2と単語W3の間に同義関係があると認定された場合、単語W2は、単語W1を代表語とする同義語の候補であると同時に、単語W3を代表語とする同義語の候補でもある。実際の抽出結果においては、数多くの単語が、複数の異なる代表語を持つと考えられる。しかしながら、本発明に関連する同義語辞書作成支援システムは、そのような候補がどこに存在するかをユーザに示したり、そのような候補に対して1つの代表語をユーザに選択させたりすることができなかった。 The problem with the synonym dictionary creation support system related to the present invention is that the user cannot support not defining one word as a synonym for a plurality of different representative words. When creating a synonym dictionary to be used for the purpose of unifying multiple synonyms into representative words, multiple different representative words cannot be defined for a single word, so there are candidates for such synonyms. The user needs to modify the candidate. For example, if it is determined that there is a synonymous relationship between the word W1 and the word W2 and between the word W2 and the word W3, the word W2 is a candidate for a synonym having the word W1 as a representative word, It is also a candidate for a synonym with the word W3 as a representative word. In the actual extraction result, many words are considered to have a plurality of different representative words. However, the synonym dictionary creation support system related to the present invention may indicate to the user where such a candidate exists or allow the user to select one representative word for such a candidate. could not.
その理由は、本発明に関連する同義語辞書作成支援システムが、1つの単語が複数の異なる代表語に対する同義語として指定さているかどうかを考慮していないためである。 This is because the synonym dictionary creation support system related to the present invention does not consider whether one word is designated as a synonym for a plurality of different representative words.
本発明の目的は、ユーザが1つの単語を複数の異なる代表語の同義語として定義しないように支援することができる同義語辞書作成支援システム、同義語辞書作成支援方法および同義語辞書作成支援プログラムを提供することにある。 An object of the present invention is to provide a synonym dictionary creation support system, a synonym dictionary creation support method, and a synonym dictionary creation support program that can assist a user not to define a word as a synonym of a plurality of different representative words. Is to provide.
本発明の第1のシステムは、テキスト中から同義関係にある単語の組を抽出するための規則を保持する抽出規則記憶手段と、前記抽出規則記憶手段から、同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出する同義語候補抽出手段と、前記同義語候補抽出手段で抽出する同義関係にある単語の組を格納する同義語候補記憶手段と、ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、前記同義語候補記憶手段から読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付ける同義語候補表示編集手段と、前記同義語候補表示編集手段が受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、前記同義語候補記憶手段に記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、前記同義語候補記憶手段に記録する同義語候補セット確定手段と、前記同義語候補セット確定手段で、確定済みというフラグ情報が付与された各単語に対して、各単語が確定済みであることを示す情報を付加表示する同義語候補確定情報表示手段とを備えたことを特徴とする。 The first system of the present invention extracts an extraction rule storage means for holding a rule for extracting a set of synonymous words from text, and a set of words having a synonym relation from the extraction rule storage means A synonym candidate extracting means for extracting a set of synonymous words from the text in accordance with the read rules, and storing a synonym word set extracted by the synonym candidate extracting means The synonym candidate storage means that receives the designation of the word to be edited from the user, reads a word having the same synonym relation with the designated word to be edited from the synonym candidate storage means, and is designated The set of the word to be edited and the synonym candidate is further displayed according to the editing instruction from the user. Synonymous candidate display editing means for accepting a user's editing instructions for the determined state indicating that the editing disabling, according to the editing instruction from the user accepted by the synonym candidate display editing means, words with the edited Flag information indicating that it is in a definite state, and is recorded in the synonym candidate storage means, and further, the word to be edited and its synonym to be in a definite state For each word candidate word, flag information indicating that the word is in the confirmed state and the word included in the set of synonym candidates is given and recorded in the synonym candidate storage unit . synonymous candidate set determining section, by the synonym candidate set determining section, for each word that flag information that definite is granted, each word definite der Characterized in that a synonym candidate determination information display means for adding display information indicating that.
本発明の第2のシステムは、テキスト中から同義関係にある単語の組を抽出するための規則を保持する抽出規則記憶手段と、前記抽出規則記憶手段から、同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出する同義語候補抽出手段と、前記同義語候補抽出手段で抽出する同義関係にある単語の組を格納する同義語候補記憶手段と、ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、前記同義語候補記憶手段から読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付ける同義語候補表示編集手段と、前記同義語候補表示編集手段が受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、前記同義語候補記憶手段に記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、前記同義語候補記憶手段に記録する同義語候補セット確定手段と、前記同義語候補セット確定手段で、確定済みというフラグ情報が付与された単語を、前記同義語候補記憶手段から読み出し、前記同義語候補記憶手段で格納されている同義関係にある単語のセットのうち、前記確定状態を表すフラグ情報が付与されていない単語と同義語候補のセットから、前記読み出した確定済みというフラグ情報が付与された単語を削除するとともに、削除結果を前記同義語候補記憶手段に記録する同義語候補セット修正手段とを備えたことを特徴とする。 The second system of the present invention extracts an extraction rule storage means for holding a rule for extracting a set of synonymous words from text, and a set of words having a synonym relation from the extraction rule storage means A synonym candidate extracting means for extracting a set of synonymous words from the text in accordance with the read rules, and storing a synonym word set extracted by the synonym candidate extracting means The synonym candidate storage means that receives the designation of the word to be edited from the user, reads a word having the same synonym relation with the designated word to be edited from the synonym candidate storage means, and is designated The set of the word to be edited and the synonym candidate is further displayed according to the editing instruction from the user. The synonym candidate display / editing means for accepting a user's editing instruction for confirming that editing is prohibited, and the word to be edited according to the editing instruction from the user accepted by the synonym candidate display / editing means Flag information indicating that it is in a definite state, and is recorded in the synonym candidate storage means, and further, the word to be edited and its synonym to be in a definite state For each word candidate word, flag information indicating that the word is in the confirmed state and the word included in the set of synonym candidates is given and recorded in the synonym candidate storage unit . read synonymous candidate set determining section, by the synonym candidate set determining section, a word flag information that definite has been applied, from the synonym candidate storage unit Out, wherein the set of words in a synonymous relationship stored synonym candidate storage unit, from a set of words and synonyms candidate flag information representing the determined state is not given, that the read definite And a synonym candidate set correcting unit that deletes the word to which the flag information is added and records the deletion result in the synonym candidate storing unit .
本発明の第1のプログラムは、テキスト中から同義関係にある単語の組を抽出するための規則を保持する抽出規則記憶処理と、前記抽出規則記憶処理により、同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出する同義語候補抽出処理と、前記同義語候補抽出処理で抽出する同義関係にある単語の組を格納する同義語候補記憶処理と、ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、前記同義語候補記憶処理によって読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付ける同義語候補表示編集処理と、前記同義語候補表示編集処理により受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、前記同義語候補記憶処理によって記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、前記同義語候補記憶処理によって記録する同義語候補セット確定処理と、前記同義語候補セット確定処理により確定済みというフラグ情報が付与された各単語に対して、各単語が確定済みであることを示す情報を付加表示する同義語候補確定情報表示処理とを、コンピュータに実行させることを特徴とする。 The first program of the present invention extracts a set of words having a synonymous relationship by an extraction rule storing process for retaining a rule for extracting a set of synonymous words from text and the extraction rule storing process. And a synonym candidate extraction process for extracting a set of synonymous words from the text according to the read rule, and a synonym word set extracted by the synonym candidate extraction process is stored. The synonym candidate storage process and the designation of the word to be edited are accepted from the user, and the word having the synonym relation with the designated word to be edited is read by the synonym candidate storage process and the designated And a set of the word to be edited and the synonym candidate according to an editing instruction from the user. Synonymous candidate display editing processing for accepting the user's editing instructions for the determined state indicating that the more editing disabling, according to the editing instruction from the user accepted by the synonym candidate display editing process, and the editing target Flag information indicating that the word is to be confirmed and its synonym candidate set, and is recorded by the synonym candidate storage process, and further, the word to be edited that is to be confirmed For each word of the synonym candidate, flag information indicating that the word is in a confirmed state and a word included in the set of synonym candidates is given, and the synonym candidate storing process synonymous candidate set determination processing for recording, the each word pair to the flag information that definite by synonym candidate set confirmation process has been granted Te, and a synonym candidate confirmation information display process information additional indication that each word is already confirmed, and characterized by causing a computer to execute.
本発明の第2のプログラムは、テキスト中から同義関係にある単語の組を抽出するための規則を保持する抽出規則記憶処理と、前記抽出規則記憶処理により、同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出する同義語候補抽出処理と、前記同義語候補抽出処理で抽出する同義関係にある単語の組を格納する同義語候補記憶処理と、ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、前記同義語候補記憶処理により読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付ける同義語候補表示編集処理と、前記同義語候補表示編集処理により受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、前記同義語候補記憶処理により記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、前記同義語候補記憶処理により記録する同義語候補セット確定処理と、前記同義語候補セット確定処理により、確定済みというフラグ情報が付与された単語を読み出し、前記同義語候補記憶処理により格納されている同義関係にある単語のセットのうち、前記確定状態を表すフラグ情報が付与されていない単語と同義語候補のセットから、前記読み出した確定済みというフラグ情報が付与された単語を削除するとともに、削除結果を前記同義語候補記憶処理により記録する同義語候補セット修正処理とを、コンピュータに実行させることを特徴とする。 The second program of the present invention extracts an extraction rule storage process that holds a rule for extracting a synonymous word set from a text and the extraction rule storage process to extract a synonym word set according to the rules read, read rules for, storing and synonym candidate extraction process for extracting a set of words from the text synonymous relationship, a set of words in a synonymous relationship extraction with the synonym candidate extraction process The synonym candidate storage process and the designation of the word to be edited are accepted from the user, and the word having the synonym relation with the designated word to be edited is read by the synonym candidate storage process and the designated And a set of the word to be edited and its synonym candidate in accordance with an editing instruction from the user. In accordance with the synonym candidate display editing process for accepting a user's editing instruction to enter a finalized state indicating that the editing is prohibited, and according to the editing instruction from the user accepted by the synonym candidate display editing process, Flag information indicating that the word is to be confirmed and the synonym candidate set, and is recorded by the synonym candidate storage process, and further, the word to be edited to be confirmed For each word of the synonym candidate, flag information indicating that the word is in a confirmed state and a word included in the set of synonym candidates is given, and the synonym candidate storing process synonymous candidate set determination processing for recording, by the synonym candidate set decision process, out read words flag information that definite was granted Of the set of words having the synonym relation stored by the synonym candidate storage process, the flag information that has been read out from the set of synonym candidates and the word to which the flag information indicating the confirmation state is not given. And a synonym candidate set correcting process for recording the deletion result by the synonym candidate storing process.
本発明の第1の方法は、テキスト中から同義関係にある単語の組を抽出するための規則を保持し、同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出し、抽出する同義関係にある単語の組を格納し、ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付け、受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、記録し、確定済みというフラグ情報が付与された各単語に対して、各単語が確定済みであることを示す情報を付加表示することを特徴とする。 The first method of the present invention holds a rule for extracting a set of synonymous words from the text, reads a rule for extracting a set of synonymous words, and follows the read rule, Extracts a set of synonymous words from the text, stores a set of synonymous words to be extracted, accepts specification of the word to be edited from the user, and synonyms with the specified word to be edited A word in a relationship is read and displayed as a synonym candidate for the designated word to be edited, and according to an editing instruction from the user, a set of the word to be edited and its synonym candidate, A user's editing instruction for confirming that editing is no longer required is accepted, and the word to be edited and its word are edited according to the editing instruction from the accepting user. For each set of synonym candidates, flag information indicating a confirmed state is given and recorded, and further, for each word of the word to be edited and the synonym candidate to be confirmed, For each word to which the flag information that has been confirmed is given and recorded, indicating that it is a word that is included in the set of words and its synonym candidates that are in a confirmed state , Information indicating that each word has been confirmed is additionally displayed.
本発明の第2の方法は、テキスト中から同義関係にある単語の組を抽出するための規則を保持し、同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出し、抽出する同義関係にある単語の組を格納し、ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付け、受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、記録し、確定済みというフラグ情報が付与された単語を、読み出し、格納されている同義関係にある単語のセットのうち、前記確定状態を表すフラグ情報が付与されていない単語と同義語候補のセットから、前記読み出した確定済みというフラグ情報が付与された単語を削除するとともに、削除結果を記録することを特徴とする。 The second method of the present invention holds a rule for extracting a set of synonymous words from the text, reads a rule for extracting a set of synonymous words, and reads the rule according to the read rule. Extracts a set of synonymous words from the text, stores a set of synonymous words to be extracted, accepts specification of the word to be edited from the user, and synonyms with the specified word to be edited A word in a relationship is read and displayed as a synonym candidate for the designated word to be edited, and according to an editing instruction from the user, a set of the word to be edited and its synonym candidate, A user's editing instruction for confirming that editing is no longer required is accepted, and the word to be edited and its word are edited according to the editing instruction from the accepting user. For each set of synonym candidates, flag information indicating a confirmed state is given and recorded, and further, for each word of the word to be edited and the synonym candidate to be confirmed, Assign and record flag information indicating that the word is in the confirmed state and the word included in the set of candidate synonyms, record , and read and store the word with the flag information that is confirmed In the set of words having the same synonym relationship, the read word having the flag information that has been confirmed is deleted from the set of synonym candidates and the word to which the flag information indicating the confirmed state is not given. At the same time, the deletion result is recorded .
本発明の第1の同義語辞書作成支援システムは、ユーザによって指定された代表語とそれに対する同義語の候補のセットを確定状態にし、確定状態にした代表語と同義語の候補のセットに含まれる各単語に対して、確定済みという情報を付与する同義語候補セット確定手段(図15の218)と、代表語あるいは同義語の候補を表示する際に、その単語が確定済みかどうかを示す情報をその単語に添えて表示する同義語候補確定情報表示手段(図15の219)とを有する。このような構成を採用し、ユーザに、すでに他の代表語に対する同義語として確定した単語を示すことで、本発明の目的を達成することができる。 The first synonym dictionary creation support system of the present invention puts a representative word designated by the user and a set of synonym candidates for the representative word into a definite state, and is included in the set of representative words and synonym candidates made definite. A synonym candidate set confirming means (218 in FIG. 15) that gives information that is confirmed for each word to be displayed, and whether or not the word is confirmed when displaying a representative word or a synonym candidate Synonym candidate fixed information display means (219 in FIG. 15) for displaying information attached to the word. By adopting such a configuration and showing the user a word that has already been confirmed as a synonym for another representative word, the object of the present invention can be achieved.
本発明の第2の同義語辞書作成支援システムは、ユーザによって指定された代表語とそれに対する同義語の候補のセットを確定状態にし、確定状態にした代表語と同義語の候補のセットに含まれる各単語に対して、確定済みという情報を付与する同義語候補セット確定手段(図17の218)と、確定済みという情報が付与された単語を未確定状態の代表語と同義語の候補のセットから削除する同義語候補セット修正手段(図17の220)とを有する。このような構成を採用し、すでに他の代表語に対する同義語として確定した単語を同義語の候補から除外することで、本発明の目的を達成することができる。 The second synonym dictionary creation support system according to the present invention sets a representative word designated by the user and a set of synonym candidates corresponding to the representative word, and is included in the set of representative words and synonym candidates set in the fixed state. Synonym candidate set confirming means (218 in FIG. 17) for assigning information that has been confirmed to each word to be confirmed, and a word to which information that has been confirmed is assigned as a representative word and a synonym candidate Synonym candidate set correcting means (220 in FIG. 17) to be deleted from the set. By adopting such a configuration and excluding a word that has already been determined as a synonym for another representative word from the synonym candidates, the object of the present invention can be achieved.
本発明の効果は、1つの単語が複数の代表語に対する同義語の候補となることをユーザが容易に防ぐことができることにある。 The effect of the present invention is that the user can easily prevent one word from becoming a synonym candidate for a plurality of representative words.
本発明の効果が生じる理由は、本発明の同義語辞書作成支援システムが、すでに他の代表語に対する同義語として確定した単語をユーザに示すので、ユーザがその単語を別の代表語に対する同義語として使用しないようにすることができるためである。 The reason why the effect of the present invention occurs is that the synonym dictionary creation support system of the present invention indicates to the user a word that has already been determined as a synonym for another representative word, so that the user can designate that word as a synonym for another representative word. It is because it can be made not to use as.
本発明の効果が生じるさらに別の理由は、本発明の同義語辞書作成支援システムが、すでに他の代表語に対する同義語として確定した単語を未確定状態の代表語と同義語の候補から削除するので、ユーザが意図的に編集しない限り、1つの単語を複数の代表語に対する同義語として確定することがないためである。 Another reason for the effect of the present invention is that the synonym dictionary creation support system of the present invention deletes a word that has already been confirmed as a synonym for another representative word from a representative word and a synonym candidate that have not yet been determined. Therefore, unless the user intentionally edits, one word is not confirmed as a synonym for a plurality of representative words.
次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。 Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.
図1を参照すると、本発明の第1の最良の形態は、キーボード、マウス等の入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶するハードディスク、メモリ等の記憶装置3と、ディスプレイ装置等の出力装置4とを含む。
Referring to FIG. 1, the first best mode of the present invention is an
記憶装置3は、テキスト記憶部301と、抽出規則記憶部302と、同義語候補記憶部303と、同義語辞書304とを備える。
The
テキスト記憶部301は、同義語を抽出する対象となるテキストを予め保持する。
The
抽出規則記憶部302は、テキスト中から同義関係にある単語の組を抽出するための規則を予め保持する。同義関係にある単語の組を抽出するための規則とは、例えば、「表記上長音記号の有無のみが異なる単語の組を抽出する」等の単語の組を抽出する際の条件を規定する規則である。
The extraction
同義語候補記憶部303は、後述する同義語候補抽出手段201によってテキスト中から抽出された同義語の候補およびそれに付随する情報を保持する。
The synonym
同義語辞書304は、ユーザが最終的に作成する同義語辞書を保持する。同義語辞書304の内容は、後述する同義語辞書出力手段205によって書き込まれる。
The
同義語候補記憶部303および同義語辞書304は、最初は空の状態である。
The synonym
データ処理装置2は、同義語候補抽出手段201と、同義語候補表示編集手段202と、域外同義関係抽出手段203と、域外同義関係情報表示手段204と、同義語辞書出力手段205とを備える。
The
同義語候補抽出手段201は、ユーザからの指示に従って、抽出規則記憶部302から同義関係にある単語の組を抽出するための規則を読み込むとともに、テキスト記憶部301からテキストを読み込み、テキスト中から同義関係にある単語の組を抽出する。さらに、抽出した単語の組のそれぞれの単語について、その単語を代表語とする同義語の候補にもう一方の単語を割り当て、同義語候補記憶部303に格納する。
The synonym
同義語候補表示編集手段202は、同義語候補記憶部303に格納された代表語の一覧をリストにしてユーザに選択させ、ユーザが選択した代表語に対する同義語の候補のリストを同義語候補記憶部303より読み出して表示する。また、同義語候補表示編集手段202は、表示中の同義語の候補をユーザの指示に従って編集し、結果を同義語候補記憶部303に保存する。
The synonym candidate
域外同義関係抽出手段203は、同義語候補表示編集手段202が表示する同義語の候補のそれぞれについて、ユーザが選択した代表語およびその代表語に対する同義語の候補以外の単語と同義関係があるかどうかを、同義語候補記憶部303を読み出して検出し、同義語の候補と検出された同義関係に関する情報を対にしたデータを域外同義関係情報表示手段204に渡す。
Whether the out-of-region synonym
域外同義関係情報表示手段204は、域外同義関係抽出手段203によってユーザが選択した代表語およびその代表語に対する同義語の候補以外の単語と同義関係があると検出された同義語の候補に対して、その同義関係に関する情報を表示する。 The out-of-range synonym relation information display means 204 is for synonym candidates detected as having a synonym relation with words other than the representative word selected by the user by the out-of-range synonym relation extraction means 203 and the synonym candidate for the representative word. , Display information about the synonymous relationship.
同義語辞書出力手段205は、同義語候補記憶部303に格納されているそれぞれの代表語について、その代表語に対する同義語の候補を、その代表語の同義語とする辞書エントリを作成し、同義語辞書304に出力する。
The synonym
次に、図1および図2を参照して本発明を実施するための第1の最良の形態の動作について詳細に説明する。 Next, the operation of the first best mode for carrying out the present invention will be described in detail with reference to FIG. 1 and FIG.
まず、同義語候補抽出手段201が、抽出規則記憶部302から同義関係にある単語の組を抽出するための規則を読み込み(図2のステップA1)、続いて、テキスト記憶部301から同義語の候補を抽出する対象となるテキストを読み込む(ステップA2)。
First, the synonym
次に、同義語候補抽出手段201が、読み込んだ抽出規則のいずれかに適合する単語の組をテキスト中から抽出し、抽出した単語の組のそれぞれの単語について、片方を代表語、もう一方をその代表語の同義語の候補として同義語候補記憶部303に格納する。すなわち、(W1,W2)という単語の組が抽出された場合、W1という代表語に対して、同義語の候補W2があり、W2という代表語に対して、同義語の候補W2があるという情報を格納する。抽出する単語の組がなくなるまでこの処理を繰り返す(ステップA3およびA4)。
Next, the synonym candidate extracting means 201 extracts a set of words that match any of the read extraction rules from the text, and for each word of the extracted set of words, one is the representative word and the other is the representative word. The synonym
次に、同義語候補表示編集手段202は、同義語候補記憶部303に格納された代表語のリストを読み出して、ユーザに表示し(ステップA5)、ユーザからの入力を待つ(ステップA6)。
Next, the synonym candidate
ユーザが、表示された代表語のリストから、代表語を1つ選択した場合、同義語候補表示編集手段202は、選択された代表語に対する同義語の候補のリストをユーザに表示する(ステップA7およびA8)。
When the user selects one representative word from the displayed list of representative words, the synonym candidate
このとき、それぞれの同義語の候補について、域外同義関係抽出手段203が、ユーザが選択した代表語およびその代表語に対する同義語の候補以外の単語との同義関係、すなわち、表示されている単語以外との同義関係(域外の同義関係)があるかどうかを、同義語候補記憶部303を読み出して検出し、同義語の候補と検出された同義関係に関する情報を対にしたデータを作成する(ステップA9)。続いて、域外同義関係情報表示手段204が、このデータに基づいて、域外の同義関係が検出された同義語の候補に対して、表示されている同義語の候補に添えて、その同義語候補が域外の同義関係を持つことを示す情報を表示する(ステップA10)。
At this time, for each synonym candidate, the synonym relationship extraction means 203 outside the synonym relationship with the representative word selected by the user and a word other than the synonym candidate for the representative word, that is, other than the displayed word The synonym
ステップA6の状態から、ユーザが同義語の候補の編集を指示した場合、同義語候補表示編集手段202が、その指示に従って同義語候補記憶部303に格納されている同義語の候補を編集し、編集後の状態を表示する(ステップA11およびA12)。ここで、同義語の候補の編集とは、同義語の候補に新たに単語を追加する処理、指定する同義語の候補を他の代表語に対する同義語の候補にも追加する処理、指定する同義語の候補を他の代表語に対する同義語の候補に変更する処理、指定する同義語の候補を削除する処理等、現在選択されている代表語に対する同義語の候補の集合に変更を加える処理を指す。
When the user instructs the editing of the synonym candidate from the state of step A6, the synonym candidate
ステップA6の状態から、ユーザが同義語辞書の出力を指示した場合、同義語辞書出力手段205が、同義語候補記憶部303に格納されている同義語の候補を同義語辞書304に出力する(ステップA13およびA14)。
When the user instructs to output the synonym dictionary from the state of step A6, the synonym
ステップA6の状態から、ユーザが処理の終了を指示した場合、同義語候補表示編集手段202は、処理を終了する。ユーザによる入力が、これまでの指示にあてはまらなかった場合、無効な入力として、再びユーザからの入力を待つ(ステップA15)。
When the user instructs the end of the process from the state of step A6, the synonym candidate
なお、本実施の形態の説明では、域外同義関係情報表示手段204が、域外の同義関係が検出された同義語の候補に対して、そのことを示す情報を表示するように説明したが、域外の同義関係が検出されなかった同義語の候補に対してそのことを示す情報を表示するようにしてもよい。同様に、同義語の候補すべてに対して、その単語が域外の同義関係を持つかどうかを示す情報を表示するようにしてもよい。
In the description of the present embodiment, the out-of-range synonym relation
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
本実施の形態では、同義語の候補それぞれに対して、ユーザが選択した代表語およびその代表語に対する同義語の候補以外の単語との同義関係があるかどうかを調べ、それに関する情報を同義語の候補それぞれに添えて表示するため、それぞれの同義語の候補に対して、現在表示されていない、その単語を代表語とする同義語の候補が別に存在するかどうかが表示から容易に分かる。すなわち、本実施の形態は、代表語と直接的な同義関係にある単語以外に、同義語の候補を介して代表語と間接的な同義関係にある単語が別に存在する場合に、ユーザにそのことを知らせるができる。 In the present embodiment, for each synonym candidate, it is checked whether or not there is a synonym relationship between the representative word selected by the user and a word other than the synonym candidate for the representative word, and the information related thereto is synonymous. Therefore, it can be easily seen from the display whether there is another synonym candidate that is not currently displayed for each synonym candidate and that has the word as a representative word. In other words, in the present embodiment, in addition to a word directly synonymous with a representative word, when there is another word indirectly synonymous with the representative word through a synonym candidate, I can let you know.
さらに、これにより、選択した代表語に対する同義語の候補が他の代表語に対する同義語の候補になっている場合、そのことが表示される。このため、ユーザが、複数の代表語に対する同義語の候補となっている単語を容易に検知し、必要に応じて、その単語に対する代表語が1つだけになるように編集を行うことができる。 Further, when the synonym candidate for the selected representative word is a synonym candidate for another representative word, this is displayed. Therefore, the user can easily detect a word that is a candidate for a synonym for a plurality of representative words, and can edit the word so that there is only one representative word if necessary. .
次に、本発明の第2の最良の形態について図面を参照して詳細に説明する。 Next, the second best mode of the present invention will be described in detail with reference to the drawings.
図3を参照すると、本発明の第2の最良の形態は、データ処理装置21が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、間接同義語候補抽出手段206および間接同義語候補表示編集手段207を有する点で異なる。
Referring to FIG. 3, the second best mode of the present invention is that the
間接同義語候補抽出手段206は、同義語候補表示編集手段202が表示する同義語の候補のリストからユーザが選択した同義語の候補に対して、その単語を代表語とする同義語の候補を同義語候補記憶部303から抽出する。間接同義語候補抽出手段206が抽出する同義語の候補は、ユーザが最初に選択した代表語に対して、ユーザが次に選択した同義語の候補を介した間接的な同義語の候補になっているため、以下では、間接同義語候補抽出手段206が抽出した同義語の候補を間接同義語候補と呼ぶことにする。
The indirect synonym
間接同義語候補表示編集手段207は、間接同義語候補抽出手段206によって抽出された間接同義語候補のリストをユーザに表示するとともに、ユーザの指示に従って編集し、結果を同義語候補記憶部303に保存する。
The indirect synonym candidate
次に、本実施の形態の動作を図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図4のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
The operations of the synonym
本発明の第2の最良の形態では、ステップA6において、ユーザが同義語の候補の1つを選択した場合、間接同義語候補抽出手段206が、その単語を代表語とする同義語の候補を同義語候補記憶部303から抽出する(ステップB1およびB2)。 In the second best mode of the present invention, when the user selects one of the synonym candidates in step A6, the indirect synonym candidate extracting means 206 selects a synonym candidate having the word as a representative word. Extracted from the synonym candidate storage unit 303 (steps B1 and B2).
次に、間接同義語候補表示編集手段207は、間接同義語候補抽出手段206によって抽出された間接同義語候補のリストをユーザに表示し(ステップB3)、再びユーザからの入力を待つ(ステップA6)。 Next, the indirect synonym candidate display editing means 207 displays the list of indirect synonym candidates extracted by the indirect synonym candidate extraction means 206 to the user (step B3), and waits for an input from the user again (step A6). ).
ステップA6において、ユーザが間接同義語候補の編集を指示した場合、間接同義語候補表示編集手段207が、その指示に従って同義語候補記憶部303に格納されている同義語の候補を編集し、編集後の状態を表示する(ステップB4およびB5)。ここで、間接同義語候補の編集とは、同義語の候補の編集と同様、間接同義語候補に新たに単語を追加する処理、指定する間接同義語候補を現在選択中の代表語等の他の代表語に対する同義語の候補に追加する処理、指定する間接同義語候補を現在選択中の代表語等の他の代表語に対する同義語の候補に変更する処理、指定する間接同義語候補を削除する処理等、間接同義語候補の集合、すなわち、ステップB1において選択された同義語の候補を代表語とする同義語の候補の集合に変更を加える処理を指す。
In step A6, when the user gives an instruction to edit the indirect synonym candidate, the indirect synonym candidate
なお、本実施の形態では、ユーザが、ステップA6において、最初に選択した代表語に対する同義語の候補の1つを選択した場合に、間接同義語候補を表示するとして説明したが、ユーザが、間接同義語候補の1つを選択した場合に、その間接同義語候補を代表語とする同義語の候補を第2の間接同義語候補として表示するようにし、再帰的に間接同義語候補を表示できるようにしてもよい。 In addition, in this Embodiment, when the user selected one of the synonym candidates for the representative word that was initially selected in Step A6, the indirect synonym candidate was displayed. When one of the indirect synonym candidates is selected, the synonym candidate having the indirect synonym candidate as a representative word is displayed as the second indirect synonym candidate, and the indirect synonym candidate is displayed recursively. You may be able to do it.
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
本実施の形態では、ユーザが同義語の候補を選択すると、現在選択中の代表語に対して、その同義語の候補を介した間接的な同義語の候補(間接同義語候補)を表示し、その間接同義語候補に対する編集の指示を受け付ける。このため、ユーザは、代表語と直接的な同義関係にある単語だけでなく、代表語と間接的な同義関係にある単語を調べ、必要に応じて、代表語の同義語の候補に追加するという操作を容易に行うことができる。すなわち、本実施の形態は、代表語と間接的な同義関係しかない単語を、代表語の同義語として辞書に登録するための支援を行うことができる。 In the present embodiment, when the user selects a synonym candidate, an indirect synonym candidate (indirect synonym candidate) via the synonym candidate is displayed for the currently selected representative word. Then, an editing instruction for the indirect synonym candidate is received. For this reason, the user examines not only words that are directly synonymous with the representative words but also words that are indirectly synonymous with the representative words, and adds them to the synonym candidates of the representative words as necessary. Can be easily performed. In other words, the present embodiment can provide support for registering a word having only an indirect synonym relation with a representative word as a synonym of the representative word in the dictionary.
次に、本発明の第3の最良の形態について図面を参照して詳細に説明する。 Next, the third best mode of the present invention will be described in detail with reference to the drawings.
図5を参照すると、本発明の第3の最良の形態は、データ処理装置22が、図3に示された第2の最良の形態におけるデータ処理装置21の構成に加え、域内間接同義語候補抽出手段208および域内間接同義語候補情報表示手段209を有する点で異なる。
Referring to FIG. 5, the third best mode of the present invention is that the
域内間接同義語候補抽出手段208は、間接同義語候補表示編集手段207が表示する間接同義語候補のそれぞれについて、ユーザが選択した代表語およびその代表語に対する同義語の候補の中に含まれているかどうかを検査する。ここでは、ユーザが選択した代表語およびその代表語に対する同義語の候補の中に含まれている間接同義語候補を域内の間接同義語候補と呼ぶことにする。域内間接同義語候補抽出手段208は、それぞれの間接同義語候補に対して、それが域内の間接同義語候補かどうかについての情報を付与し、域内間接同義語候補情報表示手段209に渡す。
The indirect synonym
域内間接同義語候補情報表示手段209は、域内間接同義語候補抽出手段208によって検出された域内の間接同義語候補に対して、その間接同義語が域内の間接同義語であることを示す情報を表示する。
The indirect synonym candidate
次に、本実施の形態の動作を図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図6のステップA1〜A8およびA11〜A15およびB1〜B5で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205、間接同義語候補抽出手段206、間接同義語候補表示編集手段207の動作は、第2の実施の形態の各手段201、202、205、206、207の動作と同一のため、説明は省略する。
Synonym candidate extraction means 201, synonym candidate display editing means 202, synonym dictionary output means 205, indirect synonym candidate extraction in the present embodiment shown in steps A1 to A8 and A11 to A15 and B1 to B5 in FIG. The operations of the
本実施の形態では、ステップB3において、間接同義語候補表示編集手段207が間接同義語候補のリストをユーザに表示した後、域内間接同義語候補抽出手段208が、それぞれの間接同義語候補に対して、それがユーザが選択した代表語およびその代表語に対する同義語の候補の中に含まれているかどうかを検査し、その結果についての情報を付与したデータを作成する(ステップC1)。次に、域内間接同義語候補情報表示手段209が、このデータに基づいて、域内の間接同義語候補に対してそのことを示す情報を表示し(ステップC2)、ユーザからの入力を待つ(ステップA6)。
In this embodiment, in step B3, after the indirect synonym candidate
なお、本実施の形態の説明では、域内間接同義語候補情報表示手段209が、域内の間接同義語候補に対して、それが域内の間接同義語候補であることを示す情報を表示するように説明したが、それ以外の間接同義語候補に対して、それが域内の間接同義語候補でないことを示す情報を表示するようにしてもよい。同様に、間接同義語候補すべてに対して、その単語が域内の間接同義語候補であるかどうかを示す情報を表示するようにしてもよい。 In the description of the present embodiment, the intra-region indirect synonym candidate information display means 209 displays information indicating that it is an indirect synonym candidate in the region for the indirect synonym candidate in the region. Although described, information indicating that it is not an indirect synonym candidate in the region may be displayed for other indirect synonym candidates. Similarly, for all indirect synonym candidates, information indicating whether the word is an indirect synonym candidate in the area may be displayed.
また、本実施の形態は、第2の実施の形態と同様に、ユーザが間接同義語候補の1つを選択した場合に、その間接同義語候補を代表語とする同義語の候補を第2の間接同義語候補として表示するようにし、再帰的に間接同義語候補を表示できるようにしてもよい。 Further, in the present embodiment, similarly to the second embodiment, when the user selects one of the indirect synonym candidates, the second synonym candidate having the indirect synonym candidate as a representative word is selected as the second synonym candidate. The indirect synonym candidates may be displayed recursively, and the indirect synonym candidates may be displayed recursively.
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
本実施の形態では、ユーザが同義語の候補を選択し、現在選択中の代表語に対して、その同義語の候補を介した間接的な同義語の候補(間接同義語候補)を表示する際に、その間接同義語候補が、ユーザが選択した代表語およびその代表語に対する同義語の候補の中に含まれているかどうかについての情報を表示する。このため、ユーザは、代表語と間接的な同義関係にある単語を、代表語の同義語の候補に新たに追加しようとする際に、既に代表語の同義語の候補に含まれている単語がどれかを知ることができ、既に代表語の同義語の候補に含まれている単語を重ねて代表語の同義語の候補に追加しようとすることを防ぐことができる。すなわち、本実施の形態は、代表語と間接的な同義関係しかない単語を、効率よく代表語の同義語として辞書に登録するための支援を行うことができる。 In the present embodiment, the user selects a synonym candidate, and displays an indirect synonym candidate (indirect synonym candidate) via the synonym candidate for the currently selected representative word. At this time, information about whether or not the indirect synonym candidate is included in the representative word selected by the user and the synonym candidate for the representative word is displayed. For this reason, when a user tries to newly add a word having an indirect synonym with a representative word to the synonym candidate for the representative word, the word already included in the synonym candidate for the representative word Can be known, and it is possible to prevent the words already included in the synonym candidate of the representative word from being added to the synonym candidate of the representative word in an overlapping manner. That is, the present embodiment can provide support for efficiently registering a word having only an indirect synonym relation with a representative word as a synonym of the representative word in the dictionary.
次に、本発明の第4の最良の形態について図面を参照して詳細に説明する。 Next, a fourth best mode of the present invention will be described in detail with reference to the drawings.
図7を参照すると、本発明の第4の最良の形態は、データ処理装置23が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、拡張同義語候補表示手段210および拡張同義語候補追加手段211を有する点で異なる。
Referring to FIG. 7, the fourth best mode of the present invention is that the
拡張同義語候補表示手段210は、ユーザが選択した代表語に対して、同義語候補表示編集手段202によって表示されている同義語の候補の拡張として追加すべき単語の候補を、同義語候補記憶部303を参照して、ユーザが選択した代表語と間接的な同義関係がある単語の中から抽出し、ユーザに提示する。ここでは、そのような単語の候補を拡張同義語候補と呼ぶことにする。拡張同義語候補としては、ユーザが選択した代表語と間接的な同義関係がある単語すべてとしてもよいし、ユーザが選択した代表語とある閾値以下の数の単語を介して間接的な同義関係がある単語、あるいは、ユーザが選択した代表語との間に、異なる単語を介する間接的な同義関係が2つ以上ある単語等に限定してもよい。また、ユーザが選択した代表語およびその代表語に対する同義語の候補を、拡張同義語候補から予め除いておいてもよい。拡張同義語候補を抽出する基準については、別途予め定めておく。
The expanded synonym candidate display means 210 stores a word candidate to be added as an extension of the synonym candidate displayed by the synonym candidate display editing means 202 with respect to the representative word selected by the user. With reference to
拡張同義語候補追加手段211は、拡張同義語候補表示手段210によってユーザに提示された拡張同義語候補のうち、ユーザによって選択されたものを、ユーザが選択した代表語に対する同義語の候補に追加し、その結果を同義語候補記憶部303に保存する。
The expanded synonym
次に、本実施の形態の動作を図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図8のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
The operations of the synonym candidate extraction means 201, the synonym candidate display editing means 202, and the synonym dictionary output means 205 in the present embodiment indicated by steps A1 to A8 and A11 to A15 in FIG. 8 are the same as those in the first embodiment. Since the operations are the same as those of the
本発明の第4の最良の形態では、ステップA6において、ユーザが拡張同義語候補の抽出を指示した場合、拡張同義語候補表示手段210が、予め定められた基準に従って、同義語候補記憶部303から拡張同義語候補を抽出し(ステップD1およびD2)、抽出した拡張同義語候補のリストをユーザに表示する(ステップD3)。
In the fourth best mode of the present invention, when the user instructs the extraction of the extended synonym candidate in step A6, the extended synonym candidate display means 210 follows the predetermined criteria and the synonym
次に、拡張同義語候補追加手段211が、ユーザが選択した代表語に対する同義語の候補に追加する拡張同義語候補をユーザに選択させる(ステップD4)。その後、ユーザが選択した拡張同義語候補を、同義語候補記憶部303において、ユーザが選択した代表語に対する同義語の候補に追加し、その状態を表示する(ステップD5)。
Next, the extended synonym
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
本実施の形態では、ユーザが選択した代表語に対する同義語の候補として、その代表語と直接的な同義関係がある単語以外に拡張する際の候補となる単語を、その代表語と間接的な同義関係がある単語の中から抽出し、その中からユーザが選択した単語を、元の代表語に対する同義語の候補として追加する。このため、ユーザは、代表語と直接的な同義関係にある単語だけでなく、代表語と間接的な同義関係にある単語のうち必要なものをその代表語の同義語の候補に追加するという操作を容易に行うことができる。すなわち、本実施の形態は、代表語と間接的な同義関係しかない単語を、代表語の同義語として辞書に登録するための支援を行うことができる。 In this embodiment, as a candidate for a synonym for a representative word selected by the user, a word that is a candidate for expansion other than a word that has a direct synonym relation with the representative word is indirectly related to the representative word. Words extracted from the words having the synonymous relationship, and the word selected by the user are added as synonym candidates for the original representative word. Therefore, the user adds not only words directly synonymous with the representative word but also necessary words among the words indirectly synonymous with the representative word to the synonym candidates of the representative word. Operation can be performed easily. In other words, the present embodiment can provide support for registering a word having only an indirect synonym relation with a representative word as a synonym of the representative word in the dictionary.
次に、本発明の第5の最良の形態について図面を参照して詳細に説明する。 Next, a fifth best mode of the present invention will be described in detail with reference to the drawings.
図9を参照すると、本発明の第5の最良の形態は、データ処理装置24が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、追加同義語候補表示手段212および追加同義語候補追加手段213を有する点で異なる。
Referring to FIG. 9, the fifth best mode of the present invention is that the
追加同義語候補表示手段212は、ユーザが、同義語の候補に対して、他の代表語の同義語の候補を追加する指示を行うとき、その単語と同時に追加すべき単語の候補を、同義語候補記憶部303を参照して、その単語と直接的または間接的な同義関係がある単語の中から抽出し、ユーザに提示する。ここでは、そのような単語の候補を追加同義語候補と呼ぶことにする。追加同義語候補としては、ユーザが追加しようとした単語と直接的または間接的な同義関係がある単語すべてとしてもよいし、間接的な同義関係について、ユーザが追加しようとした単語とある閾値以下の数の単語を介して間接的な同義関係がある、あるいは、ユーザが追加しようとした単語との間に、異なる単語を介する間接的な同義関係が2つ以上ある等の制限を加えてもよい。また、ユーザが選択した代表語およびその代表語に対する同義語の候補を、追加同義語候補から予め除いておいてもよい。追加同義語候補を抽出する基準については、別途予め定めておく。
The additional synonym candidate display means 212, when the user gives an instruction to add a synonym candidate of another representative word to the synonym candidate, The word
追加同義語候補追加手段213は、追加同義語候補表示手段212によってユーザに提示された追加同義語候補のうち、ユーザによって選択されたものを、ユーザが選択した代表語に対する同義語の候補に追加し、その結果を同義語候補記憶部303に保存する。
The additional synonym candidate adding means 213 adds the additional synonym candidate presented to the user by the additional synonym candidate display means 212 to the synonym candidate for the representative word selected by the user. The result is stored in the synonym
次に、本実施の形態の動作を図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図10のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
The operations of the synonym candidate extraction means 201, the synonym candidate display editing means 202, and the synonym dictionary output means 205 in the present embodiment shown in steps A1 to A8 and A11 to A15 in FIG. 10 are the same as those in the first embodiment. Since the operations are the same as those of the
本発明の第5の最良の形態では、ステップA6において、ユーザが現在の同義語の候補に他の代表語の同義語の候補を追加する指示をした場合、追加同義語候補表示手段212が、予め定められた基準に従って、同義語候補記憶部303から追加同義語候補を抽出し(ステップE1およびE2)、抽出した追加同義語候補のリストをユーザに表示する(ステップE3)。 In the fifth best mode of the present invention, when the user gives an instruction to add a synonym candidate of another representative word to the current synonym candidate in step A6, the additional synonym candidate display means 212 In accordance with a predetermined criterion, additional synonym candidates are extracted from the synonym candidate storage unit 303 (steps E1 and E2), and a list of the extracted additional synonym candidates is displayed to the user (step E3).
次に、追加同義語候補追加手段213が、ユーザが追加しようとした単語と同時に同義語の候補に追加すべき追加同義語候補をユーザに選択させる(ステップE4)。その後、ユーザが選択した追加同義語候補を、ユーザが追加しようとした単語と合わせて、同義語候補記憶部303において、ユーザが選択した代表語に対する同義語の候補に追加し、その状態を表示する(ステップE5)。
Next, the additional synonym
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
本実施の形態では、ユーザが単一の単語を同義語の候補に追加しようとした場合でも、その単語と同時に同義語の候補に追加すべき単語の候補を、その単語と間接的な同義関係がある単語の中から抽出し、その中からユーザが選択した単語を、ユーザが追加しようとしていた単語と合わせて同義語の候補に追加する。このため、ユーザは、追加しようとした単一の単語だけでなく、その単語と直接的あるいは間接的な同義関係にある単語のうち必要なものを、その代表語の同義語の候補に追加するという操作を容易に行うことができる。 In this embodiment, even when the user tries to add a single word to a synonym candidate, the word candidate to be added to the synonym candidate at the same time as the word is indirectly synonymous with the word. The word selected by the user is extracted from a certain word, and the word selected by the user is added to the synonym candidate together with the word to be added by the user. For this reason, the user adds not only a single word to be added but also a necessary word among the words having a direct or indirect synonym relationship with the word to the synonym candidate of the representative word. Can be easily performed.
次に、本発明の第6の最良の形態について図面を参照して詳細に説明する。 Next, a sixth best mode of the present invention will be described in detail with reference to the drawings.
図11を参照すると、本発明の第6の最良の形態は、データ処理装置25が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、同義語候補表示編集手段202、域外同義関係抽出手段203、域外同義関係情報表示手段204に代わり、同義語候補グループ分割手段214および同義語候補グループ表示編集手段215を有する点で異なる。
Referring to FIG. 11, in the sixth best mode of the present invention, the
同義語候補グループ分割手段214は、同義語候補抽出手段201によって抽出された単語を、同一のグループに属する単語どうしが互いに直接的または間接的な同義関係を持ち、かつ、同一の単語が複数の異なるグループに属さないように、グループに分割する。ここでは、こうして作成されたグループを同義語候補グループと呼ぶことにする。同義語候補グループ分割手段214は、さらに、各グループの単語の中から代表語を選定し、同義語候補グループ内の他の単語がその代表語に対する同義語の候補となるように同義語候補記憶部303に格納する。
The synonym candidate
同義語候補グループは、直接的または間接的な同義関係がある単語どうしが必ず同一のグループとなるように作成してもよいし、直接的な同義関係がある単語どうしのほか、ある閾値以下の数の単語を介して間接的な同義関係がある単語どうしが同一のグループとなるように作成したり、異なる単語を介する間接的な同義関係が2つ以上ある単語どうしが同一のグループとなるように作成したりしてもよい。同義語候補グループを作成する基準については、別途予め定めておく。 Synonym candidate groups may be created so that words that have a direct or indirect synonym relationship are always the same group, or words that have a direct synonym relationship, or less than a certain threshold Create words that have an indirect synonym between two or more words in the same group, or words that have two or more indirect synonyms through different words in the same group Or create it. A standard for creating a synonym candidate group is determined in advance.
同義語候補グループの代表語は、同義語候補グループ内の任意の単語でよいが、同一の同義語候補グループ内に直接的な同義関係にある単語をもっとも多く持つ単語、あるいは、同一の同義語候補グループ内で間接的な同義関係を持つ単語について、間接的な同義関係の途中に介する単語の数の最大値がもっとも小さい単語等の基準に従って代表語を選定することもできる。 The representative word of the synonym candidate group may be any word in the synonym candidate group, but the word having the most direct words in the same synonym candidate group or the same synonym For words having an indirect synonym relationship in the candidate group, a representative word can also be selected according to a criterion such as a word having the smallest maximum number of words in the middle of the indirect synonym relationship.
同義語候補グループ表示編集手段215は、同義語候補記憶部303に格納された代表語の一覧、すなわち、同義語候補グループ分割手段214によって選定された代表語の一覧をリストにしてユーザに選択させ、ユーザが選択した代表語を含む同義語候補グループの単語を同義語候補記憶部303より読み出して表示する。また、同義語候補グループ表示編集手段215は、表示中の同義語候補グループをユーザの指示に従って編集し、結果を同義語候補記憶部303に保存する。
The synonym candidate group
次に、本実施の形態の動作を図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図12のステップA1〜A4およびA13〜A14で示される本実施の形態における同義語候補抽出手段201、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、205の動作と同一のため、説明は省略する。
The operations of the synonym
本発明の第6の最良の形態では、同義語候補抽出手段201による同義関係にある単語の組の抽出が終了した後、同義語候補グループ分割手段214が、抽出された単語を同義語候補グループに分割する(ステップF1)。
In the sixth best mode of the present invention, after the synonym
次に、同義語候補グループ表示編集手段215が、同義語候補記憶部303に格納された代表語のリストを読み出して、ユーザに表示し(ステップF2)、ユーザからの入力を待つ(ステップF3)。
Next, the synonym candidate group display editing means 215 reads the list of representative words stored in the synonym
ユーザが、表示された代表語のリストから、代表語を1つ選択した場合、同義語候補グループ表示編集手段215は、選択された代表語に対する同義語グループの単語をユーザに表示する(ステップF4およびF5)。
When the user selects one representative word from the displayed list of representative words, the synonym candidate group
ステップF3の状態から、ユーザが同義語候補グループの編集を指示した場合、同義語候補グループ表示編集手段215が、その指示に従って同義語候補記憶部303に格納されている同義語候補グループを編集し、編集後の状態を表示する(ステップF6およびF7)。ここで、同義語候補グループの編集とは、同義語候補グループに新たに単語を追加する処理、同義語候補グループ内の指定する単語を他の同義語グループに移動する処理、同義語候補グループ内の指定する単語を削除する処理、同義語候補グループの代表語を同義語候補グループ内の別の単語に変更する処理等、現在選択されている代表語に対する同義語候補グループの内容に変更を加える処理を指す。
When the user instructs to edit the synonym candidate group from the state of step F3, the synonym candidate group
ステップF3の状態から、ユーザが処理の終了を指示した場合、同義語候補グループ表示編集手段215は、処理を終了する。ユーザによる入力が、これまでの指示にあてはまらなかった場合、無効な入力として、再びユーザからの入力を待つ(ステップF8)。
When the user instructs the end of the process from the state of step F3, the synonym candidate group
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
本実施の形態では、互いに直接的または間接的な同義関係を持つ単語を同義語候補グループとしてグループ化し、同義語候補グループを1つの単位としてユーザに編集させる。このため、ユーザは、代表語と直接的な同義関係がある単語および間接的な同義関係がある単語の双方を同時に表示して比較しながら編集することができる。 In the present embodiment, words having a direct or indirect synonym relationship with each other are grouped as a synonym candidate group, and the user is allowed to edit the synonym candidate group as one unit. For this reason, the user can edit both a word having a direct synonym relation with a representative word and a word having an indirect synonym relation while simultaneously displaying and comparing the word.
また、本実施の形態では、同一の単語が複数の異なるグループに属さないように、同義語候補グループを作成し、同義語グループ毎に代表語を1つ選定する。このため、ユーザが編集を開始する際には、1つの単語が複数の代表語に対応していることがない。この結果、1つの単語に対して代表語が一意に定まる同義語辞書を作成することが容易になる。 In this embodiment, a synonym candidate group is created so that the same word does not belong to a plurality of different groups, and one representative word is selected for each synonym group. For this reason, when the user starts editing, one word does not correspond to a plurality of representative words. As a result, it becomes easy to create a synonym dictionary in which representative words are uniquely determined for one word.
次に、本発明の第7の最良の形態について図面を参照して詳細に説明する。 Next, a seventh best mode of the present invention will be described in detail with reference to the drawings.
図13を参照すると、本発明の第7の最良の形態は、データ処理装置26が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、関係代表語抽出手段216および関係代表語情報表示手段217を有する点で異なる。
Referring to FIG. 13, the seventh best mode of the present invention is that the
関係代表語抽出手段216は、ユーザが選択した代表語と直接的または間接的な同義関係を持つ別な代表語を同義語候補記憶部303を参照して抽出する。
The related representative
関係代表語情報表示手段217は、関係代表語抽出手段216によって抽出された代表語に対して、そのことを示す情報をその代表語に添えて表示する。 The related representative word information display means 217 displays information indicating that for the representative words extracted by the related representative word extraction means 216 along with the representative words.
次に、本実施の形態の動作を図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図14のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
The operations of the synonym candidate extraction means 201, the synonym candidate display editing means 202, and the synonym dictionary output means 205 in the present embodiment indicated by steps A1 to A8 and A11 to A15 in FIG. 14 are the same as those in the first embodiment. Since the operations are the same as those of the
本発明の第7の最良の形態では、ステップA8において、同義語候補表示編集手段202がユーザが選択した代表語に対する同義語の候補を表示した後、関係代表語抽出手段216が、ユーザが選択した代表語と直接的または間接的な同義関係を持つ別な代表語を同義語候補記憶部303から抽出する(ステップG1)。続いて、関係代表語情報表示手段217が、関係代表語抽出手段216によって抽出された代表語のそれぞれに対して、そのことを示す情報をその代表語に添えて表示する(ステップG2)。
In the seventh best mode of the present invention, after the synonym candidate display / editing means 202 displays the synonym candidate for the representative word selected by the user in step A8, the related representative
本実施の形態において、関係代表語情報表示手段217は、関係代表語抽出手段216によって抽出された代表語に対して情報を表示する代わりに、それらがユーザが選択した代表語の近くに表示されるように代表語の表示順を入れ替えてもよい。このとき、さらに、ユーザが選択した代表語と直接的な同義関係を持つ代表語を元の同義語のいちばん近くに、さらに、ユーザが選択した代表語と少ない単語を介して間接的な同義関係を持つ代表語ほど近くに表示するようにしてもよい。
In the present embodiment, the related representative word
また、本実施の形態では、同義語候補表示編集手段202がユーザが選択した代表語に対する同義語の候補を表示した際に、関係代表語抽出手段216および関係代表語情報表示手段217が動作するように説明したが、ユーザが特別に指示したときに、関係代表語抽出手段216および関係代表語情報表示手段217が動作して、ユーザが選択した代表語と直接的または間接的な同義関係を持つ代表語に対して情報を表示し、ユーザが特別に指示したときにその表示を解除するようにしてもよい。その場合、情報を代表語に添えて表示するのではなく、ユーザが選択した代表語と直接的または間接的な同義関係を持たない代表語を代表語のリストにおいて非表示の状態にするようにしてもよい。
In the present embodiment, when the synonym candidate
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
本実施の形態では、ユーザが選択した代表語と直接的または間接的な同義関係を持つ別の代表語に対してそのことを示す情報を表示する。このため、ユーザは、互いに直接的または間接的な同義関係がある代表語について、同義語の候補を容易に比較することができる。 In the present embodiment, information indicating that is displayed for another representative word having a direct or indirect synonym relation with the representative word selected by the user. Therefore, the user can easily compare synonym candidates with respect to representative words that have a direct or indirect synonymous relationship with each other.
次に、本発明の第8の最良の形態について図面を参照して詳細に説明する。 Next, an eighth best mode of the present invention will be described in detail with reference to the drawings.
図15を参照すると、本発明の第8の最良の形態は、データ処理装置27が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、同義語候補セット確定手段218および同義語候補確定情報表示手段219を有する点で異なる。
Referring to FIG. 15, the eighth best mode of the present invention is that the
同義語候補セット確定手段218は、ユーザによって指定された代表語とそれに対する同義語の候補のセットを確定状態にし、同義語候補記憶部303にその情報を記録する。ここでは、代表語とそれに対する同義語の候補のセットを同義語候補セットと呼ぶことにする。同義語候補セット確定手段218は、さらに、確定状態にした同義語候補セットに含まれる各単語に対して、確定済みという情報を付与し、同義語候補記憶部303に記録する。なお、この情報は、特定の同義語候補セット中の特定の単語に付与されるものではなく、単語そのものに対して付与されるものである。すなわち、確定済みという情報を付与された単語は、どの同義語候補セット中においても確定済みとして扱う。
The synonym candidate set determining
同義語候補確定情報表示手段219は、同義語候補表示編集手段202が、代表語あるいは同義語の候補を表示する際に、その単語が確定済みかどうかを示す情報をその単語に添えて表示する。 The synonym candidate confirmation information display means 219 displays information indicating whether or not the word is confirmed when the synonym candidate display editing means 202 displays a representative word or a synonym candidate. .
次に、本実施の形態の動作を図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図14のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
The operations of the synonym candidate extraction means 201, the synonym candidate display editing means 202, and the synonym dictionary output means 205 in the present embodiment indicated by steps A1 to A8 and A11 to A15 in FIG. 14 are the same as those in the first embodiment. Since the operations are the same as those of the
本実施の形態では、ステップA5において、同義語候補表示編集手段202が、代表語のリストを表示した後、同義語候補確定情報表示手段219が、それぞれの代表語について、その単語が確定済みかどうかを示す情報をその単語に添えて表示する(ステップH1)。また、ステップA8において、同義語候補表示編集手段202が、同義語の候補のリストを表示した後、同義語候補確定情報表示手段219が、それぞれの同義語の候補について、その単語が確定済みかどうかを示す情報をその単語に添えて表示する(ステップH2)。
In the present embodiment, in step A5, after the synonym candidate
本実施の形態では、ステップA6において、ユーザが同義語候補セットの確定を指示した場合、同義語候補セット確定手段218が、その同義語候補セットを確定状態にし(ステップH3およびH4)、その同義語候補セットに含まれる各単語に対して、確定済みという情報を付与する(ステップH5)。この処理で代表語の状態が変更されることがあるため、この後、代表語に対する情報を再表示する(ステップH1)。 In this embodiment, when the user instructs to confirm the synonym candidate set in step A6, the synonym candidate set confirming means 218 places the synonym candidate set in the confirmed state (steps H3 and H4), and synonyms thereof. For each word included in the word candidate set, information that is confirmed is given (step H5). Since the state of the representative word may be changed by this process, information on the representative word is displayed again (step H1).
なお、本実施の形態では、確定状態の同義語候補セットは、同義語候補表示編集手段202の処理の対象外とする。すなわち、同義語候補表示編集手段202は、確定状態の同義語候補セットに対しては、同義語の候補をユーザに編集させない。これは、ステップA5において、確定状態の同義語候補セットの代表語を表示しないことにより実現してもよいし、確定状態の同義語候補セットについてはそのことをユーザに表示してステップA11において編集の指示を受け付けないことにより実現してもよい。
In the present embodiment, the synonym candidate set in the confirmed state is excluded from processing by the synonym candidate
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
本実施の形態では、ユーザが確定した同義語候補セットに含まれている単語に対して、そのことを示す情報が表示される。これにより、ユーザは、すでに他の代表語に対する同義語として確定した単語が分かるため、1つの単語を複数の異なる代表語の同義語として定義しないようにすることができる。 In this Embodiment, the information which shows that is displayed with respect to the word contained in the synonym candidate set which the user determined. As a result, the user can recognize a word that has already been confirmed as a synonym for another representative word, so that one word can not be defined as a synonym for a plurality of different representative words.
次に、本発明の第9の最良の形態について図面を参照して詳細に説明する。 Next, a ninth best mode of the present invention will be described in detail with reference to the drawings.
図17を参照すると、本発明の第9の最良の形態は、データ処理装置28が、図15に示された第8の最良の形態におけるデータ処理装置27の構成要素のうち、同義語候補確定情報表示手段219に代わり、同義語候補セット修正手段220を有する点で異なる。
Referring to FIG. 17, the ninth best mode of the present invention is that the
同義語候補セット修正手段220は、同義語候補セット確定手段218によって確定済みという情報が付与された単語を、未確定状態の同義語候補セットから削除する。
The synonym candidate set correcting means 220 deletes the word to which the information that has been confirmed by the synonym candidate set confirming
次に、本実施の形態の動作を図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図18のステップA1〜A8およびA11〜A15およびH3〜H5で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205、同義語候補セット確定手段218の動作は、第8の実施の形態の各手段201、202、205、218の動作と同一のため、説明は省略する。
18, synonym candidate extraction means 201, synonym candidate display editing means 202, synonym dictionary output means 205, and synonym candidate set confirmation in the present embodiment indicated by steps A <b> 1 to A <b> 8 and A <b> 11 to A <b> 15 and H <b> 3 to H <b> 5. The operation of the
本実施の形態では、ステップH5において、同義語候補セット確定手段218が単語に確定済みという情報を付与した後、同義語候補セット修正手段220が、未確定状態の同義語候補セットから確定済みとされた単語を削除する(ステップJ1)。この処理で代表語が変更されることがあるため、この後、代表語のリストを再表示する(ステップA5)。
In the present embodiment, in step H5, after the synonym candidate set
なお、本実施の形態でも、第8の実施の形態と同様に、確定状態の同義語候補セットは、同義語候補表示編集手段202の処理の対象外とする。
Also in this embodiment, as in the eighth embodiment, the synonym candidate set in the confirmed state is excluded from the processing of the synonym candidate
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
本実施の形態では、ユーザが確定した同義語候補セットに含まれている単語は、他の同義語セットから削除される。これにより、ユーザが、1つの単語を複数の異なる代表語の同義語として定義することを防ぐことができる。 In this Embodiment, the word contained in the synonym candidate set which the user determined is deleted from another synonym set. This can prevent the user from defining one word as a synonym for a plurality of different representative words.
次に、本発明の第10の最良の形態について図面を参照して詳細に説明する。 Next, a tenth best mode of the present invention will be described in detail with reference to the drawings.
図19を参照すると、本発明の第10の最良の形態は、データ処理装置29が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、同義語辞書内容反映手段221を有する点で異なる。
Referring to FIG. 19, in the tenth best mode of the present invention, the
また、本実施の形態では、同義語辞書304が予め内容を保持していてよい。同義語辞書出力手段205は、同義語辞書304の内容を破棄した後、辞書エントリを出力する。
Moreover, in this Embodiment, the
同義語辞書内容反映手段221は、同義語辞書304に定義されている辞書エントリを読み出し、辞書エントリ中で同義語として定義されている単語を同義語候補記憶部303に格納されている同義語候補セットから削除し、辞書エントリ中で代表語として定義されている単語を同義語候補記憶部303に格納されている同義語の候補から削除する。その後、読み出した辞書エントリの内容、すなわち代表語とそれに対する同義語のリストを、代表語とそれに対する同義語の候補のリストとして、同義語候補記憶部303に格納する。これらの処理により、同義語候補記憶部303に格納されている同義語候補セットにおいて、既存の同義語辞書304に含まれる単語に関しては、既存の同義語辞書304が定義する内容以外を含まなくなる。
The synonym dictionary content reflecting means 221 reads a dictionary entry defined in the
次に、本実施の形態の動作を図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図20のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
The operations of the synonym
本実施の形態では、同義語候補抽出手段201による同義関係にある単語の組の抽出が終了した後、同義語辞書内容反映手段221が、同義語辞書304に定義されている辞書エントリを読み出し、辞書エントリ中で同義語として定義されている単語を同義語候補記憶部303に格納されている同義語候補セットから削除し、辞書エントリ中で代表語として定義されている単語を同義語候補記憶部303に格納されている同義語の候補から削除する(ステップK1)。さらに、同義語辞書内容反映手段221が、読み出した辞書エントリの内容を、同義語候補記憶部303に格納する(ステップK2)。ここまでの処理で代表語が変更されていることがあるので、この後、代表語のリストを再表示する(ステップA5)。
In the present embodiment, after the synonym
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
本実施の形態では、既存の同義語辞書の内容を、テキストから抽出された同義語候補セットに追加してユーザに編集させる。これにより、ユーザは、既存の同義語辞書の内容と、抽出された同義語候補セットの内容をマージした結果を参照して同義語候補セットを編集することができ、テキストから抽出した同義語の候補によって、既存の同義語辞書を容易に拡張することができる。 In the present embodiment, the contents of the existing synonym dictionary are added to the synonym candidate set extracted from the text and edited by the user. Thus, the user can edit the synonym candidate set with reference to the result of merging the contents of the existing synonym dictionary and the extracted synonym candidate set, and the synonym candidate extracted from the text can be edited. Candidates can easily expand existing synonym dictionaries.
また、本実施の形態では、編集の対象となる同義語候補セットにおいて、既存の同義語辞書に含まれる単語に関しては、既存の同義語辞書で定義されている内容以外を含まない。このため、複数の同義語を代表語に統一する目的で使用する同義語辞書を拡張する場合に、ユーザが、既存の同義語辞書の定義内容に反する候補を採用することを防ぐことができる。 Further, in the present embodiment, in the synonym candidate set to be edited, words included in the existing synonym dictionary do not include contents other than those defined in the existing synonym dictionary. For this reason, when expanding the synonym dictionary used in order to unify a plurality of synonyms into a representative word, it can prevent that a user adopts the candidate contrary to the definition contents of the existing synonym dictionary.
次に、本発明の第11の最良の形態について図面を参照して詳細に説明する。 Next, an eleventh best mode of the present invention will be described in detail with reference to the drawings.
図21を参照すると、本発明の第11の実施の形態は、本発明の第1〜第10の実施の形態と同様に、入力装置1、データ処理装置20、記憶装置3、出力装置4を備える。
Referring to FIG. 21, the eleventh embodiment of the present invention includes an
同義語辞書作成支援プログラム5は、データ処理装置20に読み込まれ、データ処理装置20の動作を制御し、記憶装置3に、テキスト記憶部301と、抽出規則記憶部302と、同義語候補記憶部303と、同義語辞書304とを生成する。
The synonym dictionary
データ処理装置20は、同義語辞書作成支援プログラム5の制御により、第1〜第10の実施の形態におけるデータ処理装置2および21〜29による処理と同一の処理を実行する。
The
本発明の第1の実施例を図面を参照して説明する。かかる実施例は、本発明の第1の実施の形態に対応するものである。 A first embodiment of the present invention will be described with reference to the drawings. Such an example corresponds to the first embodiment of the present invention.
今、テキスト記憶部に、「コンピュータ」「コンピューター」「コンピュウタ」「コンピュウター」「PC」「パソコン」「ポリカーボネイト」「ポリ・カーボネイト」「ポリカーボネート」「ポリ・カーボネート」という単語を含み、「コンピュータ(PC)」「パソコン(PC)」「ポリカーボネイト(PC)」という表現を含むテキストが記憶されているものとする。また、抽出規則記憶部には、図22に示す規則が登録されているとする。 The text storage now contains the words "computer" "computer" "computer" "computer" "PC" "personal computer" "polycarbonate" "polycarbonate" "polycarbonate" "polycarbonate" It is assumed that texts including the expressions (PC), “PC (PC)”, and “polycarbonate (PC)” are stored. Further, it is assumed that the rules shown in FIG. 22 are registered in the extraction rule storage unit.
ここで、ユーザが、テキストからの同義語候補の抽出を指示すると、同義語候補抽出手段が、抽出規則およびテキストを読み込み、テキスト中から同義関係にある単語の組を抽出して、同義語候補記憶部に格納する。 Here, when the user instructs the extraction of synonym candidates from the text, the synonym candidate extraction means reads the extraction rule and the text, extracts a set of words having a synonymous relationship from the text, and synonym candidates Store in the storage.
本実施例では、1番の抽出規則により(コンピュータ,コンピューター)という単語の組等が、2番の抽出規則により(ポリカーボネイト,ポリ・カーボネイト)という単語の組等が、3番の抽出規則により(コンピュータ,コンピュウタ)という単語の組等が、4番の抽出規則により(ポリカーボネイト,ポリカーボネート)という単語の組等が、5番の抽出規則により(コンピュータ,PC)という単語の組等が抽出される。 In the present embodiment, the set of words (computer, computer), etc., according to the first extraction rule, and the set of words, (polycarbonate, polycarbonate), etc., according to the second extraction rule ( The word set (computer, computer), etc. is extracted by the extraction rule No. 4, the word set (polycarbonate, polycarbonate), etc., and the word set (computer, PC), etc. is extracted by the extraction rule No. 5. .
今、抽出される単語の組を、単語をノードとし、同義関係をノード間のエッジとするグラフによって模式的に表すことにすると、本実施例においては、同義語候補抽出手段によって、最終的に図23のグラフに示される単語の組が抽出されることになる。 Now, when a set of extracted words is schematically represented by a graph in which words are nodes and synonym relations are edges between nodes, in this embodiment, the synonym candidate extracting means finally A set of words shown in the graph of FIG. 23 is extracted.
同義語候補抽出手段は、抽出した単語の組のそれぞれの単語に対して、その単語を代表語とし、もう一方の単語をその代表語に対する同義語の候補として同義語候補記憶部に格納する。図24に、抽出された単語の組が格納された同義語候補記憶部の例を示す。 The synonym candidate extracting means stores, for each word in the extracted word set, the word as a representative word and the other word as a synonym candidate for the representative word in the synonym candidate storage unit. FIG. 24 shows an example of a synonym candidate storage unit that stores a set of extracted words.
次に、同義語候補表示編集手段が同義語候補記憶部から代表語を読み出し、そのリストを表示して、ユーザによる入力を待つ。図25に、画面に表示される代表語のリストの例を示す。 Next, the synonym candidate display editing means reads the representative words from the synonym candidate storage unit, displays the list, and waits for input by the user. FIG. 25 shows an example of a list of representative words displayed on the screen.
ユーザがこの中から代表語を1つ選択すると、同義語候補表示編集手段がその代表語に対する同義語の候補のリストを表示する。 When the user selects one representative word from these, the synonym candidate display / editing means displays a list of synonym candidates for the representative word.
今、図25に示される代表語のリストにおいて、「PC」という単語をユーザが選択したとする。図24を参照すると、「PC」という代表語に対しては、「コンピュータ」「パソコン」「ポリカーボネイト」の3つの同義語の候補があるため、同義語候補表示編集手段は、この3つの単語を同義語の候補として表示する。図26に、画面表示の例を示す。 Now, assume that the user selects the word “PC” in the list of representative words shown in FIG. Referring to FIG. 24, for the representative word “PC”, there are three synonym candidates “computer”, “personal computer”, and “polycarbonate”. Display as a synonym candidate. FIG. 26 shows an example of screen display.
ここで、域外同義語関係抽出手段が、それぞれの同義語の候補が、ユーザによって選択された代表語およびその代表語に対する同義語の候補以外の単語との同義関係(域外の同義関係)を持つかどうかを判定し、域外同義関係情報表示手段が、域外の同義関係を持つと判定された同義語の候補に対して、そのことを示す情報を同義語の候補に添えて表示する。 Here, the out-of-region synonym relationship extraction means has each synonym candidate having a synonym relationship (outside-region synonym relationship) between the representative word selected by the user and a word other than the synonym candidate for the representative word. And the out-of-region synonym relation information display means displays information indicating that for the synonym candidate determined to have the out-of-region synonym relationship along with the synonym candidate.
図24を参照すると、3つの同義語の候補のうち「コンピュータ」は、「PC」「コンピュータ」「パソコン」「ポリカーボネイト」以外の単語「コンピュウタ」等と同義関係を持っており、「ポリカーボネイト」も、「PC」「コンピュータ」「パソコン」「ポリカーボネイト」以外の単語「ポリカーボネート」等と同義関係を持っている。一方、「パソコン」は、現在選択中の代表語「PC」としか同義関係を持たないため、域外同義語関係抽出手段は、「コンピュータ」と「ポリカーボネイト」が域外の同義関係を持つと判定し、域外同義関係情報表示手段が、そのことを示す情報をこれらの単語に添えて表示する。図27に、画面表示の例を示す。 Referring to FIG. 24, among the three synonym candidates, “computer” has a synonym relationship with the word “computer” other than “PC”, “computer”, “personal computer”, “polycarbonate”, etc., and “polycarbonate” Are also synonymous with the word “polycarbonate” other than “PC”, “computer”, “personal computer”, and “polycarbonate”. On the other hand, since “PC” has only the synonym relationship with the currently selected representative word “PC”, the out-of-region synonym relation extraction means determines that “computer” and “polycarbonate” have the out-of-region synonym relationship. The out-of-region synonym relation information display means displays information indicating this along with these words. FIG. 27 shows an example of screen display.
図27においては、代表語「PC」に対する同義語の候補のうち、「パソコン」と「ポリカーボネイト」が域外の同義関係を持つことが「★」印によって示されている。これにより、ユーザは、これらの単語を介して、代表語「PC」が間接的な同義関係にある語を持つこと、および、これらの単語が他の代表語に対する同義語の候補となっていることを知ることができる。 In FIG. 27, among the synonym candidates for the representative word “PC”, “★” marks indicate that “PC” and “polycarbonate” have a synonymous relationship outside the region. Thereby, the user has a word in which the representative word “PC” has an indirect synonym relation through these words, and these words are candidates for synonyms for other representative words. I can know that.
図25〜27において、画面下部のボタンは、ユーザによる同義語候補の編集の指示、同義語辞書の出力の指示、動作終了の指示を受け付けるためのものである。ユーザがこれらのボタンをクリックした場合には、それに対応する処理を行う。 25 to 27, buttons at the bottom of the screen are for accepting an instruction to edit a synonym candidate, an instruction to output a synonym dictionary, and an instruction to end an operation. When the user clicks these buttons, the corresponding processing is performed.
次に、本発明の第2の実施例を図面を参照して説明する。かかる実施例は、本発明の第2の実施の形態に対応するものである。 Next, a second embodiment of the present invention will be described with reference to the drawings. Such an example corresponds to the second embodiment of the present invention.
ここでは、第1の実施例と同じ例を用いて、第2の実施例を説明する。 Here, the second example will be described using the same example as the first example.
第2の実施例においては、ユーザが選択した代表語に対する同義語の候補のリストを、同義語候補表示編集手段が、図26のように表示した後、ユーザが同義語の候補のリストの中から単語を1つ選択すると、間接同義語候補抽出手段が、その単語を代表語とする同義語の候補を抽出し、間接同義語候補表示編集手段が、抽出された同義語の候補のリストを元の同義語の候補とは別に表示し、ユーザによる編集操作を受け付ける。 In the second embodiment, the synonym candidate display editing means displays the list of synonym candidates for the representative word selected by the user as shown in FIG. Then, the indirect synonym candidate extraction unit extracts a synonym candidate having the word as a representative word, and the indirect synonym candidate display editing unit selects a list of extracted synonym candidates. This is displayed separately from the original synonym candidate and accepts an editing operation by the user.
ここでは、図26の画面において、ユーザが「コンピュータ」という同義語の候補を選択したとする。図24を参照すると、「コンピュータ」という代表語に対しては、「コンピュウタ」「コンピューター」「PC」の3語の同義語の候補が存在するため、間接同義語候補表示手段によって、これらの3つの単語が同義語の候補が表示される。図28に画面表示の例を示す。 Here, it is assumed that the user selects a synonym candidate “computer” on the screen of FIG. 26. Referring to FIG. 24, since there are three synonym candidates “computer”, “computer”, and “PC” for the representative word “computer”, these words are displayed by the indirect synonym candidate display means. Three candidates for synonyms are displayed. FIG. 28 shows an example of screen display.
ユーザは、この画面から単語を選択し、その単語を元の代表語の同義語の候補に追加するような編集の指示を与えることにより、「PC」の同義語の候補には存在しなかった「コンピューター」等の単語を「PC」の同義語の候補に追加することができる。図28の画面は、画面下部のボタンによってこの指示を受け付ける例を示している。 The user selects a word from this screen and gives an editing instruction to add the word to the synonym candidate of the original representative word, so that it does not exist in the synonym candidate of “PC” Words such as “computer” can be added to the candidate synonyms for “PC”. The screen in FIG. 28 shows an example in which this instruction is received by a button at the bottom of the screen.
次に、本発明の第3の実施例を図面を参照して説明する。かかる実施例は、本発明の第3の実施の形態に対応するものである。 Next, a third embodiment of the present invention will be described with reference to the drawings. Such an example corresponds to the third embodiment of the present invention.
ここでは、これまでと同じ例を用いて、第3の実施例を説明する。 Here, the third embodiment will be described using the same example as before.
第3の実施例においては、ユーザが選択した同義語の候補を代表語とする別の同義語の候補のリストを、間接同義語候補表示編集手段が、図28のように表示した後、域内間接同義語候補抽出手段が、その同義語の候補のうち、元の代表語および元の同義語の候補に含まれているものを域内の間接同義語候補として抽出し、域内間接同義語候補情報表示手段が、域内の間接同義語候補に対してそのことを示す情報を添えて表示する。 In the third embodiment, after the indirect synonym candidate display editing unit displays a list of other synonym candidates having the synonym candidate selected by the user as a representative word, as shown in FIG. The indirect synonym candidate extracting means extracts the synonym candidates included in the original representative word and the original synonym candidate as indirect synonym candidates in the region, and the indirect synonym candidate information in the region The display means displays the indirect synonym candidate in the region with information indicating it.
図28の例では、「コンピュウタ」「コンピューター」「PC」の3語の同義語の候補のうち、「PC」という単語は元の代表語であるため、域内の間接同義語候補であるが、残りの2単語は、元の代表語および元の同義語の候補には含まれていないため、域内の間接同義語候補ではない。域内間接同義語候補情報表示手段は、「PC」という単語に対して、その単語が域内の間接同義語候補であることを示す情報付加して表示する。図29に画面表示の例を示す。 In the example of FIG. 28, among the three synonym candidates “computer”, “computer”, and “PC”, the word “PC” is the original representative word, and thus is an indirect synonym candidate in the region. The remaining two words are not included in the original representative word and the original synonym candidate, and thus are not indirect synonym candidates in the region. The intra-region indirect synonym candidate information display means displays the word “PC” with information indicating that the word is an indirect synonym candidate in the region. FIG. 29 shows an example of screen display.
図29においては、「コンピュータ」に対する同義語の候補のうち、「PC」という単語が域内の間接同義語候補であることが「☆」印によって示されている。これにより、ユーザは、これらの単語を、元の代表語「PC」の同義語の候補として追加する必要がないことを知ることができる。 In FIG. 29, among the synonym candidates for “computer”, the word “PC” indicates that the word “PC” is an indirect synonym candidate in the region. Thereby, the user can know that it is not necessary to add these words as a synonym candidate of the original representative word “PC”.
次に、本発明の第4の実施例を図面を参照して説明する。かかる実施例は、本発明の第4の実施の形態に対応するものである。 Next, a fourth embodiment of the present invention will be described with reference to the drawings. Such an example corresponds to the fourth embodiment of the present invention.
ここでは、これまでと同じ例を用いて、第4の実施例を説明する。 Here, the fourth embodiment will be described using the same example as before.
第4の実施例においては、同義語候補表示編集手段が同義語の候補のリストを、表示した後、ユーザが同義語の候補の拡張を指示した場合に、拡張同義語候補表示手段が、ユーザが選択した代表語と間接的な同義関係がある単語の中から、同義語の候補の拡張として追加すべき単語の候補を拡張同義語候補として抽出し、ユーザに提示する。 In the fourth embodiment, after the synonym candidate display editing unit displays the list of synonym candidates, and when the user instructs expansion of the synonym candidates, the expanded synonym candidate display unit Are extracted from the words that have an indirect synonym relation with the representative word selected as an extension of synonym candidates, and are extracted as extended synonym candidates and presented to the user.
今、拡張同義語候補表示手段が、ユーザが選択した代表語と高々1つの単語を介して間接的な同義関係がある単語のうち、現在ユーザが選択している代表語および現在表示中の同義語の候補に含まれないものを拡張同義語候補として抽出することにする。この条件によると、図26のように、代表語として「PC」が選択されているときに、ユーザが同義語の候補の拡張を指示した場合、拡張同義語候補としては、「コンピュウタ」「コンピューター」「ポリカーボネート」「ポリ・カーボネイト」の4単語が抽出される。この場合の拡張同義語候補表示手段による画面表示の例を図30に示す。 The expanded synonym candidate display means now has a representative word currently selected by the user and a synonym currently being displayed out of words having an indirect synonymous relationship with the representative word selected by the user through at most one word. Those not included in the word candidates are extracted as extended synonym candidates. According to this condition, as shown in FIG. 26, when “PC” is selected as the representative word and the user instructs expansion of the synonym candidate, the expanded synonym candidate includes “computer” “ Four words of “computer”, “polycarbonate” and “polycarbonate” are extracted. An example of the screen display by the extended synonym candidate display means in this case is shown in FIG.
このように、拡張同義語候補表示手段が拡張同義語候補をユーザに提示した後、拡張同義語候補追加手段が、拡張同義語候補の中で実際に同義語の候補に追加する単語をユーザに選択させ、ユーザが選択した単語のみを同義語の候補に追加する。 Thus, after the extended synonym candidate display means presents the extended synonym candidate to the user, the extended synonym candidate addition means gives the user a word that is actually added to the synonym candidate among the extended synonym candidates. Only words selected by the user are added to the synonym candidates.
図30は、各拡張同義語候補の前のチェックボックスにチェックすることによってユーザに同義語の候補に追加する単語を選択させ、画面下部の実行ボタンがクリックされたときにチェックされた単語を同義語の候補に追加するようにする場合の画面例を示している。ユーザは、簡単な操作で、代表語と間接的な同義関係にある単語を、その代表語の同義語の候補として追加することができる。 FIG. 30 shows that a user selects a word to be added to a synonym candidate by checking a check box in front of each extended synonym candidate, and synonyms the word checked when the execution button at the bottom of the screen is clicked. The example of a screen in the case of making it add to a word candidate is shown. The user can add a word that is indirectly synonymous with the representative word as a candidate for a synonym of the representative word with a simple operation.
次に、本発明の第5の実施例を図面を参照して説明する。かかる実施例は、本発明の第5の実施の形態に対応するものである。 Next, a fifth embodiment of the present invention will be described with reference to the drawings. Such an example corresponds to the fifth embodiment of the present invention.
ここでは、これまでと同じ例を用いて、第5の実施例を説明する。 Here, the fifth embodiment will be described using the same example as before.
第5の実施例においては、同義語候補表示編集手段が同義語の候補のリストを、表示した後、ユーザが同義語の候補に、別な代表語の同義語の候補を追加するよう指示した場合に、追加同義語候補表示手段が、ユーザが追加しようとした単語と直接的または間接的な同義関係がある単語の中から、同義語の候補に同時に追加すべき単語の候補を追加同義語候補として抽出し、ユーザに提示する。 In the fifth embodiment, after the synonym candidate display / editing means displays the list of synonym candidates, the user instructs the synonym candidate to add a synonym candidate of another representative word to the synonym candidate. In this case, the additional synonym candidate display means adds a word candidate to be simultaneously added to the synonym candidate from words having a direct or indirect synonym relationship with the word the user is trying to add. Extracted as candidates and presented to the user.
今、追加同義語候補表示手段が、ユーザが追加しようとした単語と高々1つの単語を介して間接的な同義関係がある単語のうち、現在ユーザが選択している代表語および現在表示中の同義語の候補に含まれないものを追加同義語候補として抽出することにする。図26の画面のように、代表語として「PC」が選択されているとき、ユーザーが「コンピューター」という単語を追加しようとしたとすると、前述の条件によれば、追加同義語候補としては、「コンピュウタ」「コンピュウター」の2単語が抽出される。この場合の追加同義語候補表示手段による画面表示の例を図31に示す。 Now, the additional synonym candidate display means has a representative word currently selected by the user and a currently displayed word out of words having an indirect synonym relation with the word the user is trying to add at most through one word. Those not included in the synonym candidates are extracted as additional synonym candidates. As shown in the screen of FIG. 26, when “PC” is selected as the representative word and the user tries to add the word “computer”, according to the above-mentioned condition, as an additional synonym candidate, Two words “Computer” and “Computer” are extracted. An example of the screen display by the additional synonym candidate display means in this case is shown in FIG.
このように、追加同義語候補表示手段が拡張同義語候補をユーザに提示した後、追加同義語候補追加手段が、追加同義語候補の中で実際に同義語の候補に追加する単語をユーザに選択させ、ユーザが選択した単語のみを、ユーザが最初に追加しようとした単語とともに同義語の候補に追加する。 In this way, after the additional synonym candidate display means presents the extended synonym candidate to the user, the additional synonym candidate adding means gives the user a word that is actually added to the synonym candidate among the additional synonym candidates. Only the word selected by the user is added to the synonym candidate together with the word that the user tried to add first.
図31は、各追加同義語候補の前のチェックボックスにチェックすることによってユーザに同義語の候補に追加する単語を選択させ、画面下部の実行ボタンがクリックされたときにチェックされた単語を、ユーザが最初に追加しようとした単語とともに同義語の候補に追加するようにする場合の画面例を示している。ユーザは、簡単な操作で、追加しようとした単語と直接的または間接的な同義関係にある単語も含めて、同義語の候補として追加することができる。 FIG. 31 allows the user to select a word to be added to the synonym candidate by checking the check box in front of each additional synonym candidate, and the word checked when the execution button at the bottom of the screen is clicked, The example of a screen in the case of making it add to the candidate of a synonym with the word which the user tried to add first is shown. The user can add as a synonym candidate by a simple operation, including a word that is directly or indirectly synonymous with the word to be added.
次に、本発明の第6の実施例を図面を参照して説明する。かかる実施例は、本発明の第6の実施の形態に対応するものである。 Next, a sixth embodiment of the present invention will be described with reference to the drawings. This example corresponds to the sixth embodiment of the present invention.
ここでは、これまでと同じ例を用いて、第6の実施例を説明する。 Here, the sixth embodiment will be described using the same example as before.
第6の実施例においては、同義語候補抽出手段によって抽出された単語を、同義語候補グループ分割手段が、同一のグループに属する単語どうしが互いに直接的または間接的な同義関係を持ち、かつ、同一の単語が複数の異なるグループに属さないように、いくつかの同義語候補グループに分割する。 In the sixth embodiment, the words extracted by the synonym candidate extracting means are synonymous candidate group dividing means, the words belonging to the same group have a direct or indirect synonymous relationship with each other, and It is divided into several synonym candidate groups so that the same word does not belong to a plurality of different groups.
図24に示すように、同義語候補抽出手段によって単語が抽出されているとき、直接的または間接的な同義関係がある単語どうしが必ず同一のグループとなるように同義語候補グループを作成すると、「コンピュウタ」「コンピュウター」「コンピュータ」「コンピューター」「PC」「パソコン」「ポリカーボネイト」「ポリカーボネート」「ポリ・カーボネイト」「ポリ・カーボネート」の10単語からなるグループと「コンペイトー」「コンペートー」の2単語からなるグループができる。これは、図23のグラフを連結成分分解して得られるグループに対応する。 As shown in FIG. 24, when a synonym candidate extraction unit creates a synonym candidate group so that words having a direct or indirect synonym relationship are always in the same group when the word is extracted by the synonym candidate extraction unit, “Computer” “Computer” “Computer” “Computer” “PC” “PC” “Polycarbonate” “Polycarbonate” “Polycarbonate” “Polycarbonate” A group of two words is created. This corresponds to a group obtained by performing the connected component decomposition on the graph of FIG.
一方、直接的な同義関係がある単語どうしに加えて、異なる単語を介する間接的な同義関係が2つ以上ある単語どうしが同一のグループとなるように同義語候補グループを作成すると、「コンピュウタ」「コンピュウター」「コンピュータ」「コンピューター」の4単語からなるグループ、「PC」1単語だけからなるグループ、「パソコン」1単語だけからなるグループ、「ポリカーボネイト」「ポリカーボネート」「ポリ・カーボネイト」「ポリ・カーボネート」の4単語からなるグループ、「コンペイトー」1単語だけからなるグループ、「コンペートー」1単語だけからなるグループの計6グループができる。これは、図23のグラフを強連結成分分解して得られるグループに対応する。 On the other hand, when a synonym candidate group is created so that words having two or more indirect synonym relationships through different words in addition to words having a direct synonym relationship become the same group, "Computer" "Computer" "Computer" 4 words group, "PC" 1 word group, "PC" 1 word group, "Polycarbonate" "Polycarbonate" "Polycarbonate" There are 6 groups in total: 4 groups of “poly carbonate”, 1 group of “Compete”, and 1 group of “Compete”. This corresponds to the group obtained by performing the strongly connected component decomposition on the graph of FIG.
ここでは、後者のように、6つの同義語候補グループを作成したことにして、説明を続ける。 Here, like the latter, six synonym candidate groups have been created, and the description will be continued.
同義語候補グループ分割手段は、抽出された単語を同義語候補グループに分割した後、各同義語候補グループに対して代表語を選定し、同義語候補グループ中の代表語以外の単語を、代表語に対する同義語の候補として、同義語候補記憶部に記録する。 The synonym candidate group dividing means divides the extracted words into synonym candidate groups, selects a representative word for each synonym candidate group, and represents words other than the representative words in the synonym candidate group as representatives. As a synonym candidate for the word, it is recorded in the synonym candidate storage unit.
今、「コンピュウタ」「コンピュウター」「コンピュータ」「コンピューター」の4単語からなるグループの代表語を「コンピュータ」とし、「ポリカーボネイト」「ポリカーボネート」「ポリ・カーボネイト」「ポリ・カーボネート」の4単語からなるグループの代表語を「ポリカーボネイト」とし、その他、1単語からなるグループの代表語をその単語自身とすることにすると、同義語候補記憶部は、例えば、図32に示すような状態になる。 Now, the representative word of the group consisting of the four words "Computer", "Computer", "Computer" and "Computer" is "Computer", and the four words are "Polycarbonate", "Polycarbonate", "Polycarbonate" and "Polycarbonate". If the representative word of the group consisting of “polycarbonate” and the representative word of the group consisting of one word as the word itself, the synonym candidate storage unit is in a state as shown in FIG. 32, for example. .
この後、同義語候補グループ表示編集手段が、代表語のリストをユーザに提示し、ユーザがその中から代表語を選択すると、その代表語に対応する同義語候補グループを構成する単語のリストを表示する。ユーザが代表語「コンピュータ」を選択したときの画面表示の例を図33に示す。ユーザは、この画面において、同義語候補グループの編集を行うことができる。 Thereafter, the synonym candidate group display editing means presents a list of representative words to the user, and when the user selects a representative word from the list, the list of words constituting the synonym candidate group corresponding to the representative word is displayed. indicate. FIG. 33 shows an example of a screen display when the user selects the representative word “computer”. The user can edit the synonym candidate group on this screen.
次に、本発明の第7の実施例を図面を参照して説明する。かかる実施例は、本発明の第7の実施の形態に対応するものである。 Next, a seventh embodiment of the present invention will be described with reference to the drawings. Such an example corresponds to the seventh embodiment of the present invention.
ここでは、これまでと同じ例を用いて、第7の実施例を説明する。 Here, the seventh embodiment will be described using the same example as before.
第7の実施例においては、同義語候補表示編集手段が同義語の候補を表示した後、関係代表語抽出手段が、現在選択されている代表語と直接的または間接的な同義関係がある代表語を抽出し、そのような代表語に対して、関係代表語情報表示手段が、そのことを示す情報を表示する。 In the seventh embodiment, after the synonym candidate display / editing means displays the synonym candidates, the representative representative word extracting means has a direct or indirect synonym relation with the currently selected representative word. A word is extracted, and the related representative word information display means displays information indicating that for such a representative word.
例えば、図25の画面で、ユーザが「コンピュータ」という代表語を選択すると、同義語候補表示編集手段が、同義語の候補として、「コンピュウタ」「コンピューター」「PC」の3単語を表示する。一方、関係代表語抽出手段は、「コンピュータ」と直接的または間接的な同義関係がある代表語として、「コンピュウタ」「コンピュウター」「コンピューター」「PC」「パソコン」「ポリカーボネイト」「ポリカーボネート」「ポリ・カーボネイト」「ポリ・カーボネート」の9単語を抽出する。関係代表語情報表示手段が、抽出された代表語に対して「◎」印を付けて表示することにすると、画面は例えば図34のようになる。 For example, when the user selects the representative word “computer” on the screen of FIG. 25, the synonym candidate display editing means displays three words “computer”, “computer”, and “PC” as synonym candidates. . On the other hand, the related representative word extraction means includes “computer”, “computer”, “computer”, “PC”, “PC”, “polycarbonate”, “polycarbonate” as representative words that have a direct or indirect synonymous relationship with “computer”. Nine words “poly carbonate” and “poly carbonate” are extracted. If the related representative word information display means displays the extracted representative words with “◎” mark, the screen is as shown in FIG. 34, for example.
一方、関係代表語情報表示手段が、抽出された代表語がユーザが選択した代表語の近くに表示されるように代表語の表示順を入れ替えるようにする構成では、画面は例えば図35のようになる。 On the other hand, in the configuration in which the related representative word information display means changes the display order of the representative words so that the extracted representative words are displayed near the representative word selected by the user, the screen is, for example, as shown in FIG. become.
次に、本発明の第8の実施例を図面を参照して説明する。かかる実施例は、本発明の第8の実施の形態に対応するものである。 Next, an eighth embodiment of the present invention will be described with reference to the drawings. Such an example corresponds to the eighth embodiment of the present invention.
ここでは、これまでと同じ例を用いて、第8の実施例を説明する。 Here, the eighth embodiment will be described using the same example as before.
第8の実施例においては、ユーザが、代表語とそれに対する同義語の候補からなる同義語候補セットを確定することができる。例えば、ユーザが、「コンピュータ」という代表語およびその代表語に対する3つの同義語の候補「コンピュウタ」「コンピューター」「PC」を確定すると、同義語候補セット確定手段は、この同義語候補セットを確定状態にし、同義語候補セットに含まれる「コンピュータ」「コンピュウタ」「コンピューター」「PC」の4つの単語に確定済みという情報を付与して、同義語候補記憶部に記録する。このときの同義語候補記憶部の状態を図36に示す。 In the eighth embodiment, the user can determine a synonym candidate set including representative words and synonym candidates for the representative words. For example, when the user confirms the representative word “computer” and three synonym candidates “computer”, “computer”, and “PC” for the representative word, the synonym candidate set confirming means determines the synonym candidate set. In a confirmed state, information that is confirmed is given to the four words “computer”, “computer”, “computer”, and “PC” included in the synonym candidate set and recorded in the synonym candidate storage unit. FIG. 36 shows the state of the synonym candidate storage unit at this time.
本実施例においては、同義語候補確定状態表示手段が、確定済みの代表語および同義語の候補に対して、そのことを示す情報を付加して表示する。このため、上記状態から、ユーザが代表語「コンピュウター」を選択すると、例えば、図37のように表示される。この例では、確定済みの単語が、「*」印付きで表示されている。 In the present embodiment, the synonym candidate confirmation state display means adds and displays information indicating this to the confirmed representative words and synonym candidates. For this reason, when the user selects the representative word “computer” from the above state, for example, the display is as shown in FIG. In this example, confirmed words are displayed with “*” marks.
次に、本発明の第9の実施例を図面を参照して説明する。かかる実施例は、本発明の第9の実施の形態に対応するものである。 Next, a ninth embodiment of the present invention will be described with reference to the drawings. This example corresponds to the ninth embodiment of the present invention.
ここでは、これまでと同じ例を用いて、第9の実施例を説明する。 Here, the ninth embodiment will be described using the same example as before.
第9の実施例においては、ユーザが同義語候補セットを確定すると、同義語候補セット確定手段が、その同義語候補セットを確定状態にし、同義語候補セットに含まれる単語に確定済みという情報を付与した後、同義語候補セット修正手段が、確定済みの単語を未確定状態の同義語セットから削除する。 In the ninth embodiment, when the user confirms the synonym candidate set, the synonym candidate set confirming means sets the synonym candidate set to a confirmed state, and indicates that the word included in the synonym candidate set has been confirmed. After the assignment, the synonym candidate set correcting means deletes the confirmed word from the unsettled synonym set.
例えば、ユーザが、「コンピュータ」という代表語およびその代表語に対する3つの同義語の候補「コンピュウタ」「コンピューター」「PC」を確定した場合、第8の実施例の説明で示したように、同義語候補セット確定手段によって、図36のように4つの単語に確定済みの情報が付与される。同義語候補セット修正手段は、未確定状態の同義語セットから、確定済みの単語「コンピュータ」「コンピュウタ」「コンピューター」「PC」を削除する。このときの同義語候補記憶部の状態を図38に示す。代表語が確定済みである場合には、その同義語候補セット全体が削除される。また、同義語の候補が空になった同義語候補セットも削除される。例えば、図36では、代表語「パソコン」に対して「PC」という同義語の候補が存在しているが、「PC」という単語が確定済みとなった(「PC」の代表語が「コンピュータ」に確定し、代表語が「パソコン」になることはなくなった)ため、図38では、この同義語候補セットは削除されている。 For example, when the user determines a representative word “computer” and three synonym candidates “computer”, “computer”, and “PC” for the representative word, as shown in the description of the eighth embodiment, By the synonym candidate set confirmation means, confirmed information is given to the four words as shown in FIG. The synonym candidate set correcting means deletes the confirmed words “computer”, “computer”, “computer”, and “PC” from the synonym set in the unconfirmed state. The state of the synonym candidate storage unit at this time is shown in FIG. When the representative word has been confirmed, the entire synonym candidate set is deleted. In addition, a synonym candidate set in which synonym candidates are empty is also deleted. For example, in FIG. 36, there is a synonym candidate “PC” for the representative word “PC”, but the word “PC” has been confirmed (the representative word “PC” is “computer”). In this case, the synonym candidate set is deleted in FIG. 38.
同義語候補セット修正手段の処理により、確定状態の同義語候補セットに含まれる単語が、他の代表語に対する同義語の候補として残らなくなる。 By the processing of the synonym candidate set correcting means, the words included in the synonym candidate set in the confirmed state do not remain as synonym candidates for other representative words.
次に、本発明の第10の実施例を図面を参照して説明する。かかる実施例は、本発明の第10の実施の形態に対応するものである。 Next, a tenth embodiment of the present invention will be described with reference to the drawings. This example corresponds to the tenth embodiment of the present invention.
ここでは、これまでと同じ例を用いて、第10の実施例を説明する。 Here, the tenth embodiment will be described using the same example as before.
本実施例においては、同義語辞書に予め図39の内容が定義されているものとする。 In this embodiment, it is assumed that the contents of FIG. 39 are defined in advance in the synonym dictionary.
本実施例では、同義語候補抽出手段がテキスト中から同義関係にある単語の組を抽出し、その結果を図24に示すように同義語候補記憶部に格納した後、同義語辞書内容反映手段が同義語辞書の定義に含まれる単語を同義語候補記憶手段から削除し、その上で同義語辞書の内容を同義語候補記憶手段に追加する。 In this embodiment, the synonym candidate extraction means extracts a set of words having synonym relations from the text, stores the result in the synonym candidate storage unit as shown in FIG. Delete the word included in the definition of the synonym dictionary from the synonym candidate storage unit, and then add the contents of the synonym dictionary to the synonym candidate storage unit.
図39を参照すると、同義語辞書は、同義語として「コンピューター」および「ポリカーボネート」を、代表語として「コンピュータ」および「ポリカーボネイト」を含んでいる。同義語辞書内容反映手段は、まず、図24に示される同義語候補記憶部の代表語と同義語の候補の双方から「コンピューター」および「ポリカーボネート」の2単語を削除し、同義語の候補から「コンピュータ」および「ポリカーボネイト」の2単語を削除する。この結果の状態を図40に示す。 Referring to FIG. 39, the synonym dictionary includes “computer” and “polycarbonate” as synonyms, and “computer” and “polycarbonate” as representative words. The synonym dictionary content reflecting means first deletes the two words “computer” and “polycarbonate” from both the representative word and the synonym candidate of the synonym candidate storage unit shown in FIG. Delete the two words "Computer" and "Polycarbonate". The resulting state is shown in FIG.
次に、同義語辞書内容反映手段は、同義語辞書の内容を同義語候補記憶手段に追加する。この例では、代表語「コンピュータ」に対して同義語の候補「コンピューター」を、代表語「ポリカーボネイト」に対して同義語の候補「ポリカーボネート」を追加する。この結果の状態を図41に示す。 Next, the synonym dictionary content reflecting means adds the contents of the synonym dictionary to the synonym candidate storage means. In this example, a synonym candidate “computer” is added to the representative word “computer”, and a synonym candidate “polycarbonate” is added to the representative word “polycarbonate”. The resulting state is shown in FIG.
同義語辞書内容反映手段の動作により、既存の辞書内容を優先して、抽出された同義語の候補に辞書の内容が追加されている。 By the operation of the synonym dictionary content reflecting means, the dictionary contents are added to the extracted synonym candidates with priority given to the existing dictionary contents.
なお、これまでの実施例の説明において、単語に情報を添えて表示する場合には、その単語に「★」等の印を付ける例を示したが、このような印を付与する代わりに、その単語自身の色や書体を変えることにより情報を示してもよい。 In the description of the embodiments so far, in the case of displaying information with information added to a word, an example of marking the word such as “★” has been shown, but instead of adding such a mark, Information may be indicated by changing the color or typeface of the word itself.
また、ユーザが次の動作を指示する際に、ボタンをクリックするようにする例を示したが、ボタンのクリックの代わりに、キーボード入力、あるいは、メニューからの選択等によりユーザが次の動作を指示するようにしてもよい。 In addition, an example in which the user clicks the button when instructing the next operation has been shown. However, instead of clicking the button, the user can perform the next operation by keyboard input or selection from a menu. You may make it indicate.
本発明は、テキスト中の複数の同義語を単一の代表語に統一する目的で、そのテキストを基にして同義語辞書を作成する用途に適用できる。また、テキスト検索において、入力された検索キーを同義語展開するための同義語辞書を、検索対象のテキストを基にして作成する用途にも適用できる。 The present invention can be applied to the use of creating a synonym dictionary based on a text for the purpose of unifying a plurality of synonyms in the text into a single representative word. Further, in text search, the present invention can also be applied to a purpose of creating a synonym dictionary for synonym expansion of an input search key based on text to be searched.
1 入力装置
2 データ処理装置
3 記憶装置
4 出力装置
5 同義語辞書作成支援プログラム
20 データ処理装置
21 データ処理装置
22 データ処理装置
23 データ処理装置
24 データ処理装置
25 データ処理装置
26 データ処理装置
27 データ処理装置
28 データ処理装置
29 データ処理装置
201 同義語候補抽出手段
202 同義語候補表示編集手段
203 域外同義関係抽出手段
204 域外同義関係情報表示手段
205 同義語辞書出力手段
206 間接同義語候補抽出手段
207 間接同義語候補表示編集手段
208 域内間接同義語候補抽出手段
209 域内間接同義語候補情報表示手段
210 拡張同義語候補表示手段
211 拡張同義語候補追加手段
212 追加同義語候補表示手段
213 追加同義語候補追加手段
214 同義語候補グループ分割手段
215 同義語候補グループ表示編集手段
216 関係代表語抽出手段
217 関係代表語情報表示手段
218 同義語候補セット確定手段
219 同義語候補確定情報表示手段
220 同義語候補セット修正手段
221 同義語辞書内容反映手段
301 テキスト記憶部
302 抽出規則記憶部
303 同義語候補記憶部
304 同義語辞書
DESCRIPTION OF
Claims (6)
前記抽出規則記憶手段から、同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出する同義語候補抽出手段と、
前記同義語候補抽出手段で抽出する同義関係にある単語の組を格納する同義語候補記憶手段と、
ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、前記同義語候補記憶手段から読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付ける同義語候補表示編集手段と、
前記同義語候補表示編集手段が受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、前記同義語候補記憶手段に記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、前記同義語候補記憶手段に記録する同義語候補セット確定手段と、
前記同義語候補セット確定手段で、確定済みというフラグ情報が付与された各単語に対して、各単語が確定済みであることを示す情報を付加表示する同義語候補確定情報表示手段とを備えたことを特徴とする同義語辞書作成支援システム。 An extraction rule storage means for holding a rule for extracting a set of words having synonymous relationships from the text;
A synonym candidate extracting unit that reads a rule for extracting a set of words having a synonymous relationship from the extraction rule storage unit, and extracts a set of words having a synonym relationship from text according to the read rule;
Synonym candidate storage means for storing a set of words in synonym relation extracted by the synonym candidate extraction means;
Accepting designation of a word to be edited from a user, reading a word having a synonym relation with the designated word to be edited from the synonym candidate storage means, and synonymous with the word to be edited In addition to displaying as word candidates, in accordance with an editing instruction from the user, the user's editing instruction for setting the set of the word to be edited and its synonym candidate to a definite state indicating that editing is further prohibited Synonym candidate display editing means to be accepted;
In accordance with the editing instruction from the user received by the synonym candidate display editing means, flag information indicating a fixed state is given to the set of the word to be edited and the synonym candidate, and the synonym A word that is recorded in the candidate storage means and that is included in the set of the word in the confirmed state and the synonym candidate for each of the word to be edited and the synonym candidate to be confirmed. A synonym candidate set confirming unit for adding flag information indicating that it is confirmed and recording the synonym candidate set in the synonym candidate storing unit ;
The synonym candidate set confirmation means includes synonym candidate confirmation information display means for additionally displaying information indicating that each word has been confirmed for each word to which flag information that has been confirmed is given. This is a synonym dictionary creation support system.
前記抽出規則記憶手段から、同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出する同義語候補抽出手段と、
前記同義語候補抽出手段で抽出する同義関係にある単語の組を格納する同義語候補記憶手段と、
ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、前記同義語候補記憶手段から読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付ける同義語候補表示編集手段と、
前記同義語候補表示編集手段が受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、前記同義語候補記憶手段に記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、前記同義語候補記憶手段に記録する同義語候補セット確定手段と、
前記同義語候補セット確定手段で、確定済みというフラグ情報が付与された単語を、前記同義語候補記憶手段から読み出し、前記同義語候補記憶手段で格納されている同義関係にある単語のセットのうち、前記確定状態を表すフラグ情報が付与されていない単語と同義語候補のセットから、前記読み出した確定済みというフラグ情報が付与された単語を削除するとともに、削除結果を前記同義語候補記憶手段に記録する同義語候補セット修正手段とを備えたことを特徴とする同義語辞書作成支援システム。 An extraction rule storage means for holding a rule for extracting a set of words having synonymous relationships from the text;
A synonym candidate extracting unit that reads a rule for extracting a set of words having a synonymous relationship from the extraction rule storage unit, and extracts a set of words having a synonym relationship from text according to the read rule;
Synonym candidate storage means for storing a set of words in synonym relation extracted by the synonym candidate extraction means;
Accepting designation of a word to be edited from a user, reading a word having a synonym relation with the designated word to be edited from the synonym candidate storage means, and synonymous with the word to be edited In addition to displaying as word candidates, in accordance with an editing instruction from the user, the user's editing instruction for setting the set of the word to be edited and its synonym candidate to a definite state indicating that editing is further prohibited Synonym candidate display editing means to be accepted;
In accordance with the editing instruction from the user received by the synonym candidate display editing means, flag information indicating a fixed state is given to the set of the word to be edited and the synonym candidate, and the synonym A word that is recorded in the candidate storage means and that is included in the set of the word in the confirmed state and the synonym candidate for each of the word to be edited and the synonym candidate to be confirmed. A synonym candidate set confirming unit for adding flag information indicating that it is confirmed and recording the synonym candidate set in the synonym candidate storing unit ;
In the synonym candidate set determining section, a word flag information that definite has been applied, the read from the synonym candidate storage means, of a set of words in a synonymous relationship stored in the synonym candidate storage unit In addition, the word with the flag information that has been read out is deleted from the set of words and synonym candidates to which the flag information indicating the confirmed state is not given, and the deletion result is stored in the synonym candidate storage unit. A synonym dictionary creation support system comprising a synonym candidate set correcting means for recording .
前記抽出規則記憶処理により、同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出する同義語候補抽出処理と、
前記同義語候補抽出処理で抽出する同義関係にある単語の組を格納する同義語候補記憶処理と、
ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、前記同義語候補記憶処理によって読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付ける同義語候補表示編集処理と、
前記同義語候補表示編集処理により受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、前記同義語候補記憶処理によって記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、前記同義語候補記憶処理によって記録する同義語候補セット確定処理と、
前記同義語候補セット確定処理により確定済みというフラグ情報が付与された各単語に対して、各単語が確定済みであることを示す情報を付加表示する同義語候補確定情報表示処理とを、コンピュータに実行させることを特徴とする同義語辞書作成支援プログラム。 An extraction rule storage process that holds a rule for extracting a set of synonymous words from the text;
By the extraction rule storage process, a rule for extracting a set of words having a synonym relation is read, and a synonym candidate extraction process for extracting a set of words having a synonym relation from text according to the read rule;
A synonym candidate storage process for storing a set of synonymous words extracted in the synonym candidate extraction process;
The user receives designation of a word to be edited from the user, reads a word having a synonym relation with the designated word to be edited by the synonym candidate storage process, and synonymous with the word to be edited In addition to displaying as word candidates, in accordance with an editing instruction from the user, the user's editing instruction for setting the set of the word to be edited and its synonym candidate to a definite state indicating that editing is further prohibited Acceptable synonym candidate display editing process,
In accordance with the editing instruction from the user received by the synonym candidate display editing process, flag information indicating that the word to be edited and the synonym candidate are in a definite state is given to the synonym A word that is recorded in the candidate storage process and is further included in the set of the word in the confirmed state and the synonym candidate for each of the word to be edited and the synonym candidate to be confirmed. A synonym candidate set confirming process for recording by the synonym candidate storing process, flag information indicating that it has been confirmed ,
A synonym candidate confirmation information display process for displaying information indicating that each word has been confirmed for each word to which flag information that has been confirmed by the synonym candidate set confirmation process is added. A synonym dictionary creation support program characterized by being executed.
前記抽出規則記憶処理により、同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出する同義語候補抽出処理と、
前記同義語候補抽出処理で抽出する同義関係にある単語の組を格納する同義語候補記憶処理と、
ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、前記同義語候補記憶処理により読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付ける同義語候補表示編集処理と、
前記同義語候補表示編集処理により受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、前記同義語候補記憶処理により記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、前記同義語候補記憶処理により記録する同義語候補セット確定処理と、
前記同義語候補セット確定処理により、確定済みというフラグ情報が付与された単語を読み出し、前記同義語候補記憶処理により格納されている同義関係にある単語のセットのうち、前記確定状態を表すフラグ情報が付与されていない単語と同義語候補のセットから、前記読み出した確定済みというフラグ情報が付与された単語を削除するとともに、削除結果を前記同義語候補記憶処理により記録する同義語候補セット修正処理とを、コンピュータに実行させることを特徴とする同義語辞書作成支援プログラム。 An extraction rule storage process that holds a rule for extracting a set of synonymous words from the text;
By the extraction rule storage process, a rule for extracting a set of words having a synonym relation is read, and a synonym candidate extraction process for extracting a set of words having a synonym relation from text according to the read rule;
A synonym candidate storage process for storing a set of synonymous words extracted in the synonym candidate extraction process ;
Accepting designation of a word to be edited from a user, reading a word having the same synonym with the designated word to be edited by the synonym candidate storage process, and synonymous with the designated word to be edited In addition to displaying as word candidates, in accordance with an editing instruction from the user, the user's editing instruction for setting the set of the word to be edited and its synonym candidate to a definite state indicating that editing is further prohibited Acceptable synonym candidate display editing process,
In accordance with the editing instruction from the user received by the synonym candidate display editing process, flag information indicating that the word to be edited and the synonym candidate are in a definite state is given to the synonym A word that is recorded in the candidate storage process and that is included in the set of the word in the confirmed state and the synonym candidate for each of the word to be edited and the synonym candidate to be confirmed. A synonym candidate set confirming process for recording by the synonym candidate storing process, flag information indicating that it has been confirmed,
Flag information representing the confirmed state among a set of words having a synonym relation stored in the synonym candidate storing process by reading a word to which flag information that has been confirmed is given by the synonym candidate set confirming process The synonym candidate set correction process that deletes the word to which the read flag information that has been confirmed is added from the set of words and synonym candidates that have not been assigned and records the deletion result by the synonym candidate storage process And a synonym dictionary creation support program characterized by causing a computer to execute.
同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出し、
抽出する同義関係にある単語の組を格納し、
ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付け、
受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、記録し、
確定済みというフラグ情報が付与された各単語に対して、各単語が確定済みであることを示す情報を付加表示することを特徴とする同義語辞書作成支援方法。 Holds rules for extracting synonymous word pairs from text,
Read rules for extracting synonymous word pairs, follow the rules you read to extract synonymous word pairs from the text,
Stores synonymous word pairs to extract,
While accepting designation of a word to be edited from the user, reading a word that is synonymous with the designated word to be edited and displaying it as a synonym candidate for the designated word to be edited, In accordance with the editing instruction from the user, accepting the editing instruction of the user for setting the set of the word to be edited and its synonym candidate to be in a definite state indicating that editing is further prohibited,
In accordance with the editing instruction from the user who accepts, the flag information indicating the confirmed state is given to the set of the word to be edited and the synonym candidate, and the flag information is recorded, and further, the set to the confirmed state For each word of the word to be edited and its synonym candidate, flag information indicating that the word is in the confirmed state and the word included in the set of synonym candidates is added and recorded And
A synonym dictionary creation support method, characterized in that information indicating that each word has been confirmed is additionally displayed with respect to each word to which flag information indicating confirmed has been assigned.
同義関係にある単語の組を抽出するための規則を読み込み、読み込んだ規則に従って、テキスト中から同義関係にある単語の組を抽出し、
抽出する同義関係にある単語の組を格納し、
ユーザから編集対象とする単語の指定を受け付け、その指定された編集対象とする単語と同義関係にある単語を、読み込んで、前記指定された編集対象とする単語の同義語候補として表示するとともに、ユーザからの編集指示に従って、前記編集対象とする単語とその同義語候補とのセットを、それ以上編集禁止にすることを示す確定状態とするためのユーザの編集指示を受け付け、
受け付けるユーザからの前記編集指示に従って、前記編集対象とする単語とその同義語候補とのセットに対し、確定状態であることを表すフラグ情報を付与し、記録するとともに、さらに、確定状態にする前記編集対象とする単語とその同義語候補の各単語に対して、確定状態である単語とその同義語候補のセットに含まれている単語であることを示す確定済みというフラグ情報を付与し、記録し、
確定済みというフラグ情報が付与された単語を、読み出し、格納されている同義関係にある単語のセットのうち、前記確定状態を表すフラグ情報が付与されていない単語と同義語候補のセットから、前記読み出した確定済みというフラグ情報が付与された単語を削除するとともに、削除結果を記録することを特徴とする同義語辞書作成支援方法。 Holds rules for extracting synonymous word pairs from text,
Read rules for extracting synonymous word pairs, follow the rules you read to extract synonymous word pairs from the text,
Stores synonymous word pairs to extract,
While accepting designation of a word to be edited from the user, reading a word that is synonymous with the designated word to be edited and displaying it as a synonym candidate for the designated word to be edited, In accordance with the editing instruction from the user, accepting the editing instruction of the user for setting the set of the word to be edited and its synonym candidate to be in a definite state indicating that editing is further prohibited,
In accordance with the editing instruction from the user who accepts, the flag information indicating the confirmed state is given to the set of the word to be edited and the synonym candidate, and the flag information is recorded, and further, the set to the confirmed state For each word of the word to be edited and its synonym candidate, flag information indicating that the word is in the confirmed state and the word included in the set of synonym candidates is added and recorded And
The word with the flag information that has been confirmed is read out , and from the set of stored synonyms, the word that has not been given the flag information indicating the confirmed state and the set of synonym candidates, A synonym dictionary creation support method characterized by deleting a word to which the read flag information that has been confirmed is deleted and recording a deletion result .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008201131A JP4337940B2 (en) | 2008-08-04 | 2008-08-04 | Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008201131A JP4337940B2 (en) | 2008-08-04 | 2008-08-04 | Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004037066A Division JP4192799B2 (en) | 2004-02-13 | 2004-02-13 | Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008293533A JP2008293533A (en) | 2008-12-04 |
JP4337940B2 true JP4337940B2 (en) | 2009-09-30 |
Family
ID=40168124
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008201131A Expired - Lifetime JP4337940B2 (en) | 2008-08-04 | 2008-08-04 | Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4337940B2 (en) |
-
2008
- 2008-08-04 JP JP2008201131A patent/JP4337940B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2008293533A (en) | 2008-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7685529B2 (en) | Visual guides for word processing application styles | |
US20170308510A1 (en) | Display and selection of bidirectional text | |
JP5761687B2 (en) | Formula output computer, formula output method, formula output program, and computer-readable recording medium recording formula output program | |
US9372843B2 (en) | Document association device, document association method, and non-transitory computer readable medium | |
CN101802765B (en) | Method, and apparatus for facilitating object selection on display screen | |
JP5723472B1 (en) | Data link generation device, data link generation method, data link structure, and electronic file | |
US6976214B1 (en) | Method, system, and program for enhancing text composition in a text editor program | |
CN111142683B (en) | Input assisting program, input assisting method, and input assisting device | |
JP4245078B2 (en) | Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program | |
JP4337940B2 (en) | Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program | |
JP4192799B2 (en) | Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program | |
JP4337939B2 (en) | Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program | |
JP2008176764A (en) | Image processing system, image processing method and image processing program | |
JP5150657B2 (en) | Manual correction location presentation device, system, method and program | |
JP2008293532A (en) | Synonym dictionary creation support system, synonym dictionary creation support method, and synonym dictionary creation support program | |
JP4416644B2 (en) | Character processing apparatus with prediction function, method, recording medium, and program | |
JP5609718B2 (en) | Input support program, input support device, and input support method | |
JP5025118B2 (en) | Document data processing apparatus and document data processing program | |
JP6048601B2 (en) | Information display device, program, and word information display method | |
US7613709B2 (en) | System and method for editing operations of a text object model | |
JP5965785B2 (en) | Use case scenario creation support device, use case scenario creation support method, and use case scenario creation support program | |
JP6475288B2 (en) | Program comparison method, program comparison device, and program comparison program | |
JP6419902B1 (en) | Program comparison method, program comparison device, and program comparison program | |
JP5880168B2 (en) | Input support program, input support apparatus, and input support method | |
CN111930374A (en) | Data formatting method, data formatting device, programming system, data formatting equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090609 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090622 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4337940 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120710 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120710 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130710 Year of fee payment: 4 |
|
EXPY | Cancellation because of completion of term |