次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。
図1を参照すると、本発明の第1の最良の形態は、キーボード、マウス等の入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶するハードディスク、メモリ等の記憶装置3と、ディスプレイ装置等の出力装置4とを含む。
記憶装置3は、テキスト記憶部301と、抽出規則記憶部302と、同義語候補記憶部303と、同義語辞書304とを備える。
テキスト記憶部301は、同義語を抽出する対象となるテキストを予め保持する。
抽出規則記憶部302は、テキスト中から同義関係にある単語の組を抽出するための規則を予め保持する。同義関係にある単語の組を抽出するための規則とは、例えば、「表記上長音記号の有無のみが異なる単語の組を抽出する」等の単語の組を抽出する際の条件を規定する規則である。
同義語候補記憶部303は、後述する同義語候補抽出手段201によってテキスト中から抽出された同義語の候補およびそれに付随する情報を保持する。
同義語辞書304は、ユーザが最終的に作成する同義語辞書を保持する。同義語辞書304の内容は、後述する同義語辞書出力手段205によって書き込まれる。
同義語候補記憶部303および同義語辞書304は、最初は空の状態である。
データ処理装置2は、同義語候補抽出手段201と、同義語候補表示編集手段202と、域外同義関係抽出手段203と、域外同義関係情報表示手段204と、同義語辞書出力手段205とを備える。
同義語候補抽出手段201は、ユーザからの指示に従って、抽出規則記憶部302から同義関係にある単語の組を抽出するための規則を読み込むとともに、テキスト記憶部301からテキストを読み込み、テキスト中から同義関係にある単語の組を抽出する。さらに、抽出した単語の組のそれぞれの単語について、その単語を代表語とする同義語の候補にもう一方の単語を割り当て、同義語候補記憶部303に格納する。
同義語候補表示編集手段202は、同義語候補記憶部303に格納された代表語の一覧をリストにしてユーザに選択させ、ユーザが選択した代表語に対する同義語の候補のリストを同義語候補記憶部303より読み出して表示する。また、同義語候補表示編集手段202は、表示中の同義語の候補をユーザの指示に従って編集し、結果を同義語候補記憶部303に保存する。
域外同義関係抽出手段203は、同義語候補表示編集手段202が表示する同義語の候補のそれぞれについて、ユーザが選択した代表語およびその代表語に対する同義語の候補以外の単語と同義関係があるかどうかを、同義語候補記憶部303を読み出して検出し、同義語の候補と検出された同義関係に関する情報を対にしたデータを域外同義関係情報表示手段204に渡す。
域外同義関係情報表示手段204は、域外同義関係抽出手段203によってユーザが選択した代表語およびその代表語に対する同義語の候補以外の単語と同義関係があると検出された同義語の候補に対して、その同義関係に関する情報を表示する。
同義語辞書出力手段205は、同義語候補記憶部303に格納されているそれぞれの代表語について、その代表語に対する同義語の候補を、その代表語の同義語とする辞書エントリを作成し、同義語辞書304に出力する。
次に、図1および図2を参照して本発明を実施するための第1の最良の形態の動作について詳細に説明する。
まず、同義語候補抽出手段201が、抽出規則記憶部302から同義関係にある単語の組を抽出するための規則を読み込み(図2のステップA1)、続いて、テキスト記憶部301から同義語の候補を抽出する対象となるテキストを読み込む(ステップA2)。
次に、同義語候補抽出手段201が、読み込んだ抽出規則のいずれかに適合する単語の組をテキスト中から抽出し、抽出した単語の組のそれぞれの単語について、片方を代表語、もう一方をその代表語の同義語の候補として同義語候補記憶部303に格納する。すなわち、(W1,W2)という単語の組が抽出された場合、W1という代表語に対して、同義語の候補W2があり、W2という代表語に対して、同義語の候補W2があるという情報を格納する。抽出する単語の組がなくなるまでこの処理を繰り返す(ステップA3およびA4)。
次に、同義語候補表示編集手段202は、同義語候補記憶部303に格納された代表語のリストを読み出して、ユーザに表示し(ステップA5)、ユーザからの入力を待つ(ステップA6)。
ユーザが、表示された代表語のリストから、代表語を1つ選択した場合、同義語候補表示編集手段202は、選択された代表語に対する同義語の候補のリストをユーザに表示する(ステップA7およびA8)。
このとき、それぞれの同義語の候補について、域外同義関係抽出手段203が、ユーザが選択した代表語およびその代表語に対する同義語の候補以外の単語との同義関係、すなわち、表示されている単語以外との同義関係(域外の同義関係)があるかどうかを、同義語候補記憶部303を読み出して検出し、同義語の候補と検出された同義関係に関する情報を対にしたデータを作成する(ステップA9)。続いて、域外同義関係情報表示手段204が、このデータに基づいて、域外の同義関係が検出された同義語の候補に対して、表示されている同義語の候補に添えて、その同義語候補が域外の同義関係を持つことを示す情報を表示する(ステップA10)。
ステップA6の状態から、ユーザが同義語の候補の編集を指示した場合、同義語候補表示編集手段202が、その指示に従って同義語候補記憶部303に格納されている同義語の候補を編集し、編集後の状態を表示する(ステップA11およびA12)。ここで、同義語の候補の編集とは、同義語の候補に新たに単語を追加する処理、指定する同義語の候補を他の代表語に対する同義語の候補にも追加する処理、指定する同義語の候補を他の代表語に対する同義語の候補に変更する処理、指定する同義語の候補を削除する処理等、現在選択されている代表語に対する同義語の候補の集合に変更を加える処理を指す。
ステップA6の状態から、ユーザが同義語辞書の出力を指示した場合、同義語辞書出力手段205が、同義語候補記憶部303に格納されている同義語の候補を同義語辞書304に出力する(ステップA13およびA14)。
ステップA6の状態から、ユーザが処理の終了を指示した場合、同義語候補表示編集手段202は、処理を終了する。ユーザによる入力が、これまでの指示にあてはまらなかった場合、無効な入力として、再びユーザからの入力を待つ(ステップA15)。
なお、本実施の形態の説明では、域外同義関係情報表示手段204が、域外の同義関係が検出された同義語の候補に対して、そのことを示す情報を表示するように説明したが、域外の同義関係が検出されなかった同義語の候補に対してそのことを示す情報を表示するようにしてもよい。同様に、同義語の候補すべてに対して、その単語が域外の同義関係を持つかどうかを示す情報を表示するようにしてもよい。
次に、本実施の形態の効果について説明する。
本実施の形態では、同義語の候補それぞれに対して、ユーザが選択した代表語およびその代表語に対する同義語の候補以外の単語との同義関係があるかどうかを調べ、それに関する情報を同義語の候補それぞれに添えて表示するため、それぞれの同義語の候補に対して、現在表示されていない、その単語を代表語とする同義語の候補が別に存在するかどうかが表示から容易に分かる。すなわち、本実施の形態は、代表語と直接的な同義関係にある単語以外に、同義語の候補を介して代表語と間接的な同義関係にある単語が別に存在する場合に、ユーザにそのことを知らせるができる。
さらに、これにより、選択した代表語に対する同義語の候補が他の代表語に対する同義語の候補になっている場合、そのことが表示される。このため、ユーザが、複数の代表語に対する同義語の候補となっている単語を容易に検知し、必要に応じて、その単語に対する代表語が1つだけになるように編集を行うことができる。
次に、本発明の第2の最良の形態について図面を参照して詳細に説明する。
図3を参照すると、本発明の第2の最良の形態は、データ処理装置21が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、間接同義語候補抽出手段206および間接同義語候補表示編集手段207を有する点で異なる。
間接同義語候補抽出手段206は、同義語候補表示編集手段202が表示する同義語の候補のリストからユーザが選択した同義語の候補に対して、その単語を代表語とする同義語の候補を同義語候補記憶部303から抽出する。間接同義語候補抽出手段206が抽出する同義語の候補は、ユーザが最初に選択した代表語に対して、ユーザが次に選択した同義語の候補を介した間接的な同義語の候補になっているため、以下では、間接同義語候補抽出手段206が抽出した同義語の候補を間接同義語候補と呼ぶことにする。
間接同義語候補表示編集手段207は、間接同義語候補抽出手段206によって抽出された間接同義語候補のリストをユーザに表示するとともに、ユーザの指示に従って編集し、結果を同義語候補記憶部303に保存する。
次に、本実施の形態の動作を図面を参照して詳細に説明する。
図4のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
本発明の第2の最良の形態では、ステップA6において、ユーザが同義語の候補の1つを選択した場合、間接同義語候補抽出手段206が、その単語を代表語とする同義語の候補を同義語候補記憶部303から抽出する(ステップB1およびB2)。
次に、間接同義語候補表示編集手段207は、間接同義語候補抽出手段206によって抽出された間接同義語候補のリストをユーザに表示し(ステップB3)、再びユーザからの入力を待つ(ステップA6)。
ステップA6において、ユーザが間接同義語候補の編集を指示した場合、間接同義語候補表示編集手段207が、その指示に従って同義語候補記憶部303に格納されている同義語の候補を編集し、編集後の状態を表示する(ステップB4およびB5)。ここで、間接同義語候補の編集とは、同義語の候補の編集と同様、間接同義語候補に新たに単語を追加する処理、指定する間接同義語候補を現在選択中の代表語等の他の代表語に対する同義語の候補に追加する処理、指定する間接同義語候補を現在選択中の代表語等の他の代表語に対する同義語の候補に変更する処理、指定する間接同義語候補を削除する処理等、間接同義語候補の集合、すなわち、ステップB1において選択された同義語の候補を代表語とする同義語の候補の集合に変更を加える処理を指す。
なお、本実施の形態では、ユーザが、ステップA6において、最初に選択した代表語に対する同義語の候補の1つを選択した場合に、間接同義語候補を表示するとして説明したが、ユーザが、間接同義語候補の1つを選択した場合に、その間接同義語候補を代表語とする同義語の候補を第2の間接同義語候補として表示するようにし、再帰的に間接同義語候補を表示できるようにしてもよい。
次に、本実施の形態の効果について説明する。
本実施の形態では、ユーザが同義語の候補を選択すると、現在選択中の代表語に対して、その同義語の候補を介した間接的な同義語の候補(間接同義語候補)を表示し、その間接同義語候補に対する編集の指示を受け付ける。このため、ユーザは、代表語と直接的な同義関係にある単語だけでなく、代表語と間接的な同義関係にある単語を調べ、必要に応じて、代表語の同義語の候補に追加するという操作を容易に行うことができる。すなわち、本実施の形態は、代表語と間接的な同義関係しかない単語を、代表語の同義語として辞書に登録するための支援を行うことができる。
次に、本発明の第3の最良の形態について図面を参照して詳細に説明する。
図5を参照すると、本発明の第3の最良の形態は、データ処理装置22が、図3に示された第2の最良の形態におけるデータ処理装置21の構成に加え、域内間接同義語候補抽出手段208および域内間接同義語候補情報表示手段209を有する点で異なる。
域内間接同義語候補抽出手段208は、間接同義語候補表示編集手段207が表示する間接同義語候補のそれぞれについて、ユーザが選択した代表語およびその代表語に対する同義語の候補の中に含まれているかどうかを検査する。ここでは、ユーザが選択した代表語およびその代表語に対する同義語の候補の中に含まれている間接同義語候補を域内の間接同義語候補と呼ぶことにする。域内間接同義語候補抽出手段208は、それぞれの間接同義語候補に対して、それが域内の間接同義語候補かどうかについての情報を付与し、域内間接同義語候補情報表示手段209に渡す。
域内間接同義語候補情報表示手段209は、域内間接同義語候補抽出手段208によって検出された域内の間接同義語候補に対して、その間接同義語が域内の間接同義語であることを示す情報を表示する。
次に、本実施の形態の動作を図面を参照して詳細に説明する。
図6のステップA1〜A8およびA11〜A15およびB1〜B5で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205、間接同義語候補抽出手段206、間接同義語候補表示編集手段207の動作は、第2の実施の形態の各手段201、202、205、206、207の動作と同一のため、説明は省略する。
本実施の形態では、ステップB3において、間接同義語候補表示編集手段207が間接同義語候補のリストをユーザに表示した後、域内間接同義語候補抽出手段208が、それぞれの間接同義語候補に対して、それがユーザが選択した代表語およびその代表語に対する同義語の候補の中に含まれているかどうかを検査し、その結果についての情報を付与したデータを作成する(ステップC1)。次に、域内間接同義語候補情報表示手段209が、このデータに基づいて、域内の間接同義語候補に対してそのことを示す情報を表示し(ステップC2)、ユーザからの入力を待つ(ステップA6)。
なお、本実施の形態の説明では、域内間接同義語候補情報表示手段209が、域内の間接同義語候補に対して、それが域内の間接同義語候補であることを示す情報を表示するように説明したが、それ以外の間接同義語候補に対して、それが域内の間接同義語候補でないことを示す情報を表示するようにしてもよい。同様に、間接同義語候補すべてに対して、その単語が域内の間接同義語候補であるかどうかを示す情報を表示するようにしてもよい。
また、本実施の形態は、第2の実施の形態と同様に、ユーザが間接同義語候補の1つを選択した場合に、その間接同義語候補を代表語とする同義語の候補を第2の間接同義語候補として表示するようにし、再帰的に間接同義語候補を表示できるようにしてもよい。
次に、本実施の形態の効果について説明する。
本実施の形態では、ユーザが同義語の候補を選択し、現在選択中の代表語に対して、その同義語の候補を介した間接的な同義語の候補(間接同義語候補)を表示する際に、その間接同義語候補が、ユーザが選択した代表語およびその代表語に対する同義語の候補の中に含まれているかどうかについての情報を表示する。このため、ユーザは、代表語と間接的な同義関係にある単語を、代表語の同義語の候補に新たに追加しようとする際に、既に代表語の同義語の候補に含まれている単語がどれかを知ることができ、既に代表語の同義語の候補に含まれている単語を重ねて代表語の同義語の候補に追加しようとすることを防ぐことができる。すなわち、本実施の形態は、代表語と間接的な同義関係しかない単語を、効率よく代表語の同義語として辞書に登録するための支援を行うことができる。
次に、本発明の第4の最良の形態について図面を参照して詳細に説明する。
図7を参照すると、本発明の第4の最良の形態は、データ処理装置23が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、拡張同義語候補表示手段210および拡張同義語候補追加手段211を有する点で異なる。
拡張同義語候補表示手段210は、ユーザが選択した代表語に対して、同義語候補表示編集手段202によって表示されている同義語の候補の拡張として追加すべき単語の候補を、同義語候補記憶部303を参照して、ユーザが選択した代表語と間接的な同義関係がある単語の中から抽出し、ユーザに提示する。ここでは、そのような単語の候補を拡張同義語候補と呼ぶことにする。拡張同義語候補としては、ユーザが選択した代表語と間接的な同義関係がある単語すべてとしてもよいし、ユーザが選択した代表語とある閾値以下の数の単語を介して間接的な同義関係がある単語、あるいは、ユーザが選択した代表語との間に、異なる単語を介する間接的な同義関係が2つ以上ある単語等に限定してもよい。また、ユーザが選択した代表語およびその代表語に対する同義語の候補を、拡張同義語候補から予め除いておいてもよい。拡張同義語候補を抽出する基準については、別途予め定めておく。
拡張同義語候補追加手段211は、拡張同義語候補表示手段210によってユーザに提示された拡張同義語候補のうち、ユーザによって選択されたものを、ユーザが選択した代表語に対する同義語の候補に追加し、その結果を同義語候補記憶部303に保存する。
次に、本実施の形態の動作を図面を参照して詳細に説明する。
図8のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
本発明の第4の最良の形態では、ステップA6において、ユーザが拡張同義語候補の抽出を指示した場合、拡張同義語候補表示手段210が、予め定められた基準に従って、同義語候補記憶部303から拡張同義語候補を抽出し(ステップD1およびD2)、抽出した拡張同義語候補のリストをユーザに表示する(ステップD3)。
次に、拡張同義語候補追加手段211が、ユーザが選択した代表語に対する同義語の候補に追加する拡張同義語候補をユーザに選択させる(ステップD4)。その後、ユーザが選択した拡張同義語候補を、同義語候補記憶部303において、ユーザが選択した代表語に対する同義語の候補に追加し、その状態を表示する(ステップD5)。
次に、本実施の形態の効果について説明する。
本実施の形態では、ユーザが選択した代表語に対する同義語の候補として、その代表語と直接的な同義関係がある単語以外に拡張する際の候補となる単語を、その代表語と間接的な同義関係がある単語の中から抽出し、その中からユーザが選択した単語を、元の代表語に対する同義語の候補として追加する。このため、ユーザは、代表語と直接的な同義関係にある単語だけでなく、代表語と間接的な同義関係にある単語のうち必要なものをその代表語の同義語の候補に追加するという操作を容易に行うことができる。すなわち、本実施の形態は、代表語と間接的な同義関係しかない単語を、代表語の同義語として辞書に登録するための支援を行うことができる。
次に、本発明の第5の最良の形態について図面を参照して詳細に説明する。
図9を参照すると、本発明の第5の最良の形態は、データ処理装置24が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、追加同義語候補表示手段212および追加同義語候補追加手段213を有する点で異なる。
追加同義語候補表示手段212は、ユーザが、同義語の候補に対して、他の代表語の同義語の候補を追加する指示を行うとき、その単語と同時に追加すべき単語の候補を、同義語候補記憶部303を参照して、その単語と直接的または間接的な同義関係がある単語の中から抽出し、ユーザに提示する。ここでは、そのような単語の候補を追加同義語候補と呼ぶことにする。追加同義語候補としては、ユーザが追加しようとした単語と直接的または間接的な同義関係がある単語すべてとしてもよいし、間接的な同義関係について、ユーザが追加しようとした単語とある閾値以下の数の単語を介して間接的な同義関係がある、あるいは、ユーザが追加しようとした単語との間に、異なる単語を介する間接的な同義関係が2つ以上ある等の制限を加えてもよい。また、ユーザが選択した代表語およびその代表語に対する同義語の候補を、追加同義語候補から予め除いておいてもよい。追加同義語候補を抽出する基準については、別途予め定めておく。
追加同義語候補追加手段213は、追加同義語候補表示手段212によってユーザに提示された追加同義語候補のうち、ユーザによって選択されたものを、ユーザが選択した代表語に対する同義語の候補に追加し、その結果を同義語候補記憶部303に保存する。
次に、本実施の形態の動作を図面を参照して詳細に説明する。
図10のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
本発明の第5の最良の形態では、ステップA6において、ユーザが現在の同義語の候補に他の代表語の同義語の候補を追加する指示をした場合、追加同義語候補表示手段212が、予め定められた基準に従って、同義語候補記憶部303から追加同義語候補を抽出し(ステップE1およびE2)、抽出した追加同義語候補のリストをユーザに表示する(ステップE3)。
次に、追加同義語候補追加手段213が、ユーザが追加しようとした単語と同時に同義語の候補に追加すべき追加同義語候補をユーザに選択させる(ステップE4)。その後、ユーザが選択した追加同義語候補を、ユーザが追加しようとした単語と合わせて、同義語候補記憶部303において、ユーザが選択した代表語に対する同義語の候補に追加し、その状態を表示する(ステップE5)。
次に、本実施の形態の効果について説明する。
本実施の形態では、ユーザが単一の単語を同義語の候補に追加しようとした場合でも、その単語と同時に同義語の候補に追加すべき単語の候補を、その単語と間接的な同義関係がある単語の中から抽出し、その中からユーザが選択した単語を、ユーザが追加しようとしていた単語と合わせて同義語の候補に追加する。このため、ユーザは、追加しようとした単一の単語だけでなく、その単語と直接的あるいは間接的な同義関係にある単語のうち必要なものを、その代表語の同義語の候補に追加するという操作を容易に行うことができる。
次に、本発明の第6の最良の形態について図面を参照して詳細に説明する。
図11を参照すると、本発明の第6の最良の形態は、データ処理装置25が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、同義語候補表示編集手段202、域外同義関係抽出手段203、域外同義関係情報表示手段204に代わり、同義語候補グループ分割手段214および同義語候補グループ表示編集手段215を有する点で異なる。
同義語候補グループ分割手段214は、同義語候補抽出手段201によって抽出された単語を、同一のグループに属する単語どうしが互いに直接的または間接的な同義関係を持ち、かつ、同一の単語が複数の異なるグループに属さないように、グループに分割する。ここでは、こうして作成されたグループを同義語候補グループと呼ぶことにする。同義語候補グループ分割手段214は、さらに、各グループの単語の中から代表語を選定し、同義語候補グループ内の他の単語がその代表語に対する同義語の候補となるように同義語候補記憶部303に格納する。
同義語候補グループは、直接的または間接的な同義関係がある単語どうしが必ず同一のグループとなるように作成してもよいし、直接的な同義関係がある単語どうしのほか、ある閾値以下の数の単語を介して間接的な同義関係がある単語どうしが同一のグループとなるように作成したり、異なる単語を介する間接的な同義関係が2つ以上ある単語どうしが同一のグループとなるように作成したりしてもよい。同義語候補グループを作成する基準については、別途予め定めておく。
同義語候補グループの代表語は、同義語候補グループ内の任意の単語でよいが、同一の同義語候補グループ内に直接的な同義関係にある単語をもっとも多く持つ単語、あるいは、同一の同義語候補グループ内で間接的な同義関係を持つ単語について、間接的な同義関係の途中に介する単語の数の最大値がもっとも小さい単語等の基準に従って代表語を選定することもできる。
同義語候補グループ表示編集手段215は、同義語候補記憶部303に格納された代表語の一覧、すなわち、同義語候補グループ分割手段214によって選定された代表語の一覧をリストにしてユーザに選択させ、ユーザが選択した代表語を含む同義語候補グループの単語を同義語候補記憶部303より読み出して表示する。また、同義語候補グループ表示編集手段215は、表示中の同義語候補グループをユーザの指示に従って編集し、結果を同義語候補記憶部303に保存する。
次に、本実施の形態の動作を図面を参照して詳細に説明する。
図12のステップA1〜A4およびA13〜A14で示される本実施の形態における同義語候補抽出手段201、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、205の動作と同一のため、説明は省略する。
本発明の第6の最良の形態では、同義語候補抽出手段201による同義関係にある単語の組の抽出が終了した後、同義語候補グループ分割手段214が、抽出された単語を同義語候補グループに分割する(ステップF1)。
次に、同義語候補グループ表示編集手段215が、同義語候補記憶部303に格納された代表語のリストを読み出して、ユーザに表示し(ステップF2)、ユーザからの入力を待つ(ステップF3)。
ユーザが、表示された代表語のリストから、代表語を1つ選択した場合、同義語候補グループ表示編集手段215は、選択された代表語に対する同義語グループの単語をユーザに表示する(ステップF4およびF5)。
ステップF3の状態から、ユーザが同義語候補グループの編集を指示した場合、同義語候補グループ表示編集手段215が、その指示に従って同義語候補記憶部303に格納されている同義語候補グループを編集し、編集後の状態を表示する(ステップF6およびF7)。ここで、同義語候補グループの編集とは、同義語候補グループに新たに単語を追加する処理、同義語候補グループ内の指定する単語を他の同義語グループに移動する処理、同義語候補グループ内の指定する単語を削除する処理、同義語候補グループの代表語を同義語候補グループ内の別の単語に変更する処理等、現在選択されている代表語に対する同義語候補グループの内容に変更を加える処理を指す。
ステップF3の状態から、ユーザが処理の終了を指示した場合、同義語候補グループ表示編集手段215は、処理を終了する。ユーザによる入力が、これまでの指示にあてはまらなかった場合、無効な入力として、再びユーザからの入力を待つ(ステップF8)。
次に、本実施の形態の効果について説明する。
本実施の形態では、互いに直接的または間接的な同義関係を持つ単語を同義語候補グループとしてグループ化し、同義語候補グループを1つの単位としてユーザに編集させる。このため、ユーザは、代表語と直接的な同義関係がある単語および間接的な同義関係がある単語の双方を同時に表示して比較しながら編集することができる。
また、本実施の形態では、同一の単語が複数の異なるグループに属さないように、同義語候補グループを作成し、同義語グループ毎に代表語を1つ選定する。このため、ユーザが編集を開始する際には、1つの単語が複数の代表語に対応していることがない。この結果、1つの単語に対して代表語が一意に定まる同義語辞書を作成することが容易になる。
次に、本発明の第7の最良の形態について図面を参照して詳細に説明する。
図13を参照すると、本発明の第7の最良の形態は、データ処理装置26が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、関係代表語抽出手段216および関係代表語情報表示手段217を有する点で異なる。
関係代表語抽出手段216は、ユーザが選択した代表語と直接的または間接的な同義関係を持つ別な代表語を同義語候補記憶部303を参照して抽出する。
関係代表語情報表示手段217は、関係代表語抽出手段216によって抽出された代表語に対して、そのことを示す情報をその代表語に添えて表示する。
次に、本実施の形態の動作を図面を参照して詳細に説明する。
図14のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
本発明の第7の最良の形態では、ステップA8において、同義語候補表示編集手段202がユーザが選択した代表語に対する同義語の候補を表示した後、関係代表語抽出手段216が、ユーザが選択した代表語と直接的または間接的な同義関係を持つ別な代表語を同義語候補記憶部303から抽出する(ステップG1)。続いて、関係代表語情報表示手段217が、関係代表語抽出手段216によって抽出された代表語のそれぞれに対して、そのことを示す情報をその代表語に添えて表示する(ステップG2)。
本実施の形態において、関係代表語情報表示手段217は、関係代表語抽出手段216によって抽出された代表語に対して情報を表示する代わりに、それらがユーザが選択した代表語の近くに表示されるように代表語の表示順を入れ替えてもよい。このとき、さらに、ユーザが選択した代表語と直接的な同義関係を持つ代表語を元の同義語のいちばん近くに、さらに、ユーザが選択した代表語と少ない単語を介して間接的な同義関係を持つ代表語ほど近くに表示するようにしてもよい。
また、本実施の形態では、同義語候補表示編集手段202がユーザが選択した代表語に対する同義語の候補を表示した際に、関係代表語抽出手段216および関係代表語情報表示手段217が動作するように説明したが、ユーザが特別に指示したときに、関係代表語抽出手段216および関係代表語情報表示手段217が動作して、ユーザが選択した代表語と直接的または間接的な同義関係を持つ代表語に対して情報を表示し、ユーザが特別に指示したときにその表示を解除するようにしてもよい。その場合、情報を代表語に添えて表示するのではなく、ユーザが選択した代表語と直接的または間接的な同義関係を持たない代表語を代表語のリストにおいて非表示の状態にするようにしてもよい。
次に、本実施の形態の効果について説明する。
本実施の形態では、ユーザが選択した代表語と直接的または間接的な同義関係を持つ別の代表語に対してそのことを示す情報を表示する。このため、ユーザは、互いに直接的または間接的な同義関係がある代表語について、同義語の候補を容易に比較することができる。
次に、本発明の第8の最良の形態について図面を参照して詳細に説明する。
図15を参照すると、本発明の第8の最良の形態は、データ処理装置27が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、同義語候補セット確定手段218および同義語候補確定情報表示手段219を有する点で異なる。
同義語候補セット確定手段218は、ユーザによって指定された代表語とそれに対する同義語の候補のセットを確定状態にし、同義語候補記憶部303にその情報を記録する。ここでは、代表語とそれに対する同義語の候補のセットを同義語候補セットと呼ぶことにする。同義語候補セット確定手段218は、さらに、確定状態にした同義語候補セットに含まれる各単語に対して、確定済みという情報を付与し、同義語候補記憶部303に記録する。なお、この情報は、特定の同義語候補セット中の特定の単語に付与されるものではなく、単語そのものに対して付与されるものである。すなわち、確定済みという情報を付与された単語は、どの同義語候補セット中においても確定済みとして扱う。
同義語候補確定情報表示手段219は、同義語候補表示編集手段202が、代表語あるいは同義語の候補を表示する際に、その単語が確定済みかどうかを示す情報をその単語に添えて表示する。
次に、本実施の形態の動作を図面を参照して詳細に説明する。
図14のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
本実施の形態では、ステップA5において、同義語候補表示編集手段202が、代表語のリストを表示した後、同義語候補確定情報表示手段219が、それぞれの代表語について、その単語が確定済みかどうかを示す情報をその単語に添えて表示する(ステップH1)。また、ステップA8において、同義語候補表示編集手段202が、同義語の候補のリストを表示した後、同義語候補確定情報表示手段219が、それぞれの同義語の候補について、その単語が確定済みかどうかを示す情報をその単語に添えて表示する(ステップH2)。
本実施の形態では、ステップA6において、ユーザが同義語候補セットの確定を指示した場合、同義語候補セット確定手段218が、その同義語候補セットを確定状態にし(ステップH3およびH4)、その同義語候補セットに含まれる各単語に対して、確定済みという情報を付与する(ステップH5)。この処理で代表語の状態が変更されることがあるため、この後、代表語に対する情報を再表示する(ステップH1)。
なお、本実施の形態では、確定状態の同義語候補セットは、同義語候補表示編集手段202の処理の対象外とする。すなわち、同義語候補表示編集手段202は、確定状態の同義語候補セットに対しては、同義語の候補をユーザに編集させない。これは、ステップA5において、確定状態の同義語候補セットの代表語を表示しないことにより実現してもよいし、確定状態の同義語候補セットについてはそのことをユーザに表示してステップA11において編集の指示を受け付けないことにより実現してもよい。
次に、本実施の形態の効果について説明する。
本実施の形態では、ユーザが確定した同義語候補セットに含まれている単語に対して、そのことを示す情報が表示される。これにより、ユーザは、すでに他の代表語に対する同義語として確定した単語が分かるため、1つの単語を複数の異なる代表語の同義語として定義しないようにすることができる。
次に、本発明の第9の最良の形態について図面を参照して詳細に説明する。
図17を参照すると、本発明の第9の最良の形態は、データ処理装置28が、図15に示された第8の最良の形態におけるデータ処理装置27の構成要素のうち、同義語候補確定情報表示手段219に代わり、同義語候補セット修正手段220を有する点で異なる。
同義語候補セット修正手段220は、同義語候補セット確定手段218によって確定済みという情報が付与された単語を、未確定状態の同義語候補セットから削除する。
次に、本実施の形態の動作を図面を参照して詳細に説明する。
図18のステップA1〜A8およびA11〜A15およびH3〜H5で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205、同義語候補セット確定手段218の動作は、第8の実施の形態の各手段201、202、205、218の動作と同一のため、説明は省略する。
本実施の形態では、ステップH5において、同義語候補セット確定手段218が単語に確定済みという情報を付与した後、同義語候補セット修正手段220が、未確定状態の同義語候補セットから確定済みとされた単語を削除する(ステップJ1)。この処理で代表語が変更されることがあるため、この後、代表語のリストを再表示する(ステップA5)。
なお、本実施の形態でも、第8の実施の形態と同様に、確定状態の同義語候補セットは、同義語候補表示編集手段202の処理の対象外とする。
次に、本実施の形態の効果について説明する。
本実施の形態では、ユーザが確定した同義語候補セットに含まれている単語は、他の同義語セットから削除される。これにより、ユーザが、1つの単語を複数の異なる代表語の同義語として定義することを防ぐことができる。
次に、本発明の第10の最良の形態について図面を参照して詳細に説明する。
図19を参照すると、本発明の第10の最良の形態は、データ処理装置29が、図1に示された第1の最良の形態におけるデータ処理装置2の構成要素のうち、域外同義関係抽出手段203および域外同義関係情報表示手段204に代わり、同義語辞書内容反映手段221を有する点で異なる。
また、本実施の形態では、同義語辞書304が予め内容を保持していてよい。同義語辞書出力手段205は、同義語辞書304の内容を破棄した後、辞書エントリを出力する。
同義語辞書内容反映手段221は、同義語辞書304に定義されている辞書エントリを読み出し、辞書エントリ中で同義語として定義されている単語を同義語候補記憶部303に格納されている同義語候補セットから削除し、辞書エントリ中で代表語として定義されている単語を同義語候補記憶部303に格納されている同義語の候補から削除する。その後、読み出した辞書エントリの内容、すなわち代表語とそれに対する同義語のリストを、代表語とそれに対する同義語の候補のリストとして、同義語候補記憶部303に格納する。これらの処理により、同義語候補記憶部303に格納されている同義語候補セットにおいて、既存の同義語辞書304に含まれる単語に関しては、既存の同義語辞書304が定義する内容以外を含まなくなる。
次に、本実施の形態の動作を図面を参照して詳細に説明する。
図20のステップA1〜A8およびA11〜A15で示される本実施の形態における同義語候補抽出手段201、同義語候補表示編集手段202、同義語辞書出力手段205の動作は、第1の実施の形態の各手段201、202、205の動作と同一のため、説明は省略する。
本実施の形態では、同義語候補抽出手段201による同義関係にある単語の組の抽出が終了した後、同義語辞書内容反映手段221が、同義語辞書304に定義されている辞書エントリを読み出し、辞書エントリ中で同義語として定義されている単語を同義語候補記憶部303に格納されている同義語候補セットから削除し、辞書エントリ中で代表語として定義されている単語を同義語候補記憶部303に格納されている同義語の候補から削除する(ステップK1)。さらに、同義語辞書内容反映手段221が、読み出した辞書エントリの内容を、同義語候補記憶部303に格納する(ステップK2)。ここまでの処理で代表語が変更されていることがあるので、この後、代表語のリストを再表示する(ステップA5)。
次に、本実施の形態の効果について説明する。
本実施の形態では、既存の同義語辞書の内容を、テキストから抽出された同義語候補セットに追加してユーザに編集させる。これにより、ユーザは、既存の同義語辞書の内容と、抽出された同義語候補セットの内容をマージした結果を参照して同義語候補セットを編集することができ、テキストから抽出した同義語の候補によって、既存の同義語辞書を容易に拡張することができる。
また、本実施の形態では、編集の対象となる同義語候補セットにおいて、既存の同義語辞書に含まれる単語に関しては、既存の同義語辞書で定義されている内容以外を含まない。このため、複数の同義語を代表語に統一する目的で使用する同義語辞書を拡張する場合に、ユーザが、既存の同義語辞書の定義内容に反する候補を採用することを防ぐことができる。
次に、本発明の第11の最良の形態について図面を参照して詳細に説明する。
図21を参照すると、本発明の第11の実施の形態は、本発明の第1〜第10の実施の形態と同様に、入力装置1、データ処理装置20、記憶装置3、出力装置4を備える。
同義語辞書作成支援プログラム5は、データ処理装置20に読み込まれ、データ処理装置20の動作を制御し、記憶装置3に、テキスト記憶部301と、抽出規則記憶部302と、同義語候補記憶部303と、同義語辞書304とを生成する。
データ処理装置20は、同義語辞書作成支援プログラム5の制御により、第1〜第10の実施の形態におけるデータ処理装置2および21〜29による処理と同一の処理を実行する。
本発明の第1の実施例を図面を参照して説明する。かかる実施例は、本発明の第1の実施の形態に対応するものである。
今、テキスト記憶部に、「コンピュータ」「コンピューター」「コンピュウタ」「コンピュウター」「PC」「パソコン」「ポリカーボネイト」「ポリ・カーボネイト」「ポリカーボネート」「ポリ・カーボネート」という単語を含み、「コンピュータ(PC)」「パソコン(PC)」「ポリカーボネイト(PC)」という表現を含むテキストが記憶されているものとする。また、抽出規則記憶部には、図22に示す規則が登録されているとする。
ここで、ユーザが、テキストからの同義語候補の抽出を指示すると、同義語候補抽出手段が、抽出規則およびテキストを読み込み、テキスト中から同義関係にある単語の組を抽出して、同義語候補記憶部に格納する。
本実施例では、1番の抽出規則により(コンピュータ,コンピューター)という単語の組等が、2番の抽出規則により(ポリカーボネイト,ポリ・カーボネイト)という単語の組等が、3番の抽出規則により(コンピュータ,コンピュウタ)という単語の組等が、4番の抽出規則により(ポリカーボネイト,ポリカーボネート)という単語の組等が、5番の抽出規則により(コンピュータ,PC)という単語の組等が抽出される。
今、抽出される単語の組を、単語をノードとし、同義関係をノード間のエッジとするグラフによって模式的に表すことにすると、本実施例においては、同義語候補抽出手段によって、最終的に図23のグラフに示される単語の組が抽出されることになる。
同義語候補抽出手段は、抽出した単語の組のそれぞれの単語に対して、その単語を代表語とし、もう一方の単語をその代表語に対する同義語の候補として同義語候補記憶部に格納する。図24に、抽出された単語の組が格納された同義語候補記憶部の例を示す。
次に、同義語候補表示編集手段が同義語候補記憶部から代表語を読み出し、そのリストを表示して、ユーザによる入力を待つ。図25に、画面に表示される代表語のリストの例を示す。
ユーザがこの中から代表語を1つ選択すると、同義語候補表示編集手段がその代表語に対する同義語の候補のリストを表示する。
今、図25に示される代表語のリストにおいて、「PC」という単語をユーザが選択したとする。図24を参照すると、「PC」という代表語に対しては、「コンピュータ」「パソコン」「ポリカーボネイト」の3つの同義語の候補があるため、同義語候補表示編集手段は、この3つの単語を同義語の候補として表示する。図26に、画面表示の例を示す。
ここで、域外同義語関係抽出手段が、それぞれの同義語の候補が、ユーザによって選択された代表語およびその代表語に対する同義語の候補以外の単語との同義関係(域外の同義関係)を持つかどうかを判定し、域外同義関係情報表示手段が、域外の同義関係を持つと判定された同義語の候補に対して、そのことを示す情報を同義語の候補に添えて表示する。
図24を参照すると、3つの同義語の候補のうち「コンピュータ」は、「PC」「コンピュータ」「パソコン」「ポリカーボネイト」以外の単語「コンピュウタ」等と同義関係を持っており、「ポリカーボネイト」も、「PC」「コンピュータ」「パソコン」「ポリカーボネイト」以外の単語「ポリカーボネート」等と同義関係を持っている。一方、「パソコン」は、現在選択中の代表語「PC」としか同義関係を持たないため、域外同義語関係抽出手段は、「コンピュータ」と「ポリカーボネイト」が域外の同義関係を持つと判定し、域外同義関係情報表示手段が、そのことを示す情報をこれらの単語に添えて表示する。図27に、画面表示の例を示す。
図27においては、代表語「PC」に対する同義語の候補のうち、「パソコン」と「ポリカーボネイト」が域外の同義関係を持つことが「★」印によって示されている。これにより、ユーザは、これらの単語を介して、代表語「PC」が間接的な同義関係にある語を持つこと、および、これらの単語が他の代表語に対する同義語の候補となっていることを知ることができる。
図25〜27において、画面下部のボタンは、ユーザによる同義語候補の編集の指示、同義語辞書の出力の指示、動作終了の指示を受け付けるためのものである。ユーザがこれらのボタンをクリックした場合には、それに対応する処理を行う。
次に、本発明の第2の実施例を図面を参照して説明する。かかる実施例は、本発明の第2の実施の形態に対応するものである。
ここでは、第1の実施例と同じ例を用いて、第2の実施例を説明する。
第2の実施例においては、ユーザが選択した代表語に対する同義語の候補のリストを、同義語候補表示編集手段が、図26のように表示した後、ユーザが同義語の候補のリストの中から単語を1つ選択すると、間接同義語候補抽出手段が、その単語を代表語とする同義語の候補を抽出し、間接同義語候補表示編集手段が、抽出された同義語の候補のリストを元の同義語の候補とは別に表示し、ユーザによる編集操作を受け付ける。
ここでは、図26の画面において、ユーザが「コンピュータ」という同義語の候補を選択したとする。図24を参照すると、「コンピュータ」という代表語に対しては、「コンピュウタ」「コンピューター」「PC」の3語の同義語の候補が存在するため、間接同義語候補表示手段によって、これらの3つの単語が同義語の候補が表示される。図28に画面表示の例を示す。
ユーザは、この画面から単語を選択し、その単語を元の代表語の同義語の候補に追加するような編集の指示を与えることにより、「PC」の同義語の候補には存在しなかった「コンピューター」等の単語を「PC」の同義語の候補に追加することができる。図28の画面は、画面下部のボタンによってこの指示を受け付ける例を示している。
次に、本発明の第3の実施例を図面を参照して説明する。かかる実施例は、本発明の第3の実施の形態に対応するものである。
ここでは、これまでと同じ例を用いて、第3の実施例を説明する。
第3の実施例においては、ユーザが選択した同義語の候補を代表語とする別の同義語の候補のリストを、間接同義語候補表示編集手段が、図28のように表示した後、域内間接同義語候補抽出手段が、その同義語の候補のうち、元の代表語および元の同義語の候補に含まれているものを域内の間接同義語候補として抽出し、域内間接同義語候補情報表示手段が、域内の間接同義語候補に対してそのことを示す情報を添えて表示する。
図28の例では、「コンピュウタ」「コンピューター」「PC」の3語の同義語の候補のうち、「PC」という単語は元の代表語であるため、域内の間接同義語候補であるが、残りの2単語は、元の代表語および元の同義語の候補には含まれていないため、域内の間接同義語候補ではない。域内間接同義語候補情報表示手段は、「PC」という単語に対して、その単語が域内の間接同義語候補であることを示す情報付加して表示する。図29に画面表示の例を示す。
図29においては、「コンピュータ」に対する同義語の候補のうち、「PC」という単語が域内の間接同義語候補であることが「☆」印によって示されている。これにより、ユーザは、これらの単語を、元の代表語「PC」の同義語の候補として追加する必要がないことを知ることができる。
次に、本発明の第4の実施例を図面を参照して説明する。かかる実施例は、本発明の第4の実施の形態に対応するものである。
ここでは、これまでと同じ例を用いて、第4の実施例を説明する。
第4の実施例においては、同義語候補表示編集手段が同義語の候補のリストを、表示した後、ユーザが同義語の候補の拡張を指示した場合に、拡張同義語候補表示手段が、ユーザが選択した代表語と間接的な同義関係がある単語の中から、同義語の候補の拡張として追加すべき単語の候補を拡張同義語候補として抽出し、ユーザに提示する。
今、拡張同義語候補表示手段が、ユーザが選択した代表語と高々1つの単語を介して間接的な同義関係がある単語のうち、現在ユーザが選択している代表語および現在表示中の同義語の候補に含まれないものを拡張同義語候補として抽出することにする。この条件によると、図26のように、代表語として「PC」が選択されているときに、ユーザが同義語の候補の拡張を指示した場合、拡張同義語候補としては、「コンピュウタ」「コンピューター」「ポリカーボネート」「ポリ・カーボネイト」の4単語が抽出される。この場合の拡張同義語候補表示手段による画面表示の例を図30に示す。
このように、拡張同義語候補表示手段が拡張同義語候補をユーザに提示した後、拡張同義語候補追加手段が、拡張同義語候補の中で実際に同義語の候補に追加する単語をユーザに選択させ、ユーザが選択した単語のみを同義語の候補に追加する。
図30は、各拡張同義語候補の前のチェックボックスにチェックすることによってユーザに同義語の候補に追加する単語を選択させ、画面下部の実行ボタンがクリックされたときにチェックされた単語を同義語の候補に追加するようにする場合の画面例を示している。ユーザは、簡単な操作で、代表語と間接的な同義関係にある単語を、その代表語の同義語の候補として追加することができる。
次に、本発明の第5の実施例を図面を参照して説明する。かかる実施例は、本発明の第5の実施の形態に対応するものである。
ここでは、これまでと同じ例を用いて、第5の実施例を説明する。
第5の実施例においては、同義語候補表示編集手段が同義語の候補のリストを、表示した後、ユーザが同義語の候補に、別な代表語の同義語の候補を追加するよう指示した場合に、追加同義語候補表示手段が、ユーザが追加しようとした単語と直接的または間接的な同義関係がある単語の中から、同義語の候補に同時に追加すべき単語の候補を追加同義語候補として抽出し、ユーザに提示する。
今、追加同義語候補表示手段が、ユーザが追加しようとした単語と高々1つの単語を介して間接的な同義関係がある単語のうち、現在ユーザが選択している代表語および現在表示中の同義語の候補に含まれないものを追加同義語候補として抽出することにする。図26の画面のように、代表語として「PC」が選択されているとき、ユーザーが「コンピューター」という単語を追加しようとしたとすると、前述の条件によれば、追加同義語候補としては、「コンピュウタ」「コンピュウター」の2単語が抽出される。この場合の追加同義語候補表示手段による画面表示の例を図31に示す。
このように、追加同義語候補表示手段が拡張同義語候補をユーザに提示した後、追加同義語候補追加手段が、追加同義語候補の中で実際に同義語の候補に追加する単語をユーザに選択させ、ユーザが選択した単語のみを、ユーザが最初に追加しようとした単語とともに同義語の候補に追加する。
図31は、各追加同義語候補の前のチェックボックスにチェックすることによってユーザに同義語の候補に追加する単語を選択させ、画面下部の実行ボタンがクリックされたときにチェックされた単語を、ユーザが最初に追加しようとした単語とともに同義語の候補に追加するようにする場合の画面例を示している。ユーザは、簡単な操作で、追加しようとした単語と直接的または間接的な同義関係にある単語も含めて、同義語の候補として追加することができる。
次に、本発明の第6の実施例を図面を参照して説明する。かかる実施例は、本発明の第6の実施の形態に対応するものである。
ここでは、これまでと同じ例を用いて、第6の実施例を説明する。
第6の実施例においては、同義語候補抽出手段によって抽出された単語を、同義語候補グループ分割手段が、同一のグループに属する単語どうしが互いに直接的または間接的な同義関係を持ち、かつ、同一の単語が複数の異なるグループに属さないように、いくつかの同義語候補グループに分割する。
図24に示すように、同義語候補抽出手段によって単語が抽出されているとき、直接的または間接的な同義関係がある単語どうしが必ず同一のグループとなるように同義語候補グループを作成すると、「コンピュウタ」「コンピュウター」「コンピュータ」「コンピューター」「PC」「パソコン」「ポリカーボネイト」「ポリカーボネート」「ポリ・カーボネイト」「ポリ・カーボネート」の10単語からなるグループと「コンペイトー」「コンペートー」の2単語からなるグループができる。これは、図23のグラフを連結成分分解して得られるグループに対応する。
一方、直接的な同義関係がある単語どうしに加えて、異なる単語を介する間接的な同義関係が2つ以上ある単語どうしが同一のグループとなるように同義語候補グループを作成すると、「コンピュウタ」「コンピュウター」「コンピュータ」「コンピューター」の4単語からなるグループ、「PC」1単語だけからなるグループ、「パソコン」1単語だけからなるグループ、「ポリカーボネイト」「ポリカーボネート」「ポリ・カーボネイト」「ポリ・カーボネート」の4単語からなるグループ、「コンペイトー」1単語だけからなるグループ、「コンペートー」1単語だけからなるグループの計6グループができる。これは、図23のグラフを強連結成分分解して得られるグループに対応する。
ここでは、後者のように、6つの同義語候補グループを作成したことにして、説明を続ける。
同義語候補グループ分割手段は、抽出された単語を同義語候補グループに分割した後、各同義語候補グループに対して代表語を選定し、同義語候補グループ中の代表語以外の単語を、代表語に対する同義語の候補として、同義語候補記憶部に記録する。
今、「コンピュウタ」「コンピュウター」「コンピュータ」「コンピューター」の4単語からなるグループの代表語を「コンピュータ」とし、「ポリカーボネイト」「ポリカーボネート」「ポリ・カーボネイト」「ポリ・カーボネート」の4単語からなるグループの代表語を「ポリカーボネイト」とし、その他、1単語からなるグループの代表語をその単語自身とすることにすると、同義語候補記憶部は、例えば、図32に示すような状態になる。
この後、同義語候補グループ表示編集手段が、代表語のリストをユーザに提示し、ユーザがその中から代表語を選択すると、その代表語に対応する同義語候補グループを構成する単語のリストを表示する。ユーザが代表語「コンピュータ」を選択したときの画面表示の例を図33に示す。ユーザは、この画面において、同義語候補グループの編集を行うことができる。
次に、本発明の第7の実施例を図面を参照して説明する。かかる実施例は、本発明の第7の実施の形態に対応するものである。
ここでは、これまでと同じ例を用いて、第7の実施例を説明する。
第7の実施例においては、同義語候補表示編集手段が同義語の候補を表示した後、関係代表語抽出手段が、現在選択されている代表語と直接的または間接的な同義関係がある代表語を抽出し、そのような代表語に対して、関係代表語情報表示手段が、そのことを示す情報を表示する。
例えば、図25の画面で、ユーザが「コンピュータ」という代表語を選択すると、同義語候補表示編集手段が、同義語の候補として、「コンピュウタ」「コンピューター」「PC」の3単語を表示する。一方、関係代表語抽出手段は、「コンピュータ」と直接的または間接的な同義関係がある代表語として、「コンピュウタ」「コンピュウター」「コンピューター」「PC」「パソコン」「ポリカーボネイト」「ポリカーボネート」「ポリ・カーボネイト」「ポリ・カーボネート」の9単語を抽出する。関係代表語情報表示手段が、抽出された代表語に対して「◎」印を付けて表示することにすると、画面は例えば図34のようになる。
一方、関係代表語情報表示手段が、抽出された代表語がユーザが選択した代表語の近くに表示されるように代表語の表示順を入れ替えるようにする構成では、画面は例えば図35のようになる。
次に、本発明の第8の実施例を図面を参照して説明する。かかる実施例は、本発明の第8の実施の形態に対応するものである。
ここでは、これまでと同じ例を用いて、第8の実施例を説明する。
第8の実施例においては、ユーザが、代表語とそれに対する同義語の候補からなる同義語候補セットを確定することができる。例えば、ユーザが、「コンピュータ」という代表語およびその代表語に対する3つの同義語の候補「コンピュウタ」「コンピューター」「PC」を確定すると、同義語候補セット確定手段は、この同義語候補セットを確定状態にし、同義語候補セットに含まれる「コンピュータ」「コンピュウタ」「コンピューター」「PC」の4つの単語に確定済みという情報を付与して、同義語候補記憶部に記録する。このときの同義語候補記憶部の状態を図36に示す。
本実施例においては、同義語候補確定状態表示手段が、確定済みの代表語および同義語の候補に対して、そのことを示す情報を付加して表示する。このため、上記状態から、ユーザが代表語「コンピュウター」を選択すると、例えば、図37のように表示される。この例では、確定済みの単語が、「*」印付きで表示されている。
次に、本発明の第9の実施例を図面を参照して説明する。かかる実施例は、本発明の第9の実施の形態に対応するものである。
ここでは、これまでと同じ例を用いて、第9の実施例を説明する。
第9の実施例においては、ユーザが同義語候補セットを確定すると、同義語候補セット確定手段が、その同義語候補セットを確定状態にし、同義語候補セットに含まれる単語に確定済みという情報を付与した後、同義語候補セット修正手段が、確定済みの単語を未確定状態の同義語セットから削除する。
例えば、ユーザが、「コンピュータ」という代表語およびその代表語に対する3つの同義語の候補「コンピュウタ」「コンピューター」「PC」を確定した場合、第8の実施例の説明で示したように、同義語候補セット確定手段によって、図36のように4つの単語に確定済みの情報が付与される。同義語候補セット修正手段は、未確定状態の同義語セットから、確定済みの単語「コンピュータ」「コンピュウタ」「コンピューター」「PC」を削除する。このときの同義語候補記憶部の状態を図38に示す。代表語が確定済みである場合には、その同義語候補セット全体が削除される。また、同義語の候補が空になった同義語候補セットも削除される。例えば、図36では、代表語「パソコン」に対して「PC」という同義語の候補が存在しているが、「PC」という単語が確定済みとなった(「PC」の代表語が「コンピュータ」に確定し、代表語が「パソコン」になることはなくなった)ため、図38では、この同義語候補セットは削除されている。
同義語候補セット修正手段の処理により、確定状態の同義語候補セットに含まれる単語が、他の代表語に対する同義語の候補として残らなくなる。
次に、本発明の第10の実施例を図面を参照して説明する。かかる実施例は、本発明の第10の実施の形態に対応するものである。
ここでは、これまでと同じ例を用いて、第10の実施例を説明する。
本実施例においては、同義語辞書に予め図39の内容が定義されているものとする。
本実施例では、同義語候補抽出手段がテキスト中から同義関係にある単語の組を抽出し、その結果を図24に示すように同義語候補記憶部に格納した後、同義語辞書内容反映手段が同義語辞書の定義に含まれる単語を同義語候補記憶手段から削除し、その上で同義語辞書の内容を同義語候補記憶手段に追加する。
図39を参照すると、同義語辞書は、同義語として「コンピューター」および「ポリカーボネート」を、代表語として「コンピュータ」および「ポリカーボネイト」を含んでいる。同義語辞書内容反映手段は、まず、図24に示される同義語候補記憶部の代表語と同義語の候補の双方から「コンピューター」および「ポリカーボネート」の2単語を削除し、同義語の候補から「コンピュータ」および「ポリカーボネイト」の2単語を削除する。この結果の状態を図40に示す。
次に、同義語辞書内容反映手段は、同義語辞書の内容を同義語候補記憶手段に追加する。この例では、代表語「コンピュータ」に対して同義語の候補「コンピューター」を、代表語「ポリカーボネイト」に対して同義語の候補「ポリカーボネート」を追加する。この結果の状態を図41に示す。
同義語辞書内容反映手段の動作により、既存の辞書内容を優先して、抽出された同義語の候補に辞書の内容が追加されている。
なお、これまでの実施例の説明において、単語に情報を添えて表示する場合には、その単語に「★」等の印を付ける例を示したが、このような印を付与する代わりに、その単語自身の色や書体を変えることにより情報を示してもよい。
また、ユーザが次の動作を指示する際に、ボタンをクリックするようにする例を示したが、ボタンのクリックの代わりに、キーボード入力、あるいは、メニューからの選択等によりユーザが次の動作を指示するようにしてもよい。