JP6870421B2

JP6870421B2 - 判定プログラム、判定装置および判定方法

Info

Publication number: JP6870421B2
Application number: JP2017063680A
Authority: JP
Inventors: 和夫嶺野; 信子高瀬; 尚洋伊藤
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2017-03-28
Filing date: 2017-03-28
Publication date: 2021-05-12
Anticipated expiration: 2037-03-28
Also published as: US20180285349A1; US10437932B2; JP2018165949A

Description

本発明は、判定プログラムなどに関する。

マニュアル、論文、設計文書など、論理的な整合性が求められる文書においては、同じ意味を表すものには同じ表記を、別の意味を表すものには別の表記を用いることが必要である。このため、文書の推考が行われる際には、同じ意味を表す異なる表記が用いられていないか、別の意味を表す同じ表記が用いられていないかの判定が行われる。同じ意味を表す異なる表記は、「同義語」といわれる。別の意味を表す同じ表記は、「多義語」といわれる。

同義語または多義語について、表記を判定する手順は、以下のとおりである。１）形態素解析処理で文章を単語に分割する。２）分解した単語を、同義語／多義語辞書などの専用辞書と照合して判定対象を特定する。３）文章の中の判定対象を人が確認して判断する。

また、述部ペアまたは「項−述部ペア」について、同義、反義、または無関係であるか否かを判定する技術が開示されている（例えば、特許文献１参照）。かかる技術では、判定装置は、学習コーパス記憶部に記憶されている同義、反義、及び無関係のうちの何れかが分類として各々予め付与された述語ペアの各々について辞書定義文素性と意味属性素性の少なくとも一方を抽出する。そして、部分文字列を表す素性と並列述語構文の尤度を表す素性を抽出し、同義と反義を分類する素性を構築し、同義と反義を分類する分類モデルを学習する。

特開２０１５−２８６９７号公報特開２０１０−１０２５２１号公報特開２０１２−７３９５１号公報

しかしながら、従来の技術では、同義語または多義語の抽出精度を向上することができないという問題がある。

例えば、表記を判定する手順では、人が同義語または多義語の判定対象を確認して判断する。そもそも、同義語または多義語は用語の使われ方によって同じ用語でも異なる判定をする必要があるため、意味を考慮した判定が必要であるが、意味を考慮した判定は、機械処理では難しく、人の介入が必要である。しかしながら、人が介入すると、人によるバラつきや、漏れ、誤りが発生する。したがって、かかる手順では、同義語または多義語の判定対象の抽出精度を向上することができない。

また、従来技術では、判定装置が、項−述語ペアについて同義、反義を分類する分類モデルを学習し、項−述語ペアが同義、反義であるか否かを判定するが、項ペアが同義、反義であるか否かを判定しない。また、述語ペアが同義、反義であるか否かを判定しない。したがって、判定装置は、同義語の抽出精度を向上することができない。また、従来技術は、多義語を抽出するものではない。

本発明は、１つの側面では、複数の文章と前記複数の文章それぞれに含まれる用語の指定とを受け付け、受け付けた複数の文章それぞれを意味解析して、指定を受け付けた用語ごとに、該用語と、該用語を含む文章に含まれる他の複数の用語それぞれとの関係を示す情報を生成し、前記指定を受け付けた用語ごとに、生成した前記関係を示す情報から特定の関係を示す情報を抽出し、抽出した情報を素性とする特徴情報を生成し、生成した用語ごとの前記特徴情報に基づき、複数の用語間の類似性に関する判定を行う、処理をコンピュータに実行させる。

１実施態様によれば、同義語または多義語の抽出精度を向上することができる。

図１は、実施例１に係る情報処理装置の構成の一例を示す機能ブロック図である。図２Ａは、意味構造の一例を示す図（１）である。図２Ｂは、意味構造の一例を示す図（２）である。図３は、アーク記号の一例を示す図である。図４は、実施例１に係る特徴ベクトルの構成の一例を示す図である。図５は、実施例１に係る学習フェーズで導出した重みベクトルの一例を示す図である。図６Ａは、実施例１に係る特徴ベクトル生成処理の一例を示す図（１）である。図６Ｂは、実施例１に係る特徴ベクトル生成処理の一例を示す図（２）である。図６Ｃは、実施例１に係る特徴ベクトル生成処理の一例を示す図（３）である。図６Ｄは、実施例１に係る特徴ベクトル生成処理の一例を示す図（４）である。図７は、実施例１に係る特徴ベクトルの性質を示す図である。図８は、実施例１に係る同義語判定処理の一例を示す図である。図９は、実施例１に係る同義語判定処理のフローチャートの一例を示す図である。図１０は、実施例１に係る学習フェーズのフローチャートの一例を示す図である。図１１は、実施例１に係る特徴ベクトル生成処理のフローチャートの一例を示す図である。図１２は、用語の意味構造から特徴ベクトルを生成する処理のフローチャートの一例を示す図である。図１３は、実施例１に係る運用フェーズのフローチャートの一例を示す図である。図１４は、実施例１に係る同義語判定処理のフローチャートの一例を示す図である。図１５は、全素性情報を使用した特徴ベクトルの概念を示す図である。図１６は、対象用語の品詞に関する次元圧縮の一例を示す図である。図１７は、実施例２に係る次元圧縮結果の特徴ベクトルの概念を示す図である。図１８は、実施例２に係る次元圧縮結果の特徴ベクトルの一例を示す図である。図１９は、実施例２に係る同義語判定処理の判定結果の一例を示す図である。図２０は、判定プログラムを実行するコンピュータの一例を示す図である。

以下に、本願の開示する判定プログラム、判定装置および判定方法の実施例を図面に基づいて詳細に説明する。なお、実施例では、判定装置を情報処理装置として説明する。本発明は、実施例により限定されるものではない。

［実施例１に係る情報処理装置の構成］
図１は、実施例１に係る情報処理装置の構成を示す機能ブロック図である。図１に示す情報処理装置１は、機械翻訳などで利用される自然言語の意味解析処理の結果（「意味構造」という）を用いて、複数の表記間の類似性に関する判定を自動的に行う。表記間の類似性には、表記間が同義であることや、表記間が多義であることが含まれる。異なる表記であるが同じ意味を表す表記同士は、「同義語」という。同じ表記であるが別の意味を表す表記同士は、「多義語」という。

なお、実施例１で用いられる「文章」とは、意味のある文の最小単位であり、必ずしも主語および述語を含まなくても良いが、日本語では一般的に句点（。）で区切られ、英語ではピリオド（．）で区切られる。「文章」とは、「文」と同義である。「文書」とは、複数の文章として構成されるテキストのことをいう。また、実施例１で用いられる「意味構造」とは、文章の意味解析処理の結果として生成され、文章の意味を表す、概念（意味）を示すノードと、概念の関連を示す有向アークとで表わしたグラフ構造のことをいう。また、実施例１で用いられる「意味属性」とは、「意味構造」のノードについて、文法的、意味的な性質を示す記号（属性）のことをいう。また、実施例１で用いられる用語とは、独立して意味を有する単語または連語であるとする。連語とは、複数の単語の集まりのことをいう。

情報処理装置１は、制御部１０と記憶部２０とを有する。

制御部１０は、ＣＰＵ（Central Processing Unit）などの電子回路に対応する。そして、制御部１０は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、これらによって種々の処理を実行する。制御部１０は、学習フェーズ１０Ａおよび運用フェーズ１０Ｂを有する。学習フェーズ１０Ａは、意味解析部１１、特徴ベクトル生成部１２、学習部１３を有する。なお、意味解析部１１は、受付部および第１の生成部の一例である。特徴ベクトル生成部１２は、第２の生成部の一例である。学習部１３は、判定部の一例である。

記憶部２０は、例えば、ＲＡＭ、フラッシュメモリ（Flash Memory）などの半導体メモリ素子、または、ハードディスク、光ディスクなどの記憶装置である。記憶部２０は、教師例２１、意味構造２２、特徴ベクトル２３および重みベクトル２４を有する。なお、意味構造２２は、関係を示す情報の一例である。特徴ベクトル２３は、特徴情報の一例である。

教師例２１は、例題となる文章と判定すべき用語とを併せた情報同士を対にして指定したデータであり、正しい例題を示す正例と誤った例題を示す負例とを含む。正例の教師例２１は、同義語であると判定すべき用語と当該用語を含む文章とを併せた情報同士の組である。負例の教師例２１は、同義語でないと判定すべき用語と当該用語を含む文章とを併せた情報同士の組である。例えば、文章「運用環境のカスタマイズが必要です。」の中の用語「カスタマイズ」と、文章「運用環境の変更により、対処が必要です。」の中の用語「変更」とは、同じ意味を表す異なる表記同士であるため、同義語である。そこで、文章「運用環境のカスタマイズが必要です。」と併せて判定すべき用語「カスタマイズ」と、文章「運用環境の変更により、対処が必要です。」と併せて判定すべき用語「変更」との対は、正例の教師例２１の一例である。これに対して、文章「運用環境のカスタマイズが必要です。」の中の用語「カスタマイズ」と、文章「組織変更による対象が必要である。」の中の用語「変更」とは、同じ意味を表す異なる表記同士でないため、同義語でない。そこで、文章「運用環境のカスタマイズが必要です。」と併せて判定すべき用語「カスタマイズ」と、文章「組織変更による対象が必要である。」と併せて判定すべき用語「変更」との組は、負例の教師例２１の一例である。

意味解析部１１は、入力された教師例２１の中から、１組の教師例２１を選択する。意味解析部１１は、選択した教師例２１に含まれる２つの例題文章について、形態素解析および意味解析を行い、それぞれの意味構造２２を生成する。すなわち、意味解析部１１は、それぞれの例題文章について、自然言語の意味解析処理により、それぞれの意味構造２２を生成する。なお、意味解析部１１によって行われる意味解析処理は、既存の機械翻訳技術を使って実現できる。例えば、かかる意味解析処理は、例えば、特開平６−６８１６０号公報、特開昭６３−１３６２６０号公報や特開平４−３７２０６１号公報に開示されている機械翻訳技術を使って行えば良い。また、意味構造２２は、例えば、特開２０１２−７３９５１号公報に開示されている。

ここで、意味構造２２の一例を、図２Ａおよび図２Ｂを参照して説明する。図２Ａおびび図２Ｂは、意味構造の一例を示す図である。図２Ａは、意味構造２２の内部表現を示す図であり、図２Ｂは、意味構造２２を図式化したものである。なお、図２Ａおよび図２Ｂで示す意味構造２２は、原文「運用環境のカスタマイズが必要です。」の意味解析処理の結果である。

図２Ａに示すように、意味構造２２の内部表現は、用語一覧とグラフ構造を含んでいる。

用語一覧には、用語の一覧が表わされる。１つの用語は、「表記」「品詞」「意味属性」「概念記号」で表わされる。「意味属性」は、対応する用語の文法的、意味的な性質を示す記号（属性）であり、例えば、シソーラス属性や、可算規則、変化形規則などがある。シソーラス属性とは、用語の意味的な階層関係を記述した属性のことをいう。「概念記号」とは、意味的な観点（概念レベル）において用語が指し示す概念を識別する記号のことをいう。用語の一例として、表記が「カスタマイズ」である場合に、品詞としてサ変名詞「ＳＮ」、意味属性として「Ｓ１，Ｓ２，・・・」、概念記号として「ＣＵＳＴＯＭＩＺＥ」と記載されている。なお、「表記」「品詞」「意味属性」「概念記号」は、用語が有する属性情報の一例である。

グラフ構造は、（Ｆｒｏｍノード）−−＜アーク＞−−＞（Ｔｏノード）で表現され、（Ｆｒｏｍノード）の概念から（Ｔｏノード）の概念に向かって、＜アーク＞で接続されていることを示す。各ノードには、対応する用語に対応する概念を現す概念記号が付与されている。一例として、（ＣＵＳＴＯＭＩＺＥ）−−＜ＯＢＪ＞−−＞（ＥＪＲ０１）について、Ｆｒｏｍノードの概念は、概念記号（ＣＵＳＴＯＭＩＺＥ）の用語「カスタマイズ」に対応し、Ｔｏノードの概念は、概念記号（ＥＪＲ０１）の用語「運用環境」に対応し、概念（ＣＵＳＴＯＭＩＺＥ）と概念（ＥＪＲ０１）とが対象関係＜ＯＢＪ＞である。即ち、「カスタマイズ」の＜対象＞が「運用環境」であることを示す。各ノードは、用語一覧に示されている「表記」「品詞」「意味属性」「概念記号」を持っている。なお、アークは、ノードとノードとの間の関係情報の一例である。

図２Ｂに示すように、例えば、「カスタマイズ」を意味する概念は、「ＣＵＳＴＯＭＩＺＥ」という概念記号で表わされている。そして、「ＣＵＳＴＯＭＩＺＥ」という概念記号のノードは、「ＥＪＲ０１」という概念記号で表わされる「運用環境」を意味する概念と、「ＯＢＪ」という記号を持つアークで接続されている。さらに、「ＣＵＳＴＯＭＩＺＥ」という概念記号のノードには、他方のノードが存在しないアーク「Ｊ．ＧＡ」が接続されている。このアークは、Ｆｒｏｍノードである概念「ＣＵＳＴＯＭＩＺＥ」が「Ｊ．ＧＡ」という意味を持つこと、即ち、「カスタマイズ」が限定を意味する「が」という助詞をとることを示す。また、「ＣＵＳＴＯＭＩＺＥ」という概念記号のノードは、「ＮＥＥＤ」という概念記号で表わされる「必要」に対応する概念と、「ＯＢＪＡ」という記号を持つアークで接続されている。また、Ｆｒｏｍノードが存在しないアーク＜ＳＴ＞はＴｏノードである概念「ＮＥＥＤ」がこの文章の中心的な概念であることを示す。つまり、意味構造２２は、概念と、概念または間の意味的な関係を表す有向グラフで表される。
以下では、表記における「用語」と、意味構造における「概念」とを特に区別する必要が無い場合は、特定の用語に対応する概念のノードを単に用語と称する。

ここで、アークの記号の一例を、図３を参照して説明する。図３は、アーク記号の一例を示す図である。

図３に示すように、「＜ＯＢＪ＞」というアークの記号は、名称として「対象」を示し、意味として「動作の対象を示す」ことを示す。「＜ＯＢＪＡ＞」というアークの記号は、名称として「形容詞対象」を示し、意味として「形容詞の修飾対象」であることを示す。「＜Ｊ．ＧＡ＞」というアークの記号は、名称として「が助詞」を示し、意味として「「が」をとる」ことを示す。なお、図３で示すアークの記号は、一例であって、これらに限定されることはない。

図１に戻って、特徴ベクトル２３は、意味構造２２の中の、判定すべき用語における特定の意味構造２２の情報を素性とする特徴情報である。例えば、特徴ベクトル２３は、判定すべき用語を示す情報（品詞、意味属性および概念記号）と、判定すべき用語と直接アークで接続する用語を示す情報（品詞、意味属性および概念記号）とを素性とする特徴情報である。ここでいう素性とは、識別に用いる情報（現象を分解する要素）のことを意味し、特徴ベクトル２３の軸となる情報のことをいう。なお、特徴ベクトル２３の詳細は、後述する。

特徴ベクトル生成部１２は、１組の教師例２１について生成された意味構造２２の対を比較して、機械学習で用いられる特徴ベクトル２３を生成する。

例えば、特徴ベクトル生成部１２は、意味構造２２の対のうち一方の意味構造２２について、判定すべき用語に対応するノード（対象ノードという）の周辺を、特徴ベクトル２３を生成する範囲として分離する。特徴ベクトル生成部１２は、意味構造２２の対のうち他方の意味構造２２について、判定すべき用語に対応する対象ノードの周辺を、特徴ベクトル２３を生成する範囲として分離する。周辺を分離する一例として、特徴ベクトル生成部１２は、対象の意味構造について、対象ノードと直接アークで接続するノード（関連ノード）だけを残して、他のノードを削除する。

そして、特徴ベクトル生成部１２は、周辺を分離した結果を示す２種の意味構造２２からそれぞれ特徴ベクトル２３を生成する。これら生成される２種の特徴ベクトル２３は、全て同じ素性を同じ順番で持ち、２種の特徴ベクトルを比較することにより、合致する素性の値を１とし、合致しない素性の値を０と設定される新たな特徴ベクトル２３を生成する。さらに、特徴ベクトル生成部１２は、前述の３種の特徴ベクトルを合成した特徴ベクトル２３を生成する。

ここで、意味構造２２から生成される特徴ベクトル２３の構成の一例を、図４を参照して説明する。図４は、実施例１に係る特徴ベクトルの構成の一例を示す図である。なお、図４で示す特徴ベクトル２３は、判定すべき用語に対応する対象ノードの情報ｉ０と、判定すべき用語と直接アークで接続する用語に対応する関連ノードの情報ｉ１０とを素性とする特徴情報の一例である。図４に示すように、特徴ベクトル２３には、判定すべき用語に対応する対象ノードに対して、各種品詞の素性、各種意味属性の素性および各種概念記号の素性が含まれる。各種品詞の素性は、例えば、３０種存在する。各種意味属性の素性は、例えば、１００００種存在する。そして、各種品詞の素性の中で判定すべき用語の素性と合致する素性の値として１が設定される。各種意味属性の素性の中で判定すべき用語の素性と合致する素性の値として１が設定される。各種概念記号の素性の中で判定すべき用語の素性と合致する素性の値として１が設定される。加えて、特徴ベクトル２３には、判定すべき用語と直接アークで接続する用語に対応する対象ノードに対して、各種アークの数分の、方向の素性、および、そのアークと接続されている関連ノードに含まれる各種品詞の素性、各種意味属性の素性、各種概念記号の素性が含まれる。各種アークは、例えば、７００種存在する。方向の素性は、１種存在する。また、関連ノードに含まれる情報は対象ノードと同じなので、各種品詞の素性は、例えば、３０種存在する。各種意味属性の素性は、例えば、１００００種存在する。そして、対象ノードが直接アークで接続する関連ノードの情報は、当該アークに対応する領域に設定される。関連ノードについて、各種品詞の素性の中で判定すべき用語の素性と合致する素性の値として１が設定される。関連ノードについて、各種意味属性の素性の中で判定すべき用語の素性と合致する素性の値として１が設定される。関連ノードについて、各種概念記号の素性の中で判定すべき用語の素性と合致する素性の値として１が設定される。

なお、図４で示す特徴ベクトル２３は、品詞について、先頭の素性をＡＤＪとし、意味属性について、素性の順番をＳ１、Ｓ２、Ｓ３としたが、これに限定されず、予め定められた順番であれば良い。

図１に戻って、特徴ベクトル生成部１２は、生成された２種の特徴ベクトル２３を比較し、比較結果の特徴ベクトル２３を生成する。一例として、特徴ベクトル生成部１２は、生成された２種の特徴ベクトル２３について、先頭の素性から順次素性の値を比較し、一致する素性の値を１とし、一致しない値を０とする比較結果の特徴ベクトル２３を生成する。

そして、特徴ベクトル生成部１２は、生成された３種の特徴ベクトル２３、すなわち、２種の意味構造２２からそれぞれ生成された２種の特徴ベクトル２３と比較結果の特徴ベクトル２３を連結して機械学習用または判定対象の特徴ベクトル２３を生成する。

学習部１３は、全ての教師例２１から生成されたそれぞれの機械学習用の特徴ベクトル２３を教師あり学習を行う機械学習器に入力して学習する。ここでいう機械学習器には、例えば、サポートベクターマシン（ＳＶＭ）が挙げられる。以降では、機械学習器としてＳＶＭを採用した場合について説明する。学習部１３は、それぞれの教師例に対応する機械学習用の特徴ベクトルから１つの重みベクトル２４を学習結果として導出する。ここでいう重みベクトル２４は、入力される機械学習用の特徴ベクトル２３と同じ構造を有し、構造内の各素性に対する評価用の重みを値として持つベクトルである。なお、以下では、「教師例に対応する機械学習用の特徴ベクトル」のことを、単に「機械学習用の特徴ベクトル」と呼ぶものとする。

ここで、重みベクトル２４の一例を、図５を参照して説明する。図５は、実施例１に係る学習フェーズで導出した重みベクトルの一例を示す図である。図５に示すように、正例の教師例２１から生成された機械学習用の特徴ベクトル２３と、負例の教師例２１から生成された機械学習用の特徴ベクトル２３とが機械学習器（ＳＶＭ）に入力される。ここでは、正例の教師例２１として（ｘ_１２，１）（ｘ_３４，１）（x_５６，１）が入力され、負例の教師例２１として（x_１７，−１）（x_３８，−１）（ｘ_５９，−１）が入力される。例えば、（ｘ_１２，１）のｘ_１２は、例題の文章１と例題の文章２の組みから生成された特徴ベクトル２３であることを示し、（ｘ_１２，１）の１は、正例であることを示す。（x_１７，−１）のｘ_１７は、例題の文章１と例題の文章７の組みから生成された特徴ベクトル２３であることを示し、（ｘ_１７，−１）の−１は、負例であることを示す。

このような状況の下、学習部１３は、入力された教師例（正例および負例）である特徴ベクトル２３から１つの重みベクトル２４を学習結果として導出する。重みベクトル２４は、入力された特徴ベクトル２３と同じ構造を有する。そして、重みベクトル２４には、各素性について、評価用の重みが設定される。この重みベクトル２４を用いて、後述する運用フェーズ１０Ｂが、複数の対象文章内に存在する複数の対象ノードについて同義語判定を行う。

次に、実施例１に係る特徴ベクトル２３の生成処理を、図６Ａ〜図６Ｄを参照して説明する。図６Ａ〜図６Ｄは、実施例１に係る特徴ベクトル生成処理の一例を示す図である。なお、意味解析部１１によって意味解析処理がなされた１組の教師例２１は、以下であるとする。原文（例題文章）ｚ１「運用環境のカスタマイズが必要です。」と併せて判定すべき用語「カスタマイズ」と、原文（例題文章）ｚ２「運用環境の変更により、対処が必要です。」と併せて判定すべき用語「変更」との対である。

図６Ａに示すように、原文ｚ１「運用環境のカスタマイズが必要です。」について、意味解析部１１によって意味構造２２が生成されたものとする。図６Ａの上段左図は、原文ｚ１「運用環境のカスタマイズが必要です。」の意味構造２２である。例えば、意味構造２２の「ＮＥＥＤ」は、用語「必要」に対応する概念を現す概念記号であり、「ＣＵＳＴＯＭＩＺＥ」は、用語「カスタマイズ」に対応する概念を現す概念記号であり、「ＥＪＲ０１」は、用語「運用環境」に対応する概念を現す概念記号である。また、意味構造２２の「ＯＢＪＡ」「Ｊ．ＧＡ」「ＯＢＪ」などは、概念間の関連性を示すアークの記号である。原文ｚ２「運用環境の変更により、対処が必要です。」について、意味解析部１１によって意味構造２２が生成されたものとする。図６Ａの下段左図は、原文ｚ２「運用環境の変更により、対処が必要です。」の意味構造２２である。例えば、意味構造２２の「ＤＥＡＬＷＩＴＨ」は、用語「対処」に対応する概念を現す概念記号であり、「ＣＨＡＮＧＥ」は、「変更」に対応する概念を現す概念記号であり、「ＥＪＲ０１」は、用語「運用環境」に対応する概念を現す概念記号である。また、意味構造２２の「ＭＥＴＨＯＤ」「ＴＯＵＴＥＮ」「ＳＣＯＰＥ」などは、概念間の関連性を示すアークの記号である。

そして、特徴ベクトル生成部１２は、原文ｚ１の意味構造２２について、判定すべき用語「カスタマイズ」に対応する対象ノードの周辺を、特徴ベクトル２３を生成する範囲として分離して、用語「カスタマイズ」の意味構造２２を抽出する。ここでは、特徴ベクトル生成部１２は、原文ｚ１の意味構造２２について、対象ノードと直接アークで接続される関連ノードだけを残して、他のノードを削除する。図６Ａの上段右図は、用語１「カスタマイズ」の意味構造２２である。なお、用語１「カスタマイズ」に対応する概念を現す概念記号は、「ＣＵＳＴＯＭＡＩＺＥ」であり、品詞は、「ＳＮ」であり、意味属性は、「Ｓ１，Ｓ２，・・・」である。

そして、特徴ベクトル生成部１２は、原文ｚ２の意味構造２２について、判定すべき用語「変更」に対応する対象ノードの周辺を、特徴ベクトル２３を生成する範囲として分離して、用語「変更」の意味構造２２を抽出する。ここでは、特徴ベクトル生成部１２は、原文ｚ２の意味構造２２について、対象ノードとアークで直接接続される関連ノードだけを残して、他のノードを削除する。図６Ａの下段右図は、用語２「変更」の意味構造２２である。なお、用語２「変更」に対応する概念を現す概念記号は、「ＣＨＡＮＧＥ」であり、品詞は、「ＳＮ」であり、意味属性は、「Ｓ１，Ｓ３，・・・」である。

図６Ｂに示すように、特徴ベクトル生成部１２は、判定すべき用語１「カスタマイズ」に対応する対象ノードの周辺を分離した結果を示す意味構造２２から用語１の特徴ベクトル２３を生成する。ここでは、対象ノードの素性について、特徴ベクトル２３の用語１に対応する領域に設定される。用語１の品詞の素性について、品詞（ＳＮ）の値として「１」が設定され、それ以外の値として「０」が設定される。用語１の意味属性の素性について、Ｓ１、Ｓ２の値としてそれぞれ「１」が設定され、それ以外の値として「０」が設定される。用語１に対応する概念を現す概念記号の素性について、「ＣＵＳＴＯＭＩＺＥ」の値として「１」が設定され、それ以外の値として「０」が設定される。

対象ノードと直接アークで接続される関連ノードの素性について、特徴ベクトル２３の当該アークに対応する領域に設定される。

例えば、アーク（ＯＢＪＡ）の方向の素性について、関連ノード「ＮＥＥＤ」から対象ノード「ＣＵＳＴＯＭＩＺＥ」に向かう「１」が設定される。アーク（ＯＢＪＡ）の品詞の素性について、図示されないが、関連ノード「ＮＥＥＤ」の品詞に対応する素性の値として「１」が設定され、それ以外の値として「０」が設定される。アーク（ＯＢＪＡ）の意味属性の素性について、関連ノード「ＮＥＥＤ」の意味属性に対応する素性の値として「１」が設定され、それ以外の値として「０」が設定される。アーク（ＯＢＪＡ）の概念記号の素性について、関連ノード「ＮＥＥＤ」の概念記号「ＮＥＥＤ」に対応する素性の値として「１」が設定され、それ以外の値として「０」が設定される。

関連ノード「ＮＥＥＤ」と同様に、関連ノード「ＥＪＲ０１」についても、アーク（ＯＢＪ）に対応する領域に、方向、品詞、意味属性および概念記号の素性が設定される。

図６Ｃに示すように、特徴ベクトル生成部１２は、判定すべき用語２「変更」に対応する対象ノードの周辺を分離した結果を示す意味構造２２から用語２の特徴ベクトル２３を生成する。ここでは、対象ノードの素性について、特徴ベクトル２３の用語２に対応する欄に設定される。用語２の品詞の素性について、品詞（ＳＮ）の値として「１」が設定され、それ以外の値として「０」が設定される。用語２の意味属性の素性について、Ｓ１、Ｓ３の値としてそれぞれ「１」が設定され、それ以外の値として「０」が設定される。用語２に対応する概念を現す概念記号の素性について、「ＣＨＡＮＧＥ」の値として「１」が設定され、それ以外の値として「０」が設定される。

例えば、アーク（ＭＥＴＨＯＤ）の方向の素性について、関連ノード「ＤＥＡＬＷＩＴＨ」から対象ノード「ＣＨＡＮＧＥ」に向かう「１」が設定される。アーク（ＭＥＴＨＯＤ）の品詞の素性について、図示されないが、関連ノード「ＤＥＡＬＷＩＴＨ」の品詞に対応する素性の値として「１」が設定され、それ以外の値として「０」が設定される。アーク（ＭＥＴＨＯＤ）の意味属性の素性について、関連ノード「ＤＥＡＬＷＩＴＨ」の意味属性の値として「１」が設定され、それ以外の値として「０」が設定される。アーク（ＭＥＴＨＯＤ）の概念記号の素性について、関連ノード「ＤＥＡＬＷＩＴＨ」の概念記号「ＤＥＡＬＷＩＴＨ」に対応する素性の値として「１」が設定され、それ以外の値として「０」が設定される。

関連ノード「ＤＥＡＬＷＩＴＨ」と同様に、関連ノード「ＥＪＲ−０２０４４８５」についても、アーク（ＳＣＯＰＥ）に対応する領域に、方向、品詞、意味属性および概念記号の素性が設定される。

図６Ｄに示すように、特徴ベクトル生成部１２は、用語１の特徴ベクトル２３と用語２の特徴ベクトル２３とを比較し、比較結果の特徴ベクトル２３を生成する。ここでは、特徴ベクトル生成部１２は、用語１の特徴ベクトル２３と用語２の特徴ベクトル２３について、それぞれ先頭の素性から順次比較し、一致する素性の値を１とし、一致しない値を０とする比較結果の特徴ベクトル２３を生成する。

その後、特徴ベクトル生成部１２は、用語１の特徴ベクトル２３と用語２の特徴ベクトル２３と比較結果の特徴ベクトル２３とを連結して機械学習用の特徴ベクトル２３を生成することになる。

ここで、実施例１に係る特徴ベクトル２３の性質を、図７を参照して説明する。図７は、実施例１に係る特徴ベクトルの性質を示す図である。

図７に示すように、特徴ベクトル２３は、学習対象の用語１に対応する対象ノードｎ１について、品詞、意味属性および概念記号など、意味的な性質を含む用語１の特徴を示す素性を有する。このため、学習部１３は、学習対象の用語１の独立した性質を考慮して学習できる。特徴ベクトル２３は、学習対象の用語２に対応する対象ノードｎ２について、品詞、意味属性および概念記号など、意味的な性質を含む用語２の特徴を示す素性を有する。このため、学習部１３は、学習対象の用語２の独立した性質を考慮して学習できる。

図７に示すように、特徴ベクトル２３は、学習対象の用語１と意味的につながっている用語に対応する関連ノードｎ１０について、つながり方を示すアーク名およびアークの方向を併せて、関連ノードｎ１０の品詞、意味属性および概念記号など、意味的な性質を含む関連ノードの特徴を示す素性を有する。このため、学習部１３は、学習対象の文章である原文ｚ１（例えば、図６Ａ参照）における学習対象の用語１の使われ方を考慮して学習できる。特徴ベクトル２３は、学習対象の用語２と意味的につながっている用語に対応する関連ノードｎ２０について、つながり方を示すアーク名およびアークの方向を併せて、関連ノードｎ２０の品詞、意味属性および概念記号など、意味的な性質を含む関連ノードの特徴を示す素性を有する。このため、学習部１３は、学習対象の文章である原文ｚ２（例えば、図６Ａ参照）における学習対象の用語２の使われ方を考慮して学習できる。

図７に示すように、機械学習用の特徴ベクトル２３は、１対の用語（用語１、用語２）について、それぞれの用語の特徴ベクトル２３を比較した比較結果の特徴ベクトル２３を素性として有する。このため、学習部１３では、１対の用語（用語１、用語２）の組み合わせによって生じる用語間の性質を用語単独ではなくその使われ方を含めてより詳細に考慮した判定を実現する学習ができる。

図１に戻って、運用フェーズ１０Ｂは、判定対象の文書を入力し、学習フェーズ１０Ａで導出された重みベクトル２４を参照し、入力した文書内に存在する用語について同義語判定を行う。運用フェーズ１０Ｂは、意味解析部１４、特徴ベクトル生成部１５および判定部１６を有する。なお、意味解析部１４は、受付部および第１の生成部の一例である。特徴ベクトル生成部１５は、第２の生成部の一例である。判定部１６は、判定部の一例である。

意味解析部１４は、入力された判定対象の文書の中から、順次文章を選択する。意味解析部１４は、選択した文章について、形態素解析および意味解析を行い、意味構造２２を生成する。この意味解析部は、前述の学習フェーズ１０Ａにおける意味解析部１１と同じ処理により実現できる。

特徴ベクトル生成部１５は、判定対象とする２つの用語の対から特徴ベクトル２３を生成する。

例えば、特徴ベクトル生成部１５は、意味解析部１４によって生成された文章毎の意味構造２２から、判定対象とする複数の用語に対応するそれぞれのノード（判定対象ノード）を選択する。特徴ベクトル生成部１５は、選択した判定対象ノードの周辺を、特徴ベクトル２３を生成する範囲として分離する。一例として、特徴ベクトル生成部１５は、選択した判定対象ノードを含む意味構造２２について、判定対象ノードと直接アークで接続するノード（関連ノード）だけを残して、他のノードを削除する。ここでいう判定対象ノードは、以下の判定規則に基づき絞り込むようにしても良い。例えば、判定対象ノードの品詞は、形容詞、名詞（副詞的名詞、固有名詞、サ変名詞を含む）、動詞（形容動詞を含む）など、判定目的に該当する可能性のある品詞である。判定対象ノードに対応する用語は、自立語である。

そして、特徴ベクトル生成部１５は、選択された判定対象ノードを、同義語になりそうなノード同士でグループ化するようにしても良い。ここでいうグループ化は、以下の規則に基づき実施されれば良い。例えば、予め設定された品詞が同じノード同士である。

そして、特徴ベクトル生成部１５は、グループ化されたグループ毎に、グループに含まれる２つのノードを選択し、選択した２つのノードに対応するそれぞれの用語の対から特徴ベクトル２３を生成する。特徴ベクトル２３の生成方法は、特徴ベクトル生成部１２の特徴ベクトル２３の生成方法と同様である。すなわち、前述の学習フェーズで使用する機械学習用の特徴ベクトルと、運用フェーズで使用する判定対象の特徴ベクトルとは同じ構造を持つ。特徴ベクトル生成部１５は、選択した２つのノードに対応する、周辺を分離した結果を示す２種の意味構造２２からそれぞれ特徴ベクトル２３を生成し、生成された２種の特徴ベクトル２３を比較した比較結果の特徴ベクトル２３を生成する。そして、特徴ベクトル生成部１５は、生成された３種の特徴ベクトル２３、すなわち、２種の意味構造２２からそれぞれ生成された２種の特徴ベクトル２３と比較結果の特徴ベクトル２３を連結して判定対象の特徴ベクトル２３を生成する。なお、グループに含まれる２つのノードは、重複が無い総当たりで選択されるが、事前に可能性のない組み合わせを無くするようにしても良い。例えば、特許５５８５４７２号公報に開示されている粗絞りの技術を使って行えば良い。

判定部１６は、２つのノードに対応するそれぞれの用語の対から生成された判定対象の特徴ベクトル２３を機械学習器に入力し、当該用語の対が同義語であるか否かを判定する。例えば、判定部１６は、特徴ベクトル生成部１５によって生成された判定対象の特徴ベクトル２３を機械学習器に入力し、学習フェーズ１０Ａで生成済みの重みベクトル２４を用いて、機械学習器による評価を行い、総合評価値を導出する。一例として、判定部１６は、特徴ベクトル生成部１５によって生成された特徴ベクトル２３と学習フェーズ１０Ａで生成済みの重みベクトル２４との内積を計算し、総合評価値を導出する。そして、判定部１６は、導出した総合評価値を予め設定された閾値で判定することにより、同義語であるか否かの判定結果を決定する。そして、判定部１６は、決定した判定結果を出力する。なお、閾値は、評価結果に基づいて適宜変更されることが可能である。

ここで、実施例１に係る同義語判定処理を、図８を参照して説明する。図８は、実施例１に係る同義語判定処理の一例を示す図である。図８に示すように、判定部１６は、用語の対から生成された判定対象の特徴ベクトル２３を機械学習器に入力する。ここでは、特徴ベクトル２３として（ｘ_１０１）、（ｘ_１０２）、（ｘ_１０３）が入力される。（ｘ_１０１）、（ｘ_１０２）、（ｘ_１０３）は、それぞれ異なる用語の対から生成された判定対象の特徴ベクトル２３である。

判定部１６は、入力した判定対象の特徴ベクトル２３について、学習フェーズ１０Ａで生成済みの重みベクトル２４を用いて、機械学習器による評価を行い、総合評価値を導出する。ここでは、（ｘ_１０１）の特徴ベクトル２３について、判定部１６は、機械学習結果の重みベクトル２４との内積を計算し、総合評価値としてｙ_１０１（０．８６５４）を導出する。（ｘ_１０２）の特徴ベクトル２３について、判定部１６は、機械学習結果の重みベクトル２４との内積を計算し、総合評価値としてｙ_１０２（−２．０９３７）を導出する。（ｘ_１０３）の特徴ベクトル２３について、判定部１６は、機械学習結果の重みベクトル２４との内積を計算し、総合評価値としてｙ_１０３（１．５７８９）を導出する。

そして、判定部１６は、導出した総合評価値を閾値で判定することにより、同義語であるか否かの判定結果を決定する。ここでは、閾値は、機械学習器が標準で導出したマージンが１の場合であり、±１であるとする。すなわち、同義語であることを示す判定用の上位の閾値が１であり、同義語でないことを示す判定用の下位の閾値が−１である。すると、（ｘ_１０１）の特徴ベクトル２３に対して導出された総合評価値ｙ_１０１（０．８６５４）は、上位の閾値と下位の閾値との範囲内にあるため、判定不能と判定される。（ｘ_１０２）の特徴ベクトル２３に対して導出された総合評価値ｙ_１０２（−２．０９３７）は、下位の閾値より小さいため、同義語でないと判定される。（ｘ_１０３）の特徴ベクトル２３に対して導出された総合評価値ｙ_１０３（１．５７８９）は、上位の閾値より大きいため、同義語であると判定される。

［同義語判定処理のフローチャート］
図９は、実施例１に係る同義語判定処理のフローチャートの一例を示す図である。

まず、同義語判定処理は、ユーザに、同義語判定に関する教師例２１を生成させる（ステップＳ１１）。正例の教師例２１は、同義語であると判定すべき用語と例題の文章とを合わせた情報の組である。負例の教師例２１は、同義語でないと判定すべき用語と例題の文章とを合わせた情報の組である。

そして、同義語判定処理は、生成した教師例２１を、学習フェーズ１０Ａ（ステップＳ１２）に入力し、機械学習器を使用して学習結果として重みベクトル２４を導出する。なお、学習フェーズ１０Ａのフローチャートは、後述する。

次に、同義語判定処理は、判定対象の文書を入力する（ステップＳ１３）。

そして、同義語判定処理は、入力した文書について、導出済みの重みベクトル２４を参照して、運用フェーズ１０Ｂによる判定を行う（ステップＳ１４）。なお、運用フェーズ１０Ｂのフローチャートは、後述する。

同義語判定処理は、ユーザに、判定結果を利用させる（ステップＳ１５）。ユーザは、誤判定であるか否かを判定する（ステップＳ１６）。誤判定であると判定した場合には（ステップＳ１６；Ｙｅｓ）、同義語判定処理は、必要に応じて、誤判定した例題を新たな教師例２１としてフィードバックさせるべく、ステップＳ１１に移行する。

一方、誤判定でないと判定した場合には（ステップＳ１６；Ｎｏ）、同義語判定処理は、終了する。

［学習フェーズのフローチャート］
図１０は、実施例１に係る学習フェーズのフローチャートの一例を示す図である。

図１０に示すように、意味解析部１１は、入力された教師例２１の中から、１組の教師例２１を選択する（ステップＳ２１）。意味解析部１１は、選択した教師例２１に示された対の例題の文章について、意味解析を含む日本語解析処理を行い（ステップＳ２２）、それぞれの意味構造２２の対を生成する。ここでは日本語文章に対する処理を例に説明しているが、ステップＳ２２は入力された例題文章の言語により適切な言語解析処理を行う。例えば、例題文章が英語の場合は、英語解析処理を行う。

そして、特徴ベクトル生成部１２は、生成された対の意味構造２２を用いて、機械学習用の特徴ベクトル２３を生成する（ステップＳ２３）。なお、特徴ベクトル２３の生成処理のフローチャートは、後述する。

そして、意味解析部１１は、残りの教師例２１が有るか否かを判定する（ステップＳ２４）。残りの教師例２１が有ると判定した場合には（ステップＳ２４；Ｙｅｓ）、意味解析部１１は、次の教師例２１を選択すべく、ステップＳ２１に移行する。

一方、残りの教師例２１が無いと判定した場合には（ステップＳ２４；Ｎｏ）、学習部１３は、教師例２１から生成された特徴ベクトル２３をＳＶＭに入力して学習する（ステップＳ２５）。この結果、重みベクトル２４が学習結果として生成される。そして、学習フェーズ１０Ａは、終了する。

［特徴ベクトル生成処理のフローチャート］
図１１は、実施例１に係る特徴ベクトル生成処理のフローチャートの一例を示す図である。

図１１に示すように、特徴ベクトル生成部１２は、対の意味構造２２について、それぞれ判定すべき用語に対応するノード（対象ノード）の周辺を分離する（ステップＳ３１）。ここでは、判定すべき用語を用語１，用語２として説明する。

特徴ベクトル生成部１２は、用語１の意味構造２２から特徴ベクトル２３を生成する（ステップＳ３２）。なお、用語の意味構造２２から特徴ベクトル２３を生成する処理のフローチャートは、後述する。そして、特徴ベクトル生成部１２は、ステップＳ３４に移行する。

特徴ベクトル生成部１２は、用語２の意味構造２２から特徴ベクトル２３を生成する（ステップＳ３３）。なお、用語の意味構造２２から特徴ベクトル２３を生成する処理のフローチャートは、後述する。そして、特徴ベクトル生成部１２は、ステップＳ３４に移行する。

ステップＳ３４において、特徴ベクトル生成部１２は、用語１，２のそれぞれの特徴ベクトル２３を比較し、比較結果の特徴ベクトル２３を生成する（ステップＳ３４）。例えば、特徴ベクトル生成部１２は、用語１の特徴ベクトル２３と、用語２の特徴ベクトル２３とを、先頭の素性から順次素性の値を比較し、一致する素性の値を１とし、一致しない素性の値を０とする比較結果の特徴ベクトル２３を生成する。

そして、特徴ベクトル生成部１２は、３種の特徴ベクトル２３を連結する（ステップＳ３５）。すなわち、特徴ベクトル生成部１２は、用語１の特徴ベクトル２３と用語２の特徴ベクトル２３と比較結果の特徴ベクトル２３とを連結して機械学習用の特徴ベクトル２３を生成する。そして、特徴ベクトル生成部１２は、特徴ベクトル生成処理を終了する。

［用語の意味構造から特徴ベクトルを生成する処理のフローチャート］
図１２は、用語の意味構造から特徴ベクトルを生成する処理のフローチャートの一例を示す図である。

図１２に示すように、特徴ベクトル生成部１２は、判定すべき用語の意味構造２２をロードして、当該用語に対応する対象ノードを特定する（ステップＳ４１）。例えば、特徴ベクトル生成部１２は、判定すべき用語の意味構造２２から、当該用語の表記に対応する概念記号を有する対象ノードを特定する。

特徴ベクトル生成部１２は、予め定義された素性リストを順次参照して、対象ノード分の特徴ベクトル２３を設定する（ステップＳ４２）。ここでいう素性リストとは、素性として適用する要素を定義したリストであり、品詞リストと、意味属性リストと、概念記号リストとを含む。品詞リストは、対象ノードの品詞として出現する可能性のある品詞のリストである。意味属性リストは、対象ノードの意味属性として出現する可能性のある意味属性のリストである。概念記号リストは、対象ノードの概念記号として出現する可能性のある概念記号のリストである。例えば、特徴ベクトル生成部１２は、素性リストを参照し、対象ノードに該当する要素が存在する素性の値を１とし、存在しない素性の値を０として、特徴ベクトル２３の対象ノードの情報ｉ０（図４参照）のエリアに設定する。

特徴ベクトル生成部１２は、アークリストからアークを選択する（ステップＳ４３）。ここでいうアークリストとは、対象ノードに接続される可能性のあるアークを定義したリストである。特徴ベクトル生成部１２は、選択したアーク（該当アーク）が対象ノードに接続されているか否かを判定する（ステップＳ４４）。

該当アークが対象ノードに接続されていないと判定した場合には（ステップＳ４４；Ｎｏ）、特徴ベクトル生成部１２は、該当アーク分の特徴ベクトル２３に全て０を設定する（ステップＳ４５）。例えば、特徴ベクトル生成部１２は、素性リストに定義された全要素に対応する素性の値および該当アークの方向に対応する素性の値を０とし、特徴ベクトル２３の関連ノードの情報ｉ１０（図４参照）の中の該当アークのエリアに設定する。そして、特徴ベクトル生成部１２は、次のアークを選択すべく、ステップＳ４３に移行する。

一方、該当アークが対象ノードに接続されていると判定した場合には（ステップＳ４４；Ｙｅｓ）、特徴ベクトル生成部１２は、該当アークの方向を該当アーク分の特徴ベクトル２３に設定する（ステップＳ４６）。例えば、特徴ベクトル生成部１２は、対象ノードから外に向かっている方向（ＯＵＴアーク）の場合には０とし、外から対象ノードに向かっている方向（ＩＮアーク）の場合には１とし、特徴ベクトル２３の関連ノードの情報ｉ１０の中の該当アークの方向のエリアに設定する。

そして、特徴ベクトル生成部１２は、素性リストを順次参照して、関連ノード分の特徴ベクトル２３を設定する（ステップＳ４７）。例えば、特徴ベクトル生成部１２は、素性リストを参照し、関連ノードに該当する要素が存在する素性の値を１とし、存在しない素性の値を０として、特徴ベクトル２３の関連ノードの情報ｉ１０の中の該当アークのエリアに設定する。

そして、特徴ベクトル生成部１２は、アークリストに未処理のアークが有るか否かを判定する（ステップＳ４８）。未処理のアークが有ると判定した場合には（ステップＳ４８；Ｙｅｓ）、特徴ベクトル生成部１２は、次のアークを選択すべく、ステップＳ４３に移行する。

一方、未処理のアークが無いと判定した場合には（ステップＳ４８；Ｎｏ）、特徴ベクトル生成部１２は、用語の意味構造２２から特徴ベクトル２３を生成する処理を終了する。

［運用フェーズのフローチャート］
図１３は、実施例１に係る運用フェーズのフローチャートの一例を示す図である。

図１３に示すように、意味解析部１４は、入力された対象文章について、日本語の意味解析処理を行い（ステップＳ５１）、それぞれの意味構造２２を生成する。ここでは日本語文章に対する処理を例に説明しているが、ステップＳ５１は入力された対象文章の言語により適切な言語解析処理を行う。例えば、対象文章が英語の場合は、英語解析処理を行う。

特徴ベクトル生成部１５は、生成された意味構造２２について、判定対象とするノード（判定対象ノード）を選択する（ステップＳ５２）。特徴ベクトル生成部１５は、生成された意味構造２２について、判定対象ノードの周辺を分離する（ステップＳ５３）。

続いて、特徴ベクトル生成部１５は、判定対象ノードを同義語になりそうなノード同士でグループ化する（ステップＳ５４）。特徴ベクトル生成部１５は、グループを選択する（ステップＳ５５）。特徴ベクトル生成部１５および判定部１６は、選択したグループの判定対象ノードを同義語判定する（ステップＳ５６）。なお、同義語判定処理のフローチャートは、後述する。そして、判定部１６は、同義語判定した判定結果を出力する。

そして、特徴ベクトル生成部１５は、未処理のグループが有るか否かを判定する（ステップＳ５７）。未処理のグループが有ると判定した場合には（ステップＳ５７；Ｙｅｓ）、特徴ベクトル生成部１５は、次のグループを選択すべく、ステップＳ５５に移行する。

一方、未処理のグループが無いと判定した場合には（ステップＳ５７；Ｎｏ）、運用フェーズ１０Ｂは、終了する。

［同義語判定処理のフローチャート］
図１４は、実施例１に係る同義語判定処理のフローチャートの一例を示す図である。

図１４に示すように、特徴ベクトル生成部１５は、入力された判定対象ノードのグループについて、当該グループに含まれる判定対象ノードを１次元の配列に格納する（ステップＳ６１）。特徴ベクトル生成部１５は、配列の先頭の要素を用語１として選択する（ステップＳ６２）。

特徴ベクトル生成部１５は、用語１の次の要素を用語２として選択する（ステップＳ６３）。特徴ベクトル生成部１５は、用語１，２の対から特徴ベクトル２３を生成する（ステップＳ６４）。なお、用語１，２の対から特徴ベクトル２３を生成する方法は、学習フェーズ１０Ａにより行う方法（図１１のＳ３２〜３５参照）と同様である。すなわち、特徴ベクトル生成部１５は、用語１の意味構造２２から特徴ベクトル２３を生成する。特徴ベクトル生成部１５は、用語２の意味構造２２から特徴ベクトル２３を生成する。特徴ベクトル生成部１５は、用語１，２の特徴ベクトル２３を比較し、比較結果の特徴ベクトル２３を生成する。そして、特徴ベクトル生成部１５は、３種の特徴ベクトル２３を連結して、判定対象の特徴ベクトル２３を生成する。

続いて、判定部１６は、生成した判定対象の特徴ベクトル２３を機械学習器（ＳＶＭ）に入力し、学習フェーズ１０Ａで生成済みの重みベクトル２４を用いて、機械学習器による評価を行う（ステップＳ６５）。判定部１６は、評価結果として総合評価値を導出する。そして、判定部１６は、評価結果として導出された総合評価値を、予め設定された閾値で判定し、判定結果を出力する（ステップＳ６６）。

続いて、特徴ベクトル生成部１５は、選択中の用語２は配列の最後であるか否かを判定する（ステップＳ６７）。用語２は配列の最後でないと判定した場合には（ステップＳ６７；Ｎｏ）、特徴ベクトル生成部１５は、次の配列の要素を用語２として選択する（ステップＳ６８）。そして、特徴ベクトル生成部１５は、新たな用語の対について評価すべく、ステップＳ６４に移行する。

一方、用語２は配列の最後であると判定した場合には（ステップＳ６７；Ｙｅｓ）、特徴ベクトル生成部１５は、用語１の次の配列の要素を用語１として選択する（ステップＳ６９）。

そして、特徴ベクトル生成部１５は、選択した用語１は配列の最後であるか否かを判定する（ステップＳ７０）。用語１は配列の最後でないと判定した場合には（ステップＳ７０；Ｎｏ）、特徴ベクトル生成部１５は、新たな用語の対について評価すべく、ステップＳ６３に移行する。

一方、用語１は配列の最後であると判定した場合には（ステップＳ７０；Ｙｅｓ）、同義語判定処理は、終了する。

［実施例１の効果］
このようにして、情報処理装置１は、複数の文章と、複数の文章それぞれに含まれる用語の指定とを受け付ける。情報処理装置１は、受け付けた複数の文章それぞれを解析して、指定を受け付けた用語ごとに、該用語に対応する意味的なノードと、該用語を含む文章に含まれる他の意味的なノードとの意味的な関係を示す意味構造２２を生成する。情報処理装置１は、指定を受け付けた用語ごとに、生成した意味構造２２から特定の関係を示す意味構造２２を抽出し、抽出した意味構造２２内の情報を素性とする特徴ベクトル２３を生成する。そして、情報処理装置１は、生成した用語ごとの特徴ベクトル２３を、複数の用語間の類似性に関する判定を行う機械学習器に入力する。かかる構成によれば、情報処理装置１は、指定を受け付けた用語と他の用語それぞれとの関係を示す意味構造２２を用いて、意味構造２２内の情報を素性とする特徴ベクトル２３を生成することで、指定を受け付けた用語の独立した性質や使われ方を示す特徴を得ることができる。この結果、情報処理装置１は、機械学習器に用語ごとの特徴ベクトル２３を入力することで、用語間の類似性に関する判定精度を向上することが可能となる。

また、上記実施例１によれば、情報処理装置１は、指定を受け付けた用語に対して、以下の情報を持つ意味構造２２を生成する。すなわち、情報処理装置１は、指定を受け付けた用語の有する属性情報と、当該用語と当該用語を含む文章に含まれる他の複数の用語それぞれとの間の関係情報と、他の複数の用語の有する属性情報とを含む意味構造２２を生成する。かかる構成によれば、情報処理装置１は、意味構造２２に、用語の有する属性情報、当該用語と他の用語との間の関係情報を含むことで、指定を受け付けた用語と他の用語との間の関係を含む特徴を得ることができる。

また、上記実施例１によれば、情報処理装置１は、指定を受け付けた用語に対して、意味構造２２から、当該用語と直接関係する他の複数の用語との間の特定の意味構造２２を抽出し、抽出した情報を素性とする特徴ベクトル２３を生成する。かかる構成によれば、情報処理装置１は、指定を受け付けた用語と直接関係のある他の用語との間の意味構造２２を用いて特徴ベクトル２３を生成することで、指定を受け付けた用語のより良い特徴を得ることができる。

また、上記実施例１によれば、情報処理装置１は、指定を受け付けた第１の用語について、第１の用語に対応する意味構造２２から特定の意味構造２２を抽出し、抽出した前記特定の意味構造２２を素性とする第１の特徴ベクトル２３を生成する。情報処理装置１は、指定を受け付けた第２の用語について、第２の用語に対応する意味構造２２から特定の意味構造２２を抽出し、抽出した特定の意味構造２２を素性とする第２の特徴ベクトル２３を生成する。情報処理装置１は、第１の特徴ベクトル２３、第２の特徴ベクトル２３および第１の特徴ベクトル２３と第２の特徴ベクトル２３とを比較した比較結果を示す第３の特徴ベクトル２３を連結した新たな特徴ベクトル２３を機械学習器に入力する。かかる構成によれば、機械学習器は、第１の用語と第２の用語との間の類似性に関する判定精度を向上することが可能となる。

また、上記実施例１によれば、情報処理装置１は、複数の文章と複数の文章それぞれに含まれる用語の指定とともに、指定された用語間が類似であるか否かの当否情報の指定を受け付ける。情報処理装置１は、指定を受け付けた用語ごとの特徴ベクトル２３を、当否情報とともに、機械学習器に入力する。情報処理装置１は、入力された特徴ベクトル２３と当否情報とを用いて学習し、学習結果として重みベクトル２４を出力する。かかる構成によれば、情報処理装置１は、用語間の類似性に関する判定に用いられる重みベクトル２４を精度良く生成することができる。

また、上記実施例１によれば、情報処理装置１は、複数の文章と複数の文章それぞれに含まれる用語であって判定すべき用語の指定とを受け付ける。情報処理装置１は、指定を受け付けた用語ごとの特徴ベクトル２３を機械学習器に入力する。情報処理装置１は、学習結果として出力された重みベクトル２４と、入力された用語ごとの特徴ベクトル２３とを用いて、複数の用語間の類似性に関する判定を行い、判定結果を出力する。かかる構成によれば、情報処理装置１は、精度良い重みベクトル２４を用いて用語間の類似性に関する判定精度を向上することが可能となる。

ところで、実施例１に係る特徴ベクトル２３は、判定すべき用語（対象用語）に対応する対象ノードに対して、各種品詞の素性、各種意味属性の素性および各種概念記号の素性を含む。加えて、特徴ベクトル２３は、対象用語とアークでつながる用語に対応する関連ノードに対して、各種アークの数分の、各種品詞の素性、各種意味属性の素性および各種概念記号の素性を含む。各種品種の素性は、約３０種存在する。各種意味属性の素性は、約１００００種存在する。各種概念記号の素性は、約１００万種存在する。各種アークは、約７００種存在する。

ここで、全素性情報を使用した特徴ベクトル２３の概念図を、図１５を参照して説明する。図１５は、全素性情報を使用した特徴ベクトルの概念を示す図である。図１５に示すように、学習や判定対象の用語１に対する特徴ベクトル２３は、３０種の品詞、１００００種の意味属性、１００万種の概念記号を含む。そして、用語１につながる用語に対する特徴ベクトル２３は、７００種のアークに対して、それぞれ３０種の品詞、１００００種の意味属性、１００万種の概念記号を含む。また、学習や判定対象の用語２に対する特徴ベクトル２３は、３０種の品詞、１００００種の意味属性、１００万種の概念記号を含む。そして、用語２につながる用語に対する特徴ベクトル２３は、７００種のアークに対して、それぞれ３０種の品詞、１００００種の意味属性、１００万種の概念記号を含む。また、用語１と用語２との比較結果の特徴ベクトル２３は、１種の品詞、１００００種の意味属性、１種の概念記号に関する比較結果を含む。用語１につながる用語と用語２につながる用語との比較結果の特徴ベクトル２３は、７００種のアークに対して、それぞれ１種の品詞、１００００種の意味属性、１種の概念記号に関する比較結果を含む。

すなわち、全素性情報を使用した特徴ベクトル２３の次元数は、次の計算式（１）で示される。
次元数＝（（品詞３０種＋意味属性１００００種＋概念記号１００万種）＋アーク７００種×（品詞３０種＋意味属性１００００種＋概念記号１００万種））×２＋（品詞１種＋意味属性１００００種＋概念記号１種）＋アーク７００種×（品詞１種+意味属性１００００種＋概念記号１種）＝１，４２３，０７３，４６２次元・・・式（１）

しかしながら、特徴ベクトル２３は、これに限定されず、以下で示す次元を圧縮した特徴ベクトル２３であっても良い。例えば、（１）対象用語の品詞は、同義語または多義語として重要な約１０種の品詞に限定する。（２）つながる（接続先の）用語の品詞は、使用頻度の低い２種を削減して２８種に限定する。（３）概念記号は、用語を一意に区別する記号として、一致と不一致の情報のみにする。（４）意味属性は、使用頻度が高い７６種に限定する。（５）アークは、使用頻度が高い５０種に限定する。

ここで、対象用語の品詞に関する次元圧縮の一例を、図１６を参照して説明する。図１６は、対象用語の品詞に関する次元圧縮の一例を示す図である。図１６に示すように、対象用語の品詞は、選定項目に「〇」が設定された名称の品詞に限定される。すなわち、「副詞」、「接続詞、接続助詞」、「連体詞」、「前置詞」などは、同義語または多義語として重要でないとして除外される。

このような次元が圧縮された特徴ベクトル２３の概念を、図１７を参照して説明する。図１７は、実施例２に係る次元圧縮結果の特徴ベクトルの概念を示す図である。図１７に示すように、判定対象の用語１に対する特徴ベクトル２３は、１０種の品詞、７６種の意味属性を含む。そして、用語１につながる用語に対する特徴ベクトル２３は、５０種のアークに対して、それぞれ２８種の品詞、７６種の意味属性を含む。なお、用語１に対応する概念を現す概念記号は、一致と不一致の情報のみであるので、省略する。また、判定対象の用語２に対する特徴ベクトル２３は、１０種の品詞、７６種の意味属性を含む。そして、用語２につながる用語に対する特徴ベクトル２３は、５０種のアークに対して、それぞれ２８種の品詞、７６種の意味属性を含む。なお、用語２に対応する概念を現す概念記号は、一致と不一致の情報のみであるので、省略する。また、用語１と用語２との比較結果の特徴ベクトル２３は、１種の品詞、７６種の意味属性、１種の概念記号に関する比較結果を含む。用語１につながる用語と用語２につながる用語との比較結果の特徴ベクトル２３は、５０種のアークに対して、それぞれ１種の品詞、７６種の意味属性、１種の概念記号に関する比較結果を含む。

このような次元が圧縮された特徴ベクトル２３の一例を、図１８を参照して説明する。図１８は、実施例２に係る次元圧縮結果の特徴ベクトルの一例を示す図である。図１８に示すように、用語１に対する特徴ベクトル２３は、１０種の品詞、７６種の意味属性を含む。そして、５０種のアークに対して、それぞれ１種の方向、２８種の品詞、７６種の意味属性を含む。また、用語２に対する特徴ベクトル２３は、１０種の品詞、７６種の意味属性を含む。そして、５０種のアークに対して、それぞれ１種の方向、２８種の品詞、７６種の意味属性を含む。また、用語１と用語２との比較結果の特徴ベクトル２３は、１種の品詞、７６種の意味属性、１種の概念記号に関する比較結果を含む。そして、５０種のアークに対して、それぞれ１種の方向、１種の品詞、７６種の意味属性、１種の概念記号に関する比較結果を含む。

すなわち、次元圧縮結果の特徴ベクトル２３の次元数は、次の計算式（２）で示される。
次元数＝（（品詞１０種＋意味属性７６種）＋アーク５０種×（品詞２８種＋意味属性７６種））×２＋（品詞１種＋意味属性７６種＋概念記号１種）＋アーク５０種×（品詞１種+意味属性７６種＋概念記号１種）＝１４，５５０次元・・・式（２）

このようにして、次元圧縮結果の特徴ベクトル２３の次元数は、全素性情報を使用した特徴ベクトル２３の次元数と比べて現実的な次元数となり、ＳＶＭが確実に処理可能な次元数となる。

ここで、実施例２に係る次元圧縮結果の特徴ベクトル２３を使った同義語判定処理の判定結果を、図１９を参照して説明する。図１９は、実施例２に係る同義語判定処理の判定結果の一例を示す図である。

図１９上段に示すように、教師例２１は、学習フェーズ１０Ａにおいて、２３０６例作成されたものとする。

図１９中段に示すように、判定精度が確認されるために、教師例２１は、予め３つのグループに分割される。学習フェーズ１０Ａでは、１つのグループの教師例２１が使用される。ここでは、データグループｘが使用されたものとする。運用フェーズ１０Ｂでは、残りの１グループの教師例２１が使用される。ここでは、データグループｙが使用されたものとする。

図１９下段に示すように、運用フェーズ１０Ｂが、データグループｙのデータを入力して、同義語判定を行い、判定結果を出力したものである。判定結果は、７６９件のうち、人間と機械（ＳＶＭ）とが同義語と判定した件数が１７５件、人間と機械とが同義語でないと判定した件数が２６１件である。また、人間が同義語と判定し、且つ機械が同義語でないと判定した件数が８０件である。これは、機械が同義語と判定するべきところを見逃したものである。また、人間が同義語でないと判定し、且つ機械が同義語であると判定した件数が２５３件である。これは、機械が同義語でないと判定するべきところを同義語であると過剰に抽出（判定）したものである。したがって、同義語の抽出率は、１７５／（１７５＋８０）＝６９％となる。過剰抽出が２５３件あるが、全ての組み合わせを人間が同義語判定することに比べれば、人間が判定結果を再判定する労力は小さく、実用的に使用することが可能である。これにより、全ての文章を人間が読んで同義語判定する場合と比べて、人間のコスト（対応する時間）を大幅に削減することができる。

なお、さらに、運用フェーズ１０Ｂで用いられる閾値が例えば１より大きく設定されることにより、運用フェーズ１０Ｂは、より多くの用語を判定不能として判定するようになる。これにより、見逃しを減らして、人間による全文章の見直しを不要にすることができる。ただし、過剰抽出が増えるため、人間が判定結果を見直すことが必要になるが、全文章の見直しに比べるとコストが小さく、有効な手段となる。

［実施例２の効果］
このようにして、意味構造２２は、用語の有する属性情報および用語と他の用語との間の関係情報として、それぞれ使用頻度に基づいた属性情報および関係情報を含むようにする。これにより、情報処理装置１は、意味構造２２を用いた特徴ベクトル２３を機械学習器に入力することで、機械学習器による確実な処理を可能にする。つまり、情報処理装置１は、特徴ベクトル２３の次元（素性）数を削減することで、機械学習器による現実的な処理を可能にする。

［その他］
なお、実施例１，２に係る情報処理装置１は、意味構造２２を用いて、同義語判定を自動的に行う場合を説明した。しかしながら、情報処理装置１は、これに限定されず、意味構造２２を用いて、多義語判定を自動的に行っても良い。例えば、情報処理装置１は、正例の教師例２１として多義語であると判定すべき用語と当該用語を含む例題文章とを併せた情報同士の組を作成する。情報処理装置１は、負例の教師例２１として多義語でないと判定すべき用語と当該用語を含む例題文章とを併せた情報同士の組とを作成する。そして、情報処理装置１は、教師例２１ごとに、教師例２１に示された組に含まれる２つの例題文章について、それぞれ意味構造２２を生成する。そして、情報処理装置１は、教師例２１ごとに、意味構造２２の対を比較して、機械学習用の特徴ベクトル２３を生成する。そして、情報処理装置１は、教師例２１ごとに生成されたそれぞれの機械学習用の特徴ベクトル２３をＳＶＭに入力して学習し、学習結果として重みベクトル２４を導出する。そして、情報処理装置１は、運用フェーズ１０により、導出された重みベクトル２４を用いて、入力した文書内に存在する用語間の多義語判定を行う。これにより、情報処理装置１は、ＳＶＭに用語ごとの特徴ベクトル２３を入力することで、用語間の多義語に関する判定精度を向上することが可能となる。

さらに、実施例１，２に係る情報処理装置１は、同義語、多義語の判定と同様に、用法（文章における用語の使われ方）によって変化する用語の性質について、２つの用語間の比較により性質を判定する処理を汎用的に実現することができる。例えば、情報処理装置１は、正例の教師例２１として判定目的の性質であると判定すべき用語と当該用語を含む例題文章とを併せた情報同士の組を作成する。情報処理装置１は、負例の教師例２１として判定目的の性質でないと判定すべき用語と当該用語を含む例題文章とを併せた情報同士の組とを作成する。以降の処理は前述した処理について「同義語判定」を「判定目的に関する判定」と読み替えて、全く同じ処理によって、入力した文書内に存在する用語間について判定目的の性質を有することの判定を行う。これにより、情報処理装置１は、ＳＶＭに用語ごとの特徴ベクトル２３を入力することで、用語間の判定目的に関する判定精度を向上することが可能となる。

また、図示した情報処理装置１の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、情報処理装置１の分散・統合の具体的態様は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、意味解析部１１と、意味解析部１４とを１つの部として統合しても良い。特徴ベクトル生成部１２と、特徴ベクトル生成部１５とを１つの部として統合しても良い。また、特徴ベクトル生成部１２、１５を、分離部と、用語の特徴ベクトル２３を生成する第１生成部と、機械学習用または判定対象の特徴ベクトル２３を生成する第２生成部とに分散しても良い。分離部とは、意味構造２２から特定の意味構造２２に分離する機能部である。第１生成部とは、分離した意味構造２２から用語の特徴ベクトル２３を生成する機能部である。第２生成部とは、２種の用語の特徴ベクトル２３と比較結果の特徴ベクトル２３とを結合する機械学習用または判定対象の特徴ベクトル２３を生成する機能部である。また、記憶部２０を情報処理装置１の外部装置としてネットワーク経由で接続するようにしても良い。

また、上記実施例で説明した各種の処理は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図１に示した情報処理装置１と同様の機能を実現する判定プログラムを実行するコンピュータの一例を説明する。図２０は、判定プログラムを実行するコンピュータの一例を示す図である。

図２０に示すように、コンピュータ２００は、各種演算処理を実行するＣＰＵ２０３と、ユーザからのデータの入力を受け付ける入力装置２１５と、表示装置２０９を制御する表示制御部２０７とを有する。また、コンピュータ２００は、記憶媒体からプログラムなどを読取るドライブ装置２１３と、ネットワークを介して他のコンピュータとの間でデータの授受を行う通信制御部２１７とを有する。また、コンピュータ２００は、各種情報を一時記憶するメモリ２０１と、ＨＤＤ２０５を有する。そして、メモリ２０１、ＣＰＵ２０３、ＨＤＤ２０５、表示制御部２０７、ドライブ装置２１３、入力装置２１５、通信制御部２１７は、バス２１９で接続されている。

ドライブ装置２１３は、例えばリムーバブルディスク２１１用の装置である。ＨＤＤ２０５は、判定プログラム２０５ａおよび判定処理関連情報２０５ｂを記憶する。

ＣＰＵ２０３は、判定プログラム２０５ａを読み出して、メモリ２０１に展開し、プロセスとして実行する。かかるプロセスは、情報処理装置１の各機能部に対応する。判定処理関連情報２０５ｂは、例えば、教師例２１、意味構造２２、特徴ベクトル２３、重みベクトル２４に対応する。そして、例えばリムーバブルディスク２１１が、判定プログラム２０５ａなどの各情報を記憶する。

なお、判定プログラム２０５ａについては、必ずしも最初からＨＤＤ２０５に記憶させておかなくても良い。例えば、コンピュータ２００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ−ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に当該プログラムを記憶させておく。そして、コンピュータ２００がこれらから判定プログラム２０５ａを読み出して実行するようにしても良い。

１情報処理装置
１０制御部
１０Ａ学習フェーズ
１１意味解析部
１２特徴ベクトル生成部
１３学習部
１０Ｂ運用フェーズ
１４意味解析部
１５特徴ベクトル生成部
１６判定部
２０記憶部
２１教師例
２２意味構造
２３特徴ベクトル
２４重みベクトル

Claims

複数の文章と前記複数の文章それぞれに含まれる判定対象の用語の指定とを受け付け、
受け付けた複数の文章それぞれを用語解析および意味解析して、前記複数の文章の文章ごとに文章に含まれる用語間の意味関係を示す第１の構造情報を生成し、
前記指定を受け付けた判定対象の用語ごとに、生成した前記文章に対する前記第１の構造情報であって判定対象の用語を含む前記文章に対する前記第１の構造情報から当該判定対象の用語に対する特定の意味関係を示す第２の構造情報を抽出し、抽出した第２の構造情報を素性とする特徴情報を生成し、
生成した、前記判定対象の用語ごとの前記特徴情報に基づき、前記判定対象の用語間の類似性に関する判定を行う
処理をコンピュータに実行させることを特徴とする判定プログラム。
前記第１の構造情報を生成する処理は、前記複数の文章の文章ごとに、文章に含まれる用語に対して、該用語の有する属性情報と、該用語と該用語を含む文章に含まれる他の複数の用語それぞれとの間の関係情報と、前記他の複数の用語の有する属性情報とを含む前記第１の構造情報を生成する
処理をコンピュータに実行させることを特徴とする請求項１に記載の判定プログラム。
前記特徴情報を生成する処理は、前記指定を受け付けた判定対象の用語に対して、前記第１の構造情報から、該用語と直接意味的に関係する他の用語との間の前記特定の意味関係を示す第２の構造情報を抽出し、抽出した第２の構造情報を素性とする特徴情報を生成する
処理をコンピュータに実行させることを特徴とする請求項１または請求項２に記載の判定プログラム。
前記特徴情報を生成する処理は、前記指定を受け付けた判定対象の第１の用語について、前記第１の用語に対応する前記第１の構造情報から前記特定の意味関係を示す第２の構造情報を抽出し、抽出した第２の構造情報を素性とする第１の特徴情報を生成し、前記指定を受け付けた判定対象の第２の用語について、前記第２の用語に対応する前記第１の構造情報から前記特定の意味関係を示す第２の構造情報を抽出し、抽出した第２の構造情報を素性とする第２の特徴情報を生成し、
前記第１の特徴情報、前記第２の特徴情報および前記第１の特徴情報と前記第２の特徴情報とを比較した結果を示す第３の特徴情報を連結した新たな特徴情報を、前記判定を行う処理に入力する
処理をコンピュータに実行させることを特徴とする請求項１に記載の判定プログラム。
教師データである例題となる文章に含まれる用語ごとの前記特徴情報を用いて、教師あり学習を行い、
前記判定を行う処理は、学習結果と、前記判定対象の用語ごとの前記特徴情報とを用いて、前記判定対象の用語間の類似性に関する判定を行い、判定結果を出力する
処理をコンピュータに実行させることを特徴とする請求項１に記載の判定プログラム。
前記特徴情報を生成する処理は、前記第１の構造情報から抽出された前記第２の構造情報に含まれる属性情報および関係情報の複数の要素のうち使用頻度に応じた要素に限定した要素を素性とする特徴情報を生成する
ことを特徴とする請求項１または２に記載の判定プログラム。
複数の文章と前記複数の文章それぞれに含まれる判定対象の用語の指定とを受け付ける受付部と、
前記受付部によって受け付けられた複数の文章それぞれを用語解析および意味解析して、前記複数の文章の文章ごとに文章に含まれる用語間の意味関係を示す第１の構造情報を生成する第１の生成部と、
前記指定を受け付けた判定対象の用語ごとに、前記第１の生成部によって生成された文章に対する前記第１の構造情報であって判定対象の用語を含む前記文章に対する前記第１の構造情報から当該判定対象の用語に対する特定の意味関係を示す第２の構造情報を抽出し、抽出した第２の構造情報を素性とする特徴情報を生成する第２の生成部と、
前記第２の生成部によって生成された、前記判定対象の用語ごとの前記特徴情報に基づき、前記判定対象の用語間の類似性に関する判定を行う判定部と、
を有することを特徴とする判定装置。
コンピュータが、
複数の文章と前記複数の文章それぞれに含まれる判定対象の用語の指定とを受け付け、
受け付けた複数の文章それぞれを用語解析および意味解析して、前記複数の文章の文章ごとに文章に含まれる用語間の意味関係を示す第１の構造情報を生成し、
前記指定を受け付けた判定対象の用語ごとに、生成した前記文章に対する前記第１の構造情報であって判定対象の用語を含む前記文章に対する前記第１の構造情報から当該判定対象の用語に対する特定の意味関係を示す第２の構造情報を抽出し、抽出した第２の構造情報を素性とする特徴情報を生成し、
生成した、前記判定対象の用語ごとの前記特徴情報に基づき、前記判定対象の用語間の類似性に関する判定を行う
各処理を実行することを特徴とする判定方法。