JP7529048B2

JP7529048B2 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: JP7529048B2
Application number: JP2022572828A
Authority: JP
Inventors: 康佑秋元; 風人山本; 邦彦定政
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2024-08-06
Anticipated expiration: 2040-12-28
Also published as: WO2022144968A1; US20240045895A1; JPWO2022144968A1

Description

本発明は、複数のエンティティ間の関係を類別する技術に関する。

複数のエンティティ間の関係を類別する技術が知られている。例えば、非特許文献１には、エンティティのペアの関係を記述した文表現の類似性に基づいて、当該ペアの関係を類別する関連技術が記載されている。当該関連技術は、あるエンティティのペアが出現する文において、当該ペアの関係を記述した文表現を、文の構文的な構造を用いて判別する。また、当該関連技術は、判別した文表現が類似しているかどうかによって、あるペアの関係と別のペアの関係とが同一であるかどうかを判断する。

Yuan, Chenhan, et al. "Clustering-based Unsupervised Generative Relation Extraction." arXiv preprint arXiv:2009.12681 (2020).

非特許文献１に記載の関連技術においては、複数のエンティティ間の関係を類別する精度に改善の余地がある。その理由について説明する。

ここで、複数のエンティティ間の関係は、各エンティティの特徴に応じて決まる場合がある。例えば、エンティティＸ及びＹについて「ＸはＹの元首である」という関係は、Ｘが動物ではなく人物である場合に成立する。しかしながら、当該関連技術は、文の構文的な構造を用いて判別した文表現の類似性に基づいてペアの関係を類別するため、各エンティティの特徴に応じた関係を類別できない場合がある。

本発明の一態様は、上記の問題に鑑みてなされたものであり、その目的の一例は、複数のエンティティ間の関係をより精度よく類別する技術を提供することである。

本発明の一側面に係る情報処理装置は、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する特徴ベクトル生成手段と、前記関係ベクトル生成手段にて生成された関係ベクトル及び前記特徴ベクトル生成手段にて生成された特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、を備えている。

本発明の一側面に係る情報処理方法は、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成すること、前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成すること、及び前記関係ベクトル及び前記複数の注目エンティティの各々に対し生成された前記特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別すること、を含む。

本発明の一側面に係るプログラムは、コンピュータを情報処理装置として機能させるためのプログラムであって、前記コンピュータを、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する特徴ベクトル生成手段と、前記関係ベクトル生成手段にて生成された関係ベクトル及び前記特徴ベクトル生成手段にて生成された特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、として機能させる。

本発明の一側面に係る情報処理装置は、複数のパラメータを含むアルゴリズムを用いて、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、前記関係ベクトル生成手段によって複数の注目エンティティが共通して出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新する関係ベクトル生成パラメータ更新手段と、前記関係ベクトル生成手段にて生成された関係ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、を備えている。

本発明の一側面に係る情報処理方法は、複数のパラメータを含むアルゴリズムを用いて、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成すること、前記関係ベクトル生成手段によって複数の注目エンティティが共通して出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新すること、及び前記関係ベクトル生成手段にて生成された関係ベクトルを用いて、前記複数の注目エンティティ間の関係を類別すること、を含む。

本発明の一側面に係るプログラムは、コンピュータを情報処理装置として機能させるためのプログラムであって、前記コンピュータを、複数のパラメータを含むアルゴリズムを用いて、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、前記関係ベクトル生成手段によって複数の注目エンティティが共通して出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新する関係ベクトル生成パラメータ更新手段と、前記関係ベクトル生成手段にて生成された関係ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、として機能させる。

本発明の一態様によれば、複数のエンティティ間の関係をより精度よく類別することができる。

本発明の例示的実施形態１に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態１に係る情報処理方法の流れを示すフロー図である。本発明の例示的実施形態２に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態２に係る情報処理方法の流れを示すフロー図である。本発明の例示的実施形態３に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態３に係る情報処理方法の流れを示すフロー図である。本発明の例示的実施形態４に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態４に係る情報処理方法の流れを示すフロー図である。本発明の実施例による類別結果と、比較例による類別結果とを比較する図である。本発明の例示的実施形態５に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態５に係る情報処理方法の流れを示すフロー図である。本発明の各例示的実施形態における情報処理装置のハードウェア構成の一例を示すブロック図である。

〔用語の説明〕
本発明の各例示的実施形態について説明する前に、各例示的実施形態において用いる用語について説明する。なお、各例示的実施形態に係る情報処理装置は、複数の注目エンティティが出現する文集合を参照して、当該複数の注目エンティティ間の関係を類別する装置である。

（エンティティ）
エンティティとは、文により表現される事象を構成する要素である。各エンティティは、その名前により他のエンティティと区別される。エンティティは、有体物であってもよいし、無体物であってもよい。また、エンティティは、名詞により表現される主体又は客体であってもよいし、動詞により表現される動作又は関係であってもよいし、形容詞又は形容動詞により表現される状態又は程度であってもよい。エンティティには、種類がある。例えば、名前が「Japan」であるエンティティの種類は、「国家」であり、名前が「Shinzo Abe」であるエンティティの種類は、「人物」であり、名前が「青」であるエンティティの種類は、「色」である。以下、各エンティティを区別して説明する必要がある場合には、それぞれに、ｅ１，ｅ２，…，の符号を付して説明する。

（複数の注目エンティティ）
複数の注目エンティティとは、文集合に出現するエンティティのうち、複数の注目するエンティティである。本例示的実施形態では、注目エンティティの個数を２として説明する。ただし、注目エンティティの個数は２に限定されず、３以上であってもよい。

（文集合）
文集合は、文の集合である。文集合は、複数の注目エンティティの一部または全部が出現する文を含む。文は、１つ以上の単語からなる。

（出現）
エンティティが文に出現するとは、その文において当該エンティティが参照されていることをいう。また、文においてエンティティが参照されるとは、文を構成する１以上の単語が当該エンティティを表していることをいう。換言すると、あるエンティティが出現する文は、当該エンティティを表す単語を含む。なお、あるエンティティを表す単語は、１つに限らない。例えば、エンティティ「Shinzo Abe」を表す単語の一例としては、複数の単語「安倍元総理」、「安倍晋三」等が挙げられる。また、あるエンティティを指示する単語も、そのエンティティを表す単語の一種と考えることができる。例えば、エンティティ「Shinzo Abe」を指示する代名詞「he」も、エンティティ「Shinzo Abe」を表す単語と見做し得る。例えば、ある文が単語「安倍元総理」を含み、他の文が単語「安倍晋三」を含み、さらに他の文が「Shinzo Abe」を指示する「彼」を含むとき、これらの文には、共通してエンティティ「Shinzo Abe」が出現している。

（関係）
文により表現される事象において、複数のエンティティは、関連性を有する場合がある。例えば、エンティティＸ「Japan」及びＹ「Shinzo Abe」は、「ＸはＹの元首だった」との関連性を有する。このようなエンティティ間の関連性を、関係と呼ぶ。

〔例示的実施形態１〕
本発明の第１の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。

＜情報処理装置の構成＞
本発明の第１の例示的実施形態に係る情報処理装置１について、図１を参照して説明する。図１は、情報処理装置１の構成を示すブロック図である。

情報処理装置１は、関係ベクトル生成部１１と、特徴ベクトル生成部１２と、関係類別部１３とを含む。関係ベクトル生成部１１は、請求の範囲に記載した「関係ベクトル生成手段」を実現する構成の一例である。関係類別部１３は、請求の範囲に記載した「関係類別手段」を実現する構成の一例である。請求の範囲に記載した「関係類別手段」を実現する構成の一例である。

（関係ベクトル生成部）
関係ベクトル生成部１１は、文集合より選択された、少なくとも１つの関係ベクトル生成用文から、複数の注目エンティティの関係を表す関係ベクトルを生成する。

例えば、関係ベクトル生成部１１は、次のようにして、関係ベクトルを生成する。具体的には、（１）まず、関係ベクトル生成部１１は、関係ベクトル生成用文を、単語の列、又は単語がノードであるようなグラフに変換する。関係ベクトル生成部１１は、この変換を行う際に、関係ベクトル生成用文を構文解析することにより得られた情報を用いてもよい。（２）次に、関係ベクトル生成部１１は、（１）で生成した単語の列またはグラフに含まれる各単語を、ベクトルに変換して単語ベクトルとする。例えば、関係ベクトル生成部１１は、各ベクトルの要素がそれぞれ異なる種類の単語に対応し、各単語に対応する要素のみが１でそれ以外の要素が０であるようなｏｎｅ－ｈｏｔ－ｖｅｃｔｏｒを当該単語に対応する単語ベクトルとして用いる。（３）次に、関係ベクトル生成部１１は、（２）で生成した各単語の単語ベクトルを用いて、関係ベクトルを計算する。例えば、関係ベクトル生成部１１は、各単語の単語ベクトルを、単語の列又はグラフの構造を反映した処理を行う計算モデルに入力することにより、関係ベクトルを計算する。そのような計算モデルとしては、リカレントニューラルネットワーク、グラフニューラルネットワーク、又はＴｒａｎｓｆｏｒｍｅｒ等が挙げられるがこれらに限られない。

なお、関係ベクトル生成部１１が関係ベクトルを生成する技術としては、例えば、上述した非特許文献１、以下の参考文献１、又は以下の参考文献２に記載された技術を適用可能である。

［参考文献１］Zeng, Daojian, et al. "Distant supervision for relation extraction via piecewise convolutional neural networks." Proceedings of the 2015 conference on empirical methods in natural language processing. 2015
［参考文献２］Miwa, Makoto, and Mohit Bansal. "End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures." Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2016.
非特許文献１、以下の参考文献１、又は以下の参考文献２に記載された技術は、それぞれ、分類モデルを用いてエンティティ間の関係を分類する。関係ベクトル生成部１１は、これらの技術の何れかを用いて、分類モデルに入力するベクトルを関係ベクトルとして用いてもよい。

（関係ベクトル生成用文）
関係ベクトル生成用文は、文集合より選択された、複数の注目エンティティが出現する文である。文集合に出現するエンティティのうち、エンティティｅ１、ｅ２を注目エンティティとする場合、文集合は、注目エンティティｅ１及びｅ２が出現するｎ個の関係ベクトル生成用文を含む。以降、ｎ個の関係ベクトル生成用文に、Ｓ（ｅ１，ｅ２）ｉとの符号を付して説明する。なお、ｎは１以上の整数であり、ｉは１以上ｎ以下の整数である。

（特徴ベクトル生成部）
特徴ベクトル生成部１２は、複数の注目エンティティの各々に対し、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する。特徴ベクトルは、例えば、当該注目エンティティが出現する文から推定される、当該注目エンティティの種類を表す。

例えば、特徴ベクトル生成部１２は、次のようにして、特徴ベクトルを生成する。具体的には、（１）まず、特徴ベクトル生成部１２は、特徴ベクトル生成用文を、単語の列、又は単語がノードであるようなグラフに変換する。特徴ベクトル生成部１２は、この変換を行う際に、特徴ベクトル生成用文を構文解析することにより得られた情報を用いてもよい。（２）次に、特徴ベクトル生成部１２は、（１）で生成した単語の列またはグラフに含まれる各単語を、ベクトルに変換して単語ベクトルとする。例えば、特徴ベクトル生成部１２は、各ベクトルの要素がそれぞれ異なる種類の単語に対応し、各単語に対応する要素のみが１でそれ以外の要素が０であるようなｏｎｅ－ｈｏｔ－ｖｅｃｔｏｒを当該単語に対応する単語ベクトルとして用いる。（３）次に、特徴ベクトル生成部１２は、（２）で生成した各単語の単語ベクトルを用いて、特徴ベクトルを計算する。例えば、特徴ベクトル生成部１２は、各単語の単語ベクトルを、単語の列又はグラフの構造を反映した処理を行う計算モデルに入力することにより、特徴ベクトルを計算する。そのような計算モデルとしては、リカレントニューラルネットワーク、グラフニューラルネットワーク、又はＴｒａｎｓｆｏｒｍｅｒ等が挙げられるがこれらに限られない。
特徴ベクトル生成用文から特徴ベクトルを生成する技術としては、例えば、Ｗｏｒｄ２Ｖｅｃ、又は以下の参考文献３等に記載された公知の技術を適用可能である。

［参考文献３］Liang, Chen, et al. "Bond: Bert-assisted open-domain named entity recognition with distant supervision." Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2020.
参考文献３に記載された技術は、分類モデルを用いてエンティティの種類を分類する。特徴ベクトル生成部１２は、当該技術を用いて、分類モデルに入力するベクトルを特徴ベクトルとして用いてもよい。

（特徴ベクトル生成用文）
特徴ベクトル生成用文は、文集合より選択された、複数の注目エンティティのうち１つが出現する文である。文集合に出現するエンティティのうち、エンティティｅ１、ｅ２を注目エンティティとする場合、文集合は、注目エンティティｅ１が出現するｍ１個の特徴ベクトル生成用文を含む。また、文集合は、注目エンティティｅ２が出現するｍ２個の特徴ベクトル生成用文を含む。以降、ｍｋ（ｋ＝１、２）個の特徴ベクトル生成用文に、Ｓ（ｅｋ）ｊとの符号を付して説明する。なお、ｍｋは１以上の整数であり、ｊは１以上ｍｋ以下の整数である。

（関係類別部）
関係類別部１３は、関係ベクトル生成部１１にて生成された関係ベクトル及び特徴ベクトル生成部１２にて生成された特徴ベクトルを用いて、複数の注目エンティティ間の関係を類別する。

＜情報処理方法の流れ＞
情報処理装置１が実行する情報処理方法Ｓ１の流れについて、図２を参照して説明する。図２は、情報処理方法Ｓ１の流れを示すフロー図である。図２に示すように、情報処理方法Ｓ１は、ステップＳ１１～Ｓ１３を含む。以下では、文集合に出現するエンティティのうち、エンティティｅ１、ｅ２を注目エンティティとして説明する。

（ステップＳ１１）
ステップＳ１１において、関係ベクトル生成部１１は、文集合より選択された、少なくとも１つの関係ベクトル生成用文Ｓ（ｅ１，ｅ２）から、注目エンティティｅ１、ｅ２の関係を表す関係ベクトルＶ（ｅ１，ｅ２）を生成する。

（ステップＳ１２）
特徴ベクトル生成部１２は、ｋ＝１、２のそれぞれについて、ステップＳ１２を実行する。ステップＳ１２において、特徴ベクトル生成部１２は、文集合より選択された、少なくとも１つの特徴ベクトル生成用文Ｓ（ｅｋ）から、注目エンティティｅｋの特徴を表す特徴ベクトルＶ（ｅｋ）を生成する。

（ステップＳ１３）
ステップＳ１３において、関係類別部１３は、ステップＳ１１にて生成された関係ベクトルＶ（ｅ１，ｅ２）、及びステップＳ１２にて生成された特徴ベクトルＶ（ｅ１）、Ｖ（ｅ２）を用いて、注目エンティティｅ１、ｅ２間の関係を類別する。例えば、関係類別部１３は、関係ベクトルＶ（ｅ１，ｅ２）、特徴ベクトルＶ（ｅ１）、及び特徴ベクトルＶ（ｅ２）に基づいて１つのベクトルを生成し、生成したベクトルの類似性に基づいて、注目エンティティｅ１、ｅ２の関係を類別する。例えば、関係類別部１３は、生成したベクトルをクラスタリングすることにより、当該関係を類別してもよい。当該１つのベクトルを生成する手法としては、例えば、関係ベクトルＶ（ｅ１，ｅ２）、特徴ベクトルＶ（ｅ１）、及び特徴ベクトルＶ（ｅ２）を結合する手法が挙げられるが、これに限られない。一例として、関係ベクトルＶ（ｅ１，ｅ２）、特徴ベクトルＶ（ｅ１）、及び特徴ベクトルＶ（ｅ２）を結合したベクトルと、関係ベクトルＶ（ｅ３，ｅ４）、特徴ベクトルＶ（ｅ３）、及び特徴ベクトルＶ（ｅ４）を結合したベクトルとが互いに類似するとする。この場合、関係類別部１３は、「注目エンティティｅ１，ｅ２」と「注目エンティティｅ３，ｅ４」とは、同一の関係を有するものと類別する。なお、関係類別部１３は、これらのベクトル同士が互いに類似するかどうかを、例えば、ベクトル同士の内積、又はコサイン類似度が閾値を超えるかどうかに基づいて判断してもよい。

＜本例示的実施形態の効果＞
以上のように、本例示的実施形態は、複数の注目エンティティが出現する関係ベクトル生成用文から生成した関係ベクトルと、各注目エンティティが出現する特徴ベクトル生成用文から生成した特徴ベクトルとを用いて、複数の注目エンティティ間の関係を類別する。その結果、複数の注目エンティティ間の関係に加えて、各注目エンティティの特徴を考慮するので、複数の注目エンティティ間の関係をより精度よく類別することができる。

〔例示的実施形態２〕
本発明の第２の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態１にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付し、その説明を適宜省略する。

本例示的実施形態に係る情報処理装置１Ａは、例示的実施形態１に係る情報処理方法Ｓ１に含まれるステップＳ１１（関係ベクトル生成処理）を変形して実行する。換言すると、情報処理装置１Ａは、ステップＳ１１を変形して実行するのに適するよう、例示的実施形態１に係る情報処理装置１を変形した態様である。

＜情報処理装置の構成＞
情報処理装置１Ａの構成について、図３を参照して説明する。図３は、情報処理装置１Ａの構成を示すブロック図である。図３に示すように、情報処理装置１Ａは、関係ベクトル生成部１１に替えて関係ベクトル生成部１１Ａを含む点と、さらに関係ベクトル生成パラメータ更新部１４Ａを含む点とが、例示的実施形態１に係る情報処理装置１に対して異なる。その他の構成については、情報処理装置１と同様であるため、詳細な説明を繰り返さない。

（関係ベクトル生成部）
関係ベクトル生成部１１Ａは、複数のパラメータを含むアルゴリズムを用いて、少なくとも１つの関係ベクトル生成用文から関係ベクトルを生成する。関係ベクトル生成部１１Ａは、請求の範囲に記載した「関係ベクトル生成手段」を実現する構成の一例である。

（アルゴリズムの具体例）
複数のパラメータを含むアルゴリズムの具体例として、リカレントニューラルネットワークが挙げられる。リカレントニューラルネットワークは、単語ベクトル列を入力とし、その単語ベクトル列を構成する各単語ベクトルに対応するベクトルを出力とするニューラルネットワークである。関係ベクトル生成部１１Ａが用いるリカレントニューラルネットワークを、以降、第１ＲＮＮとも記載する。第１ＲＮＮに含まれる複数のパラメータは、関係ベクトル生成パラメータ更新部１４Ａによって更新される。

（関係ベクトル生成パラメータ更新部）
関係ベクトル生成パラメータ更新部１４Ａは、複数の関係ベクトルの類似度が高くなるように、上述した複数のパラメータを更新する。当該複数の関係ベクトルは、関係ベクトル生成部１１Ａによって複数の注目エンティティが共通して出現する複数の文から生成されたものである。複数のパラメータを更新する更新処理の詳細及び具体例については後述する。関係ベクトル生成パラメータ更新部１４Ａは、請求の範囲に記載した「関係ベクトル生成パラメータ更新手段」を実現する構成の一例である。

＜情報処理方法の流れ＞
情報処理装置１Ａが実行する情報処理方法の流れについて、図４を参照して説明する。情報処理装置１Ａは、図２を参照して説明した情報処理方法Ｓ１のステップＳ１１を変形して実行する。図４は、ステップＳ１１の変形例である関係ベクトル生成処理Ｓ１１Ａの詳細な流れを示すフロー図である。

（関係ベクトル生成処理の流れ）
図４に示すように、関係ベクトル生成処理Ｓ１１Ａは、ステップＳ１１１～Ｓ１１４を含む。関係ベクトル生成部１１Ａは、ステップＳ１１１～Ｓ１１３を、ｎ個の関係ベクトル生成用文Ｓ（ｅ１，ｅ２）ｉの各々について実行する。

（ステップＳ１１１）
ステップＳ１１１において、関係ベクトル生成部１１Ａは、当該関係ベクトル生成用文Ｓ（ｅ１，ｅ２）ｉについて、単語ベクトル列を生成する。詳細には、関係ベクトル生成部１１Ａは、注目エンティティｅ１、ｅ２の各々を表す単語を予め定められた単語ベクトルに置き換える。また、関係ベクトル生成部１１Ａは、複数の注目エンティティｅ１、ｅ２以外を表す単語を、その単語を表す単語ベクトルに置き換える。これにより、関係ベクトル生成部１１Ａは、関係ベクトル生成用文Ｓ（ｅ１，ｅ２）ｉに対応する単語ベクトル列を生成する。本ステップの処理は、請求の範囲に記載した「第１単語ベクトル列生成処理」の一例である。

（ステップＳ１１１の具体例）
例えば、関係ベクトル生成用文Ｓ（ｅ１，ｅ２）ｉが「I saw Star Wars by George Lucas at theater.」であり、注目エンティティｅ１を表す単語が「Star Wars」であり、注目エンティティｅ２を表す単語が「George Lucas」である具体例について説明する。関係ベクトル生成部１１Ａは、単語ベクトル列（VI,Vsaw,V*,Vby,V**,Vat,Vtheater）を生成する。ここで、「VI」は、単語「I」を表す単語ベクトルである。「Vsaw」は、単語「saw」を表す単語ベクトルである。「Vby」は、単語「by」を表す単語ベクトルである。「Vat」は、単語「at」を表す単語ベクトルである。「Vtheater」は、単語「theater」を表す単語ベクトルである。「V*」、「V**」は、それぞれ、予め定められた単語ベクトルである。

（ステップＳ１１２）
ステップＳ１１２において、関係ベクトル生成部１１Ａは、第１ＲＮＮに、ステップＳ１１１にて生成された単語ベクトル列を入力することによって、関係ベクトル生成用文Ｓ（ｅ１，ｅ２）ｉに対応するＲＮＮ出力ベクトル列を生成する。第１ＲＮＮについては、上述した通りである。第１ＲＮＮに含まれる複数のパラメータは、関係ベクトル生成パラメータ更新部１４Ａによって更新済みである。本ステップの処理は、請求の範囲に記載した「第１ＲＮＮ出力ベクトル列生成処理」の一例である。

（ステップＳ１１２の具体例）
ステップＳ１１１の具体例に対応して実行されるステップＳ１１２の具体例について説明する。関係ベクトル生成部１１Ａは、第１ＲＮＮに、単語ベクトル列（VI,Vsaw,V*,Vby,V**,Vat,Vtheater）を入力することにより、ＲＮＮ出力ベクトル列（WI,Wsaw,W*,Wby,W**,Wat,Wtheater）を生成する。ここで、「WI」は、単語ベクトル「VI」の入力に対応して出力されるベクトルである。「Wsaw」は、単語ベクトル「Vsaw」の入力に対応して出力されるベクトルである。「Wby」は、単語ベクトル「Vby」の入力に対応して出力されるベクトルである。「Wat」は、単語ベクトル「Vat」の入力に対応して出力されるベクトルである。「Wtheater」は、単語ベクトル「Vtheater」の入力に対応して出力されるベクトルである。「W*」は、単語ベクトル「V*」の入力に対応して出力されるベクトルである。「W**」は、単語ベクトル「V**」の入力に対応して出力されるベクトルである。

（ステップＳ１１３）
ステップＳ１１３において、関係ベクトル生成部１１Ａは、ステップＳ１１２にて生成されたＲＮＮ出力ベクトル列を構成するベクトルを要素毎に平均することによって、当該関係ベクトル生成用文に対応する文関係ベクトルＶｉを算出する。本ステップの処理は、請求の範囲に記載した「文関係ベクトル算出処理」の一例である。

なお、本例示的実施形態では、１つの文関係ベクトルＶｉが、１つの関係ベクトル生成用文Ｓ（ｅ１，ｅ２）ｉから生成される例について説明している。ただし、１つの文関係ベクトルＶｉは、複数の関係ベクトル生成用文Ｓ（ｅ１，ｅ２）ｉ１、Ｓ（ｅ１，ｅ２）ｉ２、…から生成されてもよい。

（ステップＳ１１３の具体例）
ステップＳ１１１～Ｓ１１２の具体例に対応して実行されるステップＳ１１３の具体例について説明する。関係ベクトル生成部１１Ａは、ＲＮＮ出力ベクトル列を構成する７つのベクトルWI、Wsaw、W*、Wby、W**、Wat、及びWtheaterの和を、ベクトルの個数の７で除することにより、文関係ベクトルＶｉを算出する。

ステップＳ１１１～Ｓ１１３の処理が、ｎ個の関係ベクトル生成用文Ｓ（ｅ１，ｅ２）ｉの各々について完了すると、関係ベクトル生成部１１Ａは、次のステップＳ１１４の処理を実行する。

（ステップＳ１１４）
ステップＳ１１４において、関係ベクトル生成部１１Ａは、ステップＳ１１３にて算出された、ｎ個の関係ベクトル生成用文Ｓ（ｅ１，ｅ２）ｉにそれぞれ対応する文関係ベクトルＶｉを要素毎に平均することによって、関係ベクトルＶ（ｅ１，ｅ２）を算出する。換言すると、関係ベクトルＶ（ｅ１，ｅ２）は、ｎ個の文関係ベクトルＶｉの和をｎで除することにより算出される。本ステップの処理は、請求の範囲に記載した「関係ベクトル算出処理」の一例である。

（パラメータ更新処理の具体例）
ステップＳ１１２において用いられる、第１ＲＮＮに含まれる複数のパラメータを、関係ベクトル生成パラメータ更新部１４Ａが更新する更新処理の具体例について説明する。なお、当該更新処理は、情報処理方法Ｓ１の実行前に事前に行われる。ただし、当該更新処理は、追加の文集合を用いて定期的に実行されてもよい。以下では、説明を簡単にするため、関係ベクトル生成パラメータ更新部１４Ａが更新処理において用いる文集合は、情報処理方法Ｓ１が対象とする文集合と同じであるものとする。ただし、更新処理において用いる文集合は、情報処理方法Ｓ１が対象とする文集合に対して一部または全部が異なっていてもよい。

まず、関係ベクトル生成パラメータ更新部１４Ａは、注目エンティティｅ１、ｅ２が共通して出現するｎ個の関係ベクトル生成用文Ｓ（ｅ１，ｅ２）ｉに対してそれぞれステップＳ１１１～Ｓ１１３と同様の処理を施すことにより、ｎ個の文関係ベクトルＶｉを算出する。なお、当該パラメータ更新処理の具体例では、ｎは２以上の整数である。また、関係ベクトル生成パラメータ更新部１４Ａは、ｎ個の文関係ベクトルＶｉのうちｎ１個を用いて、関係ベクトルＶ（ｅ１，ｅ２）１を算出する。また、関係ベクトル生成パラメータ更新部１４Ａは、ｎ個の文関係ベクトルＶｉのうち前述したｎ１個以外のｎ２個を用いて、関係ベクトルＶ（ｅ１，ｅ２）２を算出する。ここで、ｎ１は、１以上ｎ以下の整数である。また、ｎ２は、１以上（ｎ－ｎ１）以下の整数である。また、関係ベクトル生成パラメータ更新部１４Ａは、関係ベクトルＶ（ｅ１，ｅ２）１及びＶ（ｅ１，ｅ２）２が互いに類似するように、複数のパラメータを更新する。

具体的には、関係ベクトル生成パラメータ更新部１４Ａは、関係ベクトルＶ（ｅ１，ｅ２）１及びＶ（ｅ１，ｅ２）２の類似度を算出する。類似度としては、例えば、内積、又はベクトル間距離に負数をかけたもの等が挙げられるが、これらに限られない。また、関係ベクトル生成パラメータ更新部１４Ａは、当該類似度が大きくなるよう、勾配法によって第１ＲＮＮに含まれる複数のパラメータを更新する。

なお、関係ベクトル生成パラメータ更新部１４Ａは、１組の「注目エンティティｅ１、ｅ２」に限らず、複数組の「注目エンティティｅｐ、ｅｑ」の各組について上述した更新処理を行うことにより、複数のパラメータを更新してもよい。なお、ｐ、ｑは１以上ｎ以下の整数であり、ｐ≠ｑである。また、関係ベクトル生成パラメータ更新部１４Ａは、ｎ１個の文関係ベクトルＶｉの組み合わせ、及び、ｎ２個の文関係ベクトルＶｉの組み合わせの一方または両方を変化させながら上述した更新処理を繰り返すことにより、複数のパラメータを更新してもよい。

＜本例示的実施形態の効果＞
本例示的実施形態は、非特許文献１に記載された関連技術と比較して、複数の注目エンティティ間の関係をより適切に表す関係ベクトルを生成することができる。また、その結果、そのような関係ベクトルと、特徴ベクトルとを用いて、注目エンティティ間の関係をより精度よく類別することができる。以下、本例示的実施形態が生成する関係ベクトルが関係をより適切に表す理由について説明する。

ここで、非特許文献１に記載された関連技術は、注目するエンティティのペアが出現する文の構文的な構造を示す情報を、複数のパラメータを含むアルゴリズムに入力することにより、関係ベクトルを生成する。また、この関連技術は、当該ペアが出現する複数の文から生成した複数の関係ベクトルから、当該ペアが出現する他の文の構文的な構造を予測できるように、複数のパラメータを更新する。このように、この関連技術は、関係ベクトルの生成処理及びパラメータの更新処理において、文の構文的な構造を考慮するが、各エンティティの特徴を考慮していない。

これに対して、本例示的実施形態は、複数の注目エンティティが共通して出現する複数の関係ベクトル生成用文のそれぞれから単語ベクトル列を生成する。この単語ベクトル列は、単語の並びによって文の構文的な構造に関する情報を含むだけでなく、各単語ベクトルが対応するエンティティの特徴を表している。ここで、単語ベクトル列が表す、各エンティティの特徴の一例としては、文における当該エンティティの出現位置が挙げられる。また、単語ベクトル列が表す、各エンティティの特徴の他の一例としては、出現位置の前後の単語列から推察される当該エンティティの種類が挙げられる。また、本例示的実施形態は、生成した単語ベクトル列を、複数のパラメータを含むアルゴリズムに入力することにより、複数の関係ベクトルを生成する。なお、この複数のパラメータは、注目エンティティのある組み合わせに対応する複数の関係ベクトルが類似するように事前に更新済みである。したがって、このような関係ベクトルは、文の構文的な構造に基づく関係を表すだけでなく、各注目エンティティの特徴に基づく関係を表している。ここで、関係ベクトルが表す、各注目エンティティの特徴に基づく関係の一例としては、文における当該注目エンティティの出現位置に基づく関係が挙げられる。また、関係ベクトルが表す、各注目エンティティの特徴に基づく関係の他の一例としては、出現位置の前後の単語列から推察される当該注目エンティティの種類に基づく関係が挙げられる。このように、本例示的実施形態が生成する関係ベクトルは、各注目エンティティの特徴を考慮して生成されているため、文の構文的な構造のみに基づいて生成される関連技術の関係ベクトルと比較して、複数の注目エンティティ間の関係をより適切に表している。

〔例示的実施形態３〕
本発明の第３の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態１にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。

本例示的実施形態に係る情報処理装置１Ｂは、例示的実施形態１に係る情報処理方法Ｓ１に含まれるステップＳ１２（特徴ベクトル生成処理）を変形して実行する。換言すると、情報処理装置１Ｂは、ステップＳ１２を変形して実行するのに適するよう、例示的実施形態１に係る情報処理装置１を変形した態様である。

＜情報処理装置の構成＞
情報処理装置１Ｂの構成について、図５を参照して説明する。図５は、情報処理装置１Ｂの構成を示すブロック図である。図５に示すように、情報処理装置１Ｂは、特徴ベクトル生成部１２に替えて特徴ベクトル生成部１２Ｂを含む点と、さらに特徴ベクトル生成パラメータ更新部１５Ｂを含む点とが、例示的実施形態１に係る情報処理装置１に対して異なる。その他の構成については、情報処理装置１と同様であるため、詳細な説明を繰り返さない。

（特徴ベクトル生成部）
特徴ベクトル生成部１２Ｂは、複数の注目エンティティの各々に対し、複数のパラメータを含むアルゴリズムを用いて、少なくとも１つの特徴ベクトル生成用文から特徴ベクトルを生成する。特徴ベクトル生成部１２Ｂは、請求の範囲に記載した「特徴ベクトル生成手段」を実現する構成の一例である。

（アルゴリズムの具体例）
複数のパラメータを含むアルゴリズムの具体例として、リカレントニューラルネットワークが挙げられる。リカレントニューラルネットワークは、単語ベクトル列を入力とし、その単語ベクトル列を構成する各単語ベクトルに対応するベクトルを出力とするニューラルネットワークである。特徴ベクトル生成部１２Ｂが用いるリカレントニューラルネットワークを、以降、第２ＲＮＮとも記載する。第２ＲＮＮに含まれる複数のパラメータは、特徴ベクトル生成パラメータ更新部１５Ｂによって更新される。

（特徴ベクトル生成パラメータ更新部）
特徴ベクトル生成パラメータ更新部１５Ｂは、特徴ベクトルと当該注目エンティティを表す単語ベクトルとの類似度が高くなるように、上述した複数のパラメータを更新する。当該特徴ベクトルは、特徴ベクトル生成部１２Ｂによって注目エンティティが出現する文から生成されたものである。詳細には、特徴ベクトル生成パラメータ更新部１５Ｂは、後述する文特徴ベクトルと、当該注目エンティティを表す単語ベクトルとの類似度が高くなるように、上述した複数のパラメータを更新する。複数のパラメータを更新する更新処理の詳細及び具体例については後述する。特徴ベクトル生成パラメータ更新部１５Ｂは、請求の範囲に記載した「特徴ベクトル生成パラメータ更新手段」を実現する構成の一例である。

＜情報処理方法の流れ＞
情報処理装置１Ｂが実行する情報処理方法の流れについて、図６を参照して説明する。情報処理装置１Ｂは、図２を参照して説明した情報処理方法Ｓ１のステップＳ１２を変形して実行する。図６は、ステップＳ１２の変形例である特徴ベクトル生成処理Ｓ１２Ｂの詳細な流れを示すフロー図である。なお、特徴ベクトル生成処理Ｓ１２Ｂは、注目エンティティｅｋ（ｋ＝１、２）のそれぞれについて実行される。

（特徴ベクトル生成処理の流れ）
図６に示すように、特徴ベクトル生成処理Ｓ１２Ｂは、ステップＳ１２１～Ｓ１２４を含む。特徴ベクトル生成部１２Ｂは、ステップＳ１２１～Ｓ１２３を、ｍｋ個の特徴ベクトル生成用文Ｓ（ｅｋ）ｊの各々について実行する。

（ステップＳ１２１）
ステップＳ１２１において、特徴ベクトル生成部１２Ｂは、特徴ベクトル生成用文Ｓ（ｅｋ）ｊについて、単語ベクトル列を生成する。詳細には、特徴ベクトル生成部１２Ｂは、注目エンティティｅｋを表す単語を予め定められた単語ベクトルに置き換える。また、特徴ベクトル生成部１２Ｂは、注目エンティティｅｋ以外を表す単語を、その単語を表す単語ベクトルに置き換える。これにより、特徴ベクトル生成部１２Ｂは、特徴ベクトル生成用文Ｓ（ｅｋ）ｊに対応する単語ベクトル列を生成する。本ステップの処理は、請求の範囲に記載した「第２単語ベクトル列生成処理」の一例である。

（ステップＳ１２１の具体例）
例えば、特徴ベクトル生成用文Ｓ（ｅ１）ｊが「I saw Star Wars by George Lucas at theater.」であり、エンティティｅ１を表す単語が「Star Wars」である具体例について説明する。特徴ベクトル生成部１２Ｂは、単語ベクトル列（VI,Vsaw,V*,Vby,VGeorge Lucas,Vat,Vtheater）を生成する。ここで、「VGeorge」は、単語「George」を表す単語ベクトルである。単語ベクトル列を構成するその他の単語ベクトルについては、ステップＳ１１１の具体例で説明した通りである。

（ステップＳ１２２）
ステップＳ１２２において、特徴ベクトル生成部１２Ｂは、第２ＲＮＮに、ステップＳ１２１にて生成された単語ベクトル列を入力することによって、特徴ベクトル生成用文Ｓ（ｅｋ）ｊに対応するＲＮＮ出力ベクトル列を生成する。第２ＲＮＮについては、上述した通りである。第２ＲＮＮに含まれる複数のパラメータは、特徴ベクトル生成パラメータ更新部１５Ｂによって更新済みである。本ステップの処理は、請求の範囲に記載した「第２ＲＮＮ出力ベクトル列生成処理」の一例である。

（ステップＳ１２２の具体例）
ステップＳ１２１の具体例に対応して実行されるステップＳ１２２の具体例について説明する。特徴ベクトル生成部１２Ｂは、第２ＲＮＮに、単語ベクトル列（VI,Vsaw,V*,Vby,VGeorge Lucas,Vat,Vtheater）を入力することにより、ＲＮＮ出力ベクトル列（WI,Wsaw,W*,Wby,Wgeorge Lucas,Wat,Wtheater）を生成する。ここで、「Wgeorge」は、単語ベクトル「Vgeorge」の入力に対応して出力されるベクトルである。ＲＮＮ出力ベクトル列を構成するその他のベクトルについては、ステップＳ１１２の具体例で説明した通りである。

（ステップＳ１２３）
ステップＳ１２３において、特徴ベクトル生成部１２Ｂは、ステップＳ１２２にて生成されたＲＮＮ出力ベクトル列を構成するベクトルのうち、注目エンティティｅｋに対応するベクトルを、特徴ベクトル生成用文Ｓ（ｅｋ）ｊに対応する文特徴ベクトルＶｊとする。

（ステップＳ１２３の具体例）
ステップＳ１２１～Ｓ１２２の具体例に対応して実行されるステップＳ１２３の具体例について説明する。特徴ベクトル生成部１２Ｂは、ＲＮＮ出力ベクトル列を構成するベクトルのうち、注目エンティティｅ１に対応するベクトル「W*」を、文特徴ベクトルＶｊとする。本ステップの処理は、請求の範囲に記載した「文特徴ベクトル設定処理」の一例である。

ステップＳ１２１～Ｓ１２３の処理が、ｍｋ個の関係ベクトル生成用文Ｓ（ｅｋ）ｊの各々について完了すると、特徴ベクトル生成部１２Ｂは、次のステップＳ１２４の処理を実行する。

（ステップＳ１２４）
ステップＳ１２４において、特徴ベクトル生成部１２Ｂは、ステップＳ１２３にて設定された、各特徴ベクトル生成用文Ｓ（ｅｋ）ｊに対応する文特徴ベクトルＶｊを要素毎に平均することによって、特徴ベクトルＶ（ｅｋ）を算出する。本ステップの処理は、請求の範囲に記載した「特徴ベクトル算出処理」の一例である。

特徴ベクトル生成部１２Ｂは、上述したステップＳ１２１～Ｓ１２４を、ｋ＝１として注目エンティティｅ１について実行することにより、注目エンティティｅ１に対応する特徴ベクトルＶ（ｅ１）を算出する。また、特徴ベクトル生成部１２Ｂは、上述したステップＳ１２１～Ｓ１２４を、ｋ＝２として注目エンティティｅ２について実行することにより、注目エンティティｅ２に対応する特徴ベクトルＶ（ｅ２）を算出する。

（パラメータ更新処理の具体例）
ステップＳ１２２において用いられる、第２ＲＮＮに含まれる複数のパラメータを、特徴ベクトル生成パラメータ更新部１５Ｂが更新する更新処理の具体例について説明する。なお、当該更新処理は、情報処理方法Ｓ１の実行前に事前に行われる。ただし、当該更新処理は、追加の文集合を用いて定期的に実行されてもよい。以下では、説明を簡単にするため、特徴ベクトル生成パラメータ更新部１５Ｂが更新処理において用いる文集合は、情報処理方法Ｓ１が対象とする文集合と同じであるものとする。ただし、更新処理において用いる文集合は、情報処理方法Ｓ１が対象とする文集合に対して一部または全部が異なっていてもよい。

まず、特徴ベクトル生成パラメータ更新部１５Ｂは、注目エンティティｅ１が出現するｍ１個の特徴ベクトル生成用文Ｓ（ｅ１）ｊに対してそれぞれステップＳ１２１～Ｓ１２３と同様の処理を施すことにより、ｍ１個の文特徴ベクトルＶｊを算出する。なお、当該パラメータ更新処理の具体例では、ｍ１は２以上の整数である。また、特徴ベクトル生成パラメータ更新部１５Ｂは、ｍ１個の特徴ベクトル生成用文Ｓ（ｅ１）ｊのそれぞれについて、注目エンティティｅ１を表す単語の単語ベクトルと、文特徴ベクトルＶｊとの類似度が高くなるように、複数のパラメータを更新する。また、特徴ベクトル生成パラメータ更新部１５Ｂは、注目エンティティｅ２についても同様にして、ｍ２個の文特徴ベクトルＶｊを算出する。また、特徴ベクトル生成パラメータ更新部１５Ｂは、ｍ２個の特徴ベクトル生成用文Ｓ（ｅ２）ｊのそれぞれについて、注目エンティティｅ２を表す単語の単語ベクトルと、文特徴ベクトルＶｊとの類似度が高くなるように、複数のパラメータを更新する。

具体的には、特徴ベクトル生成パラメータ更新部１５Ｂは、文特徴ベクトルＶｊ及び当該単語ベクトルの類似度として、例えば、内積、又はベクトル間距離に負数をかけたものを算出する。ただし、類似度は、これらに限られない。また、特徴ベクトル生成パラメータ更新部１５Ｂは、当該類似度が大きくなるよう、勾配法によって第２ＲＮＮに含まれる複数のパラメータを更新する。

＜本例示的実施形態の効果＞
本例示的実施形態は、非特許文献１に記載された関連技術と比較して、注目エンティティの特徴をより適切に表した特徴ベクトルを生成することができる。その理由について説明する。

例えば、文集合が、特徴パラメータ生成用文Ｓ（ｅ１）ｊ１「“I found movies by John Doe at a theater.」を、特徴パラメータ生成用文Ｓ（ｅ１）ｊ２「“I found books by John Doe at a book store.」よりも多く含むとする。ここで、「movies」及び「books」は、注目エンティティｅ１を表す単語である。この場合、特徴ベクトル生成パラメータ更新部１５Ｂは、特徴パラメータ生成用文Ｓ（ｅ１）ｊ１における単語「movies」を単語ベクトル「V*」に置き換えた単語ベクトル列を第２ＲＮＮに入力して文特徴ベクトルＶｊ１を得る。そして、特徴ベクトル生成パラメータ更新部１５Ｂは、文特徴ベクトルＶｊ１が元の単語ベクトル「Vmovies」に類似するように第２ＲＮＮのパラメータを更新する。また、特徴ベクトル生成パラメータ更新部１５Ｂは、特徴パラメータ生成用文Ｓ（ｅ１）ｊ２における単語「books」を単語ベクトル「V*」に置き換えた単語ベクトル列を第２ＲＮＮに入力して文特徴ベクトルＶｊ２を得る。そして、特徴ベクトル生成パラメータ更新部１５Ｂは、文特徴ベクトルＶｊ２が元の単語ベクトル「Vbooks」に類似するように第２ＲＮＮのパラメータを更新する。ここで、特徴パラメータ生成用文Ｓ（ｅ１）ｊ１の数がＳ（ｅ１）ｊ２の数よりも多いため、複数のパラメータは、「注目エンティティｅ１は、book storeよりもtheaterで発見されやすい」という特徴を表す特徴ベクトルＶ（ｅ１）を出力するように更新される。換言すると、更新された複数のパラメータを含む第２ＲＮＮから出力される特徴ベクトルＶ（ｅ１）は、「注目エンティティｅ１がbookというよりはmovieである確度が大きい」という情報を埋め込んだものである。さらに換言すると、特徴ベクトルＶ（ｅ１）は、文集合におけるＳ（ｅ１）ｊ１の個数とＳ（ｅ１）ｊ２の個数との相対的な大小から推測される注目エンティティｅ１の特徴と整合する情報を埋め込んだものである。したがって、本例示的実施形態が生成する特徴ベクトルは、より適切に注目エンティティの特徴を表す。

また、上述した本例示的実施形態が生成する特徴ベクトルを用いることにより、本例示的実施形態は、非特許文献１に記載された関連技術と比較して、複数の注目エンティティ間の関係をより精度よく類別することができる。その理由について説明する。

ここで、非特許文献１に記載された関連技術は、２つの注目エンティティに対応する単語間の構文的な構造に基づいてエンティティ間の関係を類別する。したがって、この関連技術は、次の文１及び文２における２つの注目エンティティ（「some story」及び「John Doe」）間の関係とは直接対応していない修飾語（「at a theater」及び「at a book store」）の違いを区別できない。このため、この関連技術は、これらの２文におけるこれらの２つの注目エンティティ間の関係を区別することができない。
文１：“I found Some Story by John Doe at a theater.”
文２：“I found Some Story by John Doe at a book store.”
これに対して、本例示的実施形態は、単語「some story」に対応する注目エンティティｅ１の特徴ベクトルＶ（ｅ１）を、上述の第２ＲＮＮを用いて生成する。ここで、文１を多く含む文集合が参照される場合、当該特徴ベクトルＶ（ｅ１）は、「注目エンティティｅ１は、book storeよりもtheaterで発見されやすい」という特徴を表す。一方、文２を多く含む文集合が参照される場合、当該特徴ベクトルＶ（ｅ１）は、「注目エンティティｅ１は、theaterよりもbook storeで発見されやすい」という特徴を表す。したがって、本例示的実施形態は、文１を多く含む文集合では、「some story」と「Jone Doe」との関係は、「映画監督が制作した作品」であると類別することができる。また、本例示的実施形態は、文２を多く含む文集合では、「some story」と「Jone Doe」との関係は、「作家が執筆した本」であると類別することができる。このように、本例示的実施形態は、注目エンティティの文集合における特徴を反映した特徴ベクトルを用いて関係を類別するため、非特許文献に記載された関連技術と比較して精度よく関係を類別することができる。

〔例示的実施形態４〕
本発明の第４の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態１にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。

本例示的実施形態に係る情報処理装置１Ｃは、例示的実施形態１に係る情報処理方法Ｓ１に含まれるステップＳ１３（関係類別処理）を変形して実行する。換言すると、情報処理装置１Ｃは、ステップＳ１３を変形して実行するのに適するよう、例示的実施形態１に係る情報処理装置１を変形した態様である。

＜情報処理装置の構成＞
情報処理装置１Ｃの構成について、図７を参照して説明する。図７は、情報処理装置１Ｃの構成を示すブロック図である。図７に示すように、情報処理装置１Ｃは、関係類別部１３に代えて関係類別部１３Ｃを含む点と、さらに関係ベクトルクラスタリング部１６Ｃ及び特徴ベクトルクラスタリング部１７Ｃを含む点とが、例示的実施形態１に係る情報処理装置１に対して異なる。その他の構成については、情報処理装置１と同様であるため、詳細な説明を繰り返さない。

（関係ベクトルクラスタリング部）
関係ベクトルクラスタリング部１６Ｃは、関係ベクトルをクラスタリングする。関係ベクトルをクラスタリングする処理には、K-Means法等の公知の技術を適用可能であるが、これに限られない。関係ベクトルクラスタリング部１６Ｃは、複数の関係ベクトルを分類して複数のクラスタを生成する。関係ベクトルクラスタリング部１６Ｃは、請求の範囲に記載した「関係ベクトルクラスタリング手段」を実現する構成の一例である。

（特徴ベクトルクラスタリング部）
特徴ベクトルクラスタリング部１７Ｃは、特徴ベクトルをクラスタリングする。特徴ベクトルをクラスタリングする処理には、K-Means法等の公知の技術を適用可能であるが、これに限られない。特徴ベクトルクラスタリング部１７Ｃは、複数の特徴ベクトルを分類して複数のクラスタを生成する。特徴ベクトルクラスタリング部１７Ｃは、請求の範囲に記載した「特徴ベクトルクラスタリング手段」を実現する構成の一例である。

（関係類別部）
関係類別部１３Ｃは、関係ベクトル類別処理と、特徴ベクトル類別処理と、類別結果合成処理とを実行する。関係ベクトル類別処理は、関係ベクトル生成部１１にて生成された関係ベクトルを類別する処理である。特徴ベクトル類別処理は、特徴ベクトル生成部１２にて生成された各特徴ベクトルを類別する処理である。類別結果合成処理は、関係ベクトル類別処理にて得られた類別結果と特徴ベクトル類別処理にて得られた類別結果とを合成することによって、複数の注目エンティティ間の関係を類別する処理である。関係類別部１３Ｃは、請求の範囲に記載した「関係類別手段」を実現する構成の一例である。

＜情報処理方法の流れ＞
情報処理装置１Ｃが実行する情報処理方法の流れについて、図８を参照して説明する。情報処理装置１Ｃは、図２を参照して説明した情報処理方法Ｓ１のステップＳ１３を変形して実行する。図８は、ステップＳ１３の変形例である関係類別処理Ｓ１３Ｃの詳細な流れを示すフロー図である。

（関係類別処理の流れ）
図８に示すように、関係類別処理Ｓ１３Ｃは、ステップＳ１３１～Ｓ１３３を含む。

（ステップＳ１３１）
ステップＳ１３１において、関係類別部１３Ｃは、関係ベクトル類別処理を実行する。詳細には、関係類別部１３Ｃは、関係ベクトル生成部１１にて生成された関係ベクトルＶ（ｅ１，ｅ２）が、関係ベクトルクラスタリング部１６Ｃにより生成されたクラスタの何れかに属するかを判定する。以降、判定されたクラスタを、関係クラスタＣ（ｅ１，ｅ２）と記載する。関係ベクトル類別処理において複数のクラスタの各々について重みが得られる場合、最も重みが大きいクラスタが関係クラスタＣ（ｅ１，ｅ２）となる。

（ステップＳ１３２）
ステップＳ１３２において、関係類別部１３Ｃは、特徴ベクトル類別処理を実行する。詳細には、関係類別部１３Ｃは、特徴ベクトル生成部１２にて生成された特徴ベクトルＶ（ｅｋ）の各々が、特徴ベクトルクラスタリング部１７Ｃにより生成されたクラスタの何れかに属するかを判定する。以降、判定されたクラスタを、特徴クラスタＣ（ｅｋ）と記載する。特徴ベクトル類別処理において複数のクラスタの各々について重みが得られる場合、最も重みが大きいクラスタが特徴クラスタＣ（ｅｋ）となる。

（ステップＳ１３３）
ステップＳ１３３において、関係類別部１３Ｃは、類別結果合成処理を実行する。詳細には、関係類別部１３Ｃは、ステップＳ１３１及びＳ１３２にて得られた各類別結果を合成することによって、複数の注目エンティティｅ１、ｅ２間の関係を類別する。例えば、関係類別部１３Ｃは、関係クラスタＣ（ｅ１，ｅ２）、特徴クラスタＣ（ｅ１）、及び特徴クラスタＣ（ｅ２）の直積を、複数の注目エンティティｅ１、ｅ２間の関係の類別結果としてもよい。

＜本例示的実施形態の効果＞
本例示的実施形態は、複数の注目エンティティに対応する関係ベクトルが属する関係クラスタと、各注目エンティティに対応する特徴ベクトルが属する特徴クラスタとを合成することにより、複数の注目エンティティ間の関係を類別する。このように、関係ベクトルの類別と特徴ベクトルの類別とを別々に行うことで、これらのベクトルをまとめて類別する場合と比べて考慮すべきベクトルの次元が小さくなる。その結果、関係の類別処理がより容易になり、精度が向上する。

また、本例示的実施形態は、類別結果合成処理を行うことで、最大で、関係クラスタの総数と特徴クラスタの総数との積だけの異なる種類に、複数の注目エンティティ間の関係を類別することが可能となる。したがって、関係ベクトル類別処理及び特徴ベクトル類別処理の各々において必要なクラスタの総数を削減しても、十分な種類の関係を類別できる能力が確保される。その結果、関係の類別処理がより容易になり、精度が向上する。

したがって、本例示的実施形態は、複数の注目エンティティ間の関係をより精度よく類別することができる。

〔実施例〕
本実施例では、上述した例示的実施形態２～４を組み合わせて実施し、複数の注目エンティティ間の関係を類別する検証を行った。すなわち、本実施例は、関係ベクトル生成処理Ｓ１１Ａ、特徴ベクトル生成処理Ｓ１２Ｂ、及び関係類別処理Ｓ１３Ｃを実行することにより、類別結果を求めた。当該類別結果を、実施例の類別結果と記載する。

（比較例）
比較例として、関連技術を用いて複数の注目エンティティ間の関係を類別し、類別結果を求めた。関連技術としては、ＯｐｅｎＩＥ５．１を用いた。ＯｐｅｎＩＥ５．１は、文の構文的な構造に基づいてエンティティ間の関係を類別する公知の技術である。

（対象とした文集合）
実施例及び比較例は、同一の文集合を対象として関係の類別を行った。対象とした文集合は、大規模コーパスＣｌｕｅＷｅｂ１２の一部である。大規模コーパスＣｌｕｅＷｅｂ１２は、ウェブからのクローリングにより得られた公開されたデータセットである。また、実施例及び比較例では、ＦＡＣＣ１データベースも利用した。ＦＡＣＣ１データベースには、ＣｌｕｅＷｅｂ１２に含まれる文中の各単語がオンラインデータベースＦｒｅｅｂａｓｅに登録されているどのエンティティに対応するか、もしくはどのエンティティにも対応しないか、についてのアノテーションデータが含まれる。

（正解データ）
実施例及び比較例の類別結果の精度を算出するために、次の正解データを用いた。すなわち、Ｆｒｅｅｂａｓｅにおいてあるエンティティのペアに対して成立している述語を、正しい関係の類別結果である正解データとして扱った。また、Ｆｒｅｅｂａｓｅに登録されている述語のうち、その述語が成立しているエンティティのペアがＣｌｕｅＷｅｂ１２において頻繁に出現しているような述語を１００種程度選択した。そして、Ｆｒｅｅｂａｓｅにおいてそれらの述語が成立していることが登録されているエンティティのペアのうち、対象とした文集合に出現したものを類別対象の注目エンティティのペアとした。なお、正解データは、類別結果の精度を算出するために用い、実施例及び比較例における更新処理及び類別処理では参照していない。

（類別結果の検証）
実施例および比較例について、図９を参照して説明する。図９は、実施例による類別結果と、比較例による類別結果とを比較するグラフである。図９において、横軸は、各述語により規定される関係を示す。縦軸は、当該関係を有する注目エンティティのペアについての類別結果の精度を示す。より具体的には、実施例および比較例によって注目エンティティのペアを類別して得られた関係と、横軸に示した各述語により規定される関係との一致度合いを、それぞれの関係に類別される注目エンティティのペアの重複度合いによって評価した。そして、当該一致度合いを、類別された注目エンティティのペアの個数に応じて重みづけ平均して得られた値を精度として扱った。図９に示すように、本実施例による類別結果は、比較例による類別結果の精度が相対的に高い関係について、比較例よりも精度が低いものの、類別を行うことができた。また、本実施例による類別結果は、比較例による類別結果の精度が低い関係については、比較例よりも高い精度で類別を行うことができた。

換言すると、本実施例は、比較例では関係の類別が難しい注目エンティティのペアについても、精度よく関係を類別することができる。また、本実施例は、比較例に比べて、より多くの関係を類別することができる。

〔例示的実施形態５〕
本発明の第５の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態５は、例示的実施形態２を変形した態様である。例示的実施形態２にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。

＜情報処理装置の構成＞
情報処理装置２の構成について、図１０を参照して説明する。図１０は、情報処理装置２の構成を示すブロック図である。図１０に示すように、情報処理装置２は、特徴ベクトル生成部１２を含まない点と、関係類別部１３に替えて関係類別部２３を含む点とが、例示的実施形態２に係る情報処理装置１Ａに対して異なる。その他の構成については、情報処理装置１Ａと同様であるため、詳細な説明を繰り返さない。

（関係類別部）
関係類別部２３は、関係ベクトル生成部１１Ａにて生成された関係ベクトルを用いて、複数の注目エンティティ間の関係を類別する。関係類別部２３は、請求の範囲に記載した「関係類別手段」を実現する構成の一例である。

＜情報処理方法の流れ＞
情報処理装置２が実行する情報処理方法Ｓ２の流れについて、図１１を参照して説明する。図１１は、情報処理方法Ｓ２の流れを示すフロー図である。図１１に示すように、情報処理方法Ｓ２は、ステップＳ２１～Ｓ２２を含む。

（ステップＳ２１）
ステップＳ２１の処理は、例示的実施形態２に係るステップＳ１１Ａの処理と同様である。これにより、関係ベクトル生成部１１Ａは、複数のパラメータを含むアルゴリズムを用いて、少なくとも１つの関係ベクトル生成用文Ｓ（ｅ１，ｅ２）から関係ベクトルＶ（ｅ１，ｅ２）を生成する。

（ステップＳ２２）
ステップＳ２２において、関係類別部２３は、関係ベクトル生成部１１Ａにて生成された関係ベクトルＶ（ｅ１，ｅ２）を用いて、複数の注目エンティティｅ１，ｅ２間の関係を類別する。例えば、関係類別部２３は、関係ベクトルＶ（ｅ１，ｅ２）をクラスタリングすることにより、当該関係を類別してもよい。

＜本例示的実施形態の効果＞
本例示的実施形態は、非特許文献１に記載された関連技術と比較して、複数の注目エンティティ間の関係をより適切に表す関係ベクトルを生成することができる。その理由については、例示的実施形態２の効果において説明した通りである。その結果、本例示的実施形態は、そのような関係ベクトルを用いているため、複数の注目エンティティ間の関係をより精度よく類別することができる。

〔ソフトウェアによる実現例〕
情報処理装置１、１Ａ、１Ｂ、１Ｃ、２の一部又は全部の機能は、集積回路（ＩＣチップ）等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。

後者の場合、情報処理装置１、１Ａ、１Ｂ、１Ｃ、２は、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例（以下、コンピュータＣと記載する）を図１２に示す。コンピュータＣは、少なくとも１つのプロセッサＣ１と、少なくとも１つのメモリＣ２と、を備えている。メモリＣ２には、コンピュータＣを情報処理装置１、１Ａ、１Ｂ、１Ｃ、２として動作させるためのプログラムＰが記録されている。コンピュータＣにおいて、プロセッサＣ１は、プログラムＰをメモリＣ２から読み取って実行することにより、情報処理装置１、１Ａ、１Ｂ、１Ｃ、２の各機能が実現される。

プロセッサＣ１としては、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＭＰＵ（Micro Processing Unit）、ＦＰＵ（Floating point number Processing Unit）、ＰＰＵ（Physics Processing Unit）、マイクロコントローラ、又は、これらの組み合わせなどを用いることができる。メモリＣ２としては、例えば、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、又は、これらの組み合わせなどを用いることができる。

なお、コンピュータＣは、プログラムＰを実行時に展開したり、各種データを一時的に記憶したりするためのＲＡＭ（Random Access Memory）を更に備えていてもよい。また、コンピュータＣは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータＣは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。

また、プログラムＰは、コンピュータＣが読み取り可能な、一時的でない有形の記録媒体Ｍに記録することができる。このような記録媒体Ｍとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータＣは、このような記録媒体Ｍを介してプログラムＰを取得することができる。また、プログラムＰは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータＣは、このような伝送媒体を介してプログラムＰを取得することもできる。

〔付記事項１〕
本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。

〔付記事項２〕
上述した実施形態の一部又は全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。

（付記１）
文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、
前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する特徴ベクトル生成手段と、
前記関係ベクトル生成手段にて生成された関係ベクトル及び前記特徴ベクトル生成手段にて生成された特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、を備えている、情報処理装置。

上記構成により、複数の注目エンティティが出現する関係ベクトル生成用文から生成した関係ベクトルと、各注目エンティティが出現する特徴ベクトル生成用文から生成した特徴ベクトルとを用いて、複数の注目エンティティ間の関係を類別する。その結果、複数の注目エンティティ間の関係に加えて、各注目エンティティの特徴を考慮するので、注目エンティティ間の関係をより精度よく類別することができる。

（付記２）
前記関係ベクトル生成手段は、複数のパラメータを含むアルゴリズムを用いて、前記少なくとも１つの関係ベクトル生成用文から前記関係ベクトルを生成し、
当該情報処理装置は、前記関係ベクトル生成手段によって複数の注目エンティティが共通して出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新する関係ベクトル生成パラメータ更新手段を更に備えている、付記１に記載の情報処理装置。

上記構成により、複数の注目エンティティ間の関係をより適切に表す関係ベクトルを生成することができる。

（付記３）
前記関係ベクトル生成手段は、
各関係ベクトル生成用文について、（１）前記複数の注目エンティティの各々を表す単語を予め定められた単語ベクトルに置き換えると共に、前記複数の注目エンティティ以外を表す単語をその単語を表す単語ベクトルに置き換えることによって、当該関係ベクトル生成用文に対応する単語ベクトル列を生成する第１単語ベクトル列生成処理と、（２）単語ベクトル列を入力とし、その単語ベクトル列を構成する各単語ベクトルに対応するベクトルを出力とするリカレントニューラルネットワークに、前記第１単語ベクトル列生成処理にて生成された単語ベクトル列を入力することによって、当該関係ベクトル生成用文に対応するＲＮＮ出力ベクトル列を生成する第１ＲＮＮ出力ベクトル列生成処理と、（３）前記第１ＲＮＮ出力ベクトル列生成処理にて生成されたＲＮＮ出力ベクトル列を構成するベクトルを要素毎に平均することによって、当該関係ベクトル生成用文に対応する文関係ベクトルを算出する文関係ベクトル算出処理と、を実行すると共に、
（４）前記文関係ベクトル算出処理にて算出された、各関係ベクトル生成用文に対応する文関係ベクトルを要素毎に平均することによって、前記関係ベクトルを算出する関係ベクトル算出処理を実行し、
前記関係ベクトル生成パラメータ更新手段は、前記関係ベクトル生成手段によって複数のエンティティが共通に出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記リカレントニューラルネットワークのパラメータを更新する、付記２に記載の情報処理装置。

上記構成により、複数の注目エンティティ間の関係をより適切に表す関係ベクトルを生成するよう、リカレントニューラルネットワークを学習させることができる。

（付記４）
前記特徴ベクトル生成手段は、前記複数の注目エンティティの各々に対し、複数のパラメータを含むアルゴリズムを用いて、前記少なくとも１つの特徴ベクトル生成用文から前記特徴ベクトルを生成し、
当該情報処理装置は、前記特徴ベクトル生成手段によって注目エンティティが出現する文から生成される特徴ベクトルと当該注目エンティティを表す単語ベクトルとの類似度が高くなるように、前記複数のパラメータを更新する特徴ベクトル生成パラメータ更新手段を更に備えている、付記１～３の何れか一つに記載の情報処理装置。

上記構成により、各注目エンティティの特徴をより適切に表す特徴ベクトルを生成することができる。

（付記５）
前記特徴ベクトル生成手段は、前記複数の注目エンティティの各々に対し、
各特徴ベクトル生成用文について、（１）当該注目エンティティを表す単語を予め定められた単語ベクトルに置き換えると共に、当該注目エンティティ以外を表す単語をその単語を表す単語ベクトルに置き換えることによって、当該特徴ベクトル生成用文に対応する単語ベクトル列を生成する第２単語ベクトル列生成処理と、（２）単語ベクトル列を入力とし、当該単語ベクトル列を構成する各単語ベクトルに対応するベクトルを出力とするリカレントニューラルネットワークに、前記第２単語ベクトル列生成処理にて生成された単語ベクトル列を入力することによって、当該特徴ベクトル生成用文に対応するＲＮＮ出力ベクトル列を生成する第２ＲＮＮ出力ベクトル列生成処理と、（３）前記第２ＲＮＮ出力ベクトル列生成処理にて生成されたＲＮＮ出力ベクトル列を構成するベクトルのうち、当該注目エンティティに対応するベクトルを、当該特徴ベクトル生成用文に対応する文特徴ベクトルとする文特徴ベクトル設定処理と、を実行すると共に、
（４）前記文特徴ベクトル設定処理にて設定された、各特徴ベクトル生成用文に対応する文特徴ベクトルを要素毎に平均することによって、前記特徴ベクトルを算出する特徴ベクトル算出処理を実行し、
前記特徴ベクトル生成パラメータ更新手段は、前記特徴ベクトル生成手段によって注目エンティティが出現する文から生成される文特徴ベクトルと当該注目エンティティを表す単語ベクトルとの類似度が高くなるように、前記リカレントニューラルネットワークのパラメータを更新する、付記４に記載の情報処理装置。

上記構成により、各注目エンティティの特徴をより適切に表す特徴ベクトルを生成するよう、リカレントニューラルネットワークを学習させることができる。

（付記６）
前記関係類別手段は、前記関係ベクトル生成手段にて生成された関係ベクトルを類別する関係ベクトル類別処理と、前記特徴ベクトル生成手段にて生成された各特徴ベクトルを類別する特徴ベクトル類別処理と、前記関係ベクトル類別処理にて得られた類別結果と前記特徴ベクトル類別処理にて得られた類別結果とを合成することによって、前記複数の注目エンティティ間の関係を類別する類別結果合成処理と、を実行する、付記１～５の何れか一つに記載の情報処理装置。

上記構成により、関係ベクトル及び各特徴ベクトルを別々に類別した結果を合成することで、複数の注目エンティティ間の関係をさらに精度よく類別することができる。

（付記７）
関係ベクトルをクラスタリングする関係ベクトルクラスタリング手段と、
特徴ベクトルをクラスタリングする特徴ベクトルクラスタリング手段と、を更に備え、
前記関係類別手段は、前記関係ベクトル生成手段にて生成された関係ベクトルが前記関係ベクトルクラスタリング手段により生成されたクラスタの何れかに属するかを判定することによって、前記関係ベクトル類別処理を実行すると共に、前記特徴ベクトル生成手段にて生成された各特徴ベクトルが前記特徴ベクトルクラスタリング手段により生成されたクラスタの何れかに属するかを判定することによって、前記特徴ベクトル類別処理を実行する、付記６に記載の情報処理装置。

上記構成により、最終的な類別結果を得るために用いる関係ベクトルの類別結果及び各特徴ベクトルの類別結果を得ることができる。

（付記８）
文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成すること、
前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成すること、及び
前記関係ベクトル及び前記複数の注目エンティティの各々に対し生成された前記特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別すること、を含む、情報処理方法。

上記構成により、付記１と同様の効果を奏する。

（付記９）
コンピュータを情報処理装置として機能させるためのプログラムであって、前記コンピュータを、
文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、
前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する特徴ベクトル生成手段と、
前記関係ベクトル生成手段にて生成された関係ベクトル及び前記特徴ベクトル生成手段にて生成された特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、として機能させるプログラム。

上記構成により、付記１と同様の効果を奏する。

（付記１０）
複数のパラメータを含むアルゴリズムを用いて、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、
前記関係ベクトル生成手段によって複数の注目エンティティが共通して出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新する関係ベクトル生成パラメータ更新手段と、
前記関係ベクトル生成手段にて生成された関係ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、を備えている、情報処理装置。

上記構成により、付記１と同様の効果を奏する。

（付記１１）
複数のパラメータを含むアルゴリズムを用いて、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成すること、
複数の注目エンティティが共通して出現する複数の文から生成される複数の前記関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新すること、及び
前記関係ベクトルを用いて、前記複数の注目エンティティ間の関係を類別すること、を含む、情報処理方法。

上記構成により、付記１と同様の効果を奏する。

（付記１２）
コンピュータを情報処理装置として機能させるためのプログラムであって、前記コンピュータを、
複数のパラメータを含むアルゴリズムを用いて、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、
前記関係ベクトル生成手段によって複数の注目エンティティが共通して出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新する関係ベクトル生成パラメータ更新手段と、
前記関係ベクトル生成手段にて生成された関係ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、として機能させるプログラム。

上記構成により、付記１と同様の効果を奏する。

（付記１３）
少なくとも１つのプロセッサを備え、前記プロセッサは、
文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成処理と、
前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する特徴ベクトル生成処理と、
前記関係ベクトル生成処理にて生成された関係ベクトル及び前記特徴ベクトル生成処理にて生成された特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別処理と、を実行する情報処理装置。

（付記１４）
上述した実施形態の一部又は全部は、更に、以下のように表現することもできる。

少なくとも１つのプロセッサを備え、前記プロセッサは、
複数のパラメータを含むアルゴリズムを用いて、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成処理と、
前記関係ベクトル生成処理によって複数の注目エンティティが共通して出現する複数の文の各々から生成される関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新する関係ベクトル生成パラメータ更新処理と、
前記関係ベクトル生成処理にて生成された関係ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別処理と、を実行する情報処理装置。

なお、付記１４に記載の情報処理装置は、更にメモリを備えていてもよく、このメモリには、前記関係ベクトル生成処理と、前記特徴ベクトル生成処理と、前記関係類別処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。

また、付記１５に記載の情報処理装置は、更にメモリを備えていてもよく、このメモリには、前記関係ベクトル生成処理と、前記関係ベクトル生成パラメータ更新処理と、前記関係類別処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。

１、１Ａ、１Ｂ、１Ｃ、２情報処理装置
１１、１１Ａ関係ベクトル生成部
１２、１２Ｂ特徴ベクトル生成部
１３、１３Ｃ、２３関係類別部
１４Ａ関係ベクトル生成パラメータ更新部
１５Ｂ、１５Ｂ、１５Ｂ特徴ベクトル生成パラメータ更新部
１６Ｃ関係ベクトルクラスタリング部
１７Ｃ特徴ベクトルクラスタリング部
Ｃ１プロセッサ
Ｃ２メモリ

Claims

文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、
前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する特徴ベクトル生成手段と、
前記関係ベクトル生成手段にて生成された関係ベクトル及び前記特徴ベクトル生成手段にて生成された特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、を備え、
前記関係類別手段は、前記関係ベクトル及び前記特徴ベクトルに基づいて１つのベクトルを生成し、生成したベクトルの類似性に基づいて、前記複数の注目エンティティ間の関係を類別する、
情報処理装置。
前記関係ベクトル生成手段は、複数のパラメータを含むアルゴリズムを用いて、前記少なくとも１つの関係ベクトル生成用文から前記関係ベクトルを生成し、
当該情報処理装置は、前記関係ベクトル生成手段によって複数の注目エンティティが共通して出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新する関係ベクトル生成パラメータ更新手段を更に備えている、請求項１に記載の情報処理装置。
前記関係ベクトル生成手段は、
各関係ベクトル生成用文について、（１）前記複数の注目エンティティの各々を表す単語を予め定められた単語ベクトルに置き換えると共に、前記複数の注目エンティティ以外を表す単語をその単語を表す単語ベクトルに置き換えることによって、当該関係ベクトル生成用文に対応する単語ベクトル列を生成する第１単語ベクトル列生成処理と、（２）単語ベクトル列を入力とし、その単語ベクトル列を構成する各単語ベクトルに対応するベクトルを出力とするリカレントニューラルネットワークに、前記第１単語ベクトル列生成処理にて生成された単語ベクトル列を入力することによって、当該関係ベクトル生成用文に対応するＲＮＮ出力ベクトル列を生成する第１ＲＮＮ出力ベクトル列生成処理と、（３）前記第１ＲＮＮ出力ベクトル列生成処理にて生成されたＲＮＮ出力ベクトル列を構成するベクトルを要素毎に平均することによって、当該関係ベクトル生成用文に対応する文関係ベクトルを算出する文関係ベクトル算出処理と、を実行すると共に、
（４）前記文関係ベクトル算出処理にて算出された、各関係ベクトル生成用文に対応する文関係ベクトルを要素毎に平均することによって、前記関係ベクトルを算出する関係ベクトル算出処理を実行し、
前記関係ベクトル生成パラメータ更新手段は、前記関係ベクトル生成手段によって複数のエンティティが共通に出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記リカレントニューラルネットワークのパラメータを更新する、請求項２に記載の情報処理装置。
前記特徴ベクトル生成手段は、前記複数の注目エンティティの各々に対し、複数のパラメータを含むアルゴリズムを用いて、前記少なくとも１つの特徴ベクトル生成用文から前記特徴ベクトルを生成し、
当該情報処理装置は、前記特徴ベクトル生成手段によって注目エンティティが出現する文から生成される特徴ベクトルと当該注目エンティティを表す単語ベクトルとの類似度が高くなるように、前記複数のパラメータを更新する特徴ベクトル生成パラメータ更新手段を更に備えている、請求項１～３の何れか一項に記載の情報処理装置。
前記特徴ベクトル生成手段は、前記複数の注目エンティティの各々に対し、
各特徴ベクトル生成用文について、（１）当該注目エンティティを表す単語を予め定められた単語ベクトルに置き換えると共に、当該注目エンティティ以外を表す単語をその単語を表す単語ベクトルに置き換えることによって、当該特徴ベクトル生成用文に対応する単語ベクトル列を生成する第２単語ベクトル列生成処理と、（２）単語ベクトル列を入力とし、当該単語ベクトル列を構成する各単語ベクトルに対応するベクトルを出力とするリカレントニューラルネットワークに、前記第２単語ベクトル列生成処理にて生成された単語ベクトル列を入力することによって、当該特徴ベクトル生成用文に対応するＲＮＮ出力ベクトル列を生成する第２ＲＮＮ出力ベクトル列生成処理と、（３）前記第２ＲＮＮ出力ベクトル列生成処理にて生成されたＲＮＮ出力ベクトル列を構成するベクトルのうち、当該注目エンティティに対応するベクトルを、当該特徴ベクトル生成用文に対応する文特徴ベクトルとする文特徴ベクトル設定処理と、を実行すると共に、
（４）前記文特徴ベクトル設定処理にて設定された、各特徴ベクトル生成用文に対応する文特徴ベクトルを要素毎に平均することによって、前記特徴ベクトルを算出する特徴ベクトル算出処理を実行し、
前記特徴ベクトル生成パラメータ更新手段は、前記特徴ベクトル生成手段によって注目エンティティが出現する文から生成される文特徴ベクトルと当該注目エンティティを表す単語ベクトルとの類似度が高くなるように、前記リカレントニューラルネットワークのパラメータを更新する、請求項４に記載の情報処理装置。
少なくとも１つのプロセッサが、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成処理、
前記少なくとも１つのプロセッサが、前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する特徴ベクトル生成処理、及び
前記少なくとも１つのプロセッサが、前記関係ベクトル及び前記複数の注目エンティティの各々に対し生成された前記特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別処理、を含み、
前記関係類別処理において、前記少なくとも１つのプロセッサは、前記関係ベクトル及び前記特徴ベクトルに基づいて１つのベクトルを生成し、生成したベクトルの類似性に基づいて、前記複数の注目エンティティ間の関係を類別する、
情報処理方法。
コンピュータを情報処理装置として機能させるためのプログラムであって、前記コンピュータを、
文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、
前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する特徴ベクトル生成手段と、
前記関係ベクトル生成手段にて生成された関係ベクトル及び前記特徴ベクトル生成手段にて生成された特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、として機能させ、
前記関係類別手段は、前記関係ベクトル及び前記特徴ベクトルに基づいて１つのベクトルを生成し、生成したベクトルの類似性に基づいて、前記複数の注目エンティティ間の関係を類別する、
プログラム。
複数のパラメータを含むアルゴリズムを用いて、文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、
前記関係ベクトル生成手段によって複数の注目エンティティが共通して出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新する関係ベクトル生成パラメータ更新手段と、
前記関係ベクトル生成手段にて生成された関係ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、を備え、
前記関係ベクトル生成手段は、複数のパラメータを含むアルゴリズムを用いて、前記少なくとも１つの関係ベクトル生成用文から前記関係ベクトルを生成し、
前記関係ベクトル生成手段によって複数の注目エンティティが共通して出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新する関係ベクトル生成パラメータ更新手段を更に備え、
前記関係ベクトル生成手段は、
各関係ベクトル生成用文について、（１）前記複数の注目エンティティの各々を表す単語を予め定められた単語ベクトルに置き換えると共に、前記複数の注目エンティティ以外を表す単語をその単語を表す単語ベクトルに置き換えることによって、当該関係ベクトル生成用文に対応する単語ベクトル列を生成する第１単語ベクトル列生成処理と、（２）単語ベクトル列を入力とし、その単語ベクトル列を構成する各単語ベクトルに対応するベクトルを出力とするリカレントニューラルネットワークに、前記第１単語ベクトル列生成処理にて生成された単語ベクトル列を入力することによって、当該関係ベクトル生成用文に対応するＲＮＮ出力ベクトル列を生成する第１ＲＮＮ出力ベクトル列生成処理と、（３）前記第１ＲＮＮ出力ベクトル列生成処理にて生成されたＲＮＮ出力ベクトル列を構成するベクトルを要素毎に平均することによって、当該関係ベクトル生成用文に対応する文関係ベクトルを算出する文関係ベクトル算出処理と、を実行すると共に、
（４）前記文関係ベクトル算出処理にて算出された、各関係ベクトル生成用文に対応する文関係ベクトルを要素毎に平均することによって、前記関係ベクトルを算出する関係ベクトル算出処理を実行し、
前記関係ベクトル生成パラメータ更新手段は、前記関係ベクトル生成手段によって複数のエンティティが共通に出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記リカレントニューラルネットワークのパラメータを更新する、
情報処理装置。
文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、
前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する特徴ベクトル生成手段と、
前記関係ベクトル生成手段にて生成された関係ベクトル及び前記特徴ベクトル生成手段にて生成された特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、を備え、
前記関係ベクトル生成手段は、複数のパラメータを含むアルゴリズムを用いて、前記少なくとも１つの関係ベクトル生成用文から前記関係ベクトルを生成し、
前記関係ベクトル生成手段によって複数の注目エンティティが共通して出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記複数のパラメータを更新する関係ベクトル生成パラメータ更新手段を更に備え、
前記関係ベクトル生成手段は、
各関係ベクトル生成用文について、（１）前記複数の注目エンティティの各々を表す単語を予め定められた単語ベクトルに置き換えると共に、前記複数の注目エンティティ以外を表す単語をその単語を表す単語ベクトルに置き換えることによって、当該関係ベクトル生成用文に対応する単語ベクトル列を生成する第１単語ベクトル列生成処理と、（２）単語ベクトル列を入力とし、その単語ベクトル列を構成する各単語ベクトルに対応するベクトルを出力とするリカレントニューラルネットワークに、前記第１単語ベクトル列生成処理にて生成された単語ベクトル列を入力することによって、当該関係ベクトル生成用文に対応するＲＮＮ出力ベクトル列を生成する第１ＲＮＮ出力ベクトル列生成処理と、（３）前記第１ＲＮＮ出力ベクトル列生成処理にて生成されたＲＮＮ出力ベクトル列を構成するベクトルを要素毎に平均することによって、当該関係ベクトル生成用文に対応する文関係ベクトルを算出する文関係ベクトル算出処理と、を実行すると共に、
（４）前記文関係ベクトル算出処理にて算出された、各関係ベクトル生成用文に対応する文関係ベクトルを要素毎に平均することによって、前記関係ベクトルを算出する関係ベクトル算出処理を実行し、
前記関係ベクトル生成パラメータ更新手段は、前記関係ベクトル生成手段によって複数のエンティティが共通に出現する複数の文から生成される複数の関係ベクトルの類似度が高くなるように、前記リカレントニューラルネットワークのパラメータを更新する、
情報処理装置。
文集合より選択された、複数の注目エンティティが出現する少なくとも１つの関係ベクトル生成用文から、前記複数の注目エンティティの関係を表す関係ベクトルを生成する関係ベクトル生成手段と、
前記複数の注目エンティティの各々に対し、前記文集合より選択された、当該注目エンティティが出現する少なくとも１つの特徴ベクトル生成用文から、当該注目エンティティの特徴を表す特徴ベクトルを生成する特徴ベクトル生成手段と、
前記関係ベクトル生成手段にて生成された関係ベクトル及び前記特徴ベクトル生成手段にて生成された特徴ベクトルを用いて、前記複数の注目エンティティ間の関係を類別する関係類別手段と、を備え、
前記特徴ベクトル生成手段は、前記複数の注目エンティティの各々に対し、複数のパラメータを含むアルゴリズムを用いて、前記少なくとも１つの特徴ベクトル生成用文から前記特徴ベクトルを生成し、
前記特徴ベクトル生成手段によって注目エンティティが出現する文から生成される特徴ベクトルと当該注目エンティティを表す単語ベクトルとの類似度が高くなるように、前記複数のパラメータを更新する特徴ベクトル生成パラメータ更新手段を更に備え、
前記特徴ベクトル生成手段は、前記複数の注目エンティティの各々に対し、
各特徴ベクトル生成用文について、（１）当該注目エンティティを表す単語を予め定められた単語ベクトルに置き換えると共に、当該注目エンティティ以外を表す単語をその単語を表す単語ベクトルに置き換えることによって、当該特徴ベクトル生成用文に対応する単語ベクトル列を生成する第２単語ベクトル列生成処理と、（２）単語ベクトル列を入力とし、当該単語ベクトル列を構成する各単語ベクトルに対応するベクトルを出力とするリカレントニューラルネットワークに、前記第２単語ベクトル列生成処理にて生成された単語ベクトル列を入力することによって、当該特徴ベクトル生成用文に対応するＲＮＮ出力ベクトル列を生成する第２ＲＮＮ出力ベクトル列生成処理と、（３）前記第２ＲＮＮ出力ベクトル列生成処理にて生成されたＲＮＮ出力ベクトル列を構成するベクトルのうち、当該注目エンティティに対応するベクトルを、当該特徴ベクトル生成用文に対応する文特徴ベクトルとする文特徴ベクトル設定処理と、を実行すると共に、
（４）前記文特徴ベクトル設定処理にて設定された、各特徴ベクトル生成用文に対応する文特徴ベクトルを要素毎に平均することによって、前記特徴ベクトルを算出する特徴ベクトル算出処理を実行し、
前記特徴ベクトル生成パラメータ更新手段は、前記特徴ベクトル生成手段によって注目エンティティが出現する文から生成される文特徴ベクトルと当該注目エンティティを表す単語ベクトルとの類似度が高くなるように、前記リカレントニューラルネットワークのパラメータを更新する、
情報処理装置。
前記関係類別手段は、前記関係ベクトル生成手段にて生成された関係ベクトルを類別する関係ベクトル類別処理と、前記特徴ベクトル生成手段にて生成された各特徴ベクトルを類別する特徴ベクトル類別処理と、前記関係ベクトル類別処理にて得られた類別結果と前記特徴ベクトル類別処理にて得られた類別結果とを合成することによって、前記複数の注目エンティティ間の関係を類別する類別結果合成処理と、を実行する、請求項９または１０に記載の情報処理装置。
関係ベクトルをクラスタリングする関係ベクトルクラスタリング手段と、
特徴ベクトルをクラスタリングする特徴ベクトルクラスタリング手段と、を更に備え、
前記関係類別手段は、前記関係ベクトル生成手段にて生成された関係ベクトルが前記関係ベクトルクラスタリング手段により生成されたクラスタの何れかに属するかを判定することによって、前記関係ベクトル類別処理を実行すると共に、前記特徴ベクトル生成手段にて生成された各特徴ベクトルが前記特徴ベクトルクラスタリング手段により生成されたクラスタの何れかに属するかを判定することによって、前記特徴ベクトル類別処理を実行する、請求項１１に記載の情報処理装置。