JP7472587B2

JP7472587B2 - エンコーディングプログラム、情報処理装置およびエンコーディング方法

Info

Publication number: JP7472587B2
Application number: JP2020056889A
Authority: JP
Inventors: 一森田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-03-26
Filing date: 2020-03-26
Publication date: 2024-04-23
Anticipated expiration: 2040-03-26
Also published as: US20210303802A1; JP2021157483A

Description

本発明は、エンコーディング技術に関する。

自然言語処理では、文や文の中の単語（文節）をベクトル化してから処理することが多い。文や単語の特徴がうまく含まれるベクトルを生成することが重要になる。

文や単語（文節）は、例えば、ＬＳＴＭ（Long Short-Term Memory）ネットワークによりベクトル化することが知られている。ＬＳＴＭネットワークは、経時的に単語の情報をベクトルとして保持し、保持した情報を用いて単語のベクトルを生成することができる再帰的ニューラルネットワークである。

また、文や単語は、例えば、木構造の（tree-structured）ＬＳＴＭネットワークによりベクトル化することが知られている（例えば、非特許文献１参照）。木構造のＬＳＴＭネットワークは、チェーン構造のＬＳＴＭネットワークを木構造のネットワークトポロジに汎化したものである。図１２は、ＬＳＴＭネットワークを示す参考図である。図１２上図には、チェーン構造のＬＳＴＭネットワークが表わされている。例えば、ｘ１という単語を入力したＬＳＴＭは、入力した単語ｘ１のベクトルｙ１を生成する。そして、ｘ２という単語を入力したＬＳＴＭは、以前の単語ｘ１のベクトルｙ１も用いて単語ｘ２のベクトルｙ２を生成する。図１２下図には、任意の分岐因子を含む木構造の（tree-structured）ＬＳＴＭネットワークが表わされている。

文の中の単語間の係り受けを木構造のＬＳＴＭネットワーク（以降、ＬＳＴＭネットワークを「ＬＳＴＭ」という）で表わした係り受け木を利用する技術が知られている。例えば、文に対する係り受け木の構造の全体の情報を利用して、文の中の単語間の関係を抽出する技術が知られている（例えば、非特許文献２参照）。例えば、「薬Ａを無作為に抽出した病気Ｂの患者に投与したところ、効果があった」という文に対して、「薬Ａ」と「病気Ｂ」との間の関係（「効果」）を抽出（判定）することができる。かかる技術では、文に対して、単語レベルの情報をＬＳＴＭでエンコードし、最短係り受け経路（Shortest Path：ＳＰ）のみの係り受け木レベルの情報を木構造のＬＳＴＭでエンコードし、関係を抽出する。ここでいうＳＰとは、関係を抽出したい単語と単語との間の係り受けの最短経路のことをいい、上記文では、「薬Ａ」と「病気Ｂ」との間の経路のことをいう。また、関係の抽出に注目した実験では、文に対する全係り受け木を使った場合より、ＳＰのみの係り受け木を使った方が、良い結果になった。

Kai Sheng Tai et al, 2015 "Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks"

Miwa et al,2016 "End-To-End Relation Extraction usingLSTMs on Sequences and Tree Structures"

しかしながら、文に対して全体の係り受け木を使っても、最短係り受け経路（ＳＰ）のみの係り受け木を使っても、ＳＰ外の表現のエンコーディング時にＳＰ内の情報を利用することが難しい。ここで、ＳＰ外の表現のエンコーディング時にＳＰ内の情報を利用することが難しいことについて、図１３を参照して説明する。図１３は、ＳＰ外の表現のエンコーディングの参考例を示す図である。なお、上述した「薬Ａを無作為に抽出した病気Ｂの患者に投与したところ、効果があった」という文に対して、「薬Ａ」と「病気Ｂ」との間の関係（「効果」）を抽出（判定）する場合とする。

図１３に示すように、左図は係り受け木全体を示す。それぞれの四角のボックスはＬＳＴＭである。ＳＰは、「薬Ａ」と「病気Ｂ」との間の経路である。中図の木構造は「薬Ａ」に対するエンコーディングを計算する際に参照される範囲である。右図の木構造は関係を示す「効果」に対するエンコーディングを計算する際に参照される範囲である。

このような状況の下で、係り受け木全体では、文に対する全体の係り受け木の構造に沿ってエンコーディングするので、ＳＰ外すなわちＳＰと係り受け関係を持たない単語のエンコーディング時にＳＰ内の単語の特徴を用いてエンコーディングすることが難しい。例えば、図１３では、関係を示す「効果」は、ＳＰ外の表現である。ＳＰ外すなわち係り受け関係を持たない単語「効果」のエンコーディング時には、参照される範囲は「あった」だけであり、「あった」配下のＳＰ内の単語「薬Ａ」などの特徴を用いてエンコーディングできない。言い換えれば、係り受け木のＳＰ外の表現の重要性を判定するのが難しい。

なお、ＳＰのみの係り受け木を使った場合であっても、係り受け木全体を使った場合と同様に、ＳＰ外の表現のエンコーディング時にＳＰ内の情報を利用することが難しいことには変わりがない。

この結果、関係を示す重要な表現がＳＰの外にある場合、ＳＰ内の単語間の関係を抽出することが難しい。したがって、係り受け木のＳＰ外に基づいた、文のエンコーディングを行うことができないという問題がある。

本発明は、１つの側面では、係り受け木の最短係り受け経路（ＳＰ）外に基づいた、文のエンコーディングを行うことを目的とする。

１つの態様では、エンコーディングプログラムは、文に含まれる第１文節と第２文節とに対し、前記文から生成した係り受け木に含まれる２つのノードであって前記第１文節に対応する第１ノードと前記第２文節に対応する第２ノードとの共通の祖先ノードを特定し、前記係り受け木に含まれる葉ノードのそれぞれから前記共通の祖先ノードに向かう経路に応じて前記係り受け木に含まれる各ノードをエンコーディングすることによって、前記共通の祖先ノードのベクトルを求め、前記共通の祖先ノードのベクトルに基づいて、前記共通の祖先ノードから前記葉ノードに向かう経路に応じて前記係り受け木に含まれる各ノードをエンコーディングする、処理をコンピュータに実行させる。

１実施態様によれば、係り受け木の最短係り受け経路（ＳＰ）外に基づいた、文のエンコーディングを行うことができる。

図１は、実施例１に係る機械学習装置の構成を示す機能ブロック図である。図２は、実施例１に係る予測装置の構成を示す機能ブロック図である。図３は、文の係り受けの一例を示す図である。図４は、実施例１に係る木構造エンコーディングの一例を示す図である。図５は、実施例１に係る関係抽出学習処理のフローチャートの一例を示す図である。図６は、実施例１に係る関係抽出学習処理の一例を示す図である。図７は、実施例１に係る関係抽出予測処理のフローチャートの一例を示す図である。図８は、実施例２に係る機械学習装置の構成を示す機能ブロック図である。図９は、実施例２に係る予測装置の構成を示す機能ブロック図である。図１０は、実施例２に係る木構造エンコーディングの一例を示す図である。図１１は、エンコーディングプログラムを実行するコンピュータの一例を示す図である。図１２は、ＬＳＴＭネットワークを示す参考図である。図１３は、ＳＰ外の表現のエンコーディングの参考例を示す図である。

以下に、本願の開示するエンコーディングプログラム、情報処理装置およびエンコーディング方法の実施例を図面に基づいて詳細に説明する。実施例では、情報処理装置として機械学習装置と予測装置とに分けて説明する。なお、本発明は、実施例により限定されるものではない。

［機械学習装置の構成］
図１は、実施例に係る機械学習装置の構成を示す機能ブロック図である。機械学習装置１は、文全体の係り受け木において、共通の祖先ノードに文全体の情報を集約して、集約した情報を用いて係り受け木の各ノードをエンコーディングする。機械学習装置１は、エンコーディングした結果を用いて、文に含まれる第１文節と第２文節の関係を学習する。ここでいう「係り受け木」とは、文の中の単語間の係り受けを木構造のＬＳＴＭネットワークで表わしたものである。なお、ＬＳＴＭネットワークのことを、以降「ＬＳＴＭ」という。また、文節を単語という場合もある。

ここで、文の係り受けの一例を、図３を参照して説明する。図３は、文の係り受けの一例を示す図である。図３に示すように、文として「薬Ａを無作為に抽出した病気Ｂの患者に投与したところ、効果があった」が示されている。かかる文では、「薬Ａ」、「を」、「無作為」、「に」、「抽出」、「した」、「病気Ｂ」、「の」、「患者」、「に」、「投与」、「した」、「ところ」、「効果」、「が」、「あった」というように文節単位の列に分割される。

「薬Ａ」の係り受けは、「投与」である。「無作為」の係り受けは、「抽出」である。「抽出」および「病気Ｂ」の係り受けは、「患者」である。「患者」の係り受けは、「投与」である。「投与」の係り受けは、「ところ」である。「ところ」および「効果」の係り受けは、「あった」である。

ここで、「薬Ａ」と「病気Ｂ」との間の関係（「効果」）を抽出（判定）する場合には、「薬Ａ」と「病気Ｂ」との間の経路が、最短係り受け経路（Shortest Path：ＳＰ）になる。ここでいうＳＰとは、関係を抽出したい単語「薬Ａ」と単語「病気Ｂ」との間の係り受けの最短経路のことをいい、上記文では、「薬Ａ」と「病気Ｂ」との間の経路のことをいう。関係を示す「効果」の単語は、かかる文の中のＳＰの外にある。

また、「投与」は、「薬Ａ」と「病気Ｂ」との共通の祖先ノード（Lowest Common Ancestor：ＬＣＡ）になる。

図１に戻って、機械学習装置１は、制御部１０および記憶部２０を有する。制御部１０は、ＣＰＵ（Central Processing Unit）などの電子回路により実現される。制御部１０は、係り受け解析部１１、木構造エンコーディング部１２および関係抽出学習部１３を有する。なお、木構造エンコーディング部１２は、特定部、第１のエンコーディング部および第２のエンコーディング部の一例である。

記憶部２０は、例えば、ＲＡＭ、フラッシュメモリ（Flash Memory）などの半導体メモリ素子、または、ハードディスク、光ディスクなどにより実現される。記憶部２０は、パラメタ２１、エンコード結果２２およびパラメタ２３を有する。

パラメタ２１は、文の単語列のそれぞれの単語を木構造のＬＳＴＭ（ＴｒｅｅＬＳＴＭ）によりエンコーディングする際に各単語に対するＬＳＴＭが利用するパラメタの種類である。１つのＬＳＴＭは、１つの単語を、パラメタ２１を用いてエンコーディングする。パラメタ２１には、例えば、エンコーディングする方向が含まれる。エンコーディングする方向とは、ある単語をエンコーディングする場合に、直近の単語ベクトルの単語からある単語への方向を示す。エンコーディングする方向には、例えば、上や下が挙げられる。

エンコード結果２２は、それぞれの単語のエンコード結果（ベクトル）および文のエンコード結果（ベクトル）を示す。エンコード結果２２は、木構造エンコーディング部１２によって計算される。

パラメタ２３は、エンコード結果２２を用いて単語間の関係を学習する際に用いられるパラメタである。なお、パラメタ２３は、関係抽出学習部１３によって用いられ、適宜修正される。

係り受け解析部１１は、文の係り受けを解析する。例えば、係り受け解析部１１は、文に対して、形態素解析を実行し、形態素（文節単位）の列に分割する。係り受け解析部１１は、分割した列について、文節単位の係り受け解析を行う。なお、係り受け解析は、いかなる構文解析ツールを用いても良い。

木構造エンコーディング部１２は、文節単位の係り受けからなる木構造に変換した木の木構造のＬＳＴＭを用いて、それぞれの文節をエンコーディングする。例えば、木構造エンコーディング部１２は、係り受け解析部１１によって解析された文節単位の係り受けを用いて、文節単位の係り受けからなる木構造の係り受け木に変換する。木構造エンコーディング部１２は、文に含まれる第１文節と第２文節とに対し、変換した係り受け木に含まれる２つのノードであって第１文節に対応する第１ノードと第２文節に対応する第２ノードとの共通の祖先ノード（ＬＣＡ）を特定する。木構造エンコーディング部１２は、パラメタ２１を用いて、係り受け木に含まれる葉ノードのそれぞれからＬＣＡに向かう経路に沿って係り受け木に含まれる各ノードをエンコーディングすることによって、ＬＣＡのエンコーディング結果のベクトルを求める。すなわち、木構造エンコーディング部１２は、葉ノードのそれぞれからＬＣＡに向かう経路に沿って各ノードの情報をＬＣＡに集約することによって、ＬＣＡのエンコーディング結果ベクトルを求める。そして、木構造エンコーディング部１２は、ＬＣＡのエンコーディング結果ベクトルに基づいて、パラメタ２１を用いて、ＬＣＡから葉ノードに向かう経路に沿って係り受け木に含まれる各ノードをエンコーディングする。つまり、木構造エンコーディング部１２は、ＬＣＡに文全体の情報を集約した後に、集約した情報を逆向きに伝播させて、係り受け木の各ノードをエンコーディングする。

また、木構造エンコーディング部１２は、各ノードのエンコーディング結果のベクトルを用いて、文のベクトルを求める。

関係抽出学習部１３は、文のベクトルとすでに分かっている関係ラベル（正解ラベル）を入力すると、文に含まれる第１文節と第２文節との関係に対応する関係ラベルが入力した関係ラベルと一致するように機械学習モデルを学習する。例えば、関係抽出学習部１３は、文のベクトルを機械学習モデルに入力すると、パラメタ２３を用いて文に含まれる第１文節と第２文節との関係を出力する。そして、関係抽出学習部１３は、出力された関係に対応する関係ラベルが既にわかっている関係ラベル（正解ラベル）と一致していなければ、情報の誤差を木構造エンコーディング部１２に逆伝播させる。そして、関係抽出学習部１３は、誤差を修正した各ノードのベクトルおよび修正したパラメタ２３を用いて、機械学習モデルを学習する。言い換えれば、関係抽出学習部１３は、文のベクトルと文のベクトルに対応する正解ラベルとを入力し、入力に応じて機械学習モデルが出力する文に含まれる第１文節と第２文節との関係に対応する予測結果と正解ラベルとの差に基づいた機械学習によって機械学習モデルを更新する。

なお、機械学習モデルは、ＮＮ（Neural Network）やＳＶＭ（Support Vector Machine）が採用可能である。例えば、ＮＮは、ＣＮＮ（Convolutional Neural Network）やＲＮＮ（Recurrent Neural Network）であっても良い。また、機械学習モデルは、例えば、ＣＮＮとＲＮＮとを組み合わせた機械学習モデルなど、複数の機械学習モデルを組み合わせることで実現される機械学習モデルであっても良い。

［予測装置の構成］
図２は、実施例１に係る予測装置の構成を示す機能ブロック図である。予測装置３は、文全体の係り受け木において、共通の祖先ノードに文全体の情報を集約して、集約した情報を用いて係り受け木の各ノードをエンコーディングする。予測装置３は、エンコーディングした結果を用いて、文に含まれる第１文節と第２文節の関係を予測する。

図１に戻って、予測装置３は、制御部３０および記憶部４０を有する。制御部３０は、ＣＰＵ（Central Processing Unit）などの電子回路により実現される。制御部３０は、係り受け解析部１１、木構造エンコーディング部１２および関係抽出予測部３１を有する。なお、係り受け解析部１１および木構造エンコーディング部１２は、図１に示す機械学習装置１と同一の構成であるので、同一符号で示し、その重複する構成および動作の説明については省略する。また、木構造エンコーディング部１２は、特定部、第１のエンコーディング部および第２のエンコーディング部の一例である。

記憶部４０は、例えば、ＲＡＭ、フラッシュメモリ（Flash Memory）などの半導体メモリ素子、または、ハードディスク、光ディスクなどにより実現される。記憶部４０は、パラメタ４１、エンコード結果４２およびパラメタ２３を有する。

パラメタ４１は、文の単語列のそれぞれの単語を木構造のＬＳＴＭによりエンコーディングする際に各単語に対するＬＳＴＭが利用するパラメタである。１つのＬＳＴＭは、１つの単語を、パラメタ４１を用いてエンコーディングする。パラメタ４１には、例えば、エンコーディングする方向が含まれる。エンコーディングする方向とは、ある単語をエンコーディングする場合に、使用される以前の単語ベクトルの単語からある単語への方向を示す。エンコーディングする方向には、例えば、上や下が挙げられる。なお、パラメタ４１は、機械学習装置１のパラメタ２１に対応する。

エンコード結果４２は、それぞれの単語のエンコード結果（ベクトル）および文のエンコード結果（ベクトル）を示す。エンコード結果４２は、木構造エンコーディング部１２によって計算される。なお、エンコード結果４２は、機械学習装置１のエンコード結果２２に対応する。

パラメタ２３は、エンコード結果４２を用いて単語間の関係を予測する際に用いられるパラメタである。なお、パラメタ２３には、機械学習装置１の機械学習によって最適化されたパラメタ２３と同じパラメタが適用される。

関係抽出予測部３１は、文のベクトルを学習済みの機械学習モデルに入力すると、文に含まれる第１文節と第２文節の関係を予測する。例えば、関係抽出予測部３１は、文のベクトルを学習済みの機械学習モデルに入力すると、パラメタ２３を用いて文に含まれる第１文節と第２文節の関係を予測する。そして、関係抽出予測部３１は、予測した関係に対応する関係ラベルを出力する。なお、学習済みの機械学習モデルは、機械学習装置１の関係抽出学習部１３によって学習されたものである。

［木構造エンコーディングの一例］
図４は、実施例１に係る木構造エンコーディングの一例を示す図である。なお、文が「薬Ａを無作為に抽出した病気Ｂの患者に投与したところ、効果があった」である場合であって「薬Ａ」と「病気Ｂ」との間の関係（「効果」）を抽出（判定）する場合であるとする。

図４左図には、文における木構造の係り受け木が示されている。かかる係り受け木は、木構造エンコーディング部１２によって変換される。すなわち、木構造エンコーディング部１２は、係り受け解析部１１によって解析された文における文節単位の係り受けを用いて、文節単位の係り受けからなる木構造の係り受け木に変換する。なお、図４におけるそれぞれの四角のボックスはＬＳＴＭである。

木構造エンコーディング部１２は、文に含まれる「薬Ａ」と「病気Ｂ」とに対し、変換した係り受け木に含まれる２つのノードであって「薬Ａ」に対応するノードと「病気Ｂ」に対応するノードとの共通の祖先ノード（ＬＣＡ）を特定する。特定されるＬＣＡは、「投与」に対応するノードとなる。

木構造エンコーディング部１２は、パラメタ２１を用いて、係り受け木に含まれる葉ノードのそれぞれからＬＣＡに向かう経路に沿って係り受け木に含まれる各ノードをエンコーディングすることによって、ＬＣＡのエンコーディング結果のベクトルを求める。すなわち、木構造エンコーディング部１２は、葉ノードのそれぞれからＬＣＡに向かう経路に沿って各ノードの情報をＬＣＡに集約する。左図では、「薬Ａ」、「無作為」、「病気Ｂ」、「効果」に対応するノードが、葉ノードである。

ここでは、左図に示すように、木構造エンコーディング部１２は、「薬Ａ」をＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）を、パラメタが示す「上」に位置する「投与」（ＬＣＡ）のＬＳＴＭに出力する。

また、木構造エンコーディング部１２は、「無作為」をＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）をパラメタが示す「上」に位置する「抽出」のＬＳＴＭに出力する。また、木構造エンコーディング部１２は、「抽出」と、「無作為」からのベクトルをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）をパラメタが示す「上」に位置する「患者」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２は、「病気Ｂ」をＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）をパラメタが示す「上」に位置する「患者」のＬＳＴＭに出力する。また、木構造エンコーディング部１２は、「患者」と、「抽出」および「病気Ｂ」からのそれぞれのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）をパラメタが示す「上」に位置する「投与」（ＬＣＡ）のＬＳＴＭに出力する。

一方、木構造エンコーディング部１２は、「効果」をＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）を、パラメタが示す「上」に位置する「あった」のＬＳＴＭに出力する。また、木構造エンコーディング部１２は、「あった」と、「効果」からのベクトルをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）をパラメタが示す「下」に位置する「ところ」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２は、「ところ」と、「あった」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）をパラメタが示す「下」に位置する「投与」（ＬＣＡ）のＬＳＴＭに出力する。

そして、木構造エンコーディング部１２は、「投与」と、「薬Ａ」、「患者」および「ところ」からのそれぞれのエンコード結果（ベクトル）とをＬＳＴＭに入力する。木構造エンコーディング部１２は、エンコーディングされたエンコード結果（ベクトル）を求める。すなわち、木構造エンコーディング部１２は、葉ノードのそれぞれからＬＣＡに向かう経路に沿って各ノードの情報をＬＣＡに集約する。

この後、木構造エンコーディング部１２は、ＬＣＡのエンコード結果（ベクトル）に基づいて、パラメタ２１を用いて、ＬＣＡから葉ノードに向かう経路に沿って係り受け木に含まれる各ノードをエンコーディングする。つまり、木構造エンコーディング部１２は、ＬＣＡに文全体の情報を集約した後に、集約した情報を逆向きに伝播させて、係り受け木の各ノードをエンコーディングする。

ここでは、右図に示すように、ＬＣＡのエンコード結果（ベクトル）は、ｈ_ＬＣＡであるとする。木構造エンコーディング部１２は、ｈ_ＬＣＡを、葉ノードに向かう、パラメタが示す「下」に位置する「薬Ａ」および「患者」のＬＳＴＭに出力する。木構造エンコーディング部１２は、ｈ_ＬＣＡを、葉ノードに向かう、パラメタが示す「上」に位置する「ところ」のＬＳＴＭに出力する。

木構造エンコーディング部１２は、「薬Ａ」と、ｈ_ＬＣＡとをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_薬Ａを出力する。

また、木構造エンコーディング部１２は、「患者」と、ｈ_ＬＣＡとをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_患者を出力する。木構造エンコーディング部１２は、ｈ_患者を、葉ノードに向かう、パラメタが示す「下」に位置する「抽出」および「病気Ｂ」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２は、「病気Ｂ」と「患者」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_病気Ｂを出力する。また、木構造エンコーディング部１２は、「抽出」と、「患者」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_抽出を出力する。木構造エンコーディング部１２は、ｈ_抽出を、葉ノードに向かう、パラメタが示す「下」に位置する「無作為」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２は、「無作為」と、「抽出」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_無作為を出力する。

一方、木構造エンコーディング部１２は、「ところ」と、ｈ_ＬＣＡとをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_ところを出力する。木構造エンコーディング部１２は、ｈ_ところを、葉ノードに向かう、パラメタが示す「上」に位置する「あった」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２は、「あった」と、「ところ」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_あったを出力する。木構造エンコーディング部１２は、ｈ_あったを、葉ノードに向かう、パラメタが示す「下」に位置する「効果」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２は、「効果」と、「あった」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２は、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_効果を出力する。

そして、木構造エンコーディング部１２は、各ノードのエンコード結果を示すベクトルを用いて文のベクトルを求める。ここでは、木構造エンコーディング部１２は、以下のように、文のベクトルｈ_文を求めることができる。
ｈ_文＝［ｈ_薬Ａ；ｈ_無作為；ｈ_抽出；ｈ_病気Ｂ；ｈ_患者；ｈ_投与；ｈ_ところ；ｈ_効果；ｈ_あった；］

これにより、木構造エンコーディング部１２は、係り受け木における「薬Ａ」および「病気Ｂ」のＳＰ外に基づいた、文のエンコーディングを行なえる。すなわち、木構造エンコーディング部１２は、係り受け木における「薬Ａ」および「病気Ｂ」のＳＰのみならず、ＳＰ外に存在する関係を示す「効果」を含む各ノードの情報もＬＣＡに集まるため、ＳＰ外に基づいた、文のエンコーディングを行なえる。この結果、関係抽出学習部１３は、単語間の関係を抽出する場合に用いる精度の高い機械学習モデルを生成できる。加えて、関係抽出予測部３１は、機械学習モデルを用いて単語間の関係を精度良く抽出することができる。

［関係抽出学習処理のフローチャート］
図５は、実施例１に係る関係抽出学習処理のフローチャートの一例を示す図である。なお、図６に示す実施例１に係る関係抽出学習処理の一例を、適宜参照しながら説明する。

木構造エンコーディング部１２は、係り受け解析の解析済みの文ｓ_ｉ、固有表現対ｎ_ｉ、既にわかっている関係ラベルを受け付ける（ステップＳ１１）。図６の符号ａ１に示すように、文ｓ_ｉとして「薬Ａを無作為に抽出した病気Ｂの患者に投与したところ、効果があった」、固有表現対として「薬Ａ」および「病気Ｂ」が示されている。文ｓ_ｉでは、単語間の係り受けが解析されている。固有表現対は、関係を学習するターゲットとなる単語の対である。それぞれの単語には、文の中でのインデックスの範囲が示されている。インデックスは単語が文の中で何個目かを示す情報である。インデックスは０から数える。「薬Ａ」は、０から１の間にある。「病気Ｂ」は、６から７の間にある。なお、固有表現値ｎ_ｉは、第１文節、第２文節に対応する。

そして、木構造エンコーディング部１２は、固有表現対ｎ_ｉに対応するＬＣＡ（共通祖先ノード）としてｌｃａ_ｉを特定する（ステップＳ１２）。図６の符号ａ２に示すように、共通祖先ノードのインデックスｌｃａ_ｉは、「１０」となる。すなわち、１０個目の「投与」がＬＣＡの単語となる。

そして、木構造エンコーディング部１２は、ｌｃａ_ｉが根となる形に木構造のＬＳＴＭを接続する（ステップＳ１３）。すなわち、木構造エンコーディング部１２は、文節単位の係り受けを用いて、文節単位の係り受けからなる木構造の係り受け木に変換する。

そして、木構造エンコーディング部１２は、葉ノードの各単語からｌｃａ_ｉに向けてＬＳＴＭを辿る（ステップＳ１４）。図６の符号ａ３に示すように、例えば、薬Ａのベクトルｈ_薬Ａ´と患者のベクトルｈ_患者´と他の単語のベクトルとからＬＣＡのエンコード結果ベクトルｈ_ＬＣＡ´が求められる。すなわち、木構造エンコーディング部１２は、葉ノードのそれぞれからＬＣＡに向かう経路に沿って各ノードの情報をＬＣＡに集約することによって、ＬＣＡのエンコーディング結果ベクトルを求める。

そして、木構造エンコーディング部１２は、ｌｃａ_ｉから各単語に向けてＬＳＴＭを辿り、各単語位置にある単語ｗを表すベクトルｈ_ｗを生成する（ステップＳ１５）。図６の符号ａ４に示すように、例えば、薬Ａのベクトルｈ_薬Ａ、無作為のベクトルｈ_無作為が生成される。すなわち、木構造エンコーディング部１２は、ＬＣＡに文全体の情報を集約した後に、集約した情報を逆向きに伝播させて、係り受け木の各ノードをエンコーディングする。

そして、木構造エンコーディング部１２は、各単語のベクトルｈ_ｗを収集して結合し、文を表すベクトルｈ_ｓｉを生成する（ステップＳ１６）。図６の符号ａ５に示すように、「薬Ａ」のベクトルｈ_薬Ａ、「無作為」のベクトルｈ_無作為、・・・を収集して、結合して文ｓ_ｉのベクトルｈ_ｓｉが生成される。

そして、関係抽出学習部１３は、文のベクトルｈ_ｓｉを機械学習モデルに入力して、関係ラベルｌｐ_ｉを抽出する（ステップＳ１７）。図６の符号ａ６に示すように、関係抽出学習部１３は、関係ラベルｌ_ｐｉを抽出する。ここでは、関係無しであることを示す「０」、関係有りであるが効果ありであることを示す「１」、関係有りであるが効果無しであることを示す「２」のいずれかが抽出される。関係抽出学習部１３は、関係ラベルｌｐ_ｉが受け付けた関係ラベルと一致するか否かを判定する（ステップＳ１８）。関係ラベルｌｐ_ｉが受け付けた関係ラベルと一致しないと判定した場合には（ステップＳ１８；Ｎｏ）、関係抽出学習部１３は、パラメタ２１およびパラメタ２３を調整する（ステップＳ１９）。そして、関係抽出学習部１３は、さらに学習すべく、ステップＳ１４に移行する。

一方、関係ラベルｌｐ_ｉが受け付けた関係ラベルと一致すると判定した場合には（ステップＳ１８；Ｙｅｓ）、関係抽出学習部１３は、関係抽出学習処理を終了する。

［関係抽出予測処理のフローチャート］
図７は、実施例１に係る関係抽出予測処理のフローチャートの一例を示す図である。木構造エンコーディング部１２は、係り受け解析の解析済み文ｓ_ｉ、固有表現対ｎ_ｉを受け付ける（ステップＳ２１）。そして、木構造エンコーディング部１２は、固有表現対ｎ_ｉに対応するＬＣＡ（共通祖先ノード）としてｌｃａ_ｉを特定する（ステップＳ２２）。

そして、木構造エンコーディング部１２は、ｌｃａ_ｉが根となる形に木構造のＬＳＴＭを接続する（ステップＳ２３）。すなわち、木構造エンコーディング部１２は、文節単位の係り受けを用いて、文節単位の係り受けからなる木構造の係り受け木に変換する。

そして、木構造エンコーディング部１２は、葉ノードの各単語からｌｃａ_ｉに向けてＬＳＴＭを辿る（ステップＳ２４）。すなわち、木構造エンコーディング部１２は、葉ノードのそれぞれからＬＣＡに向かう経路に沿って各ノードの情報をＬＣＡに集約することによって、ＬＣＡのエンコーディング結果ベクトルを求める。

そして、木構造エンコーディング部１２は、ｌｃａ_ｉから各単語に向けてＬＳＴＭを辿り、各単語位置にある単語ｗを表すベクトルｈ_ｗを生成する（ステップＳ２５）。すなわち、木構造エンコーディング部１２は、ＬＣＡに文全体の情報を集約した後に、集約した情報を逆向きに伝播させて、係り受け木の各ノードをエンコーディングする。

そして、木構造エンコーディング部１２は、各単語のベクトルｈ_ｗを収集して結合し、文を表すベクトルｈ_ｓｉを生成する（ステップＳ２６）。そして、関係抽出予測部３３は、文のベクトルｈ_ｓｉを学習済みの機械学習モデルに入力して、関係ラベルｌｐ_ｉを抽出して、抽出した関係ラベルｌｐ_ｉを出力する（ステップＳ２７）。そして、関係抽出予測部３３は、関係抽出予測処理を終了する。

［実施例１の効果］
上記実施例１によれば、機械学習装置１および予測装置３を含む情報処理装置は、以下の処理を行う。情報処理装置は、文に含まれる第１文節と第２文節とに対し、当該文から生成した係り受け木に含まれる２つのノードであって第１文節に対応する第１ノードと第２文節に対応する第２ノードとの共通の祖先ノードを特定する。情報処理装置は、係り受け木に含まれる葉ノードのそれぞれから共通の祖先ノードに向かう経路に応じて係り受け木に含まれる各ノードをエンコーディングすることによって、共通の祖先ノードのベクトルを求める。情報処理装置は、共通の祖先ノードのベクトルに基づいて、共通の祖先ノードから葉ノードに向かう経路に応じて係り受け木に含まれる各ノードをエンコーディングする。これにより、情報処理装置は、係り受け木における第１文節および第２文節の最短係り受け経路外に基づいた、文のエンコーディングを行なえる。

また、上記実施例１によれば、情報処理装置は、葉ノードのそれぞれから共通の祖先ノードに向かう経路に沿って各ノードの情報を共通の祖先ノードに集約することによって、共通の祖先ノードのベクトルを求める。これにより、情報処理装置は、係り受け木における第１文節および第２文節の最短係り受け経路のみならず、最短係り受け経路外にある関係を示す文節を含む各ノードの情報も共通の祖先ノードに集まるため、最短係り受け経路外に基づいた、文のエンコーディングを行なえる。言い換えれば、情報処理装置は、最短係り受け経路外の情報を適切に含むベクトルを生成することができるようになり、第１文節および第２文節の関係抽出の精度を向上できる。

また、上記実施例１によれば、機械学習装置１は、各ノードのエンコーディング結果を示すベクトルから文のベクトルを求める。機械学習装置１は、文のベクトルと文のベクトルに対応する正解ラベルとを入力する。機械学習装置１は、入力に応じて機械学習モデルが出力する文に含まれる第１文節と第２文節との関係に対応する予測結果と正解ラベルとの差に基づいた機械学習によって機械学習モデルを更新する。これにより、機械学習装置１は、第１文節および第２文節の関係抽出の精度の高い機械学習モデルを生成できる。

また、上記実施例１によれば、予測装置３は、他の文のベクトルを更新された機械学習モデルに入力し、他の文に含まれる第１文節と第２文節との関係に対応する予測結果を出力する。これにより、予測装置３は、第１文節および第２文節の関係を精度良く出力できる。

ところで、実施例１では、木構造エンコーディング部１２が、単語をＬＳＴＭに入力し、ＬＳＴＭがエンコーディングしたエンコード結果ベクトルを、パラメタが示す方向に位置する単語のＬＳＴＭに出力すると説明した。しかしながら、木構造エンコーディング部１２は、これに限定されず、単語をＬＳＴＭに入力し、ＬＳＴＭがエンコーディングしたエンコード結果ベクトルおよび当該単語の所定の位置ベクトル（ＰＥ：Position Encoding）を、パラメタが示す方向に位置する単語のＬＳＴＭに出力しても良い。ここでいう所定の位置ベクトル（ＰＥ）とは、文において関係を抽出したい第１文節と第２文節との係り受け距離のことをいう。所定の位置ベクトル（ＰＥ）の詳細は、後述する。

［実施例２に係る機械学習装置の構成］
図８は、実施例２に係る機械学習装置の構成を示す機能ブロック図である。なお、図１に示す機械学習装置１と同一の構成については同一符号を示すことで、その重複する構成および動作の説明については省略する。実施例１と実施例２とが異なるところは、制御部１０にＰＥ付与部５１を追加した点にある。また、実施例１と実施例２とが異なるところは、制御部１０の木構造エンコーディング部１２を木構造エンコーディング部１２Ａに変更した点にある。

ＰＥ付与部５１は、文に含まれる文節ごとに、文に含まれる第１文節との位置関係および文に含まれる第２文節との位置関係を付与する。例えば、ＰＥ付与部５１は、木構造の係り受け木を用いて、文節ごとに、第１文節と第２文節との係り受け距離を示すＰＥを求める。ＰＥは、一例として、ａを第１文節からの距離、ｂを第２文節からの距離とした場合には、（ａ，ｂ）で表わされる。また、ＰＥは、一例として、第１文節と第２文節との間でない場合には（Ｏｕｔ）で表わされる。そして、ＰＥ付与部５１は、文節ごとに、ＰＥを付与する。

木構造エンコーディング部１２Ａは、文節単位の係り受けからなる木構造に変換した木の木構造のＬＳＴＭを用いて、それぞれの文節をエンコーディングする。例えば、木構造エンコーディング部１２Ａは、係り受け解析部１１によって解析された文節単位の係り受けを用いて、文節単位の係り受けからなる木構造の係り受け木に変換する。木構造エンコーディング部１２Ａは、文に含まれる第１文節と第２文節とに対し、変換した係り受け木に含まれる２つのノードであって第１文節に対応する第１ノードと第２文節に対応する第２ノードとの共通の祖先ノード（ＬＣＡ）を特定する。木構造エンコーディング部１２Ａは、パラメタ２１およびＰＥを用いて、係り受け木に含まれる葉ノードのそれぞれからＬＣＡに向かう経路に沿って、係り受け木に含まれる各ノードをエンコーディングすることによって、ＬＣＡのエンコーディング結果のベクトルを求める。すなわち、木構造エンコーディング部１２Ａは、葉ノードのそれぞれからＬＣＡに向かう経路に沿って各ノードのＰＥを含む情報をＬＣＡに集約することによって、ＬＣＡのエンコーディング結果ベクトルを求める。そして、木構造エンコーディング部１２Ａは、ＬＣＡのエンコーディング結果ベクトルに基づいて、パラメタ２１およびＰＥを用いて、ＬＣＡから葉ノードに向かう経路に沿って、係り受け木に含まれる各ノードをエンコーディングする。つまり、木構造エンコーディング部１２Ａは、ＬＣＡに文全体のＰＥを含む情報を集約した後に、集約した情報を逆向きに伝播させて、係り受け木の各ノードをエンコーディングする。

また、木構造エンコーディング部１２Ａは、各ノードのエンコーディング結果のベクトルを用いて文のベクトルを求める。

［実施例２に係る予測装置の構成］
図９は、実施例２に係る予測装置の構成を示す機能ブロック図である。なお、図２に示す予測装置３と同一の構成については同一符号を示すことで、その重複する構成および動作の説明については省略する。実施例１と実施例２とが異なるところは、制御部１０にＰＥ付与部５１を追加した点にある。また、実施例１と実施例２とが異なるところは、制御部１０の木構造エンコーディング部１２を木構造エンコーディング部１２Ａに変更した点にある。なお、ＰＥ付与部５１および木構造エンコーディング部１２Ａは、図８に示す機械学習装置１と同一の構成であるので、同一符号で示し、その重複する構成および動作の説明については省略する。

［木構造エンコーディングの一例］
図１０は、実施例２に係る木構造エンコーディングの一例を示す図である。なお、文が「薬Ａを無作為に抽出した病気Ｂの患者に投与したところ、効果があった」である場であって「薬Ａ」と「病気Ｂ」との間の関係（「効果」）を抽出（判定）する場合であるとする。

図１０左図には、文における木構造の係り受け木が示されている。かかる係り受け木は、木構造エンコーディング部１２Ａによって変換される。すなわち、木構造エンコーディング部１２Ａは、係り受け解析部１１によって解析された文における文節単位の係り受けを用いて、文節単位の係り受けからなる木構造の係り受け木に変換する。なお、図１０におけるそれぞれの四角のボックスはＬＳＴＭである。

加えて、ＰＥ付与部５１は、木構造の係り受け木を用いて、文節ごとに、「薬Ａ」と「病気Ｂ」との係り受け距離を示すＰＥを求めて、求めたＰＥを付与する。それぞれのＬＳＴＭの右横に、ＰＥが示されている。ここでは、「薬Ａ」のＰＥは、（０，３）である。すなわち、「薬Ａ」からの距離は、自身であるので、「０」である。「病気Ｂ」からの距離は、「病気Ｂ」を「０」として「患者」→「投与」→「薬Ａ」の「３」となる。また、「患者」のＰＥは、（２，１）である。すなわち、「薬Ａ」からの距離は、「薬Ａ」を「０」として「投与」→「患者」の「２」となる。「病気Ｂ」からの距離は、「病気Ｂ」を「０」として「１」となる。また、「病気Ｂ」のＰＥは、（３，０）である。すなわち、「薬Ａ」からの距離は、「薬Ａ」を「０」として「投与」→「患者」→「病気Ｂ」の「３」となる。「病気Ｂ」からの距離は、自身であるので、「０」である。また、「抽出」および「無作為」のＰＥは、「薬Ａ」と「病気Ｂ」との間にないので、「Ｏｕｔ」となる。同様に、「ところ」、「あった」および「効果」のＰＥは、「薬Ａ」と「病気Ｂ」との間にないので、「Ｏｕｔ」となる。

木構造エンコーディング部１２Ａは、文に含まれる「薬Ａ」と「病気Ｂ」とに対し、変換した係り受け木に含まれる２つのノードであって「薬Ａ」に対応するノードと「病気Ｂ」に対応するノードとの共通の祖先ノード（ＬＣＡ）を特定する。特定されるＬＣＡは、「投与」に対応するノードとなる。

木構造エンコーディング部１２Ａは、パラメタ２１およびＰＥを用いて、係り受け木に含まれる葉ノードのそれぞれからＬＣＡに向かう経路に沿って係り受け木に含まれる各ノードをエンコーディングすることによって、ＬＣＡのエンコーディング結果のベクトルを求める。すなわち、木構造エンコーディング部１２Ａは、葉ノードのそれぞれからＬＣＡに向かう経路に沿って各ノードのＰＥを含む情報をＬＣＡに集約する。左図では、葉ノードは、「薬Ａ」、「無作為」、「病気Ｂ」、「効果」に対応するノードである。

ここでは、左図に示すように、木構造エンコーディング部１２Ａは、「薬Ａ」をＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）とＰＥ（０，３）とを結合したベクトルを、パラメタが示す「上」に位置する「投与」（ＬＣＡ）のＬＳＴＭに出力する。

また、木構造エンコーディング部１２Ａは、「無作為」をＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）とＰＥ（Ｏｕｔ）とを結合したベクトルをパラメタが示す「上」に位置する「抽出」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２Ａは、「抽出」と、「無作為」からのベクトルをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）と、ＰＥ（Ｏｕｔ）とを結合したベクトルをパラメタが示す「上」に位置する「患者」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２Ａは、「病気Ｂ」をＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）とＰＥ（３，０）とを結合したベクトルをパラメタが示す「上」に位置する「患者」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２Ａは、「患者」と、「抽出」からのベクトルと、「病気Ｂ」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）とＰＥ（２，１）とを結合したベクトルをパラメタが示す「上」に位置する「投与」（ＬＣＡ）のＬＳＴＭに出力する。

一方、木構造エンコーディング部１２Ａは、「効果」をＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）とＰＥ（Ｏｕｔ）とを結合したベクトルをパラメタが示す「上」に位置する「あった」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２Ａは、「あった」と、「効果」からのベクトルをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）と、ＰＥ（Ｏｕｔ）とを結合したベクトルをパラメタが示す「下」に位置する「ところ」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２Ａは、「ところ」と、「あった」からのベクトルをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）と、ＰＥ（Ｏｕｔ）とを結合したベクトルをパラメタが示す「下」に位置する「投与」（ＬＣＡ）のＬＳＴＭに出力する。

そして、木構造エンコーディング部１２Ａは、「投与」と、「ところ」からのベクトルと、「薬Ａ」からのベクトルと、「患者」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）をＬＣＡのエンコード結果（ベクトル）として求める。すなわち、木構造エンコーディング部１２Ａは、葉ノードのそれぞれからＬＣＡに向かう経路に沿って各ノードの情報をＬＣＡに集約する。

この後、木構造エンコーディング部１２Ａは、ＬＣＡのエンコード結果（ベクトル）に基づいて、パラメタ２１およびＰＥを用いて、ＬＣＡから葉ノードに向かう経路に沿って係り受け木に含まれる各ノードをエンコーディングする。つまり、木構造エンコーディング部１２Ａは、ＬＣＡに文全体の情報を集約した後に、集約したＰＥを含む情報を逆向きに伝播させて、係り受け木の各ノードをエンコーディングする。

ここでは、右図に示すように、ＬＣＡのエンコード結果（ベクトル）は、ｈ_ＬＣＡであるとする。木構造エンコーディング部１２Ａは、ｈ_ＬＣＡを、葉ノードに向かう、パラメタが示す「下」に位置する「薬Ａ」および「患者」のＬＳＴＭに出力する。木構造エンコーディング部１２Ａは、ｈ_ＬＣＡを、葉ノードに向かう、パラメタが示す「上」に位置する「ところ」のＬＳＴＭに出力する。

木構造エンコーディング部１２Ａは、「薬Ａ」と、ｈ_ＬＣＡとをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）ｈ_薬Ａを出力する。

また、木構造エンコーディング部１２Ａは、「患者」と、ｈ_ＬＣＡとをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_患者を出力する。木構造エンコーディング部１２Ａは、ｈ_患者とＰＥ（２，１）とを結合したベクトルをパラメタが示す「下」に位置する「抽出」と「病気Ｂ」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２Ａは、「抽出」と、「患者」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_抽出を出力する。木構造エンコーディング部１２Ａは、ｈ_抽出とＰＥ（Ｏｕｔ）とを結合したベクトルをパラメタが示す「下」に位置する「無作為」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２Ａは、「無作為」と、「抽出」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_無作為を出力する。

また、木構造エンコーディング部１２Ａは、「病気Ｂ」と、「患者」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_病気Ｂを出力する。

一方、木構造エンコーディング部１２は、「ところ」と、ｈ_ＬＣＡとをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_ところを出力する。木構造エンコーディング部１２Ａは、ｈ_ところとＰＥ（Ｏｕｔ）とを結合したベクトルをパラメタが示す「上」に位置する「あった」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２は、「あった」と、「ところ」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_あったを出力する。木構造エンコーディング部１２Ａは、ｈ_あったとＰＥ（Ｏｕｔ）とを結合したベクトルをパラメタが示す「下」に位置する「効果」のＬＳＴＭに出力する。

また、木構造エンコーディング部１２Ａは、「効果」と、「あった」からのベクトルとをＬＳＴＭに入力する。木構造エンコーディング部１２Ａは、ＬＳＴＭによってエンコーディングされたエンコード結果（ベクトル）としてｈ_効果を出力する。

そして、木構造エンコーディング部１２Ａは、各ノードのエンコード結果を示すベクトルから文のベクトルを求める。ここでは、木構造エンコーディング部１２Ａは、以下のように、文のベクトルｈ_文を求めることができる。
ｈ_文＝［ｈ_薬Ａ；ｈ_無作為；ｈ_抽出；ｈ_病気Ｂ；ｈ_患者；ｈ_投与；ｈ_ところ；ｈ_効果；ｈ_あった；］

これにより、木構造エンコーディング部１２Ａは、各単語を表すベクトルにターゲット（ここでは、「薬Ａ」および「病気Ｂ」）との位置関係（ＰＥ）を加えて明示することで、重要なＳＰ内の情報とそうでない情報との扱いを変えることができる。この結果、木構造エンコーディング部１２Ａは、ターゲットと関係ある単語であるのかどうかについて、精度良くエンコーディングすることが可能となる。この結果、木構造エンコーディング部１２Ａは、係り受け木における「薬Ａ」および「病気Ｂ」のＳＰ外に基づいた、文のエンコーディングを精度良く行なうことが可能となる。

［実施例２の効果］
上記実施例２によれば、木構造エンコーディング部１２Ａは、葉ノードのそれぞれから共通の祖先ノードに向かう経路に沿って各ノードにおける、第１ノードとの位置関係および第２ノードとの位置関係を含む情報を共通の祖先ノードに集約する処理を含む。これにより、木構造エンコーディング部１２Ａは、第１ノードおよび第２ノードに対して重要なノードと重要でないノードとの扱いを変えることができる。この結果、木構造エンコーディング部１２Ａは、第１ノードおよび第２ノードと関係があるノードであるのかどうかについて、精度良くエンコーディングすることが可能となる。

［その他］
なお、実施例１，２では、機械学習装置１および予測装置３を含む情報処理装置が、日本語に対する文に関し、以下の処理を行うことについて説明した。すなわち、情報処理装置は、日本語に対する文全体の係り受け木において、共通の祖先ノードに文全体の情報を集約して、集約した情報を用いて係り受け木の各ノードをエンコーディングすることについて説明した。しかしながら、情報処理装置は、これに限定されず、英語に対する文に関する場合であっても良い。すなわち、情報処理装置は、英語に対する文全体の係り受け木において、共通の祖先ノードに文全体の情報を集約して、集約した情報を用いて係り受け木の各ノードをエンコーディングする場合であっても良い。

また、図示した機械学習装置１や予測装置３の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、機械学習装置１や予測装置３の分散・統合の具体的態様は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、木構造エンコーディング部１２を、各ノードの情報をＬＣＡに集約する集約部と、ＬＣＡに集約した情報を逆向きに伝播させる逆向き伝播部とに分散しても良い。また、ＰＥ付与部５１と、木構造エンコーディング部１２とを１つの機能部として統合しても良い。また、記憶部２０を機械学習装置１の外部装置としてネットワーク経由で接続するようにしても良い。また、記憶部４０を予測装置３の外部装置としてネットワーク経由で接続するようにしても良い。

また、上記実施例では、機械学習装置１と予測装置３とに分離する構成として説明した。しかしながら、情報処理装置が、機械学習装置１の機械学習処理と予測装置３の予測処理とを含む構成としても良い。

また、上記実施例で説明した各種の処理は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図１に示した機械学習装置１や予測装置３と同様の機能を実現するエンコーディングプログラムを実行するコンピュータの一例を説明する。ここでは、機械学習装置１と同様の機能を実現するエンコーディングプログラムを一例として説明する。図１１は、エンコーディングプログラムを実行するコンピュータの一例を示す図である。

図１１に示すように、コンピュータ２００は、各種演算処理を実行するＣＰＵ２０３と、ユーザからのデータの入力を受け付ける入力装置２１５と、表示装置２０９を制御する表示制御部２０７とを有する。また、コンピュータ２００は、記憶媒体からプログラムなどを読取るドライブ装置２１３と、ネットワークを介して他のコンピュータとの間でデータの授受を行う通信制御部２１７とを有する。また、コンピュータ２００は、各種情報を一時記憶するメモリ２０１と、ＨＤＤ（Hard Disk Drive）２０５を有する。そして、メモリ２０１、ＣＰＵ２０３、ＨＤＤ２０５、表示制御部２０７、ドライブ装置２１３、入力装置２１５、通信制御部２１７は、バス２１９で接続されている。

ドライブ装置２１３は、例えばリムーバブルディスク２１０用の装置である。ＨＤＤ２０５は、エンコーディングプログラム２０５ａおよびエンコーディング処理関連情報２０５ｂを記憶する。

ＣＰＵ２０３は、エンコーディングプログラム２０５ａを読み出して、メモリ２０１に展開し、プロセスとして実行する。かかるプロセスは、機械学習装置１の各機能部に対応する。エンコーディング処理関連情報２０５ｂは、パラメタ２１、エンコード結果２２およびパラメタ２３に対応する。そして、例えばリムーバブルディスク２１０が、エンコーディングプログラム２０５ａなどの各情報を記憶する。

なお、エンコーディングプログラム２０５ａについては、必ずしも最初からＨＤＤ２０５に記憶させておかなくても良い。例えば、コンピュータ２００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory）、ＤＶＤ（Digital Versatile Disk）、光磁気ディスク、ＩＣ（Integrated Circuit）カードなどの「可搬用の物理媒体」に当該プログラムを記憶させておく。そして、コンピュータ２００がこれらからエンコーディングプログラム２０５ａを読み出して実行するようにしても良い。

１機械学習装置
１０，３０制御部
１１係り受け解析部
１２，１２Ａ木構造エンコーディング部
１３関係抽出学習部
２０，４０記憶部
２１パラメタ
２２，４２エンコード結果
２３パラメタ
３予測装置
３１関係抽出予測部
５１ＰＥ付与部

Claims

文に含まれる複数の文節のうちの第１文節と第２文節との関係性の判定に用いる前記複数の文節それぞれのベクトルを求める場合に、前記文から生成した係り受け木に含まれる２つのノードを示す前記第１文節に対応する第１ノードと前記第２文節に対応する第２ノードとの最短係り受け経路に含まれるノードであって、前記係り受け木における前記第１ノードと前記第２ノードとの共通の祖先ノードを特定し、
前記係り受け木に含まれる葉ノードのそれぞれから前記共通の祖先ノードに向かう経路に応じて前記係り受け木に含まれる各ノードをエンコーディングすることによって、前記共通の祖先ノードのベクトルを求め、
前記共通の祖先ノードのベクトルに基づいて、前記共通の祖先ノードから前記葉ノードに向かう経路に応じて前記係り受け木に含まれる各ノードをエンコーディングする、
処理をコンピュータに実行させることを特徴とするエンコーディングプログラム。
前記共通の祖先ノードのベクトルを求める処理は、葉ノードのそれぞれから前記共通の祖先ノードに向かう経路に沿って各ノードの情報を前記共通の祖先ノードに集約することによって、前記共通の祖先ノードのベクトルを求める処理を含む、
ことを特徴とする請求項１に記載のエンコーディングプログラム。
前記集約する処理は、葉ノードのそれぞれから前記共通の祖先ノードに向かう経路に沿って各ノードにおける、前記第１ノードとの位置関係および前記第２ノードとの位置関係を含む情報を前記共通の祖先ノードに集約する処理を含む、
ことを特徴とする請求項２に記載のエンコーディングプログラム。
各ノードのエンコーディング結果を示すベクトルから前記文のベクトルを求め、
前記文のベクトルと前記文のベクトルに対応する正解ラベルとを入力し、前記入力に応じて機械学習モデルが出力する前記文に含まれる第１文節と第２文節との関係に対応する予測結果と前記正解ラベルとの差に基づいた機械学習によって前記機械学習モデルを更新する、
ことを特徴とする請求項１に記載のエンコーディングプログラム。
他の文のベクトルを前記更新された機械学習モデルに入力し、前記他の文に含まれる第１文節と第２文節との関係に対応する予測結果を出力する、
ことを特徴とする請求項４に記載のエンコーディングプログラム。
前記係り受け木における根に対応するノード以外のノードが、前記共通の祖先ノードとして特定されうる、
ことを特徴とする請求項１に記載のエンコーディングプログラム。
文に含まれる複数の文節のうちの第１文節と第２文節との関係性の判定に用いる前記複数の文節それぞれのベクトルを求める場合に、前記文から生成した係り受け木に含まれる２つのノードを示す前記第１文節に対応する第１ノードと前記第２文節に対応する第２ノードとの最短係り受け経路に含まれるノードであって、前記係り受け木における前記第１ノードと前記第２ノードとの共通の祖先ノードを特定する特定部と、
前記係り受け木に含まれる葉ノードのそれぞれから前記共通の祖先ノードに向かう経路に応じて前記係り受け木に含まれる各ノードをエンコーディングすることによって前記共通の祖先ノードのベクトルを生成する第１のエンコーディング部と、
前記共通の祖先ノードのベクトルに基づいて、前記共通の祖先ノードから前記葉ノードに向かう経路に応じて前記係り受け木に含まれる各ノードをエンコーディングする第２のエンコーディング部と、
を有することを特徴とする情報処理装置。
文に含まれる複数の文節のうちの第１文節と第２文節との関係性の判定に用いる前記複数の文節それぞれのベクトルを求める場合に、前記文から生成した係り受け木に含まれる２つのノードを示す前記第１文節に対応する第１ノードと前記第２文節に対応する第２ノードとの最短係り受け経路に含まれるノードであって、前記係り受け木における前記第１ノードと前記第２ノードとの共通の祖先ノードを特定し、
前記係り受け木に含まれる葉ノードのそれぞれから前記共通の祖先ノードに向かう経路に応じて前記係り受け木に含まれる各ノードをエンコーディングすることによって、前記共通の祖先ノードのベクトルを求め、
前記共通の祖先ノードのベクトルに基づいて、前記共通の祖先ノードから前記葉ノードに向かう経路に応じて前記係り受け木に含まれる各ノードをエンコーディングする、
処理をコンピュータが実行することを特徴とするエンコーディング方法。