JP6062829B2

JP6062829B2 - 係り受け関係解析パラメータ学習装置、係り受け関係解析装置、方法、及びプログラム

Info

Publication number: JP6062829B2
Application number: JP2013174799A
Authority: JP
Inventors: 康久吉田; 平尾　努; 努平尾; 鈴木　潤; 潤鈴木; 永田　昌明; 昌明永田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2013-08-26
Filing date: 2013-08-26
Publication date: 2017-01-18
Anticipated expiration: 2033-08-26
Also published as: JP2015043163A

Description

本発明は、係り受け関係解析パラメータ学習装置、係り受け関係解析装置、方法、及びプログラムに関し、特に、文書を解析する係り受け関係解析パラメータ学習装置、係り受け関係解析装置、方法、及びプログラムに関する。

修辞構造理論（Rhetorical Structure Theory：RST）とは文書の論理構造（修辞構造）を捉えるための理論である（例えば、非特許文献１）。ＲＳＴに基づく修辞構造を表わした木のことを修辞構造木（Rhetorical Structure Theory based Discourse Tree：ＲＳＴ−ＤＴ）と呼ぶ。ＲＳＴ−ＤＴの例を図８に示す。与えられた文書は談話構造における最小の単位（Elementary Discourse Unit：ＥＤＵ）に分割される（図８ではｅ１からｅ１０までがそれに対応)。各ＥＤＵには衛星（Satellite：Ｓ）または核（Nuclues：Ｎ）というラベルが付与され、Ｓは必ずＮを修飾するという関係がある。また、ＳとＮ、ＮとＮの間には修辞関係を表わすラベルが付与される。例えば、ｅ_１とｅ_２の間には「Background」という関係ラベルが付与される。

ＲＳＴ−ＤＴでは文書全体が一つのノードになるまで、ノード間に付与されたＮまたはＳのラベル、修辞関係のラベルを一つのノードとし、ラベルの付与とノードの生成を再帰的に行なう。Ｒｏｏｔは文書全体を表わす仮想的なノードである。

文書が与えられた際にＲＳＴ−ＤＴへと解析するアルゴリズムの代表的なものとしてＨＩＬＤＡ（例えば、非特許文献２）がある。ＨＩＬＤＡでは以下の手続きを用いて与えられた文をＲＳＴ−ＤＴへと解析する。

（ステップ１）与えられた文書をＥＤＵに区切る。

（ステップ２）隣り合うノードの中でどれが最も結合しやすいかSupport Vector Machine を用いて決定し、ラベルを付与した上で隣り合うノードを一つのノードに結合する。

（ステップ３）全体が一つのノードであれば結合された木を返し、そうでなければステップ２へ戻る。

William C，Mann and Sandra A. Thompson、「Rhetorical structure theory: Toward a functional theory of text organization」、1988、Text,8(3)、ｐ.243―281 H. Hernault, H. Prendinger, David A. duVerle, and M. Ishizuka、「HILDA: A Discourse Parser Using Support Vector Machine Classfication」、2010、In Dialogue & Discourse, 2010(3)、p.1-33

しかし、ＨＩＬＤＡに代表される従来の談話構造解析技術は、談話構造の相互依存関係を必ずしも正確に捉えているとは限らない。例えば上記図８ではｅ_７とｅ_８の間の関係ラベルを「Concession」、ｅ_９とｅ_１０との間の関係ラベルを「Antithesis」、それらを積み上げたときのものの間の関係ラベルが「Example」であるが、ｅ_７とｅ_８を積み上げたときの関係ラベルを誤って「Evidence」と付与してしまうと、さらに上の関係ラベルの「Example」を正しく付与できなくなる恐れがある。

本発明は、上記の事情を鑑みてなされたもので、係り受け解析を精度よく行うためのパラメータを得ることができる係り受け関係解析パラメータ学習装置、方法、及びプログラムを提供することを目的とする。
また、係り受け解析を精度よく行うことができる係り受け関係解析装置、方法、及びプログラムを提供することを目的とする。

上記の目的を達成するために本発明の係り受け関係解析パラメータ学習装置は、文書内の文字列単位の係り受け関係を解析するためのパラメータを学習する係り受け関係解析パラメータ学習装置であって、ルートノードが学習用文書の全体を表し、かつ前記学習用文書のうちの少なくとも１つの文字列単位の系列の各々を各ノードとした階層構造を表し、かつ、前記文字列単位の系列間の修飾関係及び関係ラベルを表した、前記学習用文書の文字列単位の系列の各々の修辞構造に基づく談話構造木について、前記修辞構造に基づく談話構造木の、文字列単位の各々と、各文字列単位のペアの各々とに基づいて、前記修辞構造に基づく談話構造木を、前記学習用文書のうちの最も重要な前記文字列単位をルートノードとし、かつ前記学習用文書のうちの各文字列単位を各ノードとし、かつ修飾関係を有する前記各文字列単位間に対応するノード間をエッジで結合し、前記エッジに、前記関係ラベルを付与した、前記学習用文書の各文字列単位の依存構造に基づく談話構造木に変換する修辞構造木変換部と、前記修辞構造木変換部によって変換された前記依存構造に基づく談話構造木のエッジの各々に対し、前記エッジで結合されたノードのペアに対応する文字列単位のペア、及び前記エッジに付与された前記関係ラベルの組み合わせについて、前記学習用文書に基づく各特徴量からなる特徴ベクトルを抽出する学習用特徴抽出部と、前記学習用特徴抽出部によって抽出された前記エッジの各々に対する特徴ベクトル、及び前記特徴ベクトルの各特徴量に対する重みからなるパラメータベクトルに基づいて算出されるスコアと、前記学習用文書の文字列単位の系列から生成される、任意の前記依存構造に基づく談話構造木のエッジの各々に対して抽出される前記特徴ベクトル、及び前記パラメータベクトルとに基づいて算出されるスコアとに基づいて、最適化された前記パラメータベクトルを学習するパラメータ学習部と、を含んで構成されている。

本発明の係り受け関係解析パラメータ学習方法は、修辞構造木変換部、学習用特徴抽出部、及びパラメータ学習部を含み、文書内の文字列単位の係り受け関係を解析するためのパラメータを学習する係り受け関係解析パラメータ学習装置における係り受け関係解析パラメータ学習方法であって、前記修辞構造木変換部によって、ルートノードが学習用文書の全体を表し、かつ前記学習用文書のうちの少なくとも１つの文字列単位の系列の各々を各ノードとした階層構造を表し、かつ、前記文字列単位の系列間の修飾関係及び関係ラベルを表した、前記学習用文書の文字列単位の系列の各々の修辞構造に基づく談話構造木について、前記修辞構造に基づく談話構造木の、文字列単位の各々と、各文字列単位のペアの各々とに基づいて、前記修辞構造に基づく談話構造木を、前記学習用文書のうちの最も重要な前記文字列単位をルートノードとし、かつ前記学習用文書のうちの各文字列単位を各ノードとし、かつ修飾関係を有する前記各文字列単位間に対応するノード間をエッジで結合し、前記エッジに、前記関係ラベルを付与した、前記学習用文書の各文字列単位の依存構造に基づく談話構造木に変換するステップと、前記学習用特徴抽出部によって、前記修辞構造木変換部によって変換された前記依存構造に基づく談話構造木のエッジの各々に対し、前記エッジで結合されたノードのペアに対応する文字列単位のペア、及び前記エッジに付与された前記関係ラベルの組み合わせについて、前記学習用文書に基づく各特徴量からなる特徴ベクトルを抽出するステップと、前記パラメータ学習部によって、前記学習用特徴抽出部によって抽出された前記エッジの各々に対する特徴ベクトル、及び前記特徴ベクトルの各特徴量に対する重みからなるパラメータベクトルに基づいて算出されるスコアと、前記学習用文書の文字列単位の系列から生成される、任意の前記依存構造に基づく談話構造木のエッジの各々に対して抽出される前記特徴ベクトル、及び前記パラメータベクトルとに基づいて算出されるスコアとに基づいて、最適化された前記パラメータベクトルを学習するステップと、を含む。

また、本発明の前記修辞構造木変換部は、前記修辞構造に基づく談話構造木のノードのうち、前記文字列単位を表すノードの各々を着目ノードとして、前記着目ノードの文字列単位が、兄弟ノードを修飾する場合に、前記兄弟ノードのうち、修飾される文字列単位を表すノードであって、最左に位置するノードを、前記依存構造に基づく談話構造木における、前記着目ノードの親ノードとし、前記着目ノードと親ノードとを結合するエッジに、前記関係ラベルを付与すると共に、前記着目ノードの文字列単位が、兄弟ノードから修飾される場合に、前記着目ノードの先祖ノードのうち、兄弟ノードを修飾するノードであって、直近に位置するノードを辿り、前記辿ったノードの親ノードの子孫ノードのうち、修飾される文字列単位を表すノードであって、最左に位置するノードを、前記依存構造に基づく談話構造木における、前記着目ノードの親ノードとし、前記着目ノードと親ノードとを結合するエッジに、前記関係ラベルを付与することにより、前記修辞構造に基づく談話構造木を、前記依存構造に基づく談話構造木に変換するようにすることができる。

本発明の係り受け関係解析装置は、入力文書を文字列単位に分割した結果に基づき生成される、任意の前記依存構造に基づく談話構造木のエッジの各々について、前記特徴ベクトルを抽出する特徴抽出部と、前記任意の前記依存構造に基づく談話構造木の中から、前記特徴抽出部によって抽出された前記エッジの各々についての特徴ベクトルと、上記の係り受け関係解析パラメータ学習装置によって学習された前記パラメータベクトルとに基づいて算出されるスコアが最大となる、前記依存構造に基づく談話構造木を特定し、前記入力文書内の文字列単位の係り受け関係の解析結果として出力する係り受け解析部と、を含んで構成されている。

本発明の係り受け関係解析方法は、特徴抽出部及び係り受け解析部を含む係り受け関係解析装置における係り受け関係解析方法であって、前記特徴抽出部によって、入力文書を文字列単位に分割した結果に基づき生成される、任意の前記依存構造に基づく談話構造木のエッジの各々について、前記特徴ベクトルを抽出するステップと、前記係り受け解析部によって、前記任意の前記依存構造に基づく談話構造木の中から、前記特徴抽出部によって抽出された前記エッジの各々についての特徴ベクトルと、上記の係り受け関係解析パラメータ学習方法によって学習された前記パラメータベクトルとに基づいて算出されるスコアが最大となる、前記依存構造に基づく談話構造木を特定し、前記入力文書内の文字列単位の係り受け関係の解析結果として出力するステップと、を含む。

本発明の第１のプログラムは、コンピュータを、本発明の係り受け関係解析パラメータ学習装置の各部として機能させるためのプログラムである。

本発明の第２のプログラムは、コンピュータを、本発明の係り受け関係解析装置の各部として機能させるためのプログラムである。

以上説明したように、本発明の係り受け関係解析パラメータ学習装置、方法、及びプログラムによれば、修辞構造に基づく談話構造木から変換された依存構造に基づく談話構造木のエッジの各々に対し、エッジで結合されたノードのペアに対応する文字列単位のペア、及びエッジに付与された関係ラベルの組み合わせについて、学習用文書に基づく各特徴量からなる特徴ベクトルを抽出し、抽出されたエッジの各々に対する特徴ベクトル、及び特徴ベクトルの各特徴量に対する重みからなるパラメータベクトルに基づいて算出されるスコアと、学習用文書の文字列単位の系列から生成される、任意の依存構造に基づく談話構造木のエッジの各々に対して抽出される特徴ベクトル、及びパラメータベクトルに基づいて算出されるスコアとに基づいて、最適化されたパラメータベクトルを学習することにより、係り受け解析を精度よく行うためのパラメータを得ることができる、という効果が得られる。

また、本発明の係り受け関係解析装置、方法、及びプログラムによれば、任意の依存構造に基づく談話構造木の中から、エッジの各々についての特徴ベクトルと、学習されたパラメータベクトルとに基づいて算出されるスコアが最大となる、依存構造に基づく談話構造木を特定し、入力文書内の文字列単位の係り受け関係の解析結果として出力することにより、係り受け解析を精度よく行うことができる、という効果が得られる。

本発明の実施の形態の係り受け関係解析パラメータ学習装置の一構成例を示すブロック図である。文書の依存構造に基づく談話構造木（ＤＥＰ−ＤＴ）の一例を示す図である。修辞構造に基づく談話構造木（ＲＳＴ−ＤＴ）から、依存構造に基づく談話構造木（ＤＥＰ−ＤＴ）への変換ルールを説明するための説明図である。本発明の実施の形態の係り受け関係解析装置の一構成例を示すブロック図である。本発明の実施の形態の係り受け関係解析パラメータ学習装置における学習処理ルーチンの内容を示すフローチャートである。本発明の実施の形態の係り受け関係解析パラメータ学習装置における構造木変換処理ルーチンの内容を示すフローチャートである。本発明の実施の形態の係り受け関係解析装置における解析処理ルーチンの内容を示すフローチャートである。修辞構造に基づく談話構造木（ＲＳＴ−ＤＴ）を説明するための説明図である。

＜概要＞
まず、本発明の実施の形態の概要について説明する。

本発明に係る実施の形態は、与えられた文書中の文法的な要素間の係り受け関係の解析に関する。この技術はアノテーションが付与されていない文書中の文法的な要素の間の修辞関係を解析し、文書全体を木として表現することで文法的な要素間の依存関係を解析する技術である。

本発明に係る実施の形態では、
（１）文書の修辞構造に基づく談話構造木（ＲＳＴ−ＤＴ）から、文書の依存構造に基づく談話構造木（Dependency based Discourse Tree：ＤＥＰ−ＤＴ）への変換ルールを定める。
（２）また、文書内の談話構造における最小の単位（Elementary Discourse Unit：以下、ＥＤＵと称する。）間の依存関係を係り受け解析として定式化する。

ここで、ＲＳＴ−ＤＴとは、ルートノードが文書の全体を表し、かつ文書のうちの少なくとも１つの文字列単位の系列の各々を各ノードとした階層構造を表し、かつ、文字列単位の系列間の修飾関係及び関係ラベルを表した、文書の文字列単位の系列の各々の修辞構造に基づく談話構造木である。

また、ＤＥＰ−ＤＴとは、文書のうちの最も重要な文字列単位をルートノードとし、かつ文書のうちの各文字列単位を各ノードとし、かつ修飾関係を有する各文字列単位間に対応するノード間をエッジで結合し、エッジに、関係ラベルを付与した、文書の各文字列単位の依存構造に基づく談話構造木である。

また、ＲＳＴ−ＤＴ及びＤＥＰ−ＤＴの文字列単位は、文書中の最小の単位（Elementary Discourse Unit：ＥＤＵ）に対応する。

本実施の形態では、談話構造関係の相互依存関係をより正確に捉えるために大域的最適化の観点に基づいて談話構造解析を行なう。ＲＳＴ−ＤＴは、文脈自由文法（Context Free Grammer：ＣＦＧ）と似ており、内側外側アルゴリズム（Inside Outside Algorithm）が適用可能にも思えるが、ＣＦＧでは単語であった終端記号がＲＳＴ−ＤＴではＥＤＵとなっている。ＥＤＵの種類数は単語の語彙数よりもはるかに多くなり、結果として終端記号の種類数が多すぎるため、ＣＦＧをそのまま談話構造解析に適用するのは現実的には不可能である。

そこで本実施の形態では、ＲＳＴ−ＤＴをＤＥＰ−ＤＴへと変換することで談話構造関係間の相互依存構造をより正確に捉え、大域的最適化に基づいて談話構造を解析する。本実施の形態は最適なパラメータを学習する段階と、最適なパラメータを使って入力された文書内のＥＤＵ間の係り受け関係を解析する段階の二つに分かれる。

まず、最適なパラメータを学習する段階について説明する。この段階ではまず、入力された修辞構造アノテーション済みの文書を、修辞構造木変換部を用いて係り受け木（ＤＥＰ−ＤＴ）に変換する。次にＤＥＰ−ＤＴから抽出された特徴ベクトルと、初期パラメータベクトルとをパラメータ学習部の入力とする。パラメータ学習部では係り受け解析を行なうのに最適なパラメータベクトルを学習し、そのパラメータベクトルを学習済みパラメータとして出力する。

次に、最適なパラメータベクトルを使って、入力された文書内のＥＤＵ間の係り受け関係を解析する段階について説明する。この段階では、入力された文書をＥＤＵの単位に分割する。次にＥＤＵの列から特徴ベクトルを抽出し、前段階で得られた学習済みパラメータベクトルと共に係り受け解析部に渡される。係り受け解析部では、それらを基に元の文書に対し、係り受け解析を行なったものを出力する。

＜係り受け関係解析パラメータ学習装置のシステム構成＞
以下、図面を参照して本発明の実施の形態を詳細に説明する。本実施の形態の係り受け関係解析パラメータ学習装置１００は、文書内のＥＤＵ間の係り受け関係を解析するためのパラメータを学習する。図１は、本発明の実施の形態の係り受け関係解析パラメータ学習装置１００を示すブロック図である。係り受け関係解析パラメータ学習装置１００は、ＣＰＵと、ＲＡＭと、後述する学習処理ルーチン及び構造木変換処理ルーチンを実行するためのプログラムを記憶したＲＯＭとを備えたコンピュータで構成され、機能的には次に示すように構成されている。

本実施の形態の係り受け関係解析パラメータ学習装置１００は、図１に示すように、学習用入力部１と、学習用演算部２と、パラメータデータベース３とを備えている。

学習用入力部１は、複数の学習データの入力を受け付ける。ここで、学習データは、修辞構造アノテーション済みの学習用文書である。修辞構造アノテーション済みの学習用文書とは、学習用文書について予め修辞構造が解析され、学習用文書内の各ＥＤＵ間の修辞関係及び関係ラベルが予め付与された文書である。また、学習用文書は、少なくとも１文からなる文書である。

学習用演算部２は、学習用入力部１により受け付けた複数の学習データに基づいて、文書の係り受け解析をするためのパラメータを学習する。学習用演算部２は、学習データベース２０と、修辞構造木変換部２２と、学習用特徴抽出部２４と、パラメータ学習部２６とを備えている。

学習データベース２０には、学習用入力部１により受け付けた複数の学習データが格納される。

修辞構造木変換部２２は、学習データである修辞構造アノテーション済みの学習用文書の各々について、ＲＳＴ−ＤＴを構築する。

そして、修辞構造木変換部２２は、構築されたＲＳＴ−ＤＴの各々について、当該ＲＳＴ−ＤＴをＤＥＰ−ＤＴに変換する。

具体的には、修辞構造木変換部２２は、ＲＳＴ−ＤＴのノードのうち、ＥＤＵを表すノードの各々を着目ノードとして、着目ノードのＥＤＵが兄弟ノードを修飾する場合に、当該兄弟ノードのうち、修飾されるＥＤＵを表すノードであって、最左に位置するノードを、ＤＥＰ−ＤＴにおける着目ノードの親ノードとする。そして、着目ノードと親ノードとを結合するエッジに、関係ラベルを付与する。

また、修辞構造木変換部２２は、ＲＳＴ−ＤＴのノードのうち、ＥＤＵを表すノードの各々を着目ノードとして、着目ノードのＥＤＵが兄弟ノードから修飾される場合に、当該着目ノードの先祖ノードのうち、兄弟ノードを修飾するノードであって、直近に位置するノードを辿り、辿ったノードの親ノードの子孫ノードうち、修飾されるＥＤＵを表すノードであって、最左に位置するノードを、ＤＥＰ−ＤＴにおける、着目ノードの親ノードとする。そして、着目ノードと親ノードとを結合するエッジに、関係ラベルを付与する。

より詳細には、修辞構造木変換部２２は、あるＥＤＵｅ_ｉの親であるＥＤＵｅ_ｊと、その間にある関係を探す手続きを以下のように定義する。

（ステップ０）
現在着目しているＥＤＵｅ_ｉがＳならば、兄弟関係にあるＥＤＵの中で最左のＮであるｅ_ｊをｅ_ｉの親とする（ｅ_ｉとその親との間の関係ラベルをｅ_ｉとｅ_ｊの間の関係ラベルに設定する）。

（ステップ１−１）
現在着目しているＥＤＵｅ_ｉがＮならば、Ｓのノードに到達するまで親のノードを辿る。Ｓのノードに到達したら、その一つ親のノードを辿り、そのノードをＰと設定する。また、Ｐとその子供の間の関係ラベルをＲとする（Ｒｏｏｔに到達したらそれ以上親は辿らない）。

（ステップ１−２）
ＰからＥＤＵに到達するまでＮのノードを辿る（Ｎの子供を複数持つ場合は最左のものを選ぶ）。到達したＥＤＵのノードｅ_ｊをｅ_ｉの親とし、その間の関係ラベルをＲと設定する。

文書中にｎ個のＥＤＵの列Ｅ＾＝[ｅ_１，ｅ_２，・・・，ｅ_ｎ]がある際に、上記の（ステップ０）、（ステップ１−１）、（ステップ１−２）の手続きを、文書中のｎ個のＥＤＵ全てに対して行なうことが、ＲＳＴ−ＤＴをＤＥＰ−ＤＴへの変換ルールと定義する。このように修辞構造木変換部２２では、上記図８のようなＲＳＴ−ＤＴを入力とし、図２のようなＤＥＰ−ＤＴを出力する。なお、記号に付された「＾」は、当該記号が行列または多次元配列またはベクトルであることを表わしている。

なお、上記の変換（ＲＳＴ−ＤＴからＤＥＰ−ＤＴ）は一意に可能であるが、逆変換（ＤＥＰ−ＤＴからＲＳＴ−ＤＴ）は一意ではない。

次に、図３を用いて、ＲＳＴ−ＤＴからＤＥＰ−ＤＴへの変換ルールを適用した例を説明する。まず、上記（ステップ０）について説明する。ここでは、上記図３のＥＤＵｅ_６について説明する。現在着目しているＥＤＵｅ_６はＳであるから、兄弟関係にある最左のＥＤＵｅ_５をＥＤＵｅ_６の親に設定する。

次に、上記（ステップ１−１）と上記（ステップ１−２）とについて説明する。ここではＥＤＵｅ_５の親と、その間の関係をどのように探すかについてのみ説明する。ＥＤＵｅ_５はＮのノードなので、（ステップ１−１）に進む。Ｓのノードに到達するまで親のノードを辿るので、ノードＮ１１まで到達する。ノードＮ１１の親ノードであるＮ５をＰと設定し、その子供の間にある関係ラベル「Elaboration」を関係ラベルＲと設定する。（ステップ１−２）に進み、ＰからＮのノードをＥＤＵに到達するまで辿る。ここではＥＤＵｅ_３がそれに該当する。以上より、ＥＤＵｅ_３をＥＤＵｅ_５の親と設定し、これらの間の関係ラベルを「Elaboration」と設定する。

学習用特徴抽出部２４は、修辞構造木変換部２２によって変換されたＤＥＰ−ＤＴの各々について、当該ＤＥＰ−ＤＴのエッジの各々に対し、エッジで結合されたノードのペアに対応するＥＤＵのペア、及びエッジに付与された関係ラベルの組み合わせについての、学習用文書に基づく各特徴量からなる特徴ベクトルを抽出する。

ここで、ＥＤＵｅ_ｉとＥＤＵｅ_ｊのペア及びＥＤＵｅ_ｉとＥＤＵｅ_ｊの間の関係ラベルｒ∈Ｒの組み合わせに対するスコア

を

と定義する。また、ｆ＾（ｅ_ｉ，ｒ，ｅ_ｊ）∈｛０，１｝^ＭはＥＤＵｅ_ｉとＥＤＵｅ_ｊの間の関係ラベルｒから得られる各特徴量を表わすバイナリベクトル（以下、特徴ベクトルと称する。ただし、Ｍは特徴量の次元数を表わす正の整数である。）、ｗ＾は、ｗ＾∈Ｒ^ＭのＭ次元の実数ベクトルのパラメータ（以下、パラメータベクトルと称する。）である。すなわち、パラメータベクトルｗ＾は、特徴ベクトルｆ＾（ｅ_ｉ，ｒ，ｅ_ｊ）の各特徴量に対する重みからなる。

特徴ベクトルが表す各特徴量のうち、代表的なものを以下に挙げる。

（１）ＥＤＵｅ_ｉに含まれる単語数が５以下であるか。
（２）ＥＤＵｅ_ｉとＥＤＵｅ_ｊが同じ文に含まれるか。
（３）ＥＤＵｅ_ｉの先頭が「Because」で始まるか。
（４）ＥＤＵｅ_ｉとＥＤＵｅ_ｊの間にあるＥＤＵの数。
（５）ＥＤＵｅ_ｉの主辞の品詞が動詞であるか。
（６）係り受け関係の向きが左から右であるか。

単語数のように１より大きい値を取りうるものについては「単語数が５以上ならば１、そうでなければ０」のように特徴量を、２値化する。以上のように、学習用特徴抽出部２４では、ＥＤＵの列を入力とし、∀ｉ，ｊ∈｛１，・・・，ｎ｝，∀ｒの組み合わせの各々に対して、Ｍ次元のバイナリの特徴ベクトルｆ＾（ｅ_ｉ，ｒ，ｅ_ｊ）を出力する。

上記図２のｅ_１とｅ_２を例に取り、実際の特徴ベクトルがどのようなものになるかを説明する。ｅ_１の実際の文書は「With its distant orbit ― 50 percent farther from the sum than Earth ― and slim atmospheric blanket,」、ｅ_２の実際の文書は「Mars experiences frigid weather conditions.」であるとする。ＥＤＵｅ_ｉをｅ_１、ＥＤＵｅ_ｉをｅ_２とし、ｅ_２がｅ_１の親である場合（関係ラベルは「Evidence」）の特徴量の各々は

（１）ｅ_１に含まれる単語数は２１個なので、単語数は５個より大きい。
（２）ｅ_１とｅ_２は同じ文に含まれる。
（３）ｅ_１の先頭は「Because」で始まらない。
（４）ｅ_１とｅ_２の間にあるＥＤＵの数は０個。
（５）ｅ_１の主辞の品詞が動詞ではない。
（６）係り受け関係の向きが左から右である。

であることからｆ＾（ｅ_１，Evidence，ｅ_２）＝[０，１，０，０，０，１]となる。

パラメータ学習部２６は、ＤＥＰ−ＤＴの各々における、学習用特徴抽出部２４よって抽出された当該ＤＥＰ−ＤＴのエッジの各々に対する特徴ベクトルｆ＾（ｅ_ｉ，ｒ，ｅ_ｊ）、及びパラメータベクトルｗ＾に基づいて算出されるスコアの和と、当該ＤＥＰ−ＤＴのＥＤＵの系列から生成される、任意のＤＥＰ−ＤＴのエッジの各々に対して抽出される特徴ベクトルｆ＾（ｅ_ｉ，ｒ，ｅ_ｊ）、及びパラメータベクトルｗ＾とに基づき算出されるスコアの和とに基づいて、最適化されたパラメータベクトルｗ＾を学習する。

最適なパラメータベクトルｗ＾が決まれば、スコア関数を通じて大域的に最適なＥＤＵ間の係り受け関係を求めることができるが、最適なパラメータベクトルｗ＾は既知ではない。そこで本実施の形態では、Support Vector Machineと同様にマージン最大化に基づいて最適なパラメータベクトルｗ＾を求める。マージン最大化基準に基づく制約付き最適化問題は以下のように定式化できる。

ここで、γは分離平面からのマージン、Ｌ（Ａ_ｋ；Ａ）は任意の係り受け木Ａとｋ番目の正解の係り受け木Ａ_ｋとの損失関数である。直感的な式の意味としては「正解Ａ_ｋと大きく違う係り受け木Ａに関してはなるべく大きなマージンを取るようにパラメータベクトルｗ＾を設定したい」ということを意味している。また、任意の係り受け木Ａと、ｋ番目の正解の係り受け木Ａ_ｋとは、同じ学習用文書内のＥＤＵ系列から得られる係り受け木である必要がある。この制約付き最適化問題（１）式自体は直接解くのは非常に困難なので、マージンγを１に固定した下で、より簡単な形に変形すると、以下の制約付き最適化問題を得る。

この最適化問題は、教師ありの構造学習の枠組み（構造化パーセプトロン）で捉えることができ、本実施の形態ではこの方法を用いて最適なパラメータベクトルｗ＾を求める。

パラメータデータベース３には、パラメータ学習部２６で学習されたパラメータベクトルｗ＾が格納される。

＜係り受け関係解析装置のシステム構成＞
図４は、本発明の実施の形態の係り受け関係解析装置２００を示すブロック図である。この係り受け関係解析装置２００は、ＣＰＵと、ＲＡＭと、後述する解析処理ルーチンを実行するためのプログラムを記憶したＲＯＭとを備えたコンピュータで構成され、機能的には次に示すように構成されている。

係り受け関係解析装置２００では、係り受け解析対象の文書が入力されると、当該文書の係り受け解析を行う。

本実施の形態の係り受け関係解析装置２００は、図４に示すように、入力部４と、パラメータデータベース５と、演算部６と、出力部７とを備えている。

入力部４は、係り受け解析対象の文書の入力を受け付ける。なお、入力される文書は、少なくとも１文からなる文書である。

パラメータデータベース５には、上記の係り受け関係解析パラメータ学習装置１００によって学習されたパラメータベクトルｗ＾が格納される。

演算部６は、入力部４により受け付けた、係り受け解析対象の文書について係り受け解析を行う。また、演算部６は、ＥＤＵ分割部６０と、特徴抽出部６２と、係り受け解析部６４とを備えている。

ＥＤＵ分割部６０は、入力部４により受け付けた係り受け解析対象の文書をＥＤＵに分割する。具体的には、ＥＤＵ分割部６０では、修辞構造のアノテーションがされていない、係り受け解析対象の文書の入力を受け付け、入力された文書をＥＤＵに分割し、ＥＤＵの列を出力する。一般に文書中のどこでＥＤＵに区切れるかは未知であるため、文書中の各単語間でＳＶＭなどの分類器を用いて、区切れるか区切れないかを判断させ、文書をＥＤＵに分割したものを出力する。

特徴抽出部６２は、ＥＤＵ分割部６０によって得られたＥＤＵの列に基づき生成される任意のＤＥＰ−ＤＴのエッジの各々について、学習用特徴抽出部２４と同様に、特徴ベクトルを抽出する。具体的には、ＥＤＵの列を入力とし、∀ｉ，ｊ∈｛１，・・・，ｎ｝，∀ｒの組み合わせの各々に対して、特徴ベクトルｆ＾（ｅ_ｉ，ｒ，ｅ_ｊ）を出力する。

係り受け解析部６４は、ＥＤＵの列に基づき生成される任意のＤＥＰ−ＤＴの中から、パラメータデータベース５に格納されたパラメータベクトルｗ＾と特徴ベクトルとに基づいて算出されるスコアの和が最大となる、ＤＥＰ−ＤＴを特定し、係り受け解析対象の文書内のＥＤＵの係り受け関係を解析結果として出力する。特定されたスコアの和が最大となるＤＥＰ−ＤＴは、ＥＤＵｅ_ｉ、関係ラベルｒ∈Ｒ、ＥＤＵｅ_ｊの三つ組を要素とする集合で表わされる。Ｒは全ての関係ラベルの集合である。このように、係り受け解析部６４では、ＥＤＵｅ_ｉとＥＤＵｅ_ｊの間に関係ラベルｒ∈Ｒがあるときのスコアを

とし、ＥＤＵの列に基づき生成される任意のＤＥＰ−ＤＴの中から、各エッジに対するスコアの和が最大になるようなＤＥＰ−ＤＴを特定する。

本実施の形態では、各エッジに対してスコアが与えられた下で、ｎ個のＥＤＵの列からスコアの和が最大になるＤＥＰ−ＤＴを求めるアルゴリズムとして、Maximum Spanning Tree Algorithm（MST Algorithm）を用いる。これにより、Ｏ（ｎ^３）で計算できる。

出力部７は、係り受け解析部６４で出力された係り受け関係を結果として出力する。

＜係り受け関係解析パラメータ学習装置の作用＞
次に、本実施の形態の係り受け関係解析パラメータ学習装置１００の作用について説明する。まず、複数の学習データが係り受け関係解析パラメータ学習装置１００に入力されると、係り受け関係解析パラメータ学習装置１００によって、入力された複数の学習データが、学習データベース２０へ格納される。そして、係り受け関係解析パラメータ学習装置１００によって、図５に示す学習処理ルーチンが実行される。

まず、ステップＳ１００において、修辞構造木変換部２２によって、１つの学習データを学習データベース２０から読み込み、ＲＳＴ−ＤＴを構築する。

次に、ステップＳ１０２において、上記ステップＳ１０２で構築されたＲＳＴ−ＤＴについて、当該ＲＳＴ−ＤＴをＤＥＰ−ＤＴに変換する。ステップＳ１０２は、図６に示す構造木変換処理ルーチンによって実現される。

＜構造木変換処理ルーチン＞
まず、ステップＳ１５０において、修辞構造木変換部２２によって、上記ステップＳ１００で構築されたＲＳＴ−ＤＴについて、ＲＳＴ−ＤＴのノードのうち、１つのＥＤＵを表すノードを着目ノードとして設定する。

次に、ステップＳ１５２において、上記ステップＳ１５０で設定された着目ノードが兄弟ノードを修飾するか、または着目ノードが兄弟ノードから修飾されるかを判定する。すなわち、当該着目ノードに付与されているラベルがＳかＮかを判定する。着目ノードに付与されているラベルがＳである場合には、ステップＳ１５４へ進む。一方、着目ノードに付与されているラベルがＮである場合には、ステップＳ１５８へ進む。

ステップＳ１５４において、着目ノードの兄弟ノードのうち、修飾されるＥＤＵを表すノード（ラベルＮが付与されたノード）であって、最左に位置するノードを、ＤＥＰ−ＤＴにおける着目ノードの親ノードとする。

ステップＳ１５６において、上記ステップＳ１５４での、着目ノードと、着目ノードの親との間の関係ラベルを、着目ノードと親ノードとを結合するエッジに対する関係ラベルとして付与する。

ステップＳ１５８において、着目ノードの先祖ノードのうち、兄弟ノードを修飾するノード（ラベルＳが付与されたノード）であって、直近に位置するノードを辿り、当該直近に位置するノードの親ノードをＰと設定する。

ステップＳ１６０において、上記ステップＳ１５８で設定されたノードＰと、ノードＰの子ノードとの間の関係ラベルをＲとする。

ステップＳ１６２において、上記ステップＳ１５８で設定されたノードＰの子孫ノードのうち、修飾されるＥＤＵを表すノード（ラベルＮが付与されたノード）であって、最左に位置するノードを、ＤＥＰ−ＤＴにおける、着目ノードの親ノードとする。

ステップＳ１６４において、上記ステップＳ１６０で設定した関係ラベルＲを、着目ノードと親ノードとを結合するエッジの関係ラベルとして付与する。

ステップＳ１６６において、全てのＥＤＵを表すノードについて、上記ステップＳ１５０〜Ｓ１６４の処理を実行したか否かを判定する。そして、全てのＥＤＵを表すノードについて、上記ステップＳ１５０〜Ｓ１６４の処理を実行した場合には、ステップＳ１６８へ進む。一方、上記ステップＳ１５０〜Ｓ１６４の処理を実行していないＥＤＵを表すノードが存在する場合には、上記ステップＳ１５０へ戻る。

そして、ステップＳ１６８において、上記ステップＳ１５０〜Ｓ１６４の処理で得られた、各着目ノードの親ノード及び関係ラベルに基づいて、ＤＥＰ−ＤＴを生成し、結果として出力して、構造木変換処理ルーチンを終了する。

次に、学習処理ルーチンに戻り、ステップＳ１０４において、学習用特徴抽出部２４によって、上記ステップＳ１０４で出力されたＤＥＰ−ＤＴについて、当該ＤＥＰ−ＤＴのエッジの各々に対し、エッジで結合されたノードのペアに対応するＥＤＵのペア、及びエッジに付与された関係ラベルの組み合わせについての、当該学習データの学習用文書に基づく各特徴量からなる特徴ベクトルを抽出する。

次に、ステップＳ１０６において、学習データベース２０に格納された全ての学習データについて上記ステップＳ１００〜Ｓ１０４の処理を実行したか否かを判定する。全ての学習データについて上記ステップＳ１００〜Ｓ１０４の処理を実行した場合には、上記ステップＳ１０８へ進む。一方、上記ステップＳ１００〜Ｓ１０４の処理を実行していない学習データが存在する場合には、ステップＳ１００へ戻る。

ステップＳ１０８において、パラメータ学習部２６によって、学習データについて得られたＤＥＰ−ＤＴの各々における、上記ステップＳ１０４で抽出された当該ＤＥＰ−ＤＴのエッジの各々に対する特徴ベクトルｆ＾（ｅ_ｉ，ｒ，ｅ_ｊ）、及びパラメータベクトルｗ＾に基づいて算出されるスコアの和と、当該ＤＥＰ−ＤＴのＥＤＵの系列から生成される、任意のＤＥＰ−ＤＴのエッジの各々に対して抽出される特徴ベクトルｆ＾（ｅ_ｉ，ｒ，ｅ_ｊ）、及びパラメータベクトルｗ＾とに基づき算出されるスコアの和とに基づいて、上記（２）式に従って、最適化されたパラメータベクトルｗ＾を学習する。

そして、ステップＳ１１０において、パラメータ学習部２６によって、上記ステップＳ１０８で学習されたパラメータベクトルｗ＾をパラメータデータベース３へ格納して、学習処理ルーチンを終了する。

＜係り受け関係解析装置の作用＞
次に、本実施の形態の係り受け関係解析装置２００の作用について説明する。まず、係り受け関係解析パラメータ学習装置１００のパラメータデータベース３に記憶されているパラメータベクトルｗ＾が、係り受け関係解析装置２００に入力されると、パラメータデータベース５に格納される。そして、係り受け解析対象としての入力文書が係り受け関係解析装置２００に入力されると、係り受け関係解析装置２００によって、図７に示す解析処理ルーチンが実行される。

まず、ステップＳ２００において、入力部４によって、係り受け解析対象の入力文書を受け付ける。

次に、ステップＳ２０２において、ＥＤＵ分割部６０によって、上記ステップＳ２００で受け付けた係り受け解析対象の入力文書をＥＤＵに分割する。

ステップＳ２０４において、特徴抽出部６２によって、上記ステップＳ２０２で得られたＥＤＵの列に基づき生成される任意のＤＥＰ−ＤＴのエッジの各々について、特徴ベクトルｆ＾を抽出する。

ステップＳ２０６において、パラメータデータベース５に格納されたパラメータベクトルｗ＾を読み込む。

ステップＳ２０８において、係り受け解析部６４によって、ＥＤＵの列に基づき生成される任意のＤＥＰ−ＤＴの中から、上記ステップＳ２０６で読み込まれたパラメータベクトルｗ＾と上記ステップＳ２０４で抽出された特徴ベクトルｆ＾とに基づいて算出されるスコアの和が最大となる、ＤＥＰ−ＤＴを特定する。

そして、ステップＳ２１０において、上記ステップＳ２０８で特定されたＤＥＰ−ＤＴを、係り受け解析対象の入力文書内のＥＤＵの係り受け関係の解析結果として出力し、解析処理ルーチンを終了する。

＜実験結果＞
本発明の実施の形態の有効性を検証するために、ＲＳＴ−ＤＴを用いて学習したＨＩＬＤＡの解析結果を修辞構造木変換部２２に適用した係り受け解析結果（単に、ＨＩＬＤＡのアルゴリズムを用いて文書から変換したＲＳＴ−ＤＴを、ＤＥＰ−ＤＴに変換処理した結果）の精度と、修辞構造木変換部２２を用いてＲＳＴ−ＤＴをＤＥＰ−ＤＴに変換したものから学習されたパラメータベクトルｗ＾を用いて、係り受け解析部６４によって係り受け解析したものの解析精度を比較した。ＲＳＴ−ＤＴのアノテーションが付与された新聞記事を、学習データとして３４２文書、評価用のデータとして３８文書用意した。評価結果を表１に示す。評価結果より、提案手法はＨＩＬＤＡよりも良い正解率を得ており、その有効性が分かる。

以上説明したように、本実施の形態の係り受け関係解析パラメータ学習装置によれば、ＲＳＴ−ＤＴから変換されたＤＥＰ−ＤＴのエッジの各々に対し、エッジで結合されたノードのペアに対応するＥＤＵのペア、及びエッジに付与された関係ラベルの組み合わせについて、学習用文書に基づく各特徴量からなる特徴ベクトルを抽出し、抽出されたエッジの各々に対する特徴ベクトル、及び特徴ベクトルの各特徴量に対する重みからなるパラメータベクトルｗ＾に基づいて算出されるスコアの和と、学習用文書のＥＤＵの系列から生成される、任意のＤＥＰ−ＤＴのエッジの各々に対して抽出される特徴ベクトル、及びパラメータベクトルに基づいて算出されるスコアの和とに基づいて、最適化されたパラメータベクトルｗ＾を学習することにより、係り受け解析を精度よく行うためのパラメータベクトルｗ＾を得ることができる。

本実施の形態の係り受け関係解析装置によれば、入力文書のＥＤＵの列から生成される任意のＤＥＰ−ＤＴの中から、エッジの各々についての特徴ベクトルと、上記の係り受け関係解析パラメータ学習装置によって学習されたパラメータベクトルｗ＾とに基づいて算出されるスコアの和が最大となる、ＤＥＰ−ＤＴを特定し、入力文書内のＥＤＵの係り受け関係の解析結果として出力することにより、係り受け解析を精度よく行うことができる。

また、本実施の形態の係り受け関係解析パラメータ学習装置及び係り受け関係解析装置を用いることで、大域的最適化の観点に基づいて談話構造の相互依存関係をより正確に捉える談話構造解析が可能となる。

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

例えば、本実施の形態では、文書中のＥＤＵをＤＥＰ−ＤＴの各ノードとした場合を例に説明したが、各ノードをＥＤＵ以外の文字列単位として表わすこともできる。その場合には、ＥＤＵ分割部６０によって、文書を当該文字列単位に分割し、当該文字列単位をノードとして表したＤＥＰ−ＤＴを構築する。

また、本実施の形態の係り受け関係解析パラメータ学習装置及び係り受け関係解析装置は、英語だけでなく日本語等の他の言語にも適用可能である。

また、学習データベース２０及びパラメータデータベース３は、係り受け関係解析パラメータ学習装置の外部に設けられ、係り受け関係解析パラメータ学習装置とネットワークで接続されていてもよい。また、パラメータデータベース３は、係り受け関係解析装置の外部に設けられ、係り受け関係解析装置とネットワークで接続されていてもよい。

また、入力部４に入力される文書は、既に文又はＥＤＵに分割された形態であってもよい。その場合には、ＥＤＵ分割部６０の処理については省略する。

また、上記実施の形態では、係り受け関係解析パラメータ学習装置と係り受け関係解析装置とを別々の装置として構成する場合を例に説明したが、係り受け関係解析パラメータ学習装置と係り受け関係解析装置とを１つの装置として構成してもよい。

上述の係り受け関係解析パラメータ学習装置及び係り受け関係解析パラメータ学習装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、ＷＷＷシステムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。

１学習用入力部
２学習用演算部
３、５パラメータデータベース
４入力部
６演算部
７出力部
２０学習データベース
２２修辞構造木変換部
２４学習用特徴抽出部
２６パラメータ学習部
６０分割部
６２特徴抽出部
６４係り受け解析部
１００係り受け関係解析パラメータ学習装置
２００係り受け関係解析装置

Claims

文書内の文字列単位の係り受け関係を解析するためのパラメータを学習する係り受け関係解析パラメータ学習装置であって、
ルートノードが学習用文書の全体を表し、かつ前記学習用文書のうちの少なくとも１つの文字列単位の系列の各々を各ノードとした階層構造を表し、かつ、前記文字列単位の系列間の修飾関係及び関係ラベルを表した、前記学習用文書の文字列単位の系列の各々の修辞構造に基づく談話構造木について、前記修辞構造に基づく談話構造木の、文字列単位の各々と、各文字列単位のペアの各々とに基づいて、
前記修辞構造に基づく談話構造木のノードのうち、前記文字列単位を表すノードの各々を着目ノードとして、
前記着目ノードの文字列単位が、兄弟ノードを修飾する場合に、前記兄弟ノードのうち、修飾される文字列単位を表すノードであって、最左に位置するノードを、依存構造に基づく談話構造木における、前記着目ノードの親ノードとし、前記着目ノードと親ノードとを結合するエッジに、前記関係ラベルを付与すると共に、
前記着目ノードの文字列単位が、兄弟ノードから修飾される場合に、前記着目ノードの先祖ノードのうち、兄弟ノードを修飾するノードであって、直近に位置するノードを辿り、前記辿ったノードの親ノードの子孫ノードのうち、修飾される文字列単位を表すノードであって、最左に位置するノードを、依存構造に基づく談話構造木における、前記着目ノードの親ノードとし、前記着目ノードと親ノードとを結合するエッジに、前記関係ラベルを付与することにより、前記修辞構造に基づく談話構造木を、前記学習用文書のうちの最も重要な前記文字列単位をルートノードとし、かつ前記学習用文書のうちの各文字列単位を各ノードとし、かつ修飾関係を有する前記各文字列単位間に対応するノード間をエッジで結合し、前記エッジに、前記関係ラベルを付与した、前記学習用文書の各文字列単位の依存構造に基づく談話構造木に変換する修辞構造木変換部と、
前記修辞構造木変換部によって変換された前記依存構造に基づく談話構造木のエッジの各々に対し、前記エッジで結合されたノードのペアに対応する文字列単位のペア、及び前記エッジに付与された前記関係ラベルの組み合わせについて、前記学習用文書に基づく各特徴量からなる特徴ベクトルを抽出する学習用特徴抽出部と、
前記学習用特徴抽出部によって抽出された前記エッジの各々に対する特徴ベクトル、及び前記特徴ベクトルの各特徴量に対する重みからなるパラメータベクトルに基づいて前記エッジの各々について算出される第１のスコアの和と、前記学習用文書の文字列単位の系列から生成される、任意の前記依存構造に基づく談話構造木のエッジの各々に対して抽出される前記特徴ベクトル、及び前記パラメータベクトルとに基づいて前記エッジの各々について算出される第２のスコアの和とに基づいて、前記第１のスコアの和と前記第２のスコアの和との差が、前記修辞構造木変換部によって変換された前記依存構造に基づく談話構造木と前記任意の前記依存構造に基づく談話構造木とに関する予め設定された損失関数の値以上であり、かつ前記パラメータベクトルのノルムを最小化するように、前記パラメータベクトルを学習するパラメータ学習部と、
を含む係り受け関係解析パラメータ学習装置。
入力文書を文字列単位に分割した結果に基づき生成される、任意の前記依存構造に基づく談話構造木のエッジの各々について、前記特徴ベクトルを抽出する特徴抽出部と、
前記任意の前記依存構造に基づく談話構造木の中から、前記特徴抽出部によって抽出された前記エッジの各々についての特徴ベクトルと、請求項１に記載の係り受け関係解析パラメータ学習装置によって学習された前記パラメータベクトルとに基づいて算出されるスコアが最大となる、前記依存構造に基づく談話構造木を特定し、前記入力文書内の文字列単位の係り受け関係の解析結果として出力する係り受け解析部と、
を含む係り受け関係解析装置。
修辞構造木変換部、学習用特徴抽出部、及びパラメータ学習部を含み、文書内の文字列単位の係り受け関係を解析するためのパラメータを学習する係り受け関係解析パラメータ学習装置における係り受け関係解析パラメータ学習方法であって、
前記修辞構造木変換部によって、ルートノードが学習用文書の全体を表し、かつ前記学習用文書のうちの少なくとも１つの文字列単位の系列の各々を各ノードとした階層構造を表し、かつ、前記文字列単位の系列間の修飾関係及び関係ラベルを表した、前記学習用文書の文字列単位の系列の各々の修辞構造に基づく談話構造木について、前記修辞構造に基づく談話構造木の、文字列単位の各々と、各文字列単位のペアの各々とに基づいて、
前記修辞構造に基づく談話構造木のノードのうち、前記文字列単位を表すノードの各々を着目ノードとして、
前記着目ノードの文字列単位が、兄弟ノードを修飾する場合に、前記兄弟ノードのうち、修飾される文字列単位を表すノードであって、最左に位置するノードを、依存構造に基づく談話構造木における、前記着目ノードの親ノードとし、前記着目ノードと親ノードとを結合するエッジに、前記関係ラベルを付与すると共に、
前記着目ノードの文字列単位が、兄弟ノードから修飾される場合に、前記着目ノードの先祖ノードのうち、兄弟ノードを修飾するノードであって、直近に位置するノードを辿り、前記辿ったノードの親ノードの子孫ノードのうち、修飾される文字列単位を表すノードであって、最左に位置するノードを、依存構造に基づく談話構造木における、前記着目ノードの親ノードとし、前記着目ノードと親ノードとを結合するエッジに、前記関係ラベルを付与することにより、前記修辞構造に基づく談話構造木を、前記学習用文書のうちの最も重要な前記文字列単位をルートノードとし、かつ前記学習用文書のうちの各文字列単位を各ノードとし、かつ修飾関係を有する前記各文字列単位間に対応するノード間をエッジで結合し、前記エッジに、前記関係ラベルを付与した、前記学習用文書の各文字列単位の依存構造に基づく談話構造木に変換するステップと、
前記学習用特徴抽出部によって、前記修辞構造木変換部によって変換された前記依存構造に基づく談話構造木のエッジの各々に対し、前記エッジで結合されたノードのペアに対応する文字列単位のペア、及び前記エッジに付与された前記関係ラベルの組み合わせについて、前記学習用文書に基づく各特徴量からなる特徴ベクトルを抽出するステップと、
前記パラメータ学習部によって、前記学習用特徴抽出部によって抽出された前記エッジの各々に対する特徴ベクトル、及び前記特徴ベクトルの各特徴量に対する重みからなるパラメータベクトルに基づいて前記エッジの各々について算出される第１のスコアの和と、前記学習用文書の文字列単位の系列から生成される、任意の前記依存構造に基づく談話構造木のエッジの各々に対して抽出される前記特徴ベクトル、及び前記パラメータベクトルとに基づいて前記エッジの各々について算出される第２のスコアの和とに基づいて、前記第１のスコアの和と前記第２のスコアの和との差が、前記修辞構造木変換部によって変換された前記依存構造に基づく談話構造木と前記任意の前記依存構造に基づく談話構造木とに関する予め設定された損失関数の値以上であり、かつ前記パラメータベクトルのノルムを最小化するように、前記パラメータベクトルを学習するステップと、
を含む係り受け関係解析パラメータ学習方法。
特徴抽出部及び係り受け解析部を含む係り受け関係解析装置における係り受け関係解析方法であって、
前記特徴抽出部によって、入力文書を文字列単位に分割した結果に基づき生成される、任意の前記依存構造に基づく談話構造木のエッジの各々について、前記特徴ベクトルを抽出するステップと、
前記係り受け解析部によって、前記任意の前記依存構造に基づく談話構造木の中から、前記特徴抽出部によって抽出された前記エッジの各々についての特徴ベクトルと、請求項３に記載の係り受け関係解析パラメータ学習方法によって学習された前記パラメータベクトルとに基づいて算出されるスコアが最大となる、前記依存構造に基づく談話構造木を特定し、前記入力文書内の文字列単位の係り受け関係の解析結果として出力するステップと、
を含む係り受け関係解析方法。
コンピュータを、請求項１に記載の係り受け関係解析パラメータ学習装置の各部として機能させるためのプログラム。
コンピュータを、請求項２に記載の係り受け関係解析装置の各部として機能させるためのプログラム。